Où sont les ancien·ne·s de Mila aujourd'hui? Quel impact leur passage dans notre institut de recherche a-t-il eu sur leur carrière? Dans le cadre de cette série, rencontrez Christopher Kermorvant, ancien chercheur postdoctoral à Mila aujourd'hui fondateur et directeur scientifique chez Teklia.
Parlez-nous de votre parcours universitaire et professionnel.
J’ai une formation d’ingénieur en informatique à l’origine en France. J’ai basculé vers la recherche quand j’ai fait un échange avec l’Université de Manchester au Royaume-Uni, où j’ai fait un Master of Science. J’ai fait mon mémoire de recherche en utilisant des réseaux de neurones pour essayer de modéliser le phénomène de perception musicale en collaboration avec un laboratoire de psychologie.
J’ai ensuite cherché à travailler dans le domaine de la recherche, et donc à faire une thèse. J’ai commencé à travailler dans un institut de recherche en Suisse qui s’appelle Idiap. J’ai travaillé presque deux ans en reconnaissance de la parole, et après, j’ai eu l'opportunité de faire ma thèse à l’Université de Lyon, Saint-Étienne en France. C’était aussi pour me rapprocher de ma femme qui habitait à Lyon! Et donc j’ai fait une thèse en apprentissage automatique (c’était du "machine learning" à l’époque, il n’y avait pas de "deep learning").
Je souhaitais faire un postdoctorat à l’étranger, et j’ai monté un financement avec la DGA qui finance des séjours de recherche. J’ai contacté Yoshua pour venir travailler avec lui, et avec mon financement, j’avais quand même un avantage!
Parlez-nous un peu de votre séjour à Mila.
Le laboratoire était quand même beaucoup plus petit à l’époque. C’était en 2003. On était quinze, et on se tenait tous dans une seule salle! Les conditions étaient sans doute très différentes de ce qu'elles sont aujourd'hui. Ce qui était bien c’était qu’on pouvait travailler avec Yoshua directement; il passait nous voir, on travaillait avec lui, il s’asseyait à côté de nous. Même si le laboratoire était petit, il était déjà assez reconnu.
Ce que j’ai trouvé intéressant à Mila à l’époque c’était le fait que les différents niveaux hiérarchiques travaillaient tous ensemble. Tout le monde venait au travail, il y avait une assez bonne collaboration. C’était une aire ouverte, ce qui n’est pas très courant en recherche.
Il y avait beaucoup de collaborations avec les entreprises. C’était aussi beaucoup plus internationalisé avec la proximité des États-Unis, et le laboratoire attirait beaucoup de monde, même s’il y avait beaucoup de Français!
Pouvez-vous nous parler de ce que vous faites dans la recherche d’entreprise?
Ce qui m’intéressait depuis le début, c’était d’être à la frontière de plusieurs disciplines, comme l’IA appliquée à la musique, ou l’IA appliquée à la parole, ou à la biologie.
Je m’intéresse maintenant à l’IA appliquée aux documents historiques. L’objectif est de développer des systèmes capables de comprendre des documents historiques qui n’ont pas été numérisés, qui étaient sous forme de papier, parchemin, papyrus, pierres, etc., et sur lesquels il y a un contenu souvent textuel (mais ça peut être de l’image aussi) et où l’on développe des modèles qui rendent le contenu accessible. Le but n'est pas seulement de transcrire ce qui est sur le document, mais aussi de comprendre quelle est sa structure : comment les informations sont organisées, quelles sont les informations, comment les typer, comment les relier entre elles à l’intérieur d’un document, etc. Ça va plus loin que la reconnaissance de l’écriture elle-même.
Votre travail s’inscrit-il dans une période historique particulière?
L’antiquité n’est pas vraiment notre domaine de prédilection; comme les corpus sont petits, ils sont déjà presque tous étudiés, et puis les expert⋅e⋅s sont peu nombreux, donc il n’y a pas de problème de masse. On commence à avoir un problème de masse avec le Moyen Âge, qui marque le début de la production de masse de manuscrits. Quatre-vingt mille pages, ce n'est plus accessible pour un⋅e seul⋅e chercheur⋅euse – c'est tout simplement impossible. C’est donc intéressant d’utiliser l’IA parce qu’on peut donner aux chercheur⋅euse⋅s un outil pour accéder tout d’un coup à ces pages et changer leurs méthodes de travail.
C’est un projet qui changer la dimension la recherche en histoire, et les historien⋅ne⋅s se rendent compte que la façon dont ils travaillaient il y a dix ans est en train d’être révolutionnée, et qu'ils doivent s’intéresser à ces outils parce qu'ils ouvrent des pistes de recherche complètement incroyables.
Quels conseils donneriez-vous aux nouveaux étudiants de Mila?
Mon conseil serait de profiter de l’interdisciplinarité et de toutes les possibilités de réseautage avec des entreprises où à l’étranger. Les opportunités, il faut les préparer; c’est important de créer une sorte de carnet d’adresses quand on est étudiant⋅e, de connaître des gens, et de se faire connaître. Tous les liens que vous établissez à ce moment-là sont utiles pour le reste de votre vie.
Quel est, selon vous, le plus grand défi auquel l’IA est confrontée aujourd’hui?
Nous devons maîtriser la manière d'améliorer la qualité de l'IA, qu'il s'agisse de l'IA générative ou même de l’IA pour la reconnaissance de l’écriture ou l’analyse de documents. Nous devons garantir un degré élevé de confiance dans le fait qu'elle maintiendra le même niveau de qualité et qu'elle ne laissera pas soudainement des "outliers" dans la production. Nous savons qu'il s'agit d'une difficulté, et tant que nous n’y arriverons pas, nous ne pourrons pas vraiment déployer l’IA à grande échelle.
Les deux grands défis sont de réussir à spécialiser les IA et de s'assurer que leur niveau de qualité est constant.
Qu’avez-vous hâte de voir avec le développement de l’IA?
Une fois que nous serons parvenus à une adoption massive, quelles formes d’interaction verrons-nous? Si on pense, par exemple, à l’utilisation des téléphones mobiles, c’est quelque chose de nouveau, le fait de pouvoir se parler en se déplaçant et de ne pas avoir de fil. Aujourd’hui, l'utilisation des téléphones mobiles a explosé, et toutes sortes de possibilités ont été inventées avec cette technologie. Dans le cas de l'IA, on le voit pour l'instant comme une IA générative, mais il y aura beaucoup d'autres utilisations que nous pourrons inventer.
Il sera intéressant de découvrir quelles seront ces utilisations lorsque la technologie sera beaucoup plus largement utilisée par le grand public.
Avez-vous des réalisations récentes que vous aimeriez partager?
- The HikarAI Project (article en anglais)
- Reconstituer l’histoire de la France « par le bas »
Suivez les ancien·ne·s de Mila sur les réseaux sociaux #MilaAlumni