
Nous avons récemment eu l’occasion de nous entretenir avec Desislava Aleksandrova, anciennement membre de Mila, et désormais spécialiste en apprentissage automatique à CBC/Radio-Canada. Desislava se concentre sur le traitement du langage naturel (NLP) pour une plateforme numérique qui met en valeur le contenu du diffuseur public.
Parlez-nous de votre parcours académique et professionnel.
Après avoir déménagé de la Bulgarie à Montréal à la fin de la vingtaine, j’ai commencé à suivre des cours de français (offerts gratuitement aux immigrants) tout en travaillant comme pigiste en tant que gestionnaire de projets web. La quête de compétences linguistiques plus avancées m’a poussée à m’inscrire à un programme de premier cycle à l’Université de Montréal, où j’ai découvert la linguistique pour la première fois. Deux ans plus tard, je commençais des études supérieures en linguistique informatique, ce qui m’a orientée vers le domaine du traitement du langage naturel (NLP).
Aujourd’hui, je suis spécialiste en apprentissage automatique à CBC/Radio-Canada, où je travaille sur des projets NLP pour Mauril, une plateforme numérique gratuite exploitant les contenus de CBC et Radio-Canada pour aider les utilisateur·rice·s à apprendre l’anglais et le français.
Comment votre intérêt pour l’IA est-il né? Qu’est-ce qui vous a attiré au départ?
Pendant ma maîtrise en linguistique informatique, il est rapidement devenu évident que travailler avec le langage, notamment à grande échelle, nécessitait l’utilisation de méthodes statistiques et de l’apprentissage automatique. Lors de la rédaction de mon mémoire, j’ai décidé d’assister au cours de Ioannis Mitliagkas sur les bases de l’apprentissage automatique, et ce sujet a immédiatement capté mon attention. J’ai donc ressenti le besoin de compléter le DESS à Mila pour acquérir les connaissances et compétences essentielles à une carrière en traitement du langage naturel (NLP).
À travers le prisme du traitement du langage, des sujets que je comprenais peu, comme le calcul et les statistiques, ont commencé à avoir du sens. La programmation m’a donné les outils nécessaires pour mettre en œuvre des idées et réaliser des travaux empiriques.
Y a-t-il un sujet que vous aimeriez approfondir? Sur quoi travaillez-vous en ce moment?
Le développement d’outils de traitement du langage naturel (NLP) conçus pour assister les humains a souligné l’importance de l’interprétabilité des modèles et de leur évaluation pour leur adoption dans des processus de travail réels. Lorsque des expert·e·s interagissent avec les prédictions d’un modèle, ils et elles ont besoin de savoir au moins deux choses : i) à quelle fréquence ce modèle a raison; et ii) les raisons qui sous-tendent ses décisions. Bien que ces questions semblent simples, leurs réponses ne le sont pas.
Le lancement des grands modèles de langage (LLMs) a conduit de nombreuses équipes, y compris la nôtre, à se concentrer sur des tâches comme la synthèse et la simplification de texte. Notre attention s’est ainsi orientée vers l’évaluation des résultats des modèles à l’aide de métriques compréhensibles par l’humain, basées à la fois sur la linguistique et les statistiques des corpus, afin de fournir une vue d’ensemble significative et exploitable de la qualité du texte généré.
Parlez-nous un peu de votre expérience à Mila.
Mon expérience à Mila a débuté et s’est entièrement terminée à distance, en raison de la pandémie. Avec le recul, cela a été une bénédiction pour moi, car j’ai pu utiliser ce temps supplémentaire pour combler les nombreuses lacunes dans mes connaissances et tirer pleinement parti du programme. Il était particulièrement utile d’avoir l’enregistrement des cours à disposition, ce qui me permettait de revoir certains détails à mon propre rythme. J'éprouverai toujours une grande reconnaissance envers tous·tes les professeur·e·s et assistant·e·s pour leur disponibilité, leur flexibilité et le temps qu’ils et elles ont consacré à répondre aux questions de chacun·e.
Quels conseils donneriez-vous aux nouveaux étudiants de Mila ?
Aux études supérieures, on ne peut pas simplement arrêter après huit heures de travail ou pendant la fin de semaine. Le travail à faire, plus celui que l’on pourrait faire est toujours plus important que ce qui est physiquement possible. Mon conseil est de l’accepter, car cela ressemble à un entraînement d’endurance qui rendra tout plus facile par la suite. C’est aussi une période où vous investissez en vous-même, donc plus que jamais, vous ne voulez pas être avare.
Quel est, selon vous, le plus grand défi auquel l’IA est confrontée aujourd’hui?
Je dirais qu’il s’agit du battage médiatique et de l’opportunisme commercial. Bien que je n’aie aucun doute que les chercheur·euse·s en IA continueront de faire progresser le domaine et de relever les nombreux défis à venir, je m’inquiète de la manière dont certaines entreprises tentent de capitaliser sur la promesse et la popularité de l’IA. Ajouter cet acronyme à chaque nom de marque et produit pour maximiser les profits risque d’entraîner de la fatigue et de la désillusion chez le grand public.
Qu’attendez-vous de l’évolution de l’IA dans les années à venir?
J’espère voir davantage d’initiatives à grande échelle axées sur la littératie en IA, car un outil n’est utile que si l’on sait comment l’utiliser. Éduquer les gens sur l’IA est un peu comme les informer sur le coronavirus pendant la récente pandémie. En plus de rendre accessibles les informations sur un sujet complexe, les éducateur·rice·s devront constamment apaiser les peurs et démystifier les idées reçues, tout en restant attentifs aux nouvelles variantes d’un écosystème IA en constante évolution.