Mila > Projet FLAIR (First Languages AI Reality)

Projet FLAIR (First Languages AI Reality)


 

Contexte

Selon l’UNESCO, près de 50 % des langues autochtones du monde entier et environ 90 % des langues autochtones d’Amérique du Nord sont menacées d’extinction. Pour contrer cette perte, les communautés autochtones doivent avoir accès à une approche novatrice pour l’enseignement des langues. Le projet First Languages AI Reality (FLAIR) a été créé afin de permettre le prochain chapitre de la reconquête des langues autochtones grâce à l’utilisation d’une technologie avancée d’IA immersive.

Vision

Imaginez un métavers inclusif où les jeunes autochtones d’Amérique du Nord renouent avec leur patrimoine. Dans ce métavers, des chasseurs⋅ses Lakota utilisent leur langue maternelle pour coordonner une chasse au bison dans les Grandes Plaines. À l’ouest, des canoës Makah traversent la mer de Salish pour se rendre à une réunion communautaire avec des locuteurs⋅trices Kwak̓wala et demandent la permission de venir à terre pour leur voyage en canoë. Nous sommes convaincus que l’IA vocale sera intrinsèque à l’expérience du métavers qui, à son tour, pourra faciliter la transmission intergénérationnelle des langues indigènes.

Pour réaliser cette vision, nous devons d’abord développer les bases de l’IA vocale autochtone. Cette recherche fondamentale sur la reconnaissance automatique de la parole (ASR) se concentrera dans un premier temps sur la famille linguistique wakashane, qui s’étend de la Colombie-Britannique au Canada à l’État de Washington aux États-Unis. L’objectif à long terme est de l’étendre à d’autres langues autochtones d’Amérique du Nord, comme les langues algonquiennes du nord-est, pour finalement apporter l’IA vocale aux communautés autochtones du monde entier et leur permettre de participer au métavers dans leurs langues d’origine.

Description du projet

L’objectif de FLAIR est de développer une méthode de création rapide de modèles ASR personnalisés pour les langues autochtones. Le développement de la reconnaissance automatique de la parole pour une nouvelle langue ou un nouveau domaine nécessite généralement la collecte de centaines d’heures de données. Pour de nombreuses langues autochtones, cela est généralement irréalisable, car il y a tout au plus quelques dizaines de locuteurs⋅trices de la première langue. De plus, lorsque des enregistrements audio existent, ils ne sont pas transcrits ou sont tout simplement inaccessibles. Une méthode permettant de réduire le nombre d’heures de données nécessaires serait donc très utile. Nous proposons une approche à multiples facettes qui pourrait réduire considérablement les besoins en données. L’objectif immédiat de ce projet est d’identifier des solutions pour un ensemble spécifique de langues autochtones en Amérique du Nord, mais nous estimons que le système de développement rapide de modèles ASR qui en résulte permettra de résoudre des problèmes similaires pour les milliers de langues utilisées à travers le monde par d’autres communautés linguistiques qui manquent de ressources ou qui sont mal desservies.

Vidéo connexe : Pourquoi l'IA des langues autochtones peut devenir une réalité

Michael Running Wolf, directeur technique de FLAIR, a présenté sa vision du projet lors d’un récent événement TEDx à Boston (en anglais). 

Équipe

L’initiative FLAIR est menée par Michael Running Wolf (responsable technique) et Caroline Running Wolf (directrice de programme). Les activités sont également rendues possibles grâce à la collaboration de plusieurs étudiants en intelligence artificielle et de consultants en culture linguistique.

Michael Running Wolf (Northern Cheyenne/Lakota/Blackfeet) a grandi dans un village rural des prairies du Montana où l’eau et l’électricité étaient intermittentes. Il détient une maîtrise en informatique et a précédemment occupé les postes d’ingénieur pour Alexa d’Amazon et de professeur à la Northeastern University. Il poursuit actuellement un doctorat en informatique à l’Université McGill. Michael étudie la récupération de la langue et de la culture autochtones à l’aide de technologies immersives (réalité augmentée/réalité virtuelle) et de l’intelligence artificielle. Ses travaux ont été récompensés par la bourse Solve du MIT, la bourse Alfred P. Sloan et le Prix Patrick McGovern AI for Humanity. Grâce à l’application éthique de l’IA et de la technologie de pointe respectant les modes de savoirs autochtones, il contribue à l’écologie de la pensée représentée par les autochtones.

Caroline Running Wolf, née Old Coyote, est citoyenne de la nation Crow. Caroline est une activiste du langage, productrice XR, éducatrice, administratrice. Caroline est doctorante à l’Université de Colombie-Britannique à Vancouver, C-B. Sa recherche explore les applications potentielles des technologies immersives (AR/VR/XR) et de l’intelligence artificielle à des fins de réclamation culturelle et linguistique autochtone. Elle est passionnée par la souveraineté des données autochtones et l’IA éthique.

Partenaire

Nous joindre

Pour toute question concernant le projet, veuillez communiquer avec Josée Poirier, Gestionnaire principale du projet FLAIR pour l’équipe d’IA pour l’humanité de Mila à josee.poirier@mila.quebec.