Initiative FLAIR

L'initiative FLAIR ouvre le prochain chapitre de la revitalisation des langues autochtones grâce à l'intelligence artificielle (IA) et à la technologie immersive.

Logo du project et photo d'une mère autochtone parlant à son enfant dans ses bras.

Contexte

Plus de 50 % des langues du monde auront disparu ou seront gravement menacées d'extinction d'ici 2100. L'extinction d'une langue entraîne la perte irrémédiable de connaissances culturelles, historiques et écologiques uniques. Chaque langue étant une expression unique de l'expérience humaine du monde, les connaissances qu'elle véhicule peuvent être la clé pour répondre aux questions fondamentales de l'avenir.

La majorité des langues menacées sont des langues autochtones. Plus de 4 000 langues sont parlées par les peuples autochtones, qui représentent moins de 6 % de la population mondiale. On estime qu'une langue autochtone meurt toutes les deux semaines. Les langues sont au cœur de l'identité des peuples autochtones, de la préservation de leurs cultures, de leurs visions du monde et de leurs conceptions, ainsi que de l'expression de leur autodétermination.

Vision

Nous imaginons un monde dans lequel les communautés autochtones jouissent d'une autodétermination et d'une souveraineté totales sur leur langue et leur culture. Nous imaginons la technologie au service de la revitalisation et de l'épanouissement des langues en tant qu'outil permettant de relier les membres d'une communauté, de célébrer leur identité et de transmettre leur culture et leurs connaissances selon leurs propres termes.

À propos du projet

L'initiative FLAIR sert les communautés autochtones dans leurs efforts pour revitaliser leur langue et leur culture par le biais de la technologie. Nous jetons les bases de l'IA vocale autochtone dans des systèmes explicitement conçus pour respecter la souveraineté des données et l'autodétermination linguistique. 

Notre recherche fondamentale sur la reconnaissance automatique de la parole (ASR) vise à développer une méthode de création rapide de modèles personnalisés pour les langues en danger. Ces modèles peuvent être utilisés pour l'apprentissage des langues, la transcription audio, les technologies à commande vocale et bien d'autres choses encore. En outre, l'IA vocale permettra aux communautés autochtones de participer au métavers dans leurs langues d'origine et facilitera la transmission intergénérationnelle des langues, un facteur essentiel pour la vitalité des langues. Elle permettra des expériences immersives inclusives dans lesquelles les jeunes autochtones pourront renouer avec leur patrimoine dans le cadre d'échanges et d'activités culturellement significatifs.

Nous proposons une approche à multiples facettes qui vise à réduire considérablement les besoins en données. Le développement d'un ASR pour une nouvelle langue nécessite généralement des centaines d'heures de données. Pour la plupart des langues autochtones, cela est généralement irréalisable en raison du nombre limité ou de l'absence d'enregistrements audio et du fait qu'il ne reste que très peu de locuteur·rice·s. Dans de nombreux cas, il reste à peine une dizaine de locuteur·rice·s natif·ve·s, voire aucun·e (qui sont généralement d'un âge avancé), et il n'est pas réaliste de collecter de grandes quantités de données auprès de ces locuteur·rice·s. Lorsque des enregistrements audio existent, ils ne sont pas transcrits ou sont inaccessibles. Il est donc essentiel de trouver une méthode permettant de réduire le nombre d'heures de données audio nécessaires afin de libérer le potentiel de l'IA pour les langues à faibles ressources.

L'objectif immédiat de FLAIR est de valider des solutions pour un ensemble spécifique de langues autochtones en Amérique du Nord. Toutes nos connaissances et tous les outils que nous construisons seront partagés publiquement et en code source libre pour une utilisation gratuite. Nous passerons ensuite au niveau supérieur pour fournir le système résultant du développement rapide de l'ASR aux communautés autochtones du monde entier, car il pourrait contribuer à résoudre des problèmes similaires pour les milliers de langues utilisées par d'autres communautés mal desservies ou en manque de moyens.


Pourquoi une IA pour les langues autochtones peut devenir réalité

Regardez le directeur technique de FLAIR, Michael Running Wolf, présenter sa vision du projet lors d'un événement TEDx organisé à Boston.

Ressources

Atlas des langues en danger dans le monde
La version interactive de l'Atlas de l'UNESCO des langues en danger répertorie environ 2 500 langues menacées d'extinction.
L'IA pourrait-elle contribuer à sauver les langues autochtones ?
Après avoir grandi avec les sons du Cheyenne, l'ingénieur logiciel Michael Running Wolf exploite aujourd'hui l'IA pour assurer la survie de cette langue, et d'autres encore.
Instance permanente des Nations unies sur les questions autochtones
Les langues autochtones ne sont pas seulement des méthodes de communication, mais aussi des systèmes de connaissances étendus et complexes qui se sont développés au fil des millénaires.

Dans les médias

Une nouvelle technologie pour les langues autochtones (ITC News)
Autres membres
Gigi Davidson
Shankhalika Srikanth
David Huggins-Haines
Farhan Shaikh
Josée Poirier (Mila)
Faith Baca (Étudiante autochtone)
Ryan Conti (Étudiant autochtone)
Daniela Ramos Ojeda (Étudiante autochtone)
Belu Ticona (Étudiante autochtone)
Dave Malenfant (Alumni)
Kyran Romero (Alumni)

Partenaires

Des questions sur le projet?