Première mondiale : un ouvrage scientifique de 800 pages est traduit par ordinateur
À votre avis, combien de temps faudrait-il pour traduire intégralement une brique de 800 pages ? Si on ajoute qu’il s’agit d’un ouvrage scientifique d’une rare complexité, où pullulent tableaux, graphiques, figures et équations mathématiques. Et si, en plus, son sujet n’est maîtrisé que par quelques poignées d’individus sur cette planète. Vous diriez six mois, un an, deux ans ?
Détrompez-vous. Une équipe d’experts a réussi ce coup de maître en seulement deux mois et demi grâce à l’intelligence artificielle (IA). En fait, la majeure partie du travail a été réalisée en l’espace de 12 heures par un outil de traduction automatisée basée sur l’apprentissage profond. Les 10 semaines suivantes ont été consacrées à une révision « humaine » visant à rectifier toute inexactitude et à apporter précisions et nuances.
Une percée majeure dans le domaine de l’IA
C’était la première fois, dans le monde, qu’un livre était traduit d’une couverture à l’autre par un logiciel d’apprentissage profond, une forme d’apprentissage automatique qui permet à un ordinateur d’apprendre par l’expérience sans qu’un être humain lui fournisse toutes les connaissances requises. Cet exploit a été réalisé en octobre dernier par une équipe d’experts en IA de la société française Quantmetry et de spécialistes de la traduction automatisée de l’entreprise allemande DeepL.
Et quel livre ont-ils choisi pour cette grande innovation ? Rien de moins que l’un des ouvrages phares du domaine de l’apprentissage profond : « Deep Learning », publié en 2016 sous la plume de Yoshua Bengio, fondateur et directeur scientifique de Mila, l’Institut québécois d’intelligence artificielle, d’Aaron Courville, professeur agrégé à l’Université de Montréal et membre de Mila, et d’Ian Goodfellow, chercheur scientifique à Google Brain.
« Qu’on ait choisi notre ouvrage est un grand honneur pour nous, souligne Aaron Courville. C’est hautement symbolique que l’on démontre toutes les possibilités offertes par l’apprentissage profond en traduisant notre livre, qui en présente les fondements. Par le fait même, on pave la voie à une diffusion plus élargie de la connaissance scientifique, car ce livre est loin d’être le dernier à être traduit de cette façon. »
Pour donner vie à « L’apprentissage profond » (son titre français), l’équipe de Quantmetry s’associe à celle de DeepL, dont le service en ligne, bien que très puissant et doté d’un corpus fort bien traduit, était encore insuffisant pour un texte aussi difficile. On y ajoute notamment des fonctionnalités spécialement développées pour la traduction de fiches et de graphiques, ainsi qu’un lexique de 200 termes techniques précis dans le but d’assurer constance et cohérence.
Fidèle, précis et rapide
Trois mois plus tard, l’outil propulsé par l’IA est fin prêt et le travail de traduction peut commencer. Seulement 12 heures après avoir téléversé l’ouvrage de 800 pages dans l’outil, l’équipe reçoit une première ébauche de texte.
Les résultats sont stupéfiants. La qualité de la traduction est remarquable, avec une fidélité et une précision jamais atteintes auparavant par un outil automatisé. Mais, sans surprise, tout n’est pas parfait. Un groupe de chercheurs et de linguistes s’attelle alors à une révision minutieuse, et effectue des corrections qui ne sont encore qu’à la portée d’un être humain.
De la traduction initiale à la correction d’épreuve finale, il ne s’écoule que deux mois et demi. Cela aurait pris environ un an à des traducteurs spécialisés « en chair et en os ». Tout compte fait, on estime que le recours à l’IA a permis de réduire de 80 % le temps de traduction.
Un monde de différence
La qualité de la traduction automatique a fait des bonds de géants au cours des dernières années.
« Un monde sépare la qualité des traductions d’aujourd’hui de celles d’il y a cinq ans, indique Yoshua Bengio. Le niveau de compréhension des subtilités de la langue affiché par les logiciels intelligents, comme celui employé pour ce projet, est saisissant. Nous sommes encore loin de reproduire l’intelligence humaine, mais les avancées récentes confirment que les possibilités offertes par l’apprentissage profond sont infinies. »