Utiliser les LLMs pour mieux comprendre le diagnostic de l'autisme

logo and page presentation

Actuellement, la plupart des diagnostics d'autisme reposent sur l'intuition humaine: les médecins évaluent les cas selon un ensemble de critères et fournissent leur évaluation. Et si nous pouvions améliorer ce processus en trouvant les points communs de ces évaluations?

Notre article, publié dans la revue généraliste Cell, (l'une des revues scientifiques les plus influentes et prestigieuses au monde avec Nature et Science). Nous utilisons des grands modèles de langage (LLMs) pour analyser de vastes quantités de données provenant de rapports écrits par des professionnelles et professionnels de la santé afin de mieux comprendre comment le diagnostic de l'autisme est effectué, et, nous l’espérons, de l'améliorer.

Décoder le processus de pensée clinique

Bien que des milliers d'études aient été menées sur le sujet, nous n'avons pas encore isolé un gène ou une région cérébrale spécifique à l'autisme: la meilleure façon d'établir un diagnostic reste l'observation clinique et la prise de décision par des médecins expérimentés.

En tant que chercheurs en IA, la meilleure matière avec laquelle nous pouvons travailler est le processus de pensée clinique lui-même, c'est-à-dire les éléments de l'intuition clinique utilisés par les médecins lors du diagnostic d'un individu suspecté d'autisme.

Ces rapports ne contiennent aucune indication directe du diagnostic (cette conclusion étant atteinte par un consensus de médecins), mais les LLMs peuvent nous aider à trouver des motifs dans de grandes quantités de données textuelles (par exemple, les dossiers de santé électroniques) et dans ce cas précis, les observations des comportements et des interactions des patientes et patients écrites par les médecins.

Passer au crible des milliers de phrases provenant de rapports de diagnostic d'autisme rédigés par des médecins peut être fastidieux, c'est pourquoi nous avons conçu des outils d'IA capables de décoder ce processus de pensée clinique: quels sont les éléments conduisant à un diagnostic d'autisme ?

En collaboration avec des chercheuses et chercheurs de l'Université de Montréal, nous avons commencé par collecter et organiser un rare corpus de plus de 4 000 documents textuels sur lesquels nous avons ensuite entraîné notre modèle d'IA.

Nous avons utilisé des LLMs pré-entraînés sur une grande quantité de texte comme base de notre modèle et ajouté un module d'interprétabilité distinct basé sur l'attention, ce qui nous aide à comprendre pourquoi le modèle prend une certaine décision (ouvrir la “boîte noire”) et met en évidence les phrases spécifiques les plus indicatives de l'autisme et du diagnostic global.

En effet, au lieu d'interpréter des mots individuels comme les LLMs classiques, nous nous sommes concentrés sur l'interprétation de phrases entières, rendant les résultats plus faciles à comprendre pour les humains.

De nouveaux critères pour le diagnostic de l'autisme

Ce que nous avons découvert remet en question des croyances de longue date sur le diagnostic de l'autisme.

Les critères existants dans le DSM-5 (le manuel de référence mondial pour le diagnostic de l'autisme) accordent beaucoup de poids aux déficits sociaux par rapport aux autres critères que notre modèle met en évidence comme pertinents.

En effet, notre analyse a révélé que les comportements répétitifs stéréotypés, les intérêts particuliers et les comportements basés sur la perception sont les plus importants lors du diagnostic de l'autisme.

Ces résultats ont été confirmés plus tard par nos collaboratrices et collaborateurs de l'Université de Montréal, qui ont des décennies d'expérience sur le terrain.

Il s'agit de l'une des premières études à tirer parti des grands modèles de langage pour exploiter une déconstruction aussi systématique du processus de pensée clinique, et les résultats contrastent avec quelque 40 ans de recherche sur ce sujet.

Avec de tels outils d'IA, nous pouvons enfin exploiter le filon de textes généré pendant des décennies dans nos systèmes de santé. À l'avenir, nous espérons pouvoir exploiter ces outils puissants pour révéler des informations encore cachées dans ces grandes bases de données textuelles.

Grâce à ces approches de modélisation du langage, nous pouvons mieux comprendre ce que les médecins observent lorsqu'ils effectuent un diagnostic et comparer cela aux lignes directrices existantes. Nous espérons ainsi fournir de nouveaux outils analytiques aux scientifiques afin de motiver la révision de ces lignes directrices et d'améliorer notre compréhension du processus de diagnostic de l’autisme.