
thetransmitter.org Traduction de "AI tool estimates social ability by analyzing speech"
Charles Q. Choi - 13 février 2025
Ces résultats s'ajoutent à un nombre croissant de preuves que certains enfants autistes parlent différemment de leurs camarades non autistes. « Bien que nous le sachions à un certain niveau, depuis les premières descriptions de Kanner, il a été difficile de déterminer quelles étaient ces différences et si elles étaient cliniquement utiles », explique Helen Tager-Flusberg, professeur émérite de psychologie et de sciences du cerveau à l'université de Boston, qui n'a pas participé à cette étude. « Nous savons maintenant que c'est le cas".
Des études antérieures ont permis d'identifier une série de différences de langage associées à l'autisme. Par exemple, certains enfants autistes peuvent utiliser un ton plus aigu et plus variable, prendre moins leur tour dans les conversations ou produire moins de phonèmes (sons de base de la parole) par énoncé.
Les scientifiques ont cherché à mettre au point des moyens automatisés pour analyser la parole et classer les enfants autistes de manière directe et objective. Par exemple, le système LENA associait un logiciel à un enregistreur audio portable pour rechercher des schémas de parole distinctifs chez les enfants autistes. Des systèmes plus récents utilisent des algorithmes d'intelligence artificielle à apprentissage profond pour détecter les traits de l'autisme.
Les projets de développement de ces algorithmes ont toutefois souffert de certaines limitations, notamment un nombre relativement faible d'enfants autistes et des données provenant d'évaluations de chaque enfant recueillies à un seul moment, ce qui limite l'applicabilité à l'ensemble du développement. LENA, par exemple, a été conçu pour travailler avec des enfants âgés de 4 ans ou moins, et n'a donc pas pu suivre l'évolution du langage chez les enfants plus âgés.
Dans la nouvelle étude, les chercheurs ont développé un algorithme d'apprentissage profond appelé ASDSpeech qu'ils ont entraîné sur les vocalisations de 136 enfants autistes âgés de 1 à 7 ans, qui ont été enregistrées lors d'une évaluation diagnostique utilisant la deuxième édition de l'Autism Diagnostic Observation Schedule (ADOS-2). L'équipe a ensuite testé le système d'IA sur les données de 61 autres enfants autistes, qui ont tous participé à deux évaluations diagnostiques séparées d'un an ou deux. Chaque enregistrement durait environ 40 minutes.
Selon Ilan Dinstein, cochercheur principal de l'étude et professeur de psychologie à l'université Ben-Gourion du Néguev, l'ensemble des données de formation et de test utilisées dans cette étude est au moins trois fois plus important que les ensembles de données antérieurs sur le langage des personnes atteintes d'autisme. Contrairement aux recherches précédentes sur les algorithmes d'analyse du langage des autistes, Dinstein et ses collègues partagent ouvertement leur algorithme et leurs données. « Cela permettra d'accélérer les recherches futures dans ce domaine », estime M. Tager-Flusberg.
Et cela ne représente qu'une petite partie des données que Dinstein et ses collègues ont accumulées dans un référentiel en pleine expansion qui contient actuellement des enregistrements d'environ 2 000 enfants, ce qui en fait « l'un des plus grands référentiels vidéo et audio d'enfants autistes au monde », précise-t-il. « Nous avons créé un réseau clinique national en Israël où nous enregistrons des enfants dans neuf sites cliniques différents à travers le pays, soit environ 800 nouveaux cas par an".
ASDSpeech a examiné la relation entre 49 caractéristiques de la parole, telles que la hauteur et la durée, et la gravité des traits autistiques tels que définis par les scores ADOS-2 des enfants. Dinstein note qu'étant donné les lacunes de l'algorithme de reconnaissance vocale dans l'identification de la parole des enfants dans des situations désordonnées et réelles, les scientifiques ont annoté manuellement les vocalisations dans les enregistrements qui appartenaient aux enfants. La nature laborieuse de ce processus a limité l'étude à une petite partie des enregistrements disponibles.
Le système d'IA a estimé les scores ADOS-2 des enfants avec une précision allant jusqu'à 60 % aux deux stades de développement, ont constaté les scientifiques. Aucune caractéristique de la parole n'a été associée à un effet fort ou constant sur la précision d'ASDSpeech, ce qui pourrait suggérer une grande redondance entre les caractéristiques. Il n'y a pas eu de différences significatives dans la précision de l'algorithme en fonction de l'âge ou entre les garçons et les filles (47 participants étaient des filles ; 150 étaient des garçons).
Les enregistrements utilisés pour ASDSpeech ont été réalisés dans des conditions bruyantes à l'aide d'un microphone mural dans un centre médical public très fréquenté, notent les chercheurs dans leur article, publié le mois dernier dans Translational Psychiatry. Cela suggère que l'algorithme est robuste dans des situations réelles, affirment-ils.
ASDSpeech s'est avéré beaucoup plus précis et fiable pour estimer les scores de communication sociale que pour estimer les scores de comportements restreints et répétitifs, un autre trait clé lié à l'autisme. Cela est très logique et montre que l'autisme est une condition complexe », déclare Ruth Grossman, professeur de sciences et de troubles de la communication à l'Emerson College, qui n'a pas participé à l'étude. « Il ne sera probablement jamais possible de définir l'autisme à l'aide d'un seul type de mesure, c'est pourquoi la nuance apportée par les auteurs à ce type de recherche est importante."
Les enfants de cette étude parlaient tous l'hébreu, note Dinstein. La prochaine étape importante pour ASDSpeech « consistera à le tester avec des échantillons de parole d'autres langues », déclare Grossman. « J'aimerais beaucoup que ce type de recherche fasse l'objet d'une collaboration internationale et interlinguistique."
D'ici là, il reste à savoir si les caractéristiques identifiées par ASDSpeech sont spécifiques à une langue ou à une culture. Certaines recherches antérieures suggèrent qu'il n'existe peut-être pas de voix autistique clairement définissable, note Grossman.
Elle précise également que l'étude n'a porté que sur des enfants autistes et n'a donc pas permis de vérifier si l'outil pouvait différencier les voix des enfants autistes de celles des enfants non autistes.
M. Dinstein espère qu'ASDSpeech pourra être associé à d'autres outils de « phénotypage numérique » utilisés pour mesurer objectivement les mouvements oculaires, les expressions faciales et d'autres facteurs liés à l'autisme, ainsi que leur évolution dans le temps et en fonction des interventions. « Ces techniques ne sont pas destinées à remplacer les cliniciens », précise-t-il. « L'idée est de réduire la dépendance à l'égard des questionnaires subjectifs sur l'autisme, qui sont biaisés et peu sensibles aux changements, mais qui sont actuellement largement utilisés."
À terme, M. Dinstein souhaiterait qu'ASDSpeech intègre des données provenant d'enregistrements de milliers d'enfants autistes ou non, afin d'améliorer la précision et la fiabilité de ce travail. « Notre étude est une étape importante qui montre la faisabilité et les possibilités inhérentes à cette approche de recherche », déclare-t-il.