Une prothèse neurale qui utilise l’activité cérébrale pour décoder la parole, via un modèle d’apprentissage automatique basé sur un réseau neuronal, c’est le développement d’une équipe de neurologues et de bioingénieurs de la National Research University Higher School of Economics (HSE, Moscou) qui présente cet implant dans le Journal of Neural Engineering. En synthèse, le dispositif « devine » en fonction de l’activité cérébrale du sujet,
le mot sur le point d’être prononcé.
Les causes de la perte de la parole sont multiples et incluent notamment les accidents vasculaires cérébraux (AVC) et certaines affections congénitales. Avec des collègues scientifiques de l’Université d’État de médecine et de dentisterie de Moscou, ces chercheurs du HSE ont développé un modèle d’apprentissage automatique capable de prédire le mot sur le point d’être prononcé par un sujet en fonction de son activité neuronale. L’activité cérébrale étant enregistrée avec un petit ensemble d’électrodes peu invasives. Ce développement pourrait changer la vie de millions de personnes dans le monde sont touchées par des troubles de la parole qui limitent leur capacité à communiquer.
L’IA pour restaurer la fonction de communication
Il existe déjà des interfaces qui reconnaissent la parole en suivant le mouvement des muscles articulatoires lorsque la personne prononce des mots sans émettre de son. Cependant, ces dispositifs sont adaptés à certains patients mais pas à tous, dont les personnes atteintes de paralysie, par exemple.
Les neuroprothèses ou interfaces cerveau-ordinateur capables de décoder la parole en fonction de l’activité cérébrale sont une piste prometteuse pour rétablir la communication chez ces patients. Ainsi, les dispositifs dotés d’une interface cerveau-ordinateur (BCI) sont contrôlés directement par le cerveau sans avoir besoin de clavier ou de microphone. Cependant les dispositifs actuels impliquent une chirurgie hautement invasive pour implanter des électrodes dans le tissu cérébral. Enfin, pour une reconnaissance vocale précise, la neuroprothèse doit comporter de multiples électrodes couvrant une grande surface de la surface corticale. Ce type de solution peut, à long terme, présenter des risques importants pour les patients.
La nouvelle neuroprothèse est en revanche capable de décoder l’activité cérébrale à partir d’un petit ensemble d’électrodes implantées dans une zone corticale limitée. Elle ne nécessite qu’une procédure peu invasive qui peut être réalisée sous anesthésie locale.
L’étude teste ce nouvel implant chez 2 patients épileptiques qui avaient déjà été implantés avec des électrodes intracrâniennes à des fins de cartographie pré-chirurgicale. Le premier patient a été équipé de 5 électrodes, le deuxième patient avec 9. Les électrodes ont été implantées sans craniotomie complète via un trou percé dans le crâne. Les patients ont été invités à lire à haute voix 6 phrases, chacune présentée 30 à 60 fois dans un ordre aléatoire. Les phrases variaient dans leur structure et la majorité des mots d’une même phrase commençaient par la même lettre. Les phrases contenaient un total de 26 mots différents. Pendant que les sujets lisaient, les électrodes enregistraient leur activité cérébrale. Ces données ont ensuite été rapprochées des signaux audio pour former 27 classes, dont 26 mots et une classe de silence. L’ensemble des données a nourri un modèle d’apprentissage automatique dont la tâche, pour le réseau neuronal, était de prédire le prochain mot prononcé sur la base des données d’activité neuronale précédant son énoncé.
Prédire le prochain mot prononcé sur la base de l’activité neuronale précédant son énoncé
Le réseau neuronal atteint une précision de prédiction de 55 % chez le premier patient et une précision de 70 % chez le deuxième patient. Une précision comparable à celle des dispositifs nécessitant l’implantation d’électrodes sur toute la surface corticale.
Mieux décrypter les processus de la parole : le modèle permet également de mieux comprendre sur le plan neurophysiologique quelle information neuronale contribue le plus à prédire un mot sur le point d’être prononcé ou « parole imaginaire ». En d’autres termes, le modèle est en mesure d’extraire des représentations vocales directement à partir des données d’activité cérébrale.
Enfin, alors que la prédiction est toujours basée sur les données d’activité neuronale qui précède l’énoncé, il est clair qu’elle n’est pas modifiée par la réponse du cortex auditif à la parole.
Source: Journal of Neural Engineering Nov, 2023 DOI: 10.1088/1741-2552/aca1e1 Speech decoding from a small set of spatially segregated minimally invasive intracranial EEG electrodes with a compact and interpretable neural network
Lire aussi : INTELLIGENCE ARTIFICIELLE : L’implanter dans le corps humain ?
Équipe de rédaction SantélogAvr 28, 2023Équipe de rédaction Santélog