Des chercheurs américains sont parvenus à mettre au point une technologie permettant d’obtenir une voix synthétisée en prenant en compte les signaux du cerveau. Ce système, qui pourrait servir aux personnes ayant perdu l’usage de la parole, deviendra peut-être un jour la toute première interface cerveau-machine commercialisée !
Des phrases entières
Dans un communiqué publié le 24 avril 2019 par l’Université de Californie à San Francisco (États-Unis), l’équipe menée par Edward Change détaille ses recherches. Celle-ci a peut-être mis au point la première interface cerveau-machine au monde ! Selon le neurochirurgien, le dispositif créé permet de générer des phrases entières prononcées à partir de l’activité cérébrale d’un individu.
Les chercheurs promettent dans un avenir plus ou moins proche la fabrication d’un dispositif spécialement destiné aux personnes assujetties aux troubles de la parole. En revanche, il faudra se montrer très patient avant qu’un tel appareil soit mis sur le marché et démocratisé. Par ailleurs, il apparaît utile de préciser que le dispositif en question ne traduit pas les pensées du patient, mais plutôt ce que ce dernier tente de prononcer. Pour l’instant en tout cas, ce procédé s’avère être très invasif en raison de l’implantation d’un grand nombre d’électrodes dans le cerveau des volontaires.
Identifier le « schéma d’activité »
Durant les tests, les chercheurs ont enregistré les signaux cérébraux des volontaires lisant des phrases à voix haute – au total plusieurs centaines. Ainsi, les meneurs de l’étude ont pu identifier un schéma d’activité dans le cerveau. En effet, celui-ci survient juste après que les volontaires aient pensé à un mot, mais avant que le signal ne parvienne aux muscles contrôlant la langue et la bouche. Les chercheurs ont ensuite relié l’audio aux mouvements et aux muscles afin d’obtenir une reproduction virtuelle de la voix du patient (voir vidéo en fin d’article).
Les chercheurs travaillent désormais sur l’élaboration d’électrodes plus denses et d’un machine learning plus performant afin d’augmenter la précision du dispositif en général. À terme, celui-ci pourrait permettre aux personnes ayant des troubles de la parole de prononcer jusqu’à 200 mots par minute ! Ces personnes pourraient au passage retrouver une vie sociale un peu plus riche et oublier un tant soit peu leur handicap.
En 2016, un scientifique français nommé Florent Bocquelet et son équipe avaient effectué des travaux du même genre à l’Institut national de la santé et de la recherche médicale (INSERM). Or, ces études très prometteuses avaient déjà permis d’élaborer un synthétiseur vocal « articulatoire » instantané basé sur l’apprentissage profond !
Sources : National Geographic – Siècle Digital
Articles liés :