Ils ont créé une IA capable de décoder les langues mortes

langue morte
Crédits : Jun / Wikipedia

Des chercheurs étasuniens ont mis au point une intelligence artificielle étonnante. Cette dernière est capable d’étudier les langues mortes de manière automatique. Or, l’IA n’a aucunement besoin d’acquérir des connaissances préalables sur la langue à déchiffrer. Néanmoins, il faut savoir que le système ne déchiffre pas ces langues à la manière d’un traducteur en ligne.

Mieux comprendre les langues mortes

Dans une pré-publication sur la plateforme arXiv le 21 octobre 2020, une équipe du MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) a dévoilé son dernier projet. Il est question d’une nouvelle technologie permettant de décoder les langues mortes. Le dispositif intègre une intelligence artificielle n’ayant pas besoin de connaissances préalables sur la langue à étudier, ni sur les liens de cette langue avec d’autres.

Les chercheurs expliquent que ce nouveau projet a pour objectif de découvrir les différentes relations existant entre certaines langues mortes. Ceci pourrait permettre aux historiens de déchiffrer plusieurs traces écrites très difficiles à comprendre. Selon les meneurs de l’étude, la plupart des langues ayant existé ne sont aujourd’hui plus parlées.

«Nous proposons une mesure de la proximité linguistique conduisant à la sélection de la meilleure langue cible parmi la richesse des langues du monde», peut-on lire dans la publication du CSAIL.

scéma langue
Crédits : CSAIL

Une IA vouée à évoluer

Actuellement, on considère qu’une douzaine de ces langues sont perdues. Malheureusement, les linguistes ont trop peu d’informations concernant leur grammaire, leur vocabulaire ou encore leur syntaxe. Or, les chercheurs sont certains que déchiffrer les traces écrites donnerait l’occasion de mieux comprendre les peuples en lien avec ces langages.

L’algorithme est capable de comprendre comment les langues évoluent dans le temps. Ensuite, celui-ci parvient à déterminer certains schémas linguistiques, et ainsi mieux appréhender ces mêmes langues. L’algorithme peut classifier les mots d’une langue afin de les relier à ceux d’une autre. Toutefois, celle-ci est incapable de déchiffrer les textes anciens et les traduire dans une langue moderne à la manière d’un traducteur en ligne. Cependant, l’IA est capable d’identifier les racines de la langue à étudier.

À titre d’exemple, citons l’identification par l’IA d’une famille linguistique à laquelle appartient l’Ibère. Cette langue disparue était parlée en Europe occidentale du VIIe au Ier siècle avant J.C. Alors que les linguistes ont débattu pendant longtemps son supposé lien avec la langue basque, l’IA a tranché. Les deux langues sont totalement indépendantes l’une de l’autre. Les chercheurs espèrent désormais que ce système puisse à l’avenir déchiffrer des langues mortes en utilisant seulement quelques milliers de mots.