Pourrons-nous un jour parler avec les cachalots ? Des chercheurs y travaillent

Crédit : Wikipedia

Une équipe interdisciplinaire de scientifiques travaille sur un ambitieux projet visant à décoder le langage des cachalots pour ensuite « converser » avec eux. Pour ce faire, les chercheurs devront collecter des milliards de « quotas » et s’appuyer sur l’apprentissage automatique pour tenter de les traduire.

Sommes-nous sur le point de discuter avec les cachalots ? Dans le cadre d’un projet baptisé CETI (pour Cetacean Translation Initiative), une équipe de chercheurs pilotée par Michael Bronstein, enseignant à l’Imperial College de Londres et expert en apprentissage automatique, travaille au développement d’une intelligence artificielle dans le but de décoder les cliquetis utilisés par ces baleines pour communiquer entre elles.

Pus précisément, les chercheurs prévoient de tirer parti du traitement du langage naturel (NLP), un sous-domaine de l’IA axé sur le traitement du langage écrit et parlé.

Les cachalots ont-ils un langage ?

Pour communiquer, les cachalots ne produisent pas de « chants » comme les grandes baleines à fanons, mais utilisent des cliquetis (ou clics) organisés en séquences types appelées « codas », capables de se propager sur plusieurs kilomètres. Pour ce faire, cachalots expulsent de l’air à travers une paire de lèvres disposées en « museau de singe » sur la partie avant de leur nez. Le son produit rebondit alors plusieurs fois dans la vaste cavité, donnant une structure unique au clic produit par chaque individu.

Nous savons évidemment que les animaux communiquent, mais ont-ils développé un véritable langage ? La question du langage dans le monde animal a longtemps divisé les chercheurs. Pour considérer l’idée, plusieurs conditions doivent en effet être remplies. D’une part, le langage a une sémantique. Autrement dit, certaines vocalisations doivent avoir une signification fixe (qui n’évolue pas avec le temps). La deuxième condition est la grammaire (des règles pour construire des phrases). Enfin, le langage n’est pas inné : il s’apprend.

Pour certains, la langue est toujours l’un des derniers bastions de l’exclusivité humaine. Malgré tout, les preuves suggérant que certaines espèces sont effectivement capables de produire un langage se succèdent au fil du temps. C’est notamment le cas des dauphins ou de certains oiseaux. Mais qu’en est-il des cachalots ?

La question se pose effectivement. En effet, ces animaux sont connus pour plonger dans les profondeurs océaniques où ils communiquent sur de grandes distances. Ces animaux ne peuvent par s’appuyer sur le langage corporel et les expressions faciales qui sont des moyens de communication importants pour les autres animaux.

« Il est donc réaliste de supposer que la communication de ces baleines est principalement acoustique« , souligne Michael Bronstein. « Lorsque deux de ces animaux bavardent pendant une période prolongée, ne faut-il pas se demander s’ils ont quelque chose à se dire ? Se donnent-ils des conseils sur les meilleurs lieux de pêche ? Les mamans baleines échangent-elles des histoires sur l’élevage de leur progéniture comme leurs homologues humains ? Cela vaut la peine d’essayer de le savoir« .

baleine cachalot
Crédits : Pixabay / Decokon

Apprentissage automatique

La tâche n’est pas aisée. En effet, nous n’avons pas de « dictionnaire des cachalots » ni de règles grammaticales propres à ces animaux à disposition. Toutefois, les chercheurs ne sont pas totalement démunis.

Prenons l’exemple humain. Les enfants apprennent leur langue maternelle en écoutant simplement la langue parlée dans leur environnement. « Ce type d’apprentissage est essentiellement statistique : l’enfant se souvient que le mot chien est souvent prononcé lorsque cet animal à fourrure entre dans la pièce, que certains mots sont souvent associés à d’autres, qu’une séquence spécifique de mots est plus probable qu’un autre« , écrit Hakai magazine.

Au cours des dix dernières années, les méthodes d’apprentissage automatique ont essentiellement tenté d’imiter ce type d’apprentissage. Pour ce faire, les chercheurs alimentent de grands réseaux de « neurones informatiques » avec des données linguistiques. Ces réseaux peuvent alors isoler des structures à partir d’observations statistiques. Le modèle de langage GPT-3, développé par la société OpenAI, est un exemple.

« GPT-3 reçoit le début d’une phrase et la complète mot par mot, de la même manière que les suggestions que font les smartphones lorsque nous tapons des messages, mais de manière beaucoup plus sophistiquée« , poursuit Hakai magazine. « En traitant d’énormes quantités de texte extrait d’Internet, les modèles de langage savent non seulement quels mots apparaissent fréquemment ensemble, mais ils apprennent également les règles de composition des phrases« .

cachalots
Crédits : nesslinger-it/Pixabay

Un travail de titan qui a du sens

D’énormes quantités de données sont en revanche nécessaires. Le premier objectif de ce projet CETI, né en mars 2020, sera donc de collecter plusieurs milliards de « codas » de cachalots. L’équipe compte notamment s’appuyer sur les recherches existantes du Dominica Sperm Whale Project qui a déjà collecté près de 100 000 codas. Les chercheurs devront également mettre toutes ces informations en contexte. En effet, les mots sans contexte n’offrent aucun sens. Cela nécessitera donc des années de recherche dans les habitats naturels des cachalots.

Si l’idée fonctionne malgré tout, il est donc tout à fait réaliste d’imaginer que nous pourrions, dans quelques années, nous appuyer sur un système analogue aux modèles de langage humain pour générer des énoncés de cachalots « grammaticalement corrects ». En cas de succès, au-delà de la simple prouesse technique, ces travaux pourraient radicalement changer notre manière de percevoir et d’interagir avec la nature.