Un réseau de neurones synthétiques apprend à jouer à « Pong »

Pong jeu Atari
Le singe ayant reçu l'implant peut jouer à Pong et à d'autres petits jeux vidéo Crédits : Bumm13 / Wikipedia

Un mini-cerveau synthétique composé de neurones humains aurait appris à jouer au jeu vidéo « Pong » après avoir été connecté à un réseau d’électrodes contrôlé par ordinateur. C’est la première fois que des cellules cérébrales isolées d’un organisme accomplissent une telle tâche. Les détails de l’étude sont publiés dans la revue Neuron.

Des chercheurs ont développé un réseau de neurones synthétiques au-dessus de rangées d’électrodes logées à l’intérieur d’un minuscule conteneur circulaire d’environ cinq centimètres de large baptisé DishBrain. Développé par la société australienne Cortical Labs, ce conteneur est doublé d’un réseau contenant 1 024 électrodes actives qui peuvent à la fois envoyer et recevoir des signaux électriques.

Les scientifiques ont introduit un mélange de neurones humains et de souris au-dessus de ces électrodes. Les cellules de souris ont été cultivées à partir de minuscules neurones extraites d’embryons en développement. Quant aux neurones humains, ils ont été créés à l’aide de cellules souches pluripotentes extraites de sang et d’échantillons cutanés donnés par des volontaires.

Les neurones ont été amenés par les chercheurs à développer de nouvelles connexions et voies jusqu’à ce qu’ils se transforment en un réseau complexe de cellules cérébrales recouvrant complètement les électrodes. Au total, le réseau de neurones contenait environ 800 000 neurones, soit l’équivalent du nombre de neurones présents dans le cerveau d’une abeille.

Les auteurs de l’étude ont ensuite utilisé un programme informatique connu sous le nom de DishServer qui, combiné avec les électrodes, a permis de créer un « monde de jeu virtuel » dans lequel les neurones pourraient jouer à « Pong ». Pour rappel, ce jeu consiste à frapper un point mobile (ou balle) sur une petite barre.

pong neurones
Une image du système DishbBrain montrant les nombreuses connexions entre les cellules cérébrales humaines et de souris. Crédits : Cortical Labs

Apprendre à jouer

Pour mieux vous rendre compte du système, imaginez que le réseau d’électrodes est un écran de télévision où chaque électrode représente un pixel. Concevez ensuite le programme informatique comme la disquette de jeu qui fournit le code permettant de jouer. L’interface neurone-électrode dans le DishBrain peut quant à elle être envisagée comme la console et les différents contrôleurs qui facilitent le jeu. Enfin, l’ensemble des neurones peut être considéré comme un joueur.

Concrètement, lorsque le programme informatique active une électrode particulière, celle-ci génère un signal électrique que les neurones peuvent interpréter, de la même manière qu’un pixel s’allume et devient visible pour une personne regardant son écran. En activant plusieurs électrodes, le programme peut alors créer une forme, dans ce cas une balle (ou un point), qui se déplace à travers le réseau (l’écran).

Une section séparée du réseau surveille les signaux émis par les neurones en réponse aux signaux de la balle. Ils peuvent ensuite être interprétés par le programme informatique pour manœuvrer la raquette. Si les signaux neuronaux reflètent ceux qui déplacent la balle, elle frappera la raquette. Dans le cas contraire, elle la manquera. Le programme envoie alors un second signal de rétroaction aux neurones pour leur dire s’ils ont touché la balle ou non.

Réduire l’imprévisibilité

Ce signal de rétroaction peut être considéré comme un système de récompense permettant de favoriser le succès du jeu. Dans le but de renforcer les « comportements souhaitables » (frapper la balle), les chercheurs se sont appuyés sur théorie connue sous le nom de principe de l’énergie libre. En gros, ce principe nous dit que les cellules essaient de minimiser l’imprévisibilité de leur environnement. Autrement dit, les neurones essaient de créer un modèle prévisible de leur monde.

Lorsque les neurones réussissaient à frapper la raquette, le signal de rétroaction était délivré vers un emplacement similaire aux signaux utilisés par l’ordinateur pour déplacer la balle. En cas d’échec, ce signal de retour frappait de manière aléatoire et à plusieurs endroits. Ainsi, selon le principe de l’énergie libre, les neurones ont commencé à changer la façon dont ils déplaçaient la « raquette » par rapport à la « balle » dans le but de minimiser la quantité de signaux aléatoires.

D’après l’équipe, les neurones augmentaient la fréquence à laquelle ils frappaient la balle au bout de cinq minutes d’entraînement. Après environ vingt minutes, les neurones auraient alors enchaîné de courts échanges.

C’est la première fois qu’un réseau neuronal biologique créé par l’Homme apprend à accomplir indépendamment une tâche axée sur un objectif. À terme, ce type de recherche pourrait ouvrir la voie à la création d’ordinateurs s’appuyant sur des cellules cérébrales pour effectuer certaines tâches que les ordinateurs d’aujourd’hui ne pourraient espérer accomplir.