in

La dernière IA de Google capable « d’inventer ses propres mathématiques »

Crédits : iStock

Il y a quelques mois AlphaGo, l’intelligence artificielle de Google, l’emportait sur le champion du monde de jeu de Go et ses milliards de combinaisons possibles. Le nouvel algorithme AlphaGo Zero aurait battu il y a quelques jours cet algorithme original cent parties à zéro. Ce programme aurait par ailleurs appris tout seul à jouer au jeu de Go en s’entraînant contre lui-même.

Les chercheurs de DeepMind de Google viennent d’annoncer la prochaine évolution de leur intelligence artificielle apparemment indomptable : AlphaGo Zero. Et AlphaGo Zero n’a visiblement pas besoin de l’Homme. En seulement trois jours, cette nouvelle intelligence artificielle aurait appris « toute seule » les règles du jeu de go et ses multiples combinaisons possibles en s’entraînant « contre elle-même ». C’est donc sans étonnement qu’elle s’est passée des enseignements humains pour littéralement écraser cent parties à zéro son prédécesseur, Alpha Go, qui a battu quatre manches à un le champion du monde de jeu de Go il y a quelques mois.

Dans un article accompagnant l’étude publiée dans la revue Nature, Satinder Singh, spécialiste de l’IA, a estimé qu’il s’agissait là de « l’une des plus grandes avancées en termes d’applications dans le champ de l’apprentissage par renforcement ». De son côté, l’informaticien Nick Hynes, du MIT, a comparé cette nouvelle version artificielle à une sorte « d’extraterrestre capable d’inventer ses propres mathématiques ». Cette nouvelle prouesse s’appuie ici sur un réseau neuronal amélioré unique et à des simulations d’entraînement plus avancées. La technique utilisée s’appelle « apprentissage par renforcement » (reinforcing learning). En d’autres termes, les chercheurs intègrent à la machine les différentes règles du jeu et les différentes actions possibles. Au fur et à mesure, la machine apprend d’elle-même les actions qui fonctionnent le mieux et celles qui ne marchent pas.

Ainsi, « AlphaGo Zero est devenu son propre professeur », image Demis Hassabis, le PDG de DeepMind dans un communiqué. « Après des millions de parties d’AlphaGo contre AlphaGo, le système a progressivement appris le jeu de Go à partir de rien en accumulant des milliers d’années de connaissances humaines en quelques jours ». Il aura fallu 4,9 millions de parties d’entraînement pour arriver à un tel résultat. La version précédente avait eu besoin de trente millions de parties avant de pouvoir battre l’Homme.

Crédits : DeepMind

Mais le simple fait que l’IA progresse à un rythme aussi impressionnant ne signifie pas qu’AlphaGo Zero est plus intelligent ou plus capable que les humains dans d’autres domaines que ce jeu complexe. « L’IA échoue dans des tâches qui sont étonnamment faciles pour les humains », a noté le neuroscientifique Eleni Vasilaki, de l’université de Sheffield (Royaume-Uni) alors interrogé par The Guardian. « Il suffit de regarder la performance d’un robot humanoïde dans les tâches quotidiennes telles que marcher, courir ou simplement taper dans un ballon ». Permettez-nous tout de même un petit moment d’admiration silencieuse, tandis que nous assistons à la naissance de ce mode de pensée synthétique étonnamment puissant.

Source