En seulement 4 heures, une I.A. est parvenue à maîtriser toutes les connaissances en matières d’échecs

Crédits : FelixMittermeier/Pixabay

Les échecs ne sont pas un jeu facile, selon les standards humains. Mais pour une intelligence artificielle de haut niveau, la diversion triviale peut être maîtrisée en seulement quelques heures. Quatre, plus précisément.

Les chercheurs de Google détaillent en effet dans une étude comment l’I.A. AlphaZero a développé des « performances surhumaines » aux échecs, ne prenant que quatre heures pour apprendre les règles avant d’oblitérer le champion du monde d’échecs. En d’autres termes, toutes nos connaissances en échecs ont été absorbées et dépassées par une I.A. en seulement 4 heures. Imbattable au jeu de go, le système conçu par DeepMind a en effet su démontrer à tous son excellent niveau de jeu lors d’une série de parties organisées contre Stockfish, un programme d’échecs open source considéré comme « le plus puissant au monde » dans sa catégorie.

Cette nouvelle I.A. aurait en effet participé à une série de cent matchs contre Stockfish, et en a remporté à 28 reprises, apprend-on, les autres s’étant terminés sur une égalité. Le plus impressionnant est qu’au départ, Alphazero n’avait appris que les règles du jeu d’échecs, aucune stratégie. Elle a donc ensuite progressé seule, sans avoir vu préalablement des parties jouées par des humains. « Nous savons maintenant qui est notre nouveau seigneur », note l’expert en échecs David Kramaley, PDG du site Chessable. « Il va sans aucun doute révolutionner le jeu, mais réfléchissez à la façon dont cela pourrait être appliqué en dehors des échecs. Cet algorithme pourrait gérer des villes, des continents, des univers ».

Selon DeepMind, il aura fallu au total 9 heures d’entraînement et 44 millions de parties pour maîtriser les échecs avec un algorithme d’apprentissage de renforcement général, avec à chaque fois un temps de réflexion très court : 40 millisecondes. Ensuite, il n’a fallu que 4 heures au système d’I.A. pour surclasser Stockfish. Comment a-t-il fait la différence ? « AlphaZero recherche seulement 80 000 positions par seconde aux échecs contre 70 millions pour Stockfish », peut-on lire dans l’étude. « AlphaZero compense ce faible nombre en utilisant son réseau de neurones profonds pour se concentrer beaucoup plus sélectivement sur les variations les plus prometteuses – sans doute une approche de recherche plus “humaine” ».

Pour l’instant, les informaticiens de Google et de DeepMind ne commentent pas publiquement cette nouvelle recherche, qui n’a pas encore été évaluée par des pairs. Mais à partir de ce que nous pouvons lire jusqu’à présent, l’ascension vertigineuse de cet algorithme au sommet de l’intelligence artificielle est loin d’être terminée. Même les grands maîtres d’échecs sont déconcertés par le spectacle : « Je me suis toujours demandé comment cela se passerait si une espèce supérieure débarquait sur Terre et nous montrait comment elle jouait aux échecs », note l’un d’entre eux, Peter Heine Nielsen. « Maintenant je sais ».

Les résultats de cette étude sont disponibles sur le site de préimpression arXiv.

Source