Des informaticiens ont mis au point un algorithme capable de battre n’importe qui au poker

Crédits : NGi / Pixabay

Des informaticiens de l’UniversitĂ© d’Alberta sont parvenus Ă  crĂ©er un programme informatique capable de « rĂ©soudre » le problème du poker hold’hem. Face Ă  lui, vous n’avez aucune chance, il vous battra sur le long terme.

Des logiciels imbattables ont déjà été mis au point pour nombre de jeux, l’exemple le plus notable étant certainement la victoire de Deep Blue d’IBM contre le champion d’échec Garry Kasparov en 1997. Mais les jeux comme les échecs sont des jeux d’information parfaite. C’est-à-dire que les deux joueurs connaissent parfaitement l’état du jeu à un moment donné. Ce n’est bien entendu pas le cas au poker, qui repose justement sur le fait qu’aucun joueur ne connait la main des autres.

Le petit nom de ce programme est Cepheus. Il est donc capable de prendre à chaque instant la décision optimale, et ainsi de maximiser ses chances de gagner. Mieux que ça , la stratégie qu’il adopte est la meilleure possible. C’est-à-dire qu’il ne peut tout simplement pas perdre, statistiquement parlant. Bien sûr, comme le jeu en question repose aussi en grande partie sur la chance, Cepheus n’a pas la garantie de gagner chaque manche. Mais sur le long terme, il est assuré de gagner de l’argent, même si un coup de malchance pourrait l’éliminer des tournois.

Pour en arriver là, il a dû s’entrainer en jouant des milliards de parties de poker contre lui-même. Il a été initialement programmé uniquement avec les règles du jeu, et a commencé à jouer en prenant des décisions au hasard. Chaque erreur qu’il faisait était ajoutée à une liste de regrets, qui correspondait à des cas où il aurait pu prendre une décision différente, avec un meilleur résultat à la clé. En faisant tendre le nombre de ces regrets vers zéro, les Cepheus a réussi à minimiser ses erreurs, et à s’approcher du jeu parfait.

La méthode d’apprentissage utilisée par Cepheus n’est pas seulement utile pour jouer aux cartes. Cette méthode permet en effet d’automatiser la prise de décisions dans l’incertitude. Le modèle qu’il utilise pour gagner au poker peut aussi l’être pour mieux juger les risques, que ce soit dans le domaine de la météo, des protections sismiques ou même de la politique internationale.

Source : Science