Il demande à une intelligence artificielle de détruire l’humanité

capture ChaosGPT
Crédits : capture YouTube / ChaosGPT

Un internaute a eu recours au projet open source Auto-GPT afin de mettre sur pied le projet de détruire l’humanité. Si ce même projet n’a rien de létal et peut même prêter à sourire, le contenu et l’attitude de l’IA peuvent faire tout de même un peu peur.

Quand Auto-GPT devient ChaosGPT

Auto-GPT est une application Python expérimentale et open source utilisant GPT-4 pour agir de manière autonome. Ainsi, l’IA peut effectuer une ou plusieurs tâches avec peu d’intervention humaine. Par exemple, un utilisateur peut annoncer un objectif final et l’IA générera toutes les invites nécessaires pour mener sa mission. Ainsi, Auto-GPT peut faire beaucoup de choses que ChatGPT ne peut pas faire comme fonctionner en mode continu et se montrer actif jusqu’à l’accomplissement de sa tâche.

Dans une vidéo publiée sur YouTube le 6 avril 2023 (voir en fin d’article), un internaute a utilisé Auto-GPT. Or, cette intelligence artificielle, qui a finalement pris le nom de ChaosGPT, a reçu une série de commandes lui ordonnant de détruire l’humanité et d’assurer sa propre survie. La vidéo d’une vingtaine de minutes montre comment l’IA décrit ses « pensées » ainsi que sa manière de travailler pour accomplir sa mission.

Chercher les armes les plus mortelles

Dans un premier temps, ChaosGPT a effectué une recherche sur Google afin de savoir quelles étaient les armes existantes les plus destructrices. Cette enquête a ainsi permis à l’IA de conclure que la Tsar Bomba, bombe atomique russe testée dans les années 1960, était la plus appropriée pour détruire l’humanité. Dans un second temps, ChaosGPT a recruté un agent alimenté par GPT-3.5 dans le but d’effectuer davantage de recherches sur des armes encore plus mortelles. Néanmoins, l’agent en question souhaitait seulement œuvrer pour la paix et ne s’est pas exécuté. L’IA a ensuite essayé de tromper un second agent, sans succès.

À ce jour, ChaosGPT n’a pas encore élaboré de plan permettant de réellement détruire l’humanité. En revanche, l’IA est très active sur son compte Twitter, publiant des commentaires et répondant aux humains osant interagir avec elle. Cette dernière a clairement indiqué vouloir atteindre ses objectifs de chaos, de destruction, de domination et d’immortalité.

capture Twitter ChaosGPT
Crédits : capture écran Twitter / ChaosGPT

Cette expérience montre les capacités impressionnantes d’Auto-GPT, mais aussi la logique interne de certains chatbots. Pour les instigateurs du projet, les dangers des IA ne viendraient pas de ce genre d’expérience, mais plutôt de scénarios comme le « maximiseur de trombones ». Un tel scénario verrait une IA si déterminée pour accomplir sa tâche qu’elle serait capable d’utiliser toutes les ressources disponibles sur Terre, allant jusqu’à asservir l’humanité où même la réduire en matière première.