Cette IA a appris à piloter une voiture autonome en un temps record !

voiture autonome I.A wayve
Crédits : capture Youtube / Wayve

Une vingtaine de minutes auront suffit à cette intelligence artificielle pour apprendre à conduire un véhicule autonome. La start-up à l’origine du projet a utilisé une méthode d’apprentissage par renforcement.

Former une intelligence artificielle à la conduite automobile en un temps record ? Wayve, une start-up créée par des doctorants de l’Université de Cambridge (Royaume-Uni), l’a fait ! À savoir que leur méthode est également différente de ce qui se fait actuellement.

En effet, les voitures autonomes reposent habituellement sur une multitude de capteurs ultrasons, de capteurs LIDAR ainsi que de caméras. Le but ? Cartographier leur environnement et éviter un maximum les obstacles en temps réel. L’apprentissage de la conduite est donc une procédure prenant un certain temps.

La start-up Wayve procède différemment, dans la mesure où celle-ci a développé une intelligence artificielle ayant appris la conduite sans connaissances acquises au préalable. Selon les chercheurs, celle-ci se serait simplement basée sur des expérimentations empiriques inspirées du processus d’apprentissage des humains. C’est ainsi que l’IA en question a eu besoin de seulement vingt minutes – et tout autant de tentatives – pour savoir manœuvrer un véhicule et maintenir ce dernier sur la route, comme en témoignent les images publiées le 2 juillet 2018 et visibles en fin d’article.

L’IA, qui n’avait que les repères disponibles via les images d’une seule et unique caméra, a notamment appris grâce aux corrections d’un conducteur qui gérait les écarts de trajectoire causés par le logiciel en stoppant le véhicule. Une logique de pénalité (intervention humaine) et de récompense (distance maximale parcourue sans correction) a donc été suivie, ce qui a permis les progrès rapides de l’IA.

Cette dernière est d’ailleurs composée d’un réseau neuronal convolutif multicouches utilisant le reinforcement learning (ou apprentissage par renforcement). Le but de ce dernier est d’apprendre à partir d’expériences, de façon à optimiser une récompense quantitative au cours du temps. Il s’agit d’une méthode faisant de plus en plus de bruit, comme récemment lorsque DeepMind l’a utilisée pour apprendre à une IA à jouer au jeu vidéo Quake II Arena en multijoueur.

Sources : Tech Crunch – Futura Sciences

Articles liés :

Cette voiture autonome est capable d’arpenter des chemins non cartographiés !

En seulement 4 heures, une I.A. est parvenue à maîtriser toutes les connaissances en matières d’échecs

La dernière IA de Google capable “d’inventer ses propres mathématiques”