Comment savoir si une intelligence artificielle a utilisé une photo de vous ?

homme
Crédits : Mirel Kipioro / iStock

Si les images que produisent les IA pullulent de plus en plus sur Internet, les sources des photos permettant d’entraîner les algorithmes posent parfois problème. Désormais, il existe une plateforme en ligne permettant de savoir si une ou plusieurs de vos photos figurent dans la plus importante base de données d’images publiques à laquelle les IA ont souvent recours.

Une base contenant 5,8 milliards d’images

Le progression des intelligences artificielles est réellement effective depuis l’apparition de l’apprentissage profond (deep learning). Il est désormais question de réseaux neuronaux apprenant à effectuer des tâches de manière autonome, avec un objectif à atteindre en l’absence d’autres informations. Concernant les images, il peut s’agir de générer des deepfakes ou encore des images en partant de simple phrases.

Mais pour obtenir des résultats probants, l’entraînement des algorithmes à l’aide de bases de données est indispensable. Concernant les images, la base de données publique la plus imposante n’est autre que Laion-5B. Celle-ci contient la bagatelle de 5,8 milliards d’images environ. Or, si les images sont censées provenir de sources libres de droits, ce n’est pas le cas d’un certain nombre d’entre elles. Et si une IA utilisait des photos de vous pour s’entraîner ?

Une vérification très facile

Dévoilée par plusieurs médias dont Techcrunch dans un article du 22 septembre 2022, la plateforme Have I Been Trained? a pour objectif d’effectuer des recherches dans la fameuse base de données Laion-5B. À l’origine, le site a été créé pour les artistes et photographes afin que ces derniers puissent découvrir si leurs oeuvres ont été utilisées. Toutefois, n’importe qui peut effectuer une recherche afin de savoir si ses propres photos figurent dans la base. Le processus est d’ailleurs très simple car il suffit de taper son nom ou encore d’utiliser une photo. Selon la plateforme, les photos chargées pour effectuer une recherche ne sont pas conservées.

plateforme IA
Crédits : haveibeentrained.com

Il s’avère que la base de données Laion-5B est source d’interrogations. Par exemple, une femme y a retrouvé des photos prises par son médecin après plusieurs chirurgies de sa mâchoire. Évidemment, il s’agit de photos qui n’auraient jamais du fuiter de son dossier médical. Cependant, il est utile de souligner que Laion-5B ne contient pas directement des images. En effet, la base communique des liens vers d’autres plateformes où se trouvent les images. Ainsi, il est très facile de retrouver leur source. En cas de problème, la meilleure chose à faire est donc de contacter les responsables du site source afin de demander un retrait.