L’intelligence artificielle sera-t-elle à court de données dès 2026 ?

IA humain données
Crédits : Guillaume / iStock

ChatGPT et les autres agents conversationnels pourraient bien manquer de carburant dans les années à venir. Or, ce carburant est principalement incarné par les données textuelles de haute qualité, les données d’image et les données linguistiques utilisées par l’intelligence artificielle.

Un sérieux problème à venir pour l’intelligence artificielle

Certains experts promettent un boom de croissance économique énorme dans les années à venir grâce aux intelligences artificielles. Toutefois, cette technologie devrait très bientôt faire face à un problème très préoccupant, comme l’explique Rita Matulionyte, experte en droit de la propriété intellectuelle et des technologies de l’information dans une publication de The Conversation le 7 novembre 2023.

Les travaux sur lesquels se base cette experte de l’Université Macquarie à Sydney (Australie) ont été publiés sur la plateforme arXiv en octobre 2022 par l’institut de recherche Epoch AI. Cette étude s’intéressait aux limites de la mise à l’échelle des ensembles de données en matière d’apprentissage automatique. Notez que cette publication a pour l’heure seulement fait l’objet d’une prépublication et n’a donc pas encore été validée par des pairs.

Cela lui a toutefois permis d’affirmer que les données textuelles de haute qualité manqueront aux IA avant 2026. Ces données sont principalement issues d’articles de presse, d’articles scientifiques et de pages Wikipédia. Rita Matulionyte évoque également les données linguistiques de faible qualité (issues des réseaux sociaux et des commentaires) ainsi que les données d’image de faible qualité qui devraient commencer à manquer dès 2030, au plus tard vers 2060.

ChatGPT
Crédits : Galeanu Mihai / iStock

Les acteurs du secteur devront agir

Rita Matulionyte pense que dans ce futur cadre, les développeurs devraient perfectionner leurs algorithmes. L’objectif ? Utiliser les données de manière plus efficace tout en réduisant l’empreinte carbone de cette technologie. Il serait également possible d’utiliser l’IA pour créer des données synthétiques afin de former des systèmes. De plus, ces programmes pourraient bénéficier de nouvelles matières avec la numérisation d’œuvres publiées avant l’arrivée d’Internet. Ainsi, le boom économique que promettent certains observateurs ne serait pas forcément remis en cause.

En revanche, l’experte souligne aussi que les responsables des IA comme les décideurs politiques devront régler un autre problème assez important : la rémunération des auteurs et des artistes. Or, cette question concernant les droits d’auteur ne plaît pas vraiment aux entreprises du secteur. En effet, elles aimeraient profiter des œuvres gratuitement.

Enfin, rappelons que le secteur de l’IA rencontre des difficultés liées directement avec le développement durable. En effet, les intelligences artificielles consomment énormément de ressources, notamment de l’électricité et de l’eau en quantités phénoménales.