Et si une intelligence artificielle pouvait accomplir en quelques jours ce que la nature met des centaines de millions d’années à réaliser ? C’est précisément ce qu’ont accompli des chercheurs avec la création d’une protéine fluorescente unique, appelée esmGFP, grâce à un modèle d’IA. Cette découverte, publiée récemment dans la revue Science, ouvre la voie à des avancées révolutionnaires dans les domaines de la biologie, de la médecine et de l’ingénierie des protéines. Mais comment cette prouesse a-t-elle été rendue possible et quelles en sont les implications ?
Les protéines, piliers de la vie
Pour comprendre l’importance de cette avancée, commençons par les bases : les protéines. Ces molécules complexes sont les véritables ouvrières de la vie. Elles construisent nos muscles, transportent l’oxygène dans notre sang, combattent les infections et orchestrent presque tous les processus biologiques. Chaque protéine est constituée d’une chaîne d’acides aminés repliée en une forme tridimensionnelle unique qui détermine sa fonction.
Certaines protéines, comme celles présentes chez les méduses et les coraux, ont une propriété fascinante : elles brillent sous certains types de lumière. Fluorescentes, elles sont connues sous le nom de GFP (Green Fluorescent Proteins) et sont devenues des outils essentiels dans les laboratoires. Les chercheurs les utilisent pour marquer et suivre des processus biologiques invisibles à l’œil nu, comme le déplacement des molécules dans une cellule.
Dans ce contexte, la découverte de la protéine esmGFP est un véritable exploit. Contrairement aux GFP naturelles, cette protéine n’existait pas dans la nature : elle a été conçue par une intelligence artificielle qui a simulé un demi-milliard d’années d’évolution moléculaire en quelques jours seulement.

L’intelligence artificielle au service de l’évolution
La création d’esmGFP repose sur une IA baptisée ESM3 qui a été développée par des chercheurs d’EvolutionaryScale. Ce modèle d’IA fonctionne de manière similaire à des outils comme ChatGPT, mais au lieu de traiter du langage humain, il manipule le « langage » des protéines.
Les chercheurs ont entraîné ESM3 en lui fournissant des données issues de 2,78 milliards de protéines naturelles. Ces dernières, trouvées dans différents organismes vivants, possèdent des séquences uniques d’acides aminés qui déterminent leur structure et leur fonction. L’IA a appris à analyser ces séquences pour comprendre leurs règles sous-jacentes.
Une fois entraînée, l’IA a été soumise à un défi : combler les lacunes dans des séquences protéiques incomplètes, un peu comme lorsqu’on devine des mots manquants dans une phrase familière. En résolvant ces problèmes, ESM3 a découvert des schémas d’évolution possibles, créant ainsi une protéine fonctionnelle qui n’existait pas encore.
Ce processus peut être comparé à une version accélérée de la sélection naturelle. Là où l’évolution aurait pris des millions d’années pour expérimenter et valider des mutations successives, l’IA a simulé ce processus en quelques jours. Le résultat, esmGFP, possède une structure unique, différente à 42 % des GFP les plus proches connues. Selon les chercheurs, il aurait fallu 500 millions d’années pour que cette protéine émerge naturellement.
Des applications prometteuses pour la science et la médecine
Les implications de cette avancée sont considérables. Les GFP, déjà utilisées dans les laboratoires, permettent de visualiser des processus biologiques en temps réel. Par exemple, elles peuvent marquer des cellules spécifiques ou suivre la progression de molécules dans un organisme. La nouvelle protéine esmGFP, avec sa séquence unique, pourrait élargir ces possibilités en offrant de nouvelles propriétés fluorescentes ou une meilleure stabilité dans certaines conditions.
Toutefois, les applications vont bien au-delà. Grâce à des outils comme ESM3, il devient possible de concevoir des protéines sur mesure pour des besoins spécifiques. Par exemple, des enzymes pourraient être créées pour dégrader des plastiques polluants ou pour produire des biocarburants plus efficaces. En médecine, ces technologies pourraient accélérer la découverte de nouveaux médicaments en créant des protéines capables de cibler des maladies avec une précision inédite.
Dans un monde confronté à des défis importants comme les crises sanitaires ou le changement climatique, cette capacité à concevoir des solutions biologiques rapidement et efficacement pourrait s’avérer précieuse.
Les limites et défis de cette approche
Malgré son potentiel, cette technologie soulève des questions. Les protéines conçues par l’IA, aussi prometteuses soient-elles, restent des produits de laboratoire. Comme le souligne Tiffany Taylor, biologiste évolutionniste à l’Université de Bath, l’approche de l’IA ne reproduit pas toutes les complexités de la sélection naturelle. Cette dernière intègre de nombreux facteurs écologiques, environnementaux et comportementaux qui influencent l’évolution des organismes vivants.
Par ailleurs, les découvertes comme esmGFP posent des questions éthiques et pratiques. Peut-on prévoir toutes les conséquences de l’introduction de protéines artificielles dans des systèmes naturels ou médicaux ? Et jusqu’où devons-nous aller dans notre volonté de « réinventer » la biologie ?
Malgré ces défis, il est indéniable que cette approche représente une révolution scientifique. Là où la nature suit un rythme lent, mais sûr, l’intelligence artificielle ouvre des chemins nouveaux en accélérant les processus évolutifs et en explorant des territoires encore inconnus.