Cette IA peut prédire la structure de toutes les protéines de l’Univers

protéines
Crédits : Christoph Burgstedt/istock

L’annonce de DeepMind concernant la sortie de la troisième version de son logiciel AlphaFold marque une avancée majeure dans le domaine de la biologie structurale et de l’intelligence artificielle (IA). AlphaFold3, basé sur l’apprentissage automatique, vise à modéliser de manière précise la façon dont les protéines se replient, ouvrant ainsi la porte à une meilleure compréhension des processus biologiques fondamentaux.

La complexité de la prédiction des structures trotéiques

Les protéines sont des chaînes d’acides aminés qui doivent se replier en une forme tridimensionnelle précise pour exercer leurs fonctions biologiques spécifiques. Ce processus de repliement est fondamental pour la vie, car il détermine la manière dont les protéines interagissent avec d’autres molécules et accomplissent des tâches essentielles, telles que la catalyse enzymatique, le transport des molécules, la signalisation cellulaire et la réponse immunitaire.  Comprendre leur structure tridimensionnelle est ainsi crucial pour saisir comment elles fonctionnent au niveau moléculaire. Cependant, la prédire à partir de sa séquence d’acides aminés est un défi scientifique majeur.

La séquence d’acides aminés, aussi connue sous le nom de séquence primaire, se présente en effet comme une longue chaîne linéaire qui doit se plier dans une configuration complexe et unique pour devenir fonctionnelle. Le processus de repliement est influencé par des forces chimiques et physiques variées, telles que les interactions hydrophobes, les liaisons hydrogène et les forces de Van der Waals. De plus, le repliement se produit dans un environnement cellulaire complexe où des interactions avec d’autres molécules et conditions locales peuvent également jouer un rôle. Les protéines peuvent donc adopter une vaste diversité de structures. En outre, de petites variations dans la séquence d’acides aminés peuvent conduire à des différences significatives dans la structure finale.

Les défis de la prédiction par modélisation

Cette complexité a longtemps rendu difficile la prédiction précise des structures protéiques à partir de la seule séquence primaire. Traditionnellement, des techniques expérimentales telles que la cristallographie aux rayons X, la résonance magnétique nucléaire (RMN) et la cryomicroscopie électronique ont été utilisées pour déterminer les structures des protéines. Bien que ces méthodes fournissent des informations détaillées, elles sont coûteuses, laborieuses et souvent limitées à des types spécifiques de protéines.

Les approches computationnelles pour la prédiction des structures protéiques ont tenté de combler cette lacune. Des méthodes comme l’homologie de modélisation, où la structure d’une protéine est prédite en se basant sur la similitude de séquence avec des protéines de structure connue, et les simulations de dynamique moléculaire, qui utilisent les principes de la physique pour simuler le repliement des protéines, ont été développées. Cependant, ces méthodes ont des limites significatives en termes de précision et de portée. Le développement de l’intelligence artificielle (IA) a cependant offert de nouvelles perspectives dans ce domaine.

protéines AlphaFold3
Crédits : CHRISTOPH BURGTEDT

La puissance d’AlphaFold3

AlphaFold, développé par DeepMind, est un logiciel conçu justement pour modéliser le repliement des protéines. Jusqu’à présent, les versions précédentes se concentraient principalement sur la prédiction des structures de protéines. Plus récemment, DeepMind a toutefois développé une nouvelle version (AlphaFold3) qui permet également de prédire comment ces protéines interagissent avec d’autres molécules biologiques telles que l’ADN, l’ARN et les ligands.

Pour rappel, les ligands sont des molécules qui se lient spécifiquement à une protéine cible, formant ainsi un complexe ligand-protéine. Ces molécules peuvent être de différentes natures chimiques, allant des petites molécules organiques aux ions métalliques en passant par les macromolécules comme les polysaccharides. Dans le contexte de la biologie structurale, les ligands sont souvent des molécules régulatrices ou des médiateurs biologiques qui interagissent avec les protéines pour réguler leur activité. Par exemple, dans le domaine de la pharmacologie, les ligands sont souvent des composés chimiques conçus pour se lier à des protéines cibles spécifiques, comme les récepteurs cellulaires, afin de moduler leur fonction et de traiter des maladies.

Cette capacité élargie du programme AlphaFold, jugé 50 % plus précis que les méthodes logicielles actuelles dans la prédiction des structures protéiques et de leurs interactions, ouvre ainsi de nouvelles possibilités dans des domaines variés tels que la médecine, l’agriculture et la biotechnologie.

Cependant, une limitation importante est que contrairement à ses prédécesseurs, AlphaFold3 n’est pas open source, ce qui signifie que les chercheurs ne peuvent pas accéder publiquement à son code ou à ses données de formation. Cela pourrait limiter la capacité de la communauté scientifique à personnaliser le modèle ou à utiliser le logiciel pour des travaux de recherche spécifiques.

Néanmoins, les chercheurs non commerciaux peuvent toujours accéder à AlphaFold3 grâce au serveur AlphaFold de DeepMind qui leur permet de soumettre des séquences moléculaires et d’obtenir des prédictions sur la structure des protéines en quelques minutes. En revanche, il existe une limite de vingt tâches par jour, ce qui pourrait limiter son utilisation intensive dans certaines situations de recherche.