Le génome humain est enfin complètement séquencé

génome humain
Crédits : Vic_B/Pixabay

Lorsque les scientifiques ont déclaré avoir séquencé le génome humain il y a deux décennies, leur annonce était un peu prématurée. Si les chercheurs ont effectivement eu accès à la séquence d’ADN de la plupart des gènes codant pour les protéines, environ 8% de ce génome restaient toujours non séquencés à ce jour. C’est désormais chose faite. Or, ces derniers pourcentages, considérés autrefois comme de l’ADN « poubelle », contiennent plus que de simples déchets.

Le projet génome humain fut un programme lancé fin 1988 dont la mission était d’établir le séquençage complet de l’ADN du génome humain. Son « achèvement » fut annoncé le 14 avril 2003. Les guillemets sont ici de mise. À l’époque, les chercheurs avaient en effet terminé le plus gros du puzzle. Cependant, les limitations technologiques avaient empêché d’intégrer environ 15% de la séquence d’ADN humain dans le tableau.

La plupart des régions non cartographiées à l’époque étaient concentrées autour des télomères et des centromères. Les premiers sont les coiffes situées aux extrémités des chromosomes, tandis que les seconds sont les sections médianes densément emballées des chromosomes. En 2013, les chercheurs ont ensuite réduit cet écart à seulement 8 %, mais ils ne pouvaient toujours pas intégrer et placer environ 200 millions de paires de bases, soit l’équivalent d’un chromosome entier.

Plus récemment, un consortium dirigé par l’Institut national de recherche sur le génome humain, l’Université de Californie et l’Université de Washington a finalement réussi à cartographier le génome humain en entier. Ces travaux ont été publiés dans la revue Science.

Les difficultés du séquençage

Pour rappel, l’ADN est constitué de petites molécules appelées nucléotides, chacune contenant un groupe phosphate, une molécule de sucre et une base azotée. Les quatre types de bases azotées sont l’adénine, la thymine, la guanine et la cytosine. Toutes s’apparient pour former les échelons de la double hélice d’ADN qui code notre identité génétique. Deux brins de ces doubles hélices forment un chromosome et nous héritons de 23 paires de chromosomes de nos parents biologiques.

Ce matériel génétique est présent dans chacune de nos cellules. Chaque cellule lit alors les gènes qui la concernent. Par exemple, une cellule de la peau consulte l’information sur la texture et la couleur de la peau ou encore sur la quantité de poils, mais ne lit pas les instructions sur les yeux, le cœur ou l’estomac.

Concrètement, le séquençage de l’ADN est le processus visant à déterminer l’ordre des éléments constitutifs de la paire de bases dans une section d’ADN. Pour séquencer le génome humain au cours de ces dernières années, les chercheurs se sont appuyés sur des technologies à lecture courte. Ces dernières sont capables de scanner plusieurs centaines de paires de bases à la fois, les séparant en fragments d’ADN minuscules par rapport au génome entier beaucoup plus grand. Le projet était alors semblable à l’assemblage d’un puzzle de dix millions de pièces de ciel bleu, ce qui laissait beaucoup de lacunes.

Ces travaux étaient également difficiles dans la mesure où les deux chromosomes d’une paire de chromosomes provenaient de chaque parent, ce qui rendait la distinction entre les séquences d’ADN du même tronçon du génome plus difficile.

ADN génome
Crédits : mirerek8/Pixabay

Nouvelles techniques

Pour contourner ces difficultés, les chercheurs se sont ici tournés vers un étrange tissu humain qui se forme lorsqu’un spermatozoïde féconde un ovule sans noyau. Dans cette configuration, l’œuf n’est pas viable et se fixe à l’utérus pour se développer avec tous les chromosomes du père, mais aucun de la mère.

À partir de ce résultat, les chercheurs ont créé une lignée cellulaire contenant 23 paires de chromosomes provenant d’une seule personne. Ils ont ensuite utilisé de nouvelles techniques pour séquencer cet ADN. Ces nouvelles techniques dites « à lecture longue » utilisent des lasers pour scanner 20 000 à un million de paires de bases à la fois, créant des pièces de puzzle beaucoup plus grandes, ce qui a permis de réduire les écarts auparavant constatés. Pour résumer, ces travaux très compliqués ont donc permis de combler les « trous » dans les séquences que la technologie de l’époque était incapable de compléter.

Le fait de disposer d’une séquence complète permettra aux chercheurs d’étudier des régions autrefois inaccessibles. Or, ces dernières pourraient abriter des mutations complexes de l’ADN contenant des indices sur certaines maladies.