Un film, un système d’exploitation et une carte-cadeau Amazon stockés dans un seul brin d’ADN

Crédits : iStock

Une équipe de chercheurs annonce avoir stocké six fichiers (y compris un court-métrage, tout un système d’exploitation d’ordinateur et une carte-cadeau Amazon) dans un seul brin d’ADN en atteignant une densité théorique record de 215 pétaoctets par gramme.

En approchant le maximum théorique pour les informations stockées par nucléotide, ces scientiques ouvrent ainsi de vraies pistes sur le stockage pérenne d’informations. Dans la revue Science, les chercheurs Yaniv Erlich et Dina Zielinksi et leur équipe ont en effet mis au point une nouvelle technique appelée ADN Fountain permettant un stockage théorique d’informations de 215 pétaoctets par gramme d’ADN et un nombre de lectures avant dégradation estimé à 10^15. Autant dire virtuellement illimité.

Dans le monde du vivant, l’ADN est prévu pour stocker, transporter et transmettre l’information, en l’occurrence le patrimoine génétique (génome). Cette information est stockée grâce à des paires de nucléotides : adénine (A), cytosine (C), guanine (G) et thymine (T). L’ensemble de l’information est donc représenté par une séquence de ces quatre lettres. Mais des erreurs peuvent survenir avec l’ADN et en ce sens, la technique utilisée doit être accompagnée d’une véritable tolérance aux erreurs.

La nouvelle technique ADN Fountain permet ici de générer des données supplémentaires pour les informations transmises par paquets. Plus on ajoute de données, plus la tolérance d’erreur devient grande, l’information réelle pouvant être reconstituée. Le processus commence avec un encodage tenant compte des « fountain codes ». En s’appuyant sur les nucléotides, les chercheurs obtiennent alors une grande quantité de petits paquets qui sont ensuite codés en séquences ADN. L’astuce est alors d’analyser le code obtenu et de retirer toutes les séquences qui pourraient poser des problèmes à la lecture. Puisque les données supplémentaires sont là en solution de secours, cette suppression n’a pas d’impact sur l’information.

Dans une archive compressée de 2,1 Mo, les chercheurs ont pu stocker un système d’exploitation minimal et son interface, un court-métrage français de 1895 (l’arrivée d’un train à La Ciotat), une carte-cadeau Amazon de 50 $ ainsi qu’un virus informatique, une plaque de Pioneer et les travaux universitaires du théoricien Claude Shannon. Mais le plus important était de tester si la fontaine de l’algorithme d’ADN était en mesure de pouvoir coder l’information binaire en données génétiques sans perdre aucune des informations. Tous les tests effectués ensuite par les chercheurs ont montré que le système fonctionnait très bien. Ils ont eux-mêmes inséré des erreurs ou encore supprimé aléatoirement des séquences d’ADN, mais l’information a quand même pu être restaurée à chaque fois.

Pourquoi ne pas construire dès demain des banques de stockage et passer au tout-ADN ? Parce qu’il y a bien sûr des limites et principalement une : le coût. La création de ces brins d’informations coûte actuellement une petite fortune : les chercheurs estiment la facture – très salée – à environ 3 500 dollars par Mo. La technique devra donc être affinée pour être un jour industrialisée.

Rappelons que le stockage de données d’ADN est non seulement un économiseur d’espace étonnant, mais aussi que la technique pourrait nous permettre de préserver les connaissances avec une extrême robustesse et la longévité à la différence des technologies traditionnelles qui succombent aujourd’hui à toutes sortes de défauts avec le temps. Les spécialistes estiment qu’il faudra encore attendre au moins une décennie avant que ce type de stockage ne devienne accessible au grand public.

Source