Un chercheur déterre des séquences génétiques du SARS-CoV-2 supprimées l'année dernière

En juin 2020, les séquences génétiques de 241 échantillons de virus prélevés à Wuhan au début de l’épidémie ont disparu d’une base de données scientifique en ligne. En analysant des fichiers stockés sur Google Cloud, Jesse Bloom, virologue de l’Université de Seattle, souligne avoir pu en récupérer treize.

Ces séquences génétiques avaient disparu d’une base de données en ligne nommée Sequence Read Archive, gérée par les National Institutes of Health (NIH). Le Dr Bloom, virologue de l’Université de Seattle, explique avoir remarqué leur absence en analysant une feuille de calcul disponible dans une étude publiée en mai 2020 dans la revue PeerJ. Au cours de ces travaux, les auteurs avaient répertorié 241 séquences génétiques du SRAS-CoV-2 jusqu’à fin mars 2020 dans le cadre d’un projet de l’Université de Wuhan.

Cette fameuse feuille de calcul indiquait que les auteurs de l’étude avaient téléchargé leurs séquences dans la base de données. Or, en tapant ces informations dans la barre de recherche, le chercheur ne les a pas trouvées.

Il n’y avait « aucune raison scientifique » de les supprimer

Au cours de son travail d’enquête, le chercheur a ensuite souligné que ces 241 séquences supprimées avaient été collectées par le Dr Aisu Fu, de l’hôpital Renmin de Wuhan.

En parcourant la littérature scientifique, Bloom est alors tombé sur une « version préimpression » d’une autre étude menée en mars 2020 par ce même chercheur. Publiée trois mois plus tard dans la revue Small, cette étude se concentrait sur les mutations spécifiques de virus isolées dans 45 écouvillons nasaux prélevés sur des patients ambulatoires à Wuhan (pas de zone précisée) au début de l’épidémie (pas de date précisée).

Cela dit, pour le Dr Bloom, ces échantillons étaient probablement la source des fameux 241 séquences manquantes. Il s’est ensuite aperçu que le Sequence Read Archive sauvegardait des informations sur Google Cloud. Grâce à ces données, il explique avoir finalement pu récupérer treize des 241 séquences supprimées au départ.

Cette nouvelle étude, qui n’a pas encore été évaluée par des pairs, pose naturellement des questions sur les raisons pour lesquelles ces séquences originales ont été supprimées. Pour Jesse Bloom, les chercheurs n’avaient « aucune raison scientifique de le faire« . Il semble donc probable selon lui que ces séquences ont été « supprimées pour masquer leur existence« .

chauves-souris virus — Crédits : 13848407/Pixabay

Remonter à l’origine

Ces données pourraient s’avérer très précieuses dans les efforts visant à remonter jusqu’à l’origine du virus. Afin de la déterminer, les chercheurs doivent en effet isoler le « premier virus » à partir duquel sont nées toutes les autres souches. Jusqu’à présent, les premières séquences avaient été principalement échantillonnées à partir de cas enregistrés en décembre 2019 sur le marché Huanan à Wuhan, longtemps considéré comme le point de départ de l’épidémie. Or, les premières séquences génétiques isolées depuis ce marché comprenaient trois mutations absentes de certaines séquences de virus échantillonnées des semaines plus tard en dehors du marché. Ici, les séquences retrouvées par Jesse Bloom étaient également dépourvues de ces mutations.

Dans le Times, le chercheur souligne que cette nouvelle annonce ne renforce ni n’écarte l’hypothèse selon laquelle le SARS-C-V-2 pourrait avoir fui d’un laboratoire P4. D’ailleurs, les virus dépourvus de ces trois mutations correspondent plus étroitement aux coronavirus trouvés chez les chauves-souris en fer à cheval, que beaucoup soupçonnent être à l’origine de la pandémie.

En revanche, elle renforce les suggestions antérieures selon lesquelles ce virus pourrait avoir circulé à Wuhan avant les premières déclarations officielles en décembre 2019 (puisque ceux de Wuhan avaient déjà muté). L’emploi du conditionnel se justifie dans la mesure où l’on ignore précisément où et quand les échantillons reliés à ces séquences génétiques récupérées ont été collectées. Or, ces informations évidemment cruciales pour retracer le virus jusqu’à son origine.