• Aucun résultat trouvé

Article 22. Crise du stockage: conserver les molécules d'ADN ou les données informatiques de l'ADN ?

N/A
N/A
Protected

Academic year: 2021

Partager "Article 22. Crise du stockage: conserver les molécules d'ADN ou les données informatiques de l'ADN ?"

Copied!
3
0
0

Texte intégral

(1)

HAL Id: hal-02397731

https://hal.archives-ouvertes.fr/hal-02397731

Submitted on 21 Dec 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Article 22. Crise du stockage: conserver les molécules

d’ADN ou les données informatiques de l’ADN ?

Dominique Joly, Guy Perriere

To cite this version:

Dominique Joly, Guy Perriere. Article 22. Crise du stockage: conserver les molécules d’ADN ou les données informatiques de l’ADN ?. 101 Secrets de l’ADN. CNRS Editions, Paris, pp 90-91, pp.90-91, 2019. �hal-02397731�

(2)

22. Crise du stockage : conserver les molécules d’ADN ou les données

informatiques de l’ADN ?

Dominique Joly, Evolution, Génomes, Comportement et Ecologie (EGCE, Gif-sur-Yvette) et Guy Perrière, Biologie Biométrie Evolutives (LBBE, Lyon)

Le séquençage ADN à haut débit pose la question du volume de mémoire nécessaire au stockage des données et de leur conservation. Des besoins urgents de nouveaux

développements en capacité de calcul, de stockage et d’archivage nécessitent un changement des pratiques du traitement des données.

Grâce aux méthodes omiques, les analyses à haut débit les molécules du vivant (ADN, ARN, protéines et métabolites) dans des échantillons environnementaux et humains ont engendré une forte augmentation des besoins de traitement, de stockage et d’archivage des données. En 10 ans, la grande campagne océanographique Tara Océans a collecté 60 000 échantillons d’eau de mer, généré 1 milliard de codes-barres de taxons inconnus, identifié 100 000 nouvelles espèces de protistes et 100 millions de gènes. Le projet international Earth Microbiome visant à connaitre la diversité microbienne a produit, à partir des premiers 135 échantillons analysés, environ 28,8 milliards de séquences, soit environ 10 Téra-bytes (1013

bytes) de données et 23,3 milliards de séquences protéiques prédites. Le programme international de médecine personnalisée (IC PerMed), qui permettra d’améliorer le diagnostic des maladies rares, prévoit de séquencer 100 000 génomes humains, donc de produire plusieurs dizaines de péta-octets (1015 octets) de données par an.

Tous ces grands projets produisent des océans de séquences à gérer, à assembler et à comparer. En plus des données résultant du séquençage ADN, il est nécessaire de conserver l’ensemble des métadonnées qui caractérisent l’échantillon (données spatio-temporelle, physico-chimiques, sociologiques …). Alors que le coût de séquençage ADN a diminué d’un facteur 105 en 20 ans (100 millions de dollars pour un génome en 2001 contre 1000 dollars

aujourd’hui), les capacités informatiques n’ont doublé que tous les 2 ans. Que faire ? Un compromis est nécessaire entre l’intérêt de stocker les données et la récupération de l’espace mémoire pour stocker de nouvelles données. Une première approche est le tri des données pour éliminer les données inutiles et non exploitables. Une autre approche est de développer le cloud computing en coordination avec les systèmes de calcul haute

performance bien connu du monde de la physique. Il s’agit d’améliorer la performance en termes de calcul et d’entrées/sorties des données, ainsi que d’adaptation aux variations de la demande. GenBank, la principale banque de stockage mondiale de données génomique, utilise déjà cette approche. Reste le problème de la bande passante pour accéder au cloud, qui est souvent limitante.

La conservation des molécules d’ADN au lieu des séquences informatique est également une alternative. Elle a l’avantage de s’affranchir des technologies de séquençage qui évoluent rapidement. L’ADN est communément stocké au froid entre -20°C et -80°C. Le Genopôle d’Evry a élaboré une méthode alternative dans des mini-capsules métalliques et

(3)

animal, végétal, microorganismes) à température ambiante et à l’abri des facteurs d’altération, sous une forme compatible avec un séquençage ultérieur.

L’entrée de l’ADN dans la révolution du Big Data induit un changement inédit de pratiques technologiques et scientifiques.

Des plaques de mini-capsules permettant de conserver de l’ADN et de l’ARN, de façon durable, à température ambiante. Photographie : www.imagene.eu.

Références

Documents relatifs

Diérentes méthodes de recherche locale existent dans la littérature, nous avons vu la méthode du gradient, qui est une méthode déterministe, mais qui nécessite de trop

De plus, la juxtaposition des quantités d’ARN et d’ADN trouvées chez les oeufs à diapause, alors qu’ils ont repris leur développement et chez les oeufs

Rappel : L’ADN nucléaire est à l’origine d’un « messager »On suspecte que cela pourrait être l'ARN,molécule présente dans le cytoplasme et dans le noyau..

Applications: L'écologie des bactéries, levures et moisissures a été étudié sur le Karité et le Physalis, plantes et fruits de différentes zones géographiques aux forts

Chaque chromosome est composé d'une seule molécule d'ADN linéaire (dans une cellule on a 46 molécules d’ADN) excessivement longue associée à des protéines qui replient

Il a été montré par hybridation in situ que ces séquences ne se répartissent pas au hasard le long des chromosomes humains, mais sui- vent une distribution caractéristique

S'il est révoqué avant cette date par l'un des signataires, il ne restera valable jusqu'à la date susmentionnée que pour les transpmis sur les territoires des Parties

On compare les séquences du gène de la ß globine humaine et l’ARN mature présent dans le cytoplasme (qui contient les informations nécessaires à la synthèse de la protéine) : on