• Aucun résultat trouvé

Chapitre 1 : Partie bibliographique

II. Bio-informatique

4. Les techniques "omiques"

L'ajout "omiques" à un terme moléculaire implique une évaluation complète ou globale d'un ensemble de molécules (http://omics.org/). Le domaine de "omique" repose en grande partie sur les progrès technologiques qui ont rendu possible une analyse rentable et à haut débit des molécules biologiques (Hasin, Seldin, et Lusis 2017).

Les bio-informaticiens et les biologistes moléculaires ont figuré parmi les premiers scientifiques à appliquer les techniques "omiques". Parmi les premiers utilisateurs, il y avait des bio-informaticiens à Cambridge, au Royaume-Uni, où se trouvaient de nombreux premiers laboratoires de bio-informatique tels que le centre MRC, le centre Sanger et le EBI (European Bioinformatics Institute). Par exemple, le centre MRC a réalisé les premiers projets sur le génome et le protéome. Les techniques "omiques" comprennent plusieurs approches tel que l'épigénomique, la génomique, la transcriptomique, la protéomique et la métabolomique (Fröhlich 2017).

4.1. La Génomique

La première discipline "omique" apparue était la génomique, elle est basée sur l'étude de gènes entiers, par opposition à la génétique qui interrogeait des variantes individuelles ou des gènes individuels (Hasin, Seldin, et Lusis 2017). La génomique est une science récente en pleine expansion, qui permet l’étude de l’ensemble de l’information génétique d’un organisme afin de comprendre le fonctionnement de l’organisme humain et sur certaines maladies héréditaire (Makarova et Koonin 2007). C’est une discipline qui implique le séquençage de grandes quantités d’ADN, une technique utilisée lors des diagnostics de maladies et produit une énorme quantité de données. La génomique utilise une combinaison d'ADN recombinant, de méthodes de séquençage d'ADN et de bio-informatique pour séquencer, assembler et analyser la structure et la fonction des génomes.

L’analyse génomique se compose de trois étapes primordiales : le séquençage de l’ADN à haut débit, l’assemblage et l’annotation.

a. L’assemblage est une étape d’analyse in silico nécessaire après le séquençage, elle consiste à reconstituer un génome en identifiant les reads chevauchants, et les groupés en contigs3 ou scaffolds4. L'assemblage peut être globalement divisé en deux approches

3 Contigs : Séquence sans gaps obtenue par chevauchement des séquences courtes générées par le séquenceur.

: l'assemblage de novo, pour les nouveaux génomes qui sont séquencé pour la première fois et ne ressemblent à aucun séquencé dans le passé, et l'assemblage par référence, qui utilise la séquence existante d'un organisme étroitement apparenté comme référence lors de l'assemblage (Miller, Koren, et Sutton 2010).

b. L’annotation du génome consiste à identifier les emplacements des gènes et toutes les régions codantes et déterminer la fonction de ces gènes par une approche in silico, en utilisant des outils bio-informatiques dotés de fonctionnalités spécifiques (Koonin et Galperin 2003), qui distinguent trois types d’annotation :

§ L’annotation syntaxique (structurale) permet d’identifier les objets génétique, l’essentiel de ces objets sont les séquences codant des protéines, des molécules d’ARN (ARNt, ARNr, ARNsn, …), les pseudo-gènes, les retrotransposons, certaines séquences répétées et séquences régulatrices de l’expression des gènes peuvent également être détectées grâce à leurs motifs structuraux particuliers (de Sá et al. 2018).

§ L’annotation fonctionnelle se base sur la recherche d’homologie des objets génétiques identifiés considérés inconnues avec des séquences annotées et répertoriées dans les banques de données biologiques (NCBI, EMBL, DDBJ), afin de collecter plusieurs informations utiles pour prédire et comprendre leurs fonctions (de Sá et al. 2018).

§ L’annotation relationnelle détermine plusieurs relations susceptibles d’exister entre les éléments génétiques prédits tel que l’homologie, l’interaction physique et l’implication dans un processus biologique (même voie métabolique, même voie de transport,…) (de Sá et al. 2018).

4.2. L’épigénomique

L'épigénomique est l'étude de l'ensemble complet de modifications épigénétiques sur le matériel génétique d'une cellule, appelé épigénome. Le domaine est analogue à la génomique et à la protéomique. Les modifications épigénétiques sont des modifications réversibles de l'ADN d'une cellule ou d'histones affectant l'expression des gènes sans modifier la séquence de l'ADN. La maintenance épigénomique est un processus continu qui joue un rôle important dans la stabilité des génomes eucaryotes en participant à des mécanismes biologiques cruciaux tels que la réparation de l'ADN (Russell PJ 2010).

4.3. La protéomique

La protéomique est l'étude des protéomes5, qui sont les collections de protéines exprimées dans les cellules. Alors que les génomes sont essentiellement invariants dans différentes cellules d'un organisme, les protéomes varient d'une cellule à l'autre, avec le temps et en fonction des stimuli environnementaux et du stress (Liebler 2002). Cette approche permet d’identifier de manière globale les protéines extraites d’une culture cellulaire, d’un tissu ou d’un fluide biologique, leur localisation dans les compartiments cellulaires, leur quantité et leurs modifications post-traductionnelles6. La protéomique tente de déterminer toutes les propriétés biochimiques et physiques des protéines, telles que le poids moléculaire, le pHi, les séquences de protéines et les structures tridimensionnelles (Kratchmarova et al. 2002).

4.4. La transcriptomique

La transcriptomique est l’un des domaines les plus développés de l’ère post-génomique, qui repose sur l’analyse du transcriptome7 qui comprend l'ARN messager, l'ARN de transfert, l'ARN ribosomal et d'autres ARN non codants. La Transcriptomique se concentre sur l'expression des gènes au niveau de l'ARN et offre des informations à l'échelle du génome sur la structure et la fonction des gènes afin de révéler les mécanismes moléculaires impliqués dans des processus biologiques spécifiques. La première technologie utilisée est basée sur les puces à ADN "MicroArray", qui permet d’analyser un répertoire large de transcrits non exhaustif. La seconde approche, est le séquençage à haut débit du transcriptome (RNA-seq) qui a progressivement permis d’étudier un plus grand nombre d’informations, tel que l’expression de gènes, l’analyse des ARN non-codants (miRNA, IncRNA, etc) et le mécanisme d’épissage alternatif.

Après le séquençage du génome, l'analyse du transcriptome permet de comprendre l'expression du génome au niveau de la transcription, ce qui fournit des informations sur la structure des gènes, la régulation de l'expression des gènes, la fonction du produit du gène et la dynamique du génome. L'analyse du transcriptome révélera en outre le réseau de régulation

5 Protéomes : Ensemble des protéines d’une cellule, d’un tissu, d’un organite, d’un organe ou d’un organisme à un temps "t" et sous des conditions spécifiques.

6Une modification post-traductionnelle est une modification chimique d'une protéine, réalisée le plus souvent par une enzyme, après sa synthèse ou au cours de sa vie dans la cellule.

7 Le transcriptome est défini comme l’ensemble des transcrits présents dans une cellule à un moment donné et dans des conditions données

des processus biologiques et finira par donner des indications sur le diagnostic des maladies, le traitement clinique et l'amélioration des cultures.

Documents relatifs