• Aucun résultat trouvé

CHAPITRE I Revue bibliographique

I. 1.2.5.1 Le séquençage de novo

Il s’agit du séquençage d’un génome pour lequel il n’existe pas de séquence référence, donc détermination d’une séquence inconnue. Pour réussir à obtenir des versions de génome de bonne qualité, il est souvent nécessaire de combiner plusieurs méthodes. Le pyroséquençage permet grâce à des lectures longues de construire une première version du squelette du génome quand les méthodes par terminateurs réversibles vont corriger les erreurs présentes dans cette première reconstruction pour produire un brouillon du génome de qualité. Dans le domaine médical ces outils sont utilisés pour la découverte de génomes d’agents pathogènes inconnus ou de nouveaux virus (Gaynor et al., 2007).

I.1.2.5.2 Le reséquençage

Dans les études de génomes, le terme de reséquençage est utilisé à la place de séquençage. Cette dénomination, essentiellement utilisée en génétique, désigne le séquençage d’un segment d’ADN suivi de la comparaison du résultat obtenu avec celui d’une séquence de référence connue. Le séquençage à haut débit est alors employé pour connaître quelles sont les variations génomiques de l’échantillon qui est étudié en comparaison avec celui pris

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 42

comme référence. Ces approches sont certainement parmi les plus employées actuellement dans le domaine médical. Ces outils ont typiquement pour vocation de remplacer les méthodes traditionnelles d’hybridation génomique comparative (CGH) et de permettre de préciser les diagnostics soit de façon préventive soit pour caractériser une pathologie déjà déclarée.

I.1.2.5.3 La métagénomique

Le dernier domaine d’application du séquençage à haut débit, à la frontière entre reséquençage et séquençage de novo, concerne la métagénomique. Le but est de découvrir dans un mélange complexe l’ensemble des organismes qui le composent comme par exemple la flore intestinale. On peut ainsi imaginer qu’en séquençant le sérum de patients, il sera possible de déterminer quels sont les agents pathogènes qui y sont présents et qui sont à l’origine de la pathologie observée. Il pourrait aussi être possible d’envisager en toxicologie le suivi de l’incorporation de vecteurs viraux dans différents tissus d’un organisme en dehors de ceux ciblés par le vecteur de thérapie génique (Chiu et al., 2008).

I.1.2.6 Génomique comparative et exploitation des génomes I.1.2.6.1 Assemblages des génomes

L’assemblage de séquence est le processus consistant à aligner, orienter et fusionner les fragments d’ADN obtenus durant la phase de séquençage. Cette étape est nécessaire parce que le séquençage d’ADN ne peut pas retourner en sortie le génome complet en une lecture. Au lieu de cela, on obtient de petites séquences de 20bp à 40000bp (selon la technologie utilisée) en utilisant souvent des fragments venant de séquençage shotgun. A partir des lectures de la phase de séquençage, l’assembleur (un programme informatique) va essayer de mettre les lectures ensemble en se basant sur leur chevauchement. L’assemblage est généralement fait en 2 étapes:

 D’abord, les fragments sont assemblés en utilisant le chevauchement des lectures pour construire de plus grandes séquences complètes appelées contigs. L’information utilisée est ainsi généralement limitée aux lectures simples (sans l’information de paire).

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 43

 Ensuite vient la phase de scaffolding (échafaudage) : cette étape a pour but d’orienter et de placer les contigs les uns par rapport aux autres pour obtenir une séquence unique, bien que possédant des lacunes (soit des trous dans la séquence finale). Ces lacunes seront corrigées lors de l’étape de finition du génome qui vise à combler les trous restant dans l’assemblage par des méthodes expérimentales, comme la PCR ou l’extension d’amorces (Pevzner et al., 2001).

L’assemblage de génomes complets destinés à être comparés nécessite une phase de vérification. Les critères de qualité d’une séquence génomique complète sont une couverture suffisante, un petit nombre de contigs et un minimum d’incertitude sur l’ordre de ces derniers. Les étapes de finition et de validation d’un projet de séquençage sont généralement longues et difficiles, dépendant à la fois de la méthode de séquençage utilisée, de la stratégie d’assemblage et de la richesse en éléments répétés des génomes. De plus, la construction des banques et librairies d’ADN génomique ou l’utilisation des programmes d’assemblage (et leur paramétrage) peuvent générer des erreurs préjudiciables à l’analyse ultérieure des séquences tels que des contigs chimériques et des décalages de phase de lecture artéfactuels.

Il existe différentes techniques permettant la validation d’un assemblage au niveau «macroscopique » (scaffolding).

Une approche plus ancienne, utilisant le clonage, consiste à combiner un séquençage de plusieurs banques de fragments génomiques de tailles différentes. Il existe des banques d’inserts de taille moyenne (de 5 à 12 kpb) et des banques d’inserts de plus grande taille (50 à 100 kpb) clonés dans des vecteurs BACs (Bacterial Artificial Chromosome). Le séquençage et l’assemblage d’inserts de différentes tailles permettent d’organiser les contigs entre eux et de réduire l’incertitude de l’assemblage de certaines zones.

Une autre approche, par des cartes de restrictions obtenues par digestion de l’ADN génomique par une enzyme, peut être utilisée pour valider un assemblage de génome. Une migration sur gel ou une lecture optique des produits obtenus permet d’obtenir un profil de restriction qui peut être comparé à un profil de restriction in silico du génome à valider.

Les cartes optiques sont des outils développés par la société OpGen Technologies (Madison, WI) depuis une dizaine d’années. Il s’agit de cartes de restriction ordonnées à haute résolution d’un génome dont l’obtention est grandement automatisée. Elle permet d’ordonner et d’orienter des contigs lors d’un assemblage de génome et constitue également une méthode de

H. Lemriss Thèse de doctorat Université Mohammed V-Rabat 44

validation indépendante d’un projet de séquençage. Comparée à une carte de restriction in

silico d’une séquence connue, ces cartes optiques peuvent aussi être utilisées en génomique

pour identifier des réarrangements génomiques tels que des insertions, des délétions, des duplications et des inversions (Shukla et al., 2009). Cette méthode peut être d’un grand intérêt pour la finition de génomes complets (; Lim et al., 2001; Reslewic et al., 2005 Latreille et al., 2007).

Dans certains cas, les approches et techniques de validation citées ci-dessus, les techniques classiques de biologie moléculaire (PCR) et d’analyses bioinformatiques (biais de composition en GC, assembleurs…) ne suffisent pas à valider l’organisation et la structure d’un chromosome bactérien. Les incertitudes peuvent alors être levées par la mise en place d’autres stratégies expérimentales faisant l’objet de projet de recherche.

Documents relatifs