• Aucun résultat trouvé

Le séquençage d’ADN est une méthode d’acquisition de données génomiques qui ne vise pas à connaître le génotype à une position précise, mais cherche à extraire le génotype de l’ensemble des positions des fragments d’ADN analysés. Il est possible de séquencer l’ensemble de l’ADN du génome, on parle alors de séquençage de génome complet. Il est également fréquent de ne séquencer que l’exome, soit les portions du génome codant pour des protéines. Enfin, il est tout à fait possible de ne capturer que certaines régions d’intérêt et de les séquencer. De même que pour le génotypage, l’ADN est extrait, amplifié parfois, et fragmenté.

Il existe de nombreuses technologies de séquençage. Le séquençage Sanger est la première techniques de séquençage a avoir été utilisée dans les années 1970. L’échantillon d’ADN a sé-quencer est fragmenté en fragments de taille allant jusqu’à 3 kb maximum. Chaque fragment est alors amplifié par PCR de manière indépendante. Après amplification, le fragment am-plifié est mis en présence d’un mélange des 4 désoxyribonucléotides constituant notre ADN (dATP, dTTP, dCTP, dGTP, et dont le mélange est noté dNTP). On ajoute également une faible proportion de ddNTPs, soit des didesoxyribonucléotides : ce sont des dNTPs privés de 2 groupements −OH. L’absence de ces groupements empêche toute élongation du brin d’ADN

après incorporation d’un ddNTP. Les ddNTPs introduits sont de plus marqués par un fluo-rochrome spécifique de chaque base A, C, G, T. Enfin, des amorces et des ADN-polymérases sont également introduites dans le mélange réactionnel. Ainsi, les amorces s’hybrident sur les brins d’ADN amplifiés, et l’ADN-polymérase va alors synthétiser le brin d’ADN complémen-taire de ce fragment en incorporant les nucléotides disponibles. Cependant, lorsqu’un ddNTP est incorporé, l’élongation cesse (Figure 11). Ainsi, l’incorporation des ddNTPs qui a lieu de manière stochastique aboutit à un ensemble de fragments de taille variable, et dont le dernier nucléotide incorporé est marqué (Figure 12). On fait ensuite migrer les fragments sur gel par électrophorèse, ils vont alors s’aligner en fonction de leur taille. Enfin, un laser et un détecteur

sont ensuite utilisés afin de déterminer quelle base se situe à chaque position de la séquence.

Figure 11 – Séquençage Sanger : Polymérisation

Figure 12 – Séquençage Sanger : Détermination de la séquence à partir des fragments néosynthétisés

Le séquençage Sanger est très fiable et reste la technique de séquençage de référence, pré-sentant très peu de faux-positifs. Cependant, cette méthode reste relativement lente, puisque l’amplification et la PCR de séquençage et la migration sur gel doivent être faites de manière indépendante pour chaque fragment. C’est pourquoi de nouvelles technologies de séquençage appelées technologies à haut débit ou encore NGS pour Next-Generation Sequencing ont fait

leur apparition. Ces technologies, indépendemment du principe de séquençage qu’elles utilisent, ont la propriété d’être massivement parallélisées, et de pouvoir séquencer un nombre élevé de fragments d’ADN de manière simultanée. Elles sont donc beaucoup plus efficace en nombre de paires de bases séquencées par unité de temps. Cependant, la sensibilité et la spécificité de ces nouvelles technologies de séquençage n’atteignent pas encore celles de la méthode Sanger. Les technologies Illumina et Ion Torrent en sont deux exemples.

La technologie d’Illumina est un type de séquençage par synthèse. Une amorce vient s’ap-parier sur le fragment d’ADN à séquencer. On introduit également des enzymes polymérases pouvant procéder à l’élongation de l’amorce par complémentarité avec le fragment d’ADN sur lequel l’amorce est hybridée. On introduit alors des nucléotides libres dans le milieu, chaque type de nucléotide A, C, T, ou G étant couplé à un fluorochore différent. Ces nucléotides sont d’autre part munis d’un groupement protecteur qui empêche la polymérase d’incorporer un second nucléotide à la suite du premier. À chaque cycle d’incorporation d’un nucléotide, la fluorescence est mesurée, et en fonction de la longueur d’onde émise, on sait quelle base à été incorporée. On supprime ensuite le groupement protecteur, et un nouveau cycle recommence. À la fin du processus, on a reconstitué la séquence de l’ensemble des fragments d’ADN analysés. Ces fragments sont appelés lectures, ou reads.

Ion torrent utilise une autre technologie de séquençage. C’est également une méthode de séquençage par synthèse, mais basée sur la détection de variations de pH. En effet, l’incorpo-ration d’un nucléotide par la polymérase rejette un ion H+, ce qui fait varier le pH du milieu. De la même manière que la technologie Illumina, des nucléotides sont injectés de manière suc-cessive dans le milieu réactionnel par cycle, et à chaque injection d’un type de nucléotide, une détection de la variation du pH est effectuée. Si le pH varie, il y a eu élongation. Contrairement à la technologie d’Illumina, les nucléotides injectés ne possèdent pas de groupement protecteur, la polymérase peut donc incorporer plusieurs nucléotides identiques à la suite. Ainsi, si la sé-quences du brin d’ADN séquencé contient plusieurs bases A d’affilée, alors autant de T seront incorporés dans le brin néosynthétisé. Le nombre de nucléotides ainsi incorporés est déterminé par la variation de pH détectée qui augmente avec le nombre d’incorporations.

L’analyse des données de séquençage nécessite un traitement bioinformatique beaucoup plus important que celui des données de génotypage. De plus chaque technologie de séquençage présente ses propres limites et biais. Le séquençage est à l’heure actuelle encore beaucoup plus coûteux que le génotypage.

II.3 Analyse de liaison génétique, ou Linkage Analysis

Le premier type d’analyse généralement effectué dans l’identification d’une éventuelle com-posante génétique dans l’étude d’une maladie est l’analyse de liaison génétique. Ce type d’ana-lyse permet en effet de localiser grossièrement au niveau d’une région chromosomique, à quel endroit se situe l’élément génétique associé au trait phénotypique99. Les analyses de liaison génétique sont basées sur l’analyse au sein d’une famille des génotypes dont certains sont issus d’évènements de recombinaison.