• Aucun résultat trouvé

Techniques d’identification

3. Mutations génétiques

3.1. Variants nucléotidiques

3.1.1. Techniques d’identification

Le séquençage à haut débit de « nouvelle génération » (Figure 17) se base sur l’amplification simultanée, de nombreux fragments d’un même brin d’ADN. La première étape consiste à fragmenter l’ADN par sonication. Des sondes couplées à des billes magnétiques peuvent être utilisées pour enrichir l’échantillon en exons, lors d’un séquençage de l’exome. Puis, les fragments sont hybridés sur une plaque à ADN pour leur amplification. Durant l’amplification, des ddNTPs couplés à un fluorochrome s’insèrent à la séquence, bloquent l’élongation et émettent une longueur d’onde qui leur est spécifique.

147983 56079 22755 22331 2083 529 Faux/Non- sens Petites indels Grandes indels Épissage Réarrangement Répétition variable 0 20000 40000 60000 80000 100000 120000 140000 160000

Mutations génétiques

qui renseignera sur le ddNTP final qui s’est inséré à leur séquence. Le terminateur du ddNTP est ensuite coupé, supprimant son effet bloqueur et sa fluorescence, permettant à un nouveau cycle d’amplification de s’effectuer.

Lorsque tous les cycles sont terminés, l’analyse bioinformatique permettra de renseigner la séquence nucléotidique de chaque fragment présent sur la plaque, le tout annoté dans un fichier FastQ. Les différentes séquences obtenues ou « lues » sont appelées « reads » et sont alignées entre elles pour recomposer la séquence globale de l’échantillon. Cet alignement peut s’effectuer via des logiciels tel que BWA (Burrows-wheeler alignment

tool)258 et se retrouve dans un fichier BAM (Bianry Alignment Map).

Figure 17 : Séquençage haut débit

Sur une plaque à ADN, les fragments d’ADN vont s’hybrider. À chaque cycle, le nucléotide qui s’est inséré à la séquence va émettre une longueur d’onde qui lui est spécifique. L’identification de la longueur d’onde permet de connaître le type de nucléotide qui s’est inséré. À la fin de l’amplification une séquence nucléotidique est obtenue pour chaque fragment d’ADN. Ces séquences sont ensuite alignées entre elles pour former la séquence complète de l’échantillon. Cette séquence est alignée avec celle de référence pour identifier les mutations qu’elle possède. (Inspirée de Illumina).

Le nombre de séquences alignées permet d’établir ce que l’on appelle « la profondeur de lecture » (Figure 18). Plus un nucléotide a été lu et plus il aura de profondeur de lecture. Plus celle-ci est grande et plus la probabilité que ce nucléotide existe est forte. En effet,

Plaque à ADN

1ercycle 2èmecycle 3èmecycle

T

G

G G G

A

Alignement des séquences

Séquence de référence ATCAATCGGATCGAATTTTCGGGACTGCAAATCGGCCTTGACCAAATGGCTTTGCCAAAATTCGCA ATCAATCGGATCGAATGTTCGGG CGGATCGAATGTTCGGGACTGCAAA CAATCGGATCGAATGTTCGGGACTG GTTCGGGACTGCAAATCGGCCTT GACTGCAAATCGGCCTTGACCAAATG ATCGGCCTTGACCAAATGGCTTTGCC TTGACCAAATGGCTTTGCCAAAATT TGGCTTTGCCAAAATTCGCA TGCAAATCGGCCTTGACCA CGAATGTTCGGGACTGCAAATCG CTGCAAATCGGCCTTGACCAAA GCCAAAATTCGCA GGCCTTGACCAAATGGCTTTGCCA TCGCA ATCA ATCGGCCTTGACCAAATGGCTTTG AATTCGCA ATCAATCGGATCG CCAAATGGCTTTGCCAAAATTCG ATCAATCGGATCGAATGT TTGCCAAAATTCGCA ATCGGATCGAATGTTCGGGACTG ATCAAT ATCAATCGGATCGAATGTTCG AATTCGCA Polymorphisme nucléotidique Plaque à ADN ADN Variant

bien que la technique ait une bonne sensibilité, les erreurs de lecture peuvent survenir. Ainsi, chaque variant possède une profondeur de lecture et un score de qualité appelée QScore (un QScore de 30 correspond à une probabilité d’erreur de 0,001, un QScore de 20 correspond à une probabilité d’erreur de 0,01, etc.).

Cet alignement est comparé au génome humain de référence pour identifier les différences nucléotidiques qu’il pourrait posséder, ainsi que les coordonnées génomiques de la mutation identifiée. Cette détection des variants peut s’effectuer via des logiciels tel

que GATK (Genome Analysis ToolKit)259 fournissant un fichier VCF (Variant Call

Format). Ces fichiers seront ensuite utilisés pour annoter les variants identifiés.

Les variants peuvent être retrouvés sous forme homo- ou hétérozygote. Lorsque le variant apparaît dans près de 100% des séquences alignées, c’est une mutation homozygote. Lorsqu’il est retrouvé dans environ 50%, il s’agira d’une mutation hétérozygote. Mais lorsque le variant est retrouvé dans un très faible pourcentage, il pourra s’agir de mutation mosaïque, par exemple, mais l’erreur de séquençage n’est pas à écarter.

Figure 18 : Illustration d'un alignement de séquence pour identifier un variant

La profondeur de lecteur fait référence au nombre de séquences alignées pour un nucléotide donné. Plus ce nucléotide aura été lu et plus la probabilité qu’il existe est élevée. Ce nucléotide est ensuite comparé à celui de gène de référence afin d’identifier un possible variant. Dans l’encadré noir, le nucléotide C est retrouvé dans 100% des séquences amplifiées et dans celui du gène de référence, soulignant l’absence de mutation. Dans l’encadré rouge, il y a une alternance entre le nucléotide A et le C, à un taux de 50-50, suggérant une mutation hétérozygote du nucléotide A de référence pour le nucléotide C. P rof on d eu r d e l ec tu re 50/50 Alignement des séquences Gène de référence 100%

3.1.1.2. Technique de Sanger

La technique de Sanger (Figure 19) est la méthode la plus courante pour séquencer une région précise du génome. Celle-ci se base sur l’amplification de différents fragments d’ADN de taille différente associés à un ddNTP final couplé à un fluorochrome. Les différents brins amplifiés vont être séparés en fonction de leur taille, par électrophorèse capillaire, et la fluorescence qu’ils émettent est mesurée. Ainsi, chaque taille de fragment est associée à un ddNTP final précis. Lorsque tous les fragments ont migré, la séquence totale de l’ADN est connue.

Figure 19 : Technique de Sanger

Des ddNTP couplés à un fluorochrome sont ajouté à la réaction d’amplification des brins d’ADN. Chaque fragment a une taille différente. L’insertion d’un ddNTP stop la réaction d’amplification. Les fragments vont ensuite migrer en fonction de leur taille. Durant la migration, le fluorochrome, associé au ddNTP, est lu par l’appareil. À la fin de la migration, chaque fluorochrome est associé à son nucléotide et la séquence complète du fragment amplifié est identifiée. (Inspiré de onlinebiologynotes.com).

Séparation par électrophorèse et lecture de la fluorescence

3.1.1.3. SnaPshot

La technique du SnaPshot (Figure 20) est utilisée pour le séquençage d’un

nucléotide sur un site bien précis. Cette dernière partage le principe de la méthode de

Sanger, à la différence que seuls des ddNTPs marqués sont ajoutés à la réaction, mais aucun dNTPs. Il n’y a donc qu’un seul nucléotide qui peut se rajouter à l’amorce, ce qui permet d’amplifier la région d’intérêt, et d’obtenir une seule taille de fragment d’ADN. La fluorescence enregistrée va renseigner sur la nature du nucléotide qui s’est inséré dans la séquence et l’intensité de fluorescence. En comparant à un échantillon de référence, il est ainsi possible de connaître le pourcentage d’allèles mutés dans l’échantillon analysé.

Figure 20 : Technique de SnaPshot

Seuls les ddNTPs sont ajoutés à la réaction d’amplification. Les brins d’ADN de même taille vont donc s’amplifier que d’un seul nucléotide. Durant la migration, le fluorochrome est lu et permet d’identifier le ddNTP qui s’est inséré dans la séquence. En fonction du niveau de fluorescence émis, il est possible d’avoir une idée du pourcentage d’allèle muté dans l’échantillon (Inspiré de onlinebiologynotes.com).

Documents relatifs