• Aucun résultat trouvé

Validation de la PCR quantitative en temps réel dans le cadre de l’étude d’une famille de gènes

Article 1: Mingam A, Gachon C and Charrier B. Quantifying nucleic acids with

IV. Validation de la PCR quantitative en temps réel dans le cadre de l’étude d’une famille de gènes

Du fait de leur origine commune, les gènes d’une famille présentent des séquences similaires, rendant difficile l’étude de leur expression par les approches de type Northern Blot. Celles-ci sont d’autant plus difficiles à réaliser que les gènes étudiés présentent des expressions faibles. La PCR quantitative en temps réel semble alors être un bon substitut aux techniques d’hybridation. En effet, la combinaison des oligonucléotides associée à l’amplification par PCR permettent d’une part une plus grande spécificité et d’autre part une plus grande sensibilité. Il est cependant nécessaire de déterminer le domaine d’application dans lequel la RT-PCR quantitative en temps réel est une approche valable, avant de l’appliquer à l’étude de la famille des AtRH.

Pour ce faire, l’étendue de la gamme d’ADN génomique permettant des mesures fiables et reproductibles, puis la limite de spécificité des amorces, la reproductibilité technique, la variabilité biologique et enfin la qualité des échantillons d’ADNc ont été évaluées.

A. Etendue de la gamme dynamique

En PCR quantitative, la qualité de la quantification d'un échantillon inconnu dépend directement de la qualité de la gamme-étalon. Il existe une partie de la courbe représentant le cycle-seuil (Ct) en fonction de la quantité initiale d’ADN (N0) où la variabilité expérimentale est la plus faible et où la fiabilité de la quantification est maximale. Les limites inférieure et supérieure de cette région ont été précisément déterminées par étapes successives.

Une première expérience nous a indiqué que la saturation est atteinte au-delà de 40 ng d'ADN génomique (soit 266 667 équivalents-génome) par puits. Cette saturation provient soit d’un excès d’ADN (inhibition par excès de substrat), soit de la présence d’inhibiteurs de PCR. Ensuite, en procédant par des dilutions successives, nous avons atteint la limite de 9 pg d'ADN génomique (soit 60 équivalents-génome) par puits sur une gamme de 12 points. L'amplification réalisée avec 17 équivalents-génome environ se confondait avec le bruit de fond. L'étendue maximale dans laquelle la gamme est linéaire et fiable est donc de 60 à 266 667 équivalents-génome, soit une amplitude de l'ordre de 4000 fois. Par la suite, nous avons limité l'étendue de la gamme aux valeurs du tableau ci-dessous (Tableau 6).

Tableau 6 Correspondance entre la quantité d’ADN génomique et le nombre d’équivalents-génome chez

A. thaliana.

Quantité d’ADN déposée (ng) 0,1 0,4 1,4 4,8 16,7

Tableau 7 Efficacité de la PCR des couples d’amorces dérivant du couple spécifique d’AtRH15 par le dernier nucléotide.

En gras sont signalés les nucléotides spécifiques d’AtRH15, en italique ceux spécifiques d’AtRH56 et en minuscules les nucléotides n’existant ni dans AtRH15, ni dans AtRH56.

Amorces AtRH15 sens

GGGGGTTCACAACTATCTCTCG

Amorces AtRH15 antisens G c t A

TAACTGTGCGATTTGGAGAGTG 100,0% 0,3% 3,5% 23,3% c 0,5% 0,0% 0,0% 0,8% t 1,6% 3,4% 0,1% 0,3% A 7,3% 0,4% 0,0% 20,1% AtRH15 TGCCTTCTTAAACAAGTAGCA-CGTCCCTCAGGAAAGAAGCTCTTCAGATTTCAAC AtRH56 TGCCGTCTTAAACAAGTAGCATCATCTCTGAGGAACGAACCTCTTCAGATTTCAAC **** **************** * ** ** ***** *** **************** AtRH15 CTTGAGGTGTTCAAAGGG-TCATGGGGGTTCACAACTATCTCTCGCTCCGTTTGTT AtRH56 CTTTAGGTGTTCAAAGGGGTCATGGAGGTCCACAACTATCTCTCACACCGTTTGTT *** ************** ****** *** ************** * ********* AtRH15 ---TTAGTGTTTTCTATGACGACATTTTTTTCCATATGTTTAGAACGT AtRH56 GCTTCGCTATTTTAGACTTTTCTATGAGGACAAGTTTTTCCATATATTTAGACCGT **** ********** **** *********** ****** *** AtRH15 CTGTTGTACTCTTTAAAG--GAGATTCGAGTCACTCTCCAAATCGC--ACAGTTAA AtRH56 TTTGTA-ACTCTTGAAAAATGAGATT-GAGCTACTCTCCAAATCGCGCACAGTTGA * * ****** *** ****** *** ************** ****** * AtRH15 AAGCTGTCCAGTTTTTTGTACAAGAGATTATTATGTTTGAAATATCAGGATTT-AG AtRH56 GAGCTCTCCTGTTTTTTGTACTAGTGATGGTTATCTTTAAAATATTAAGATTTCAG **** *** *********** ****** **** *** ****** * ***** ** AtRH15 TCTCGACCTGATTACTGTGTTCCTTAGGAATCGATCTATTATCAATTTATCATGGT AtRH56 GATT---* AtRH15 GTTGCT AtRH56 ---AtRH15 TGCCTTCTTAAACAAGTAGCA-CGTCCCTCAGGAAAGAAGCTCTTCAGATTTCAAC AtRH56 TGCCGTCTTAAACAAGTAGCATCATCTCTGAGGAACGAACCTCTTCAGATTTCAAC **** **************** * ** ** ***** *** **************** AtRH15 CTTGAGGTGTTCAAAGGG-TCATGGGGGTTCACAACTATCTCTCGCTCCGTTTGTT AtRH56 CTTTAGGTGTTCAAAGGGGTCATGGAGGTCCACAACTATCTCTCACACCGTTTGTT *** ************** ****** *** ************** * ********* AtRH15 ---TTAGTGTTTTCTATGACGACATTTTTTTCCATATGTTTAGAACGT AtRH56 GCTTCGCTATTTTAGACTTTTCTATGAGGACAAGTTTTTCCATATATTTAGACCGT **** ********** **** *********** ****** *** AtRH15 CTGTTGTACTCTTTAAAG--GAGATTCGAGTCACTCTCCAAATCGC--ACAGTTAA AtRH56 TTTGTA-ACTCTTGAAAAATGAGATT-GAGCTACTCTCCAAATCGCGCACAGTTGA * * ****** *** ****** *** ************** ****** * AtRH15 AAGCTGTCCAGTTTTTTGTACAAGAGATTATTATGTTTGAAATATCAGGATTT-AG AtRH56 GAGCTCTCCTGTTTTTTGTACTAGTGATGGTTATCTTTAAAATATTAAGATTTCAG **** *** *********** ****** **** *** ****** * ***** ** AtRH15 TCTCGACCTGATTACTGTGTTCCTTAGGAATCGATCTATTATCAATTTATCATGGT AtRH56 GATT---* AtRH15 GTTGCT AtRH56

---Figure 5 Alignement du dernier exon des gènes AtRH15 et AtRH56.

La position des amorces est signalée en gras et leur orientation est indiquée par une flèche, située au-dessus de la séquence pour AtRH15 et au-dessous de la séquence pour AtRH56. Les nucléotides identiques entre les deux gènes sont indiqués par les étoiles. L’accolade symbolise le site d’épissage et le début de l’exon. Le codon STOP est encadré, rappelant la fin de la région codante et le début de la région 3’ UTR des deux gènes.

B. Spécificité des amorces

L’étude de l’expression d’une famille de gènes par PCR quantitative pose le problème de discrimination des différents membres de la famille, dont les séquences sont proches, par des couples d’amorces spécifiques de chaque gène. La famille des AtRH comporte des gènes récemment dupliqués et très proches en séquence. Nous avons cherché à déterminer les limites de la spécificité de la PCR quantitative.

Nous nous sommes tout d’abord intéressés au cas des gènes AtRH4 et AtRH19. Leurs séquences présentent 88% d’identité et divergent surtout au niveau des extrémités non codantes. Le couple d’oligonucléotides défini pour chaque gène est composé d’une amorce spécifique du gène, présentant plus de 50% de différence entre le gène ciblé et son paralogue, et d’une autre amorce, ne divergeant que par quelques nucléotides et pouvant s’hybrider potentiellement sur les deux gènes. La spécificité de ces couples d’amorces a été établie par l’amplification d’un seul produit correspondant au gène ciblé. Ceci a été vérifié par l’obtention d’un pic unique après réalisation de la courbe de fusion des produits PCR, par l’observation d’une bande unique sur gel coloré au BEt et par séquençage. La présence d’une seule amorce spécifique du gène considéré suffit à assurer l’amplification du gène désiré uniquement. Par ailleurs, la suppression du dernier nucléotide des amorces influence peu l’efficacité de la PCR, même si une plus grande variabilité de l’efficacité de l’amplification a été observée.

Les transcrits des gènes AtRH15 et AtRH56 présentent plus de 97% d’identité au niveau de la partie codante et 74% d’identité dans la partie la plus divergente (3’ UTR). Les seules amorces qu’il a été possible de définir pour le gène AtRH15 divergent de la séquence d’AtRH56 par uniquement 2 à 3 nucléotides dont un seul à l’extrémité 3’ (Figure 5). Pour tester la spécificité de ces amorces, nous avons mesuré l’influence du mésappariement du dernier nucléotide des amorces sur l’efficacité de la PCR. Le dernier nucléotide de chaque amorce correspondant au gène AtRH15 est un G, substitué en T dans la séquence du gène AtRH56. A partir des amorces du gène AtRH15, six autres amorces ont été générées en échangeant la dernière base (G) contre un A, un C ou un T. L’efficacité des 16 expériences de PCR quantitative testant l’ensemble des combinaisons possibles des huit amorces différant uniquement par le dernier nucléotide sont présentées ci-contre (Tableau 7).

Lorsqu’un seul des oligonucléotides présente un mésappariement avec la matrice, l’efficacité de la PCR est considérablement réduite : un mésappariement purine-pyrimydine (G/A ou T) entraîne une inhibition de 96,5% à 98,4% et un mésappariement G/C une inhibition supérieure à 99,5%. Lorsque les deux amorces présentent un mésappariement avec la matrice, l’inhibition est totale dans 3 cas sur 4 et de 99,5% pour le 4ème cas. Lorsque la dernière base de l’amorce correspond à la séquence nucléotidique de l’autre paralogue l’inhibition de la PCR est variable : de 77% à 93% environ. Nous avons également observé ce phénomène avec le gène AtRH56 dont un des oligonucléotides est spécifique et l’autre ne diverge de la séquence d’AtRH15 que par trois nucléotides, dont un seul à l’extrémité 3’.

Dans les puits où la quantité de produit PCR était significative, nous avons vérifié la courbe de fusion : dans tous les cas nous n’avons observé qu’un seul pic correspondant au produit spécifique attendu. Ainsi, nous avons pu montrer que, dans nos conditions expérimentales, le dernier nucléotide de chaque amorce est suffisant pour assurer la spécificité de la PCR.

C. Stratégie expérimentale

Etudier l’expression d’une famille de gènes par RT-PCR quantitative en temps réel implique des choix expérimentaux spécifiques qui prennent en considération le nombre important de gènes mesurés. Le nombre de manipulations du protocole standard a donc été réduit au maximum pour limiter d’autant les sources d’erreurs, le temps nécessaire pour chaque mesure et le coût total des expériences.

Tout d’abord, j’ai séparé l’étape de transcription inverse (RT) de l’étape de PCR quantitative car cela permet de mesurer les teneurs de plusieurs transcrits à partir des ADNc d’une seule réaction de RT. Pour ce faire, les ADNc simple brin ont été synthétisés à l’aide d’oligo(dT) pour convertir l’ensemble des ARNm polyadénylés en ADNc. La synthèse du second brin, nécessitant un oligonucléotide spécifique, n’est pas réalisée. Ce système dissocie l’étape de RT de l’étape de PCR : il permet de réduire le nombre de RT et donc la variation introduite par la RT dans la mesure finale.

Pour la PCR quantitative en temps réel, j’ai trouvé plus intéressant d’utiliser le SYBR-Green® comme molécule fluorogène plutôt que des sondes oligonucléotidiques. Ce choix est motivé par le nombre de gènes étudiés et par leur expression a priori faible. Tout d’abord, cette solution est économique. En effet, l’utilisation de sondes implique la conception d’un troisième oligonucléotide par gène étudié. Or, ces sondes sont marquées par des fluorophores

et coûtent plus chers que des oligonucléotides classiques. L’aspect financier mis à part, l’utilisation d’un troisième oligonucléotide augmente le nombre de manipulations à chaque PCR et le nombre de tubes à stocker. Le SYBR-Green® permet un marquage du fragment d’ADN amplifié, indépendamment de sa séquence. Ainsi, cette molécule peut être vue comme un marqueur fluorescent « universel », contrairement aux sondes qui sont spécifiques du produit amplifé. Mais l’avantage principal du SYBR-Green® est la grande sensibilité qu’il confère à la mesure. Comme chaque fragment d’ADN amplifié est marqué par plusieurs molécules de SYBR-Green®, le signal qu’il génère est plus intense que celui des sondes. Le SYBR-Green® a donc été retenu comme agent fluorescent unique, utilisable pour tous les transcrits. Pour assurer la simplicité du protocole et garantir une reproductibilité maximale des mesures, nous avons choisi de travailler avec un mélange commercial 2X « prêt-à-l’emploi », contenant l’enzyme, les dNTP et le SYBR-Green®, auquel il suffit d’ajouter les deux amorces et l’eau.

D. Reproductibilité technique et biologique

La méthode permettant de mesurer l’expression transcriptionnelle d’un gène par RT-PCR nécessite trois étapes principales : tout d’abord, les ARN totaux sont extraits de différents organes végétaux, puis ils sont convertis en ADNc par transcription inverse et enfin, l’abondance d’un transcrit dans un échantillon d’ADNc est estimée par PCR quantitative en temps réel. Ces différentes étapes introduisent chacune une variabilité sur la mesure finale (Figure 6A). Pour estimer l’impact de ces trois étapes sur la variabilité des mesures, nous avons comparé l’expression transcriptionnelle de 20 gènes AtRH et de 3 autres gènes, EF1 alpha 4, ACT2/8 et SUPERMAN (SUP1), par PCR quantitative en temps réel dans différents organes d’A. thaliana : racines, feuilles de la rosette jeunes et âgées, hampes florales, feuilles caulines jeunes et âgées, bourgeons floraux, fleurs et jeunes siliques.

Les organes végétaux cités ci-dessus ont été prélevés séparément sur plusieurs lots de plantes indépendants pour constituer 27 échantillons biologiques. Chaque organe est représenté par 3 échantillons, sauf les jeunes feuilles caulines et les tiges des hampes florales, représentées deux fois et, les racines et les siliques, représentées 4 fois. Les ARN totaux ont été extraits de ces échantillons indépendants. Plusieurs extractions ayant pu être réalisées à partir du même

Prél.

27 échantillons

Prél.

27 échantillons

Extr.

9 organes

ARN