• Aucun résultat trouvé

 Dans le cas des puces d'expression, les sondes sont construites de façon à s'hybrider aux ARN synthétisés par un génome. Lors d'une expérience de puce à ARN, on synthétise des ADN complémentaires (ADNc) à partir d'un échantillon d'ARN. Leur hybridation sur la puce permet de connaître, pour les transcrits ciblé par la puce, la quantité des diérents ARN dans l'échantillon initial.

 Les puces de génotypage intègrent des sondes ciblant la séquence entourant les SNP. Pour chaque SNP, deux sondes correspondant aux deux allèles du SNP sont inté-grées. L'ADN de l'échantillon est alors hybridé sur la puce de manière à fournir une mesure pour chaque allèle, marqué par un uorochrome diérent. Le niveau relatif de ces deux mesures permet alors de déterminer le génotype (genotype calling).  Les puces de méthylation ou d'immuno-précipitation de la chromatine (Chip)

in-tègrent des sondes couvrant le génome avec régularité. Des anticorps sont ensuite utilisés pour marquer les zones de méthylation ou les zones de xation d'une pro-téine et seuls les fragments marqués par des anticorps sont hybridés sur la puce. La lecture des intensités renvoyées par la puce indique l'emplacement sur le génome des zones de méthylation ou de xation de la protéine (facteurs de transcription).  les puces CGH (comparaison de l'hybridation génomique) couvrent également

l'en-semble du génome. L'hybridation de l'ADN sur la puce permet alors de repérer des duplications ou des délétions anormales de l'ADN.

Chaque type de puce nécessite des traitements informatiques et statistiques spéci-ques. Nous nous contenterons ici de décrire le fonctionnement des biopuces d'expression et de génotypage telles qu'elles sont construites par les deux constructeurs Illumina et Aymetrix. Nous aborderons ensuite dans les chapitres 4 et 5 les prétraitements relatifs à ces puces, avant de discuter dans le chapitre 6 des problèmes statistiques posés par l'analyse des biopuces.

2 Puces d'expression

2.1 Principe détaillé

Dans le cas des puces d'expression, le protocole expérimental permettant de mesurer l'expression se décompose en 5 étapes (gure 3.1) :

1. Les ARNm issus de la transcription des gènes sont extraits de la cellule ou du tissu. Des ADN complémentaires (ADNc) sont synthétisés par rétro-transcription puis puriés et ampliés.

2. Le brin complémentaire des ADNc puriés est re-synthétisé à partir de nucléotides marqués à la biotine. Les ADN ainsi obtenus fournissent alors une image dèle de la

CHAPITRE 3. GÉNÉRALITÉS SUR LES BIOPUCES

2. PUCES D'EXPRESSION

séquence du transcriptome, où chaque morceau de séquence est présent en quantité proportionnelle à la quantité de transcrit correspondant.

3. Les ADN sont alors hybridés sur la puce et la puce est lavée. 4. Un uorochrome Cy3 est appliqué sur la puce.

5. La puce est scannée. L'intensité lumineuse qui est mesurée sur un point de la puce évalue alors la quantité de l'ARNm correspondant à ce point, dans la cellule ou le tissu, pour l'échantillon étudié.

2.2 Caractéristiques techniques

La forte densité des biopuces (700 000 à 1 million de mesures par puce) relativement au nombre restreint de gènes qui composent le génome permet d'inclure plusieurs mesures par transcrit. Selon les puces, ces mesures peuvent être des réplicats techniques (même séquence) ou simplement des réplicats biologiques (séquence diérente ciblant le même transcrit). Les réplicats techniques permettent une quantication ne et précise des er-reurs de mesure purement expérimentales, tandis que les réplicats biologiques permettent de pallier en partie les biais de construction liés au choix de la séquence utilisée pour construire les sondes. Notons également que sur les puces les plus récentes (Exon Array Aymetrix), le grand nombre de sondes permet une meilleure couverture de la séquence des transcrits favorisant la recherche de phénomènes d'épissage alternatif.

Une caractéristique importante des puces ARN est la présence de contrôles permettant de vérier le bon fonctionnement de la puce (contrôles positifs) et de mesurer le niveau d'hybridation non spécique (contrôles négatifs).

Parmi les contrôles positifs on trouve :

 des contrôles d'hybridation ciblant des séquences non humaines ajoutées dans la solution

 des contrôles de uorescence où sont directement xés des uorochromes  des séquences ciblant des gènes de ménage (GAPDH,. . .)2

Les contrôles négatifs plus nombreux que les contrôles positifs (plusieurs milliers de mesures sur chaque puce) sont en général des sondes dont la séquence est formée aléatoi-rement et ne correspond à aucun transcrit connu. L'hybridation mesurée par ces sondes est alors uniquement non-spécique.

2. Les gènes de ménage (ou HouseKeeping Genes en anglais) sont des gènes codant des protéines essentielles au bon fonctionnement de la cellule et dont le niveau est par conséquent maintenu élevé en permanence.

CHAPITRE 3. GÉNÉRALITÉS SUR LES BIOPUCES

2.3 Diérents types de puces

Bien que fondées sur les principes communs déjà évoqués, les biopuces dièrent selon les constructeurs, entraînant des diérences tant au niveau du traitement que du choix de la terminologie.

Ainsi les puces créées par Aymetrix sont construites en déposant sur une plaque des séquences qui composent les sondes à des emplacements xes (les spots). Ces séquences, diérentes pour chaque sonde, sont regroupées par probesets d'une dizaine de séquences ciblant le même transcrit. Dans les puces Aymetrix les plus anciennes3, des versions imparfaites des sondes, appelés mismatchs étaient également déposées sur la puce dans le but de capturer l'hybridation non-spécique liée à chaque séquence4. L'ecacité de l'utilisation des mismatchs ayant été largement remise en cause, les puces les plus récentes sont composées uniquement de perfect matchs (sondes originales). Les puces Aymetrix contiennent entre 30 000 et 60 000 probesets selon les modèles.

Pour les puces Illumina, les séquences sont assemblées directement sur des billes ma-gnétisées qui sont ensuite réparties aléatoirement sur chaque puce. Chaque séquence est mesurée sur la puce par un nombre aléatoire de billes (entre 15 et 30 en moyenne selon la puce). Ce positionnement aléatoire permet de réduire le risque de biais lié à la répartition spatiale des sondes. Par ailleurs, chaque sonde donnant lieu à un nombre important de réplicats techniques, il est possible de mesurer avec précision le niveau d'expression de chaque ARNm ciblé, et de quantier l'erreur de mesure spécique de chaque sonde en considérant la variance entre billes. En revanche, la faible variabilité des séquences rend les puces Illumina plus vulnérables aux biais de construction. En eet, avec un nombre de sondes compris entre 24 000 et 48 000, la majeure partie des transcrits ne sont représentés que par une seule séquence.

Le tableau 3.2 détaille les principales caractéristiques de chaque puce.