Partie 1 Etude des gènes candidats et des régions identifiées par les études GWAS dans les
1.2. Matériel et méthodes
1.2.3. a. Génotypage de SNP de gènes candidats et des régions 9q22 et 14q13
Nous avons conçu une puce génétique de 96 SNP regroupant 38 SNP de gènes candidats,
11 tags-SNP (incluant les SNP rs965513 et rs1867277) du locus 9q22 (entre le SNP GWAS
rs965513 et le gène FOXE1) et 47 tags SNP (incluant les SNP rs944289 et rs116909374) du
locus 14q13 (entre les gènes PTCSC3 et NKX2-1).
Les SNP des gènes candidats sélectionnés pour réplication dans notre étude sont
rapportés dans le Tableau 2; ils ont été sélectionnés de la manière suivante :
- Polymorphismes associés au risque de CDT dans au moins deux études (Landa &
Robledo 2011), en 2012 soit 10 SNP incluant les SNP GWAS rs2439302 du locus 8q12
et rs966423 du locus 2q35 ainsi que 7 SNP identifiés dans les études de liaisons
pan-génomique.
- Polymorphismes associés au risque de CDT dans une seule étude mais pouvant être
impliqués dans la survenue de CDT selon des études fonctionnelles (10 SNP dont 5 SNP
dans le gène ATM).
- Polymorphismes des gènes de l’obésité mis en évidence dans les études du consortium
PAGE (Fesinmeyer et al. 2013) (« Population Architecture using Genomics and
Epidemiology ») et répliqués dans d’autres études (9 SNP). Nous nous sommes
intéressés à ces polymorphismes du fait du rôle avéré de l’obésité dans le risque de
CDT.
40
Tableau 2: Liste des SNP sélectionnés pour réplication dans les études CATHY et Nouvelle
Calédonie.
SNP Gene Position Fonction Données littérature
Variants répliqués dans au moins 2 études
rs6983267 gene desert 8q24 Landa et al. 2011
rs1042522 TP53 17p13 p.Arg72Pro Landa et al. 2011
rs2910164 pre-miRNA-146a 5q24 Landa et al. 2011
rs861539 XRCC3 14q32 p.Thr241Met Landa et al. 2011
rs25487 XRCC1 19q13 p.Arg399Gln Landa et al. 2011
rs1799782 XRCC1 19q13 p.Arg194Trp Landa et al. 2011
rs966423 2q35 SNP GWAS (Gudmunson et al. 2012)
rs2439302 8p12 SNP GWAS (Gudmunson et al. 2012)
rs732609 TPO 2 exon12 Cipollini et al 2013
rs2048722 TPO 2 Cipollini et al 2013
Variants non répliqués mais avec fonction biologique pertinente dans les CDT
rs1133076 TG 8q24 p.Arg2530Gln Landa et al. 2011
rs4752904 PTPRJ 11p11.2 p.Asp872Gln Landa et al 2011
rs4903957 TSHR Associé au taux circulant de TSH (Arnaud-Lopez et al, 2008)
rs2252696 TG 8q24 TSH(Arnaud-Lopez et al 2008) + familial PTC (He et al 2009 )
rs1801516 ATM 11q22 Asp1853Asn Landa et al. 2011
rs664677 ATM 11q22 IVS22-77 T>C Landa et al. 2011
rs1800057 ATM 11q22 P1054R Xu et al 2012
rs189037 ATM 11q22 promoteur Xu et al 2012
rs3092993 ATM 11q22 Damiola et al. 2014
rs3764340 WWOX 16q23 Cancemi et al. 2011
SNP des cas familiaux de PTC
rs6885099 PDE8B 5q13 TSH (Arnaud-Lopez et al. 2008)
rs1445493 8q23 Cas familiaux (Cavaco et. al 2008)
rs822318 8p22 Cas familiaux
rs9942754 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)
rs2702968 SLA/TG 8q24 Genome-wide linkage analysis (He et al, 2009
rs2702967 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)
rs17695552 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)
rs2741205 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)
Gènes obésité (Fesinmeger et al 2013)
rs9939609 FTO 16
rs10767664 BDNF 11
rs7498665 SH2B1 16
rs6548238 TMEM18 2
rs2815752 NEGR1 1
rs17782313 MC4R 18
rs12970134 MC4R 18
rs11084753 KCTD15 19
rs13130484 GNPDA2 4
rs10838738 MTCH2 11
Afin de mieux couvrir les régions 9q22 et 14q13 identifiés par les études GWAS, des tags
SNP ont été sélectionnés de manière à représenter au moins 80% de la variabilité génétique
dans chacune des régions ; les SNP sélectionnés devaient avoir une fréquence de l’allèle
mineur d’au moins 0,05 et une corrélation d’au moins 0,8 avec les autres tags SNP du locus
41
dans la population européenne de HapMap. Le design et la sélection des SNP a été effectué
avec le logiciel Tagger software (Howie et al. 2011)).
Le génotypage de la puce (puce « Fluidigm Dynamic array » à 96 SNP) a été effectué par
la société Integragen.
i. Contrôle qualité des SNP
Les amorces (« oligonucleotide primers ») utilisées pour le génotypage des SNP ont
dans été vérifiées sur un échantillon de 90 sujets CEPH pour lesquels le génotypage est connu
et publié dans HapMap et dans le projet 1000 génomes. Les génotypes observés avec ces
amorces avaient un taux de concordance d’au moins 98 % avec les génotypes publiés pour ces
SNP chez les 90 sujets CEPH.
Le taux de génotypage ou « call rate » de tous les SNP génotypés était supérieur à 95%.
Nous avons également testé la déviation à l’équilibre d’Hardy Weinberg (HW) pour chaque
SNP séparément chez les européens et chez les mélanésiens.
La loi d’équilibre d’HW stipule qu’au sein d’une population théorique idéale, les
fréquences alléliques et génotypiques d’un polymorphisme sont distribuées de manière
équilibrée d’une génération à l’autre. Les fréquences génotypiques sont déterminées à partir
des fréquences alléliques par la relation suivante : dans le cas d'un polymorphisme à deux
allèles A de fréquence p et deux allèles a de fréquence (1-p), nous avons une fréquence
attendue de p
2 pour le génotype AA, 2p(1-p) pour Aa et (1-p)
2 pour le génotype aa. Un écart
trop important à l’équilibre d’Hardy-Weinberg peut être la conséquence de problème de
génotypage. Le test d’équilibre de HW correspond à par un test de chi2 à 1 degré de liberté
comparant les génotypes observés aux attendus sous l’équilibre de HW.
Nous avons corrigé le test de l’équilibre d’HW sur le nombre de tests effectués en
appliquant la méthode de Bonferroni. Les SNP ayant une p-value inférieure à 5x10
-4 (sur la
base de 96 tests effectués) pour le test d’équilibre d’HW étaient ainsi exclus de l’analyse. Dans
nos deux populations, tous les SNP génotypés respectaient l’équilibre d’HW. Aucun des 96
SNP, n’a donc été exclu de l’analyse.
42
ii. Contrôle qualité des sujets
Parmi les 231 cas et 270 témoins de l’étude Nouvelle-Calédonie, et 517 cas et 568
témoins de l’étude CATHY pour lesquels nous avions des prélèvements ADN, 64 cas et 65
témoins de l’étude CATHY n’ont pas été génotypés du fait d’une trop faible concentration
d’ADN.
Les sujets ayant un taux de génotypage ou « call rate » < 90% (10 cas et 2 témoins de
l’étude CATHY et 9 cas ainsi que 9 témoins de l’étude de NC) ainsi que les sujets s’étant
déclarés d’origine non européenne ou non mélanésienne ont été exclu de l’analyse (28 cas et
12 témoins dans l’étude CATHY, 32 cas et 59 témoins dans l’étude de NC).
Au total, 481 cas et 544 témoins d’origine européenne de l’étude CATHY ainsi que 183
cas et 194 témoins de l’étude de NC (dont 156 cas /112 témoins d’origine mélanésienne et 27
cas /82 témoins d’origine européenne) sont inclus dans les analyses. Les fréquences alléliques
des SNP des témoins d’origine européenne de l’étude CATHY et de l’étude de NC étant
similaires (annexe 10), nous avons regroupé tous les sujets européens de ces études.
Au final, les analyses ont donc porté sur 508 cas et 629 témoins d’origine européenne
provenant des études CATHY et NC, et 156 cas et 112 témoins d’origine mélanésienne
provenant de l’étude de NC (Figure 3).
43