• Aucun résultat trouvé

a. Génotypage de SNP de gènes candidats et des régions 9q22 et 14q13

Partie 1 Etude des gènes candidats et des régions identifiées par les études GWAS dans les

1.2. Matériel et méthodes

1.2.3. a. Génotypage de SNP de gènes candidats et des régions 9q22 et 14q13

Nous avons conçu une puce génétique de 96 SNP regroupant 38 SNP de gènes candidats,

11 tags-SNP (incluant les SNP rs965513 et rs1867277) du locus 9q22 (entre le SNP GWAS

rs965513 et le gène FOXE1) et 47 tags SNP (incluant les SNP rs944289 et rs116909374) du

locus 14q13 (entre les gènes PTCSC3 et NKX2-1).

Les SNP des gènes candidats sélectionnés pour réplication dans notre étude sont

rapportés dans le Tableau 2; ils ont été sélectionnés de la manière suivante :

- Polymorphismes associés au risque de CDT dans au moins deux études (Landa &

Robledo 2011), en 2012 soit 10 SNP incluant les SNP GWAS rs2439302 du locus 8q12

et rs966423 du locus 2q35 ainsi que 7 SNP identifiés dans les études de liaisons

pan-génomique.

- Polymorphismes associés au risque de CDT dans une seule étude mais pouvant être

impliqués dans la survenue de CDT selon des études fonctionnelles (10 SNP dont 5 SNP

dans le gène ATM).

- Polymorphismes des gènes de l’obésité mis en évidence dans les études du consortium

PAGE (Fesinmeyer et al. 2013) (« Population Architecture using Genomics and

Epidemiology ») et répliqués dans d’autres études (9 SNP). Nous nous sommes

intéressés à ces polymorphismes du fait du rôle avéré de l’obésité dans le risque de

CDT.

40

Tableau 2: Liste des SNP sélectionnés pour réplication dans les études CATHY et Nouvelle

Calédonie.

SNP Gene Position Fonction Données littérature

Variants répliqués dans au moins 2 études

rs6983267 gene desert 8q24 Landa et al. 2011

rs1042522 TP53 17p13 p.Arg72Pro Landa et al. 2011

rs2910164 pre-miRNA-146a 5q24 Landa et al. 2011

rs861539 XRCC3 14q32 p.Thr241Met Landa et al. 2011

rs25487 XRCC1 19q13 p.Arg399Gln Landa et al. 2011

rs1799782 XRCC1 19q13 p.Arg194Trp Landa et al. 2011

rs966423 2q35 SNP GWAS (Gudmunson et al. 2012)

rs2439302 8p12 SNP GWAS (Gudmunson et al. 2012)

rs732609 TPO 2 exon12 Cipollini et al 2013

rs2048722 TPO 2 Cipollini et al 2013

Variants non répliqués mais avec fonction biologique pertinente dans les CDT

rs1133076 TG 8q24 p.Arg2530Gln Landa et al. 2011

rs4752904 PTPRJ 11p11.2 p.Asp872Gln Landa et al 2011

rs4903957 TSHR Associé au taux circulant de TSH (Arnaud-Lopez et al, 2008)

rs2252696 TG 8q24 TSH(Arnaud-Lopez et al 2008) + familial PTC (He et al 2009 )

rs1801516 ATM 11q22 Asp1853Asn Landa et al. 2011

rs664677 ATM 11q22 IVS22-77 T>C Landa et al. 2011

rs1800057 ATM 11q22 P1054R Xu et al 2012

rs189037 ATM 11q22 promoteur Xu et al 2012

rs3092993 ATM 11q22 Damiola et al. 2014

rs3764340 WWOX 16q23 Cancemi et al. 2011

SNP des cas familiaux de PTC

rs6885099 PDE8B 5q13 TSH (Arnaud-Lopez et al. 2008)

rs1445493 8q23 Cas familiaux (Cavaco et. al 2008)

rs822318 8p22 Cas familiaux

rs9942754 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)

rs2702968 SLA/TG 8q24 Genome-wide linkage analysis (He et al, 2009

rs2702967 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)

rs17695552 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)

rs2741205 SLA/TG 8q24 Genome-wide linkage analysis (He et al. 2009)

Gènes obésité (Fesinmeger et al 2013)

rs9939609 FTO 16 rs10767664 BDNF 11 rs7498665 SH2B1 16 rs6548238 TMEM18 2 rs2815752 NEGR1 1 rs17782313 MC4R 18 rs12970134 MC4R 18 rs11084753 KCTD15 19 rs13130484 GNPDA2 4 rs10838738 MTCH2 11

Afin de mieux couvrir les régions 9q22 et 14q13 identifiés par les études GWAS, des tags

SNP ont été sélectionnés de manière à représenter au moins 80% de la variabilité génétique

dans chacune des régions ; les SNP sélectionnés devaient avoir une fréquence de l’allèle

mineur d’au moins 0,05 et une corrélation d’au moins 0,8 avec les autres tags SNP du locus

41

dans la population européenne de HapMap. Le design et la sélection des SNP a été effectué

avec le logiciel Tagger software (Howie et al. 2011)).

Le génotypage de la puce (puce « Fluidigm Dynamic array » à 96 SNP) a été effectué par

la société Integragen.

i. Contrôle qualité des SNP

Les amorces (« oligonucleotide primers ») utilisées pour le génotypage des SNP ont

dans été vérifiées sur un échantillon de 90 sujets CEPH pour lesquels le génotypage est connu

et publié dans HapMap et dans le projet 1000 génomes. Les génotypes observés avec ces

amorces avaient un taux de concordance d’au moins 98 % avec les génotypes publiés pour ces

SNP chez les 90 sujets CEPH.

Le taux de génotypage ou « call rate » de tous les SNP génotypés était supérieur à 95%.

Nous avons également testé la déviation à l’équilibre d’Hardy Weinberg (HW) pour chaque

SNP séparément chez les européens et chez les mélanésiens.

La loi d’équilibre d’HW stipule qu’au sein d’une population théorique idéale, les

fréquences alléliques et génotypiques d’un polymorphisme sont distribuées de manière

équilibrée d’une génération à l’autre. Les fréquences génotypiques sont déterminées à partir

des fréquences alléliques par la relation suivante : dans le cas d'un polymorphisme à deux

allèles A de fréquence p et deux allèles a de fréquence (1-p), nous avons une fréquence

attendue de p

2

pour le génotype AA, 2p(1-p) pour Aa et (1-p)

2

pour le génotype aa. Un écart

trop important à l’équilibre d’Hardy-Weinberg peut être la conséquence de problème de

génotypage. Le test d’équilibre de HW correspond à par un test de chi2 à 1 degré de liberté

comparant les génotypes observés aux attendus sous l’équilibre de HW.

Nous avons corrigé le test de l’équilibre d’HW sur le nombre de tests effectués en

appliquant la méthode de Bonferroni. Les SNP ayant une p-value inférieure à 5x10

-4

(sur la

base de 96 tests effectués) pour le test d’équilibre d’HW étaient ainsi exclus de l’analyse. Dans

nos deux populations, tous les SNP génotypés respectaient l’équilibre d’HW. Aucun des 96

SNP, n’a donc été exclu de l’analyse.

42

ii. Contrôle qualité des sujets

Parmi les 231 cas et 270 témoins de l’étude Nouvelle-Calédonie, et 517 cas et 568

témoins de l’étude CATHY pour lesquels nous avions des prélèvements ADN, 64 cas et 65

témoins de l’étude CATHY n’ont pas été génotypés du fait d’une trop faible concentration

d’ADN.

Les sujets ayant un taux de génotypage ou « call rate » < 90% (10 cas et 2 témoins de

l’étude CATHY et 9 cas ainsi que 9 témoins de l’étude de NC) ainsi que les sujets s’étant

déclarés d’origine non européenne ou non mélanésienne ont été exclu de l’analyse (28 cas et

12 témoins dans l’étude CATHY, 32 cas et 59 témoins dans l’étude de NC).

Au total, 481 cas et 544 témoins d’origine européenne de l’étude CATHY ainsi que 183

cas et 194 témoins de l’étude de NC (dont 156 cas /112 témoins d’origine mélanésienne et 27

cas /82 témoins d’origine européenne) sont inclus dans les analyses. Les fréquences alléliques

des SNP des témoins d’origine européenne de l’étude CATHY et de l’étude de NC étant

similaires (annexe 10), nous avons regroupé tous les sujets européens de ces études.

Au final, les analyses ont donc porté sur 508 cas et 629 témoins d’origine européenne

provenant des études CATHY et NC, et 156 cas et 112 témoins d’origine mélanésienne

provenant de l’étude de NC (Figure 3).

43