• Aucun résultat trouvé

Méthodologie des GWAS

Dans le document en fr (Page 51-57)

CHAPITRE I : METHODOLOGIE DE L’ETUDE GENETIQUE DES MALADIES

I.5. Identification de la composante génétique des maladies humaines

I.5.3. Etude d’association génétique

I.5.3.5. Méthodologie des GWAS

Les GWAS sont classiquement divisées en deux grandes phases (Bush and Moore 2012). Dans la première appelée phase de découverte, les données de génotypage par puce de la population d’étude subissent un contrôle qualité approfondi (QC) (Anderson, Pettersson et al. 2010) puis l’analyse statistique visant à tester l’association de chacun des polymorphismes

44 passant le QC avec le trait étudié est réalisée. L’étape du QC avant la mise en œuvre de différents tests d’association est très importante car elle permet d’éviter les faux positifs en excluant les échantillons d’ADN de mauvaise qualité, les marqueurs mal génotypés, ainsi qu’un éventuel biais de stratification de population. De plus, de nouveaux marqueurs peuvent être imputés à partir de génotype existant dans la phase de découverte (Marchini and Howie 2010), afin de permettre une couverture encore plus large du génome des individus étudiés.

La seconde phase, consiste à confirmer les polymorphismes les plus associés dans la phase de découverte au sein de cohortes indépendantes de réplication (Studies, Chanock et al. 2007). Il s’agit du « gold standard » pour la validation statistique de l’association des polymorphismes identifiés dans la phase de découverte et éventuellement s’affranchir d’un potentiel « winner’s curse », synonyme d’effet pour le variant identifié beaucoup plus fort dans la population du GWAS que dans la population générale (Zollner and Pritchard 2007). Notons aussi que la cohorte de réplication doit provenir d’une population avec la même ascendance ethnique que celle de la phase de découverte et ayant une caractérisation phénotypique identique. En résumé, la réplication consiste à conduire une nouvelle étude d’association, la plus proche possible de celle de la phase de découverte, en n’examinant cette fois que l’implication spécifique de variants associés au trait sous un certain seuil de significativité. Ainsi, peuvent alors être considérés comme répliqués les variants associés à nouveau dans la cohorte de réplication et présentant un effet sur le trait étudié allant dans la même direction pour les deux études (Bush and Moore 2012).

Notons que compte tenu du nombre important de variants testés dans la phase de découverte, l’interprétation de la p-value d’association tient compte de la problématique des tests multiples. Ainsi, on considère généralement un seuil de significativité à P = 5 × 10-8 après

45 puissance statistique nécessaire pour atteindre ce seuil, l’une des stratégies dans le cadre des

GWAS est d’augmenter la taille de l’échantillon étudié. Cela peut se faire directement à la phase

de découverte ou en collaboration entre différentes équipes dans le cadre de méta-analyses de résultats de GWAS (Willer, Li et al. 2010, Anttila, Winsvold et al. 2013, Evangelou and Ioannidis 2013).

Le challenge de la méthodologie des GWAS est donc d’apporter des arguments statistiques exhaustifs à partir d’études rigoureusement conduites permettant de mettre en évidence des polymorphismes associés au trait étudié. L’objectif ultime étant d’identifier à partir de ces signaux d’associations, des variants de prédisposition qui feront l’objet d’une caractérisation fonctionnelle dans le but de lier le locus à la pathologie/trait étudiée.

I.5.3.6. GWAS : du polymorphisme de prédisposition à la fonction

L’évaluation de l’implication causale des variants de prédisposition identifiés par les

GWAS passe par la mise en œuvre d’expérimentations fonctionnelles. Ces études peuvent être

conduites initialement in-vitro, par la surexpression de l'allèle à risque dans une lignée de cellules immortalisées, biologiquement pertinentes pour le trait étudié. Le résultat de ces expériences peut ensuite être confirmé dans des cellules de donneurs sains ou malades portant différents génotypes au marqueur d'intérêt. Le but étant de montrer une expression différentielle du gène entre les cas et les témoins d’une part puis en fonction du génotype porté d’autre part.

Ces expérimentations initiales peuvent être complétées par l’introduction de modifications génomiques au locus étudié dans des modèles expérimentaux. De même, le développement de souris mutantes knock-out (KO) peut fournir des informations importantes

46 sur les mécanismes moléculaires de médiation des effets pathogènes des loci de prédisposition au trait étudié (Edwards, Beesley et al. 2013).

I.5.3.7. Limite des GWAS : héritabilité manquante

Les études d’association pangénomiques ont ouvert la voie à l’identification de milliers de variants génétiques (Burdett T (EBI) , Welter, MacArthur et al. 2014) permettant une avancée significative dans la détermination de la composante génétique des maladies complexes (Manolio 2010). Cependant, malgré toutes ces avancées, ces études présentent quelques limites. Pour la grande majorité des polymorphismes associés identifiés par les GWAS, aucun lien de causalité n’a encore été mis en évidence. Cela s’explique par le fait que ces variants sont situés le plus souvent dans des régions non codantes ou intergéniques du génome. Pour ceux-ci, il est difficile d’identifier le variant causal en LD avec le variant associé ou même de leur associer un rôle fonctionnel. De plus, l’ensemble des variants fréquents associés aux maladies complexes pris conjointement ne permettent d’expliquer qu’une part limitée de la variabilité phénotypique (Manolio, Collins et al. 2009). Il en résulte donc une héritabilité manquante pour la majeure partie des maladies complexes que plusieurs facteurs peuvent expliquer.

I.5.3.7.1. Le rôle des variants rares

Les GWAS sont focalisés sur l’étude des marqueurs relativement fréquents dans la population générale (MAF ≥ 5%) faisant totalement l’impasse sur les variants rares et très rares (Zeggini, Rayner et al. 2005). Or, on s’attend à ce que ces variants rares aient un effet plus

47 important sur le trait étudié, participant ainsi de façon importante à l’héritabilité des maladies complexes (Frazer, Murray et al. 2009). Ceci dit, l’étude d’association des variants rares est beaucoup plus ardue. La majeure partie des puces de génotypage offre une couverture limitée de ces variants et les méthodes statistiques utilisées dans les GWAS ne sont pas assez puissantes à cause de la faible fréquence allélique et de l’extrême hétérogénéité allélique. Ainsi, des variants génétiques rares de prédisposition aux maladies complexes ont déjà été identifiés (Rivas, Beaudoin et al. 2011, Jonsson, Atwal et al. 2012). Ces variants peuvent donc avoir une implication non négligeable dans les maladies complexes (Iyengar and Elston 2007, Liu and Leal 2010, Ionita-Laza, Buxbaum et al. 2011, Saint Pierre and Genin 2014) et pourraient donc expliquer en partie cette héritabilité manquante.

Notons aussi que le terme variant rare est largement utilisé de nos jours sans consensus clair sur sa définition exacte qui peut être évoquée dans de multiples circonstances soit en synonyme au terme mutation, soit en opposition à polymorphisme ou tout simplement à variant fréquent. Nous retiendrons donc cette dernière définition du terme variant rare en opposition à variant fréquent dans la population avec un seuil de discrimination de la MAF qui varie entre 0,1% (Gorlov, Gorlova et al. 2011), 1% (Frazer, Murray et al. 2009) voire 5% (Bodmer and Bonilla 2008).

I.5.3.7.2. Puissance statistique des GWAS et seuil génomique

Le manque de puissance statistique imputable à la taille de la population étudiée est également une source de limitations des GWAS. La maximisation des chances de détecter des variants associés nécessiterait de recruter des échantillons de dizaines de milliers d’individus (Park, Wacholder et al. 2010) inenvisageable en pratique pour de nombreuses maladies. En

48 outre, le seuil de significativité génomique de P = 5 × 10-8, bien que faisant l’objet d’un

consensus semble toutefois très conservateur de même que la notion de seuil qui fait penser que l’ensemble des polymorphismes en dessous peuvent n’avoir aucune implication fonctionnelle pour le trait étudié, ce qui n’est pas toujours le cas (Germain, Eyries et al. 2013).

I.5.3.7.3. Autre limites pour les GWAS : modèle génétique, interaction, CNVs

Le modèle génétique des GWAS, qui teste indépendamment l’implication de chaque marqueur dans la maladie peut paraitre assez réducteur. Il est évident que l’architecture génétique des maladies complexes est bien plus compliquée avec l’implication et l’interaction de plusieurs variants appartenant aussi bien au même gène qu’à des gènes différents ou à la même voie métabolique (pathway). D’autres facteurs peuvent aussi être source d’héritabilité manquante. Il s’agit de l’implication de variations structurales comme les CNVs (Kidd, Cooper et al. 2008, Sudmant, Rausch et al. 2015), de polymorphismes de novo, de l’hétérogénéité génétique ou même d’une héritabilité surestimée (Clarke and Cooper 2010).

De ce fait, de nouvelles approches ont été pensées et développées pour permettre d’éviter l’héritabilité manquante. Il s’agit notamment des techniques de séquençage nouvelle- génération (NGS), qui ont permis l’accès aux variants rares ouvrant ainsi la voie à de nouvelles opportunités dans l’étude génétique des maladies humaines (Kiezun, Garimella et al. 2012).

49

Dans le document en fr (Page 51-57)

Documents relatifs