• Aucun résultat trouvé

Figure 18. Scénarii selon lesquels les variants génétiques permettent de distinguer les cas des contrôles

Figure 18. Scénarii selon lesquels les variants génétiques permettent

de distinguer les cas des contrôles.

La ligne bleue représente des régions génomiques ; les rectangles rouges représentent les variants.

(a) A un seul locus, un variant fréquent est plus présent chez les patients que chez les contrôles.

(b) Plusieurs variants rares contribuent au phénotype de telle sorte que la fréquence collective des variants rares est plus importante chez les patients. (c) Plusieurs variants rares contribuent au phénotype mais agissent de manière coordonnée de telle sorte que les patients sont plus à même d’avoir des séquences similaires comparées aux contrôles.

(d) Plusieurs variants rares contribuent au phénotype mais les variations sont positionnnées dans des régions génomiques spécifiques.

2.4.2. Approches expérimentales pour l’étude des variants rares

Deux stratégies sont possibles pour étudier ces variants (Bansal, Libiger et al. 2010, Metzker 2010):

- La première, sans à priori, consiste à étudier les variants rares ou à faible MAF présents dans les exons grâce à de nouvelles puces à ADN: les ExomeChip. Ces études requièrent des échantillons de taille importante. Les estimations du nombre d’échantillons (avec autant de cas et de contrôles) nécessaires pour atteindre une puissance de 80% afin de détecter un OR de 2 à une p-value significative genome-wide de 5x10-8 augmentent de 12 000 à 117 000 échantillons, lorsque la MAF diminue respectivement de 0,01 à 0,001 (Asimit and Zeggini 2010).

- La deuxième, avec à priori, consiste à utiliser le séquençage pour identifier des variants rares se trouvant dans ou à proximité des régions identifiées comme associées à la maladie par les GWAS.

2.4.3. Hypothèses sur le rôle des variants rares dans la prédisposition génétique

Comment les variants rares pourraient-ils jouer un rôle dans la prédisposition aux maladies complexes ? La Figure 18 reprend les hypothèses les plus probables (Bansal, Libiger et al. 2010) :

- un variant rare pourrait influencer la maladie indépendamment des autres variants - l’interaction entre des variants rares et des variants communs ou peu fréquents serait à l’origine de la maladie

- quelques variants rares influenceraient un phénotype déterminé par leur localisation dans un élément fonctionnel d’une région d’intérêt

L’hypothèse la plus étudiée est l’Hétérogénéité Allélique Extrême (HEA ou Extreme Allelelic Heterogeneity, EAH), dans laquelle un individu ou des petits sous-groupes d’individus présentant un phénotype particulier de la maladie possède un ou quelques sous-ensemble(s) d’un groupe plus large de variants rares qui tous indépendamment les uns des autres ne perturbent qu’un seul gène d’une manière similaire (McClellan and King 2010). !

!

2.4.4. Limites

Avec l’étude des variants rares se pose aussi le problème des méthodes statistiques à utiliser.

La plus simple d’entre elles consiste à tester de manière indépendante les variants rares pour leur association avec la maladie. Cependant, comme mentionné précédemment, cette méthode nécessite des échantillons de grande taille (de 12.000 à 117.000 patients) pour atteindre des puissances statistiques suffisantes.

Une solution permettant de passer outre ce problème de puissance serait d’étudier l’association de sous-groupes de variants. La stratification des variants en sous-groupes est alors basée sur les fonctions des gènes et /ou sur la prédiction du risque plus ou moins délétère que pourrait conférer chaque variant. Ainsi, dans sa forme la plus simple, cette stratégie reposerait sur le fait de compter le nombre d’individus portant un variant rare à n’importe quelle position dans la région génomique d’intérêt ou dans le groupe de régions d’intérêt, puis de calculer la fréquence de ces individus chez les patients et les contrôles et enfin de tester la différence de fréquences entre ces deux groupes (Bansal, Libiger et al. 2010).

Au cours de mon doctorat, je me suis intéressé à l’hypothèse des variants rares par le biais d’une étude de l’IMSGC, le projet ExomeChip. Ce projet vise à génotyper 243.094 variants dans une cohorte de 16.762 patients et de 10.397 contrôles. Les variants analysés étant rares, l’analyse individuelle des SNPs n’aurait que peu de puissance statistique. C’est pourquoi la stratégie d’analyse sera probablement d’étudier la charge génétique en variants rares au sein d’un gène ou d’un pathway. L’orientation stratégique de l’analyse des résultats est en cours de discussion au sein du consortium.

Dans le cadre de ce projet, mon rôle a été de génotyper 400 patients et 200 contrôles français en utilisant la puce ExomeChip créée par Illumina et d’effectuer les premiers contrôles qualités. J’ai aussi été le représentant de l’équipe au cours des différents échanges qu’il y eu jusqu’à maintenant.

Ce projet est en cours et n’a pour le moment pas atteint la phase finale d’analyse. Il ne constituera donc pas une partie à part entière de ce mémoire.

2.5. Hypothèse 5 : L’interaction de variants d’un même réseau

biologique confère un risque de développer la maladie

Les études de criblage anonyme du génome ont permis l’identification de régions de prédisposition de différentes maladies complexes comme la SEP. Les analyses statistiques utilisées dans ces projets pan-génomiques ont consisté à tester l’association individuelle de chaque variant avec la maladie (Wang, Li et al. 2010). Cependant, cette stratégie a une puissance limitée pour identifier le rôle des gènes ayant un effet individuel très faible ou nul. Néanmoins, il est probable que parmi ces variants à faible effet individuel, il en existe certains qui, en interaction, peuvent conférer un risque de prédisposition aux maladies. De plus, même si un certain nombre de gènes ont été identifiés par les GWAS dans différentes maladies, très peu d’entre eux peuvent être reliés à des mécanismes biologiques expliquant la physiopathologie des maladies. Enfin, même s’il est primordial d’identifier les gènes de prédisposition aux maladies, il est également nécessaire d’étudier et d’identifier les pathways ou les réseaux biologiques pouvant être impliqués dans leur développement (Ramanan, Shen et al. 2012).

Il a déjà été montré dans certaines pathologies, comme la maladie de Crohn ou le diabète de type 2, que des gènes impliqués dans la même fonction biologique influencent collectivement la prédisposition à la maladie, même si les variants de ces gènes considérés de manière individuelle ne confèrent aucun risque génétique (Wang, Li et al. 2010, Zhong, Yang et al. 2010).

Ainsi, les analyses des réseaux biologiques (ici analyses pathways) sont aujourd’hui le lien indispensable à identifier entre les données génétiques de prédisposition et les phénotypes cliniques des patients. Même si les analyses pathways sont aujourd’hui très populaires, les stratégies d’analyses ont progressé ces dernières années sans véritables lignes directrices (Ramanan, Shen et al. 2012).

2.5.1. Définition d’une analyse pathway

Dans une analyse pathway, un groupe de gènes impliqués dans une même voie biologique, le pathway, est testé pour l’enrichissement en signaux d’association avec la maladie. Cette analyse permet de répondre à la question suivante : Le groupe de gènes

montre-t-il significativement plus d’association que ce à quoi on s’attendrait sous l’hypothèse nulle ? (Holmans 2010)