• Aucun résultat trouvé

4. Combinaison d’approches génétiques et moléculaires pour étudier les différences

4.1. Contrôle génétique de l’expression des gènes

4.1.1. Principe des eQTL et complémentarité avec les GWAS

Une variation génétique peut faire varier un trait phénotypique si elle est située dans une séquence codante, perturbant la séquence d’acides aminés ou induisant un arrêt de sa traduction, ou si elle est localisée dans une séquence régulatrice de l’expression génique, induisant une variation de la quantité de transcrit. Les analyses d’associations pangénomiques que nous avons évoquées dans la section 2 visent à identifier les variations génétiques qui participent à la variabilité phénotypique. Seules 9 % des mutations mises en évidence par ces approches modifient une séquence protéique (Hindorff et al., 2009). De plus, 43 % des sites associés à une variabilité phénotypique sont localisés dans des séquences intergéniques qui sont apparues au cours de ces dernières années comme participant à la régulation de l’expression des gènes (Schaub et al., 2012). La majorité des sites identifiés par GWAS semble donc participer au phénotype via un contrôle de la transcription.

Les niveaux d’expression génique peuvent servir de phénotype d’étude intermédiaire entre un trait complexe observé au niveau de l’organisme et les variations génétiques (Jansen and Nap, 2001). De plus, les variations portant sur la régulation de la quantité des transcrits sont estimés comme jouant un rôle important dans l’adaptation locale des populations à leur environnement (Fraser, 2013). Caractériser la diversité génétique présente dans les régions régulatrices et tenter de la corréler à l’expression des séquences codantes revient donc à identifier des variations génétiques qui sont impliquées dans la variabilité de phénotypes plus complexes et qui peuvent être le fruit d’une adaptation de la population à un environnement (Gaffney, 2013). Un marqueur génétique de la quantité d’un transcrit est appelé eQTL de l’anglais expression Quantitative Trait Loci. Les sites identifiés par GWAS ont significativement plus de chance d’être associés à des différences d’expression génétique que ce qui est attendu par hasard (Nica et al., 2010; Nicolae et al., 2010). La cartographie d’eQTL se révèle donc complémentaire des GWAS dans le but d’identifier les causes génétiques des variabilités de phénotypes complexes.

Les cartographies d’eQTL ont l’avantage de requérir une cohorte moins importante que les GWAS (~50-200 individus non apparentés) pour avoir un pouvoir de détection de l’association suffisant. Leur efficacité à établir un lien entre génotype et phénotype moléculaire dépend aussi du nombre de transcrits dont l’expression est mesurée. Le développement des puces d’expression et, plus récemment, des techniques de séquençage des

ARN, a donc été une étape critique pour leur réalisation et permettent aujourd’hui d’obtenir des résultats particulièrement détaillés et non biaisés lors de l’utilisation des techniques de séquençage. De la même manière, l’amélioration constante des techniques de séquençage du génome permet d’identifier de plus en plus de variations génétiques, augmentant la résolution de la cartographie des eQTL.

4.1.2. Organisation génomique des eQTL

Au cours des dernières années, de nombreuses cartographies d’eQTL ont été réalisées dans différentes populations humaines (par exemple Lappalainen et al., 2013; Pickrell et al., 2010; Stranger et al., 2012)

Les eQTL peuvent être situés à différentes distances des gènes. Ils peuvent être proximaux et agir en cis ou être distaux et agir en trans. Les signaux d’associations les plus forts ont souvent été localisés à proximité du site d’initiation de la transcription (Montgomery and Dermitzakis, 2011). Ces résultats suggèrent que les régions génomiques proches des gènes tels que le promoteur et les sites de fixation des facteurs de transcription ont un effet particulièrement fort sur l’expression des gènes. Cependant, l’étendue de la cartographie des

trans-eQTL requiert des corrections contraignantes, ce qui pourrait laisser supposer une potentielle perte de signal expliquée par la nécessité de la maitrise du nombre de faux résultats positifs du test. Par exemple, la recherche de trans-eQTL dans le cadre de l’immunité n’a permis de détecter que deux sites, chacun contrôlant l’expression de nombreux transcrits, qui seraient d’importants régulateurs de la quantité de transcrits dans les cellules (Fairfax et al., 2014, 2012). De plus, alors que les cis-eQTL ont un effet fort sur l’expression du gène dont ils sont proches, il a été proposé que les trans-eQTL ont, eux, un effet plus modeste sur l’abondance des ARNm, ce qui laisse supposer un rôle biologique plus important que ce qui est aujourd’hui démontré pour cette classe d’association génotype-phénotype (Gilad et al., 2008; Majewski and Pastinen, 2011; Montgomery and Dermitzakis, 2011).

L’influence de certains trans-eQTL sur un grand nombre de transcrits peut mener à l’identification de voies de signalisation grâce à une approche non biaisée par le choix de candidats d’étude. Ainsi, il a récemment été démontré qu’un locus lié à l’expression de nombreux gènes impliqués dans la réponse à l’interféron dans le cadre du lupus érythémateux disséminé était aussi corrélé à l’expression du facteur de transcription IKZF1 (Westra et al.,

2013). Les gènes régulés en trans par ce SNP se sont révélés enrichis en séquences servant à la fixation d’IKZF1, permettant de lever le voile sur le rôle de ce facteur de transcription dans la maladie systémique auto-immune étudiée. De nombreux autres trans-eQTL ont été identifiés dans la région génomique contenant les gènes codant pour le CMH (Fairfax et al., 2014, 2012; Fehrmann et al., 2011; Westra et al., 2013). Ces locus ont été associés à des différences d’expression du CMH-II dans des contextes particuliers (Fairfax et al., 2014), soulignant l’importance de l’effet de l’environnement sur ces associations.

4.1.3. eQTL et identification d’interactions entre gènes et environnement

Les phénotypes complexes résultent de l’interaction de nombreux facteurs génétiques et environnementaux. Cette complexité rend une étude globale impossible, ou tout du moins peu puissante. En revanche, réduire l’analyse à des approches cellulaires permet de mieux comprendre l’interaction entre les facteurs extérieurs et les variations génétiques impliquées dans les phénotypes non mendéliens (Dermitzakis, 2012; Idaghdour and Awadalla, 2012; Maranville et al., 2012). La cartographie d’eQTL permet d’atteindre ce niveau de détails. Des études récentes ayant utilisé différentes approches ont ainsi montré qu’une même variation génétique pouvait avoir des conséquences différentes sur l’expression de certains gènes en fonction de l’état d’activation de la cellule (Figure 10, Barreiro et al., 2012; Dombroski et al., 2010; Fairfax et al., 2014; Gargalovic et al., 2006; Lee et al., 2014; Maranville et al., 2011; Romanoski et al., 2010; Smirnov et al., 2009; Smith and Kruglyak, 2008), identifiant des eQTL de réponse. Les travaux réalisés chez l’Homme ont identifié des eQTL de réponse corrélés à l’expression de gènes suite à la stimulation de différents types cellulaires par des facteurs variés. Deux études ont à ce jour utilisé une stimulation des cellules par un agent infectieux, permettant d’identifier des facteurs génétiques impliqués dans les différences interindividuelles de réponses immunitaires (Barreiro et al., 2012; Lee et al., 2014). De telles stratégies d’étude permettent donc d’avoir une vue plus détaillée du contrôle génétique de l’expression des gènes, qui peut se faire dans un contexte environnemental particulier uniquement ou qui peut varier en fonction des facteurs externes à la cellule. Les SNP contrôlant l’abondance de transcrits et dont l’effet dépend de facteurs environnementaux se sont montré enrichis en locus liés à un risque de maladies infectieuses dans deux analyses (Barreiro et al., 2012; Fairfax et al., 2014). Cela traduit une fois de plus l’importance de la régulation de l’expression des gènes dans le devenir de l’infection et la susceptibilité aux

Figure 10. Régulation génétique de l’expression génique.

Pas d’eQTL : aucune association n’est retrouvée entre le génotype à un site donné et l’expression du gène. eQTL : l’expression du gène est corrélée au génotype au SNP considéré. eQTL de réponse : alors qu’aucune association entre génotype et expression génique n’est observée dans les cellules non stimulées (gris), on observe une corrélation entre génotype et phénotype suite à l’activation des cellules par un facteur extérieur (par exemple l’infection, en bleu).

maladies infectieuses. Si nous avons pour l’instant discuté du contrôle génétique de cette expression, il parait aussi d’intérêt de considérer les transcrits impliqués dans la régulation de la quantité des ARNm.