• Aucun résultat trouvé

WES et maladies complexes

Dans le document en fr (Page 72-75)

CHAPITRE I : METHODOLOGIE DE L’ETUDE GENETIQUE DES MALADIES

I.5. Identification de la composante génétique des maladies humaines

I.5.6. Analyse des données de séquençage d’exome

I.5.6.2. WES et maladies complexes

Les techniques de séquençage d’exome peuvent aussi être considérées dans le cadre l’étude de maladies complexes (Kiezun, Garimella et al. 2012), offrant des alternatives à l’hypothèse maladie fréquente variants fréquent largement exploité par les GWAS avec un succès relatif. Plusieurs stratégies d’analyse ont été développées pour tester l’hypothèse de l’implication de variants rares et extrêmement rares dans les maladies complexes. Il s’agit entre autres d’études d’association de variants rares (Kozlitina, Smagris et al. 2014, Jackson, Ntalla et al. 2016), de stratégies de WES pour les individus porteurs du phénotype sévère du trait étudié (Cohen, Kiss et al. 2004), au sein d’isolats génétiques (Holm, Gudbjartsson et al. 2011), ou encore de stratégies de reséquençage de loci identifiés au préalable par GWAS (Johansen, Wang et al. 2012).

Dans cette section nous aborderons uniquement les études d’association de variants rares.

I.5.6.2.1. Etude d’association de variants rares

L’étude d’association des variants rares est une approche intéressante dont la démarche consiste à comparer l’ensemble des variants identifiés par WES chez des cas porteurs du trait étudié et des témoins non porteurs. Cependant, cette approche à priori séduisante, se heurte à

65 une difficulté majeure. Il s’agit de la puissance des tests d’association simples –marqueurs qui est largement compromise par la fréquence des variants rares et leur nombre bien plus important. Pour surmonter cette difficulté, plusieurs développements méthodologiques de tests d’association de variants rares proposent de tester l’effet combiné de n variants regroupés au sein d’un gène, une région chromosomique ou un pathway d’intérêt. Cette approche peut être conduite sur des données de séquençage dont le coût est de plus en plus accessible mais aussi et surtout sur des données de puce exoniques développées à partir de projets de séquençage en population générale (Exome Chip Design 2014).

I.5.6.2.1.1. Les "burden" tests

L’une des premières méthodes proposées est le Combined Multivariate and Collapsing (CMC) test de Li et collaborateurs (Li and Leal 2008). Cette approche propose de combiner les signaux de plusieurs variants rares d’une unité fonctionnelle ou d’un gène candidat au sein d’un signal commun ou score génétique dont on va tester l’association avec le phénotype. Le score génétique d’un individu est de 1 s’il a au moins un variant rare dans le gène et 0 sinon (Li and Leal 2008).

Des évolutions du CMC ont été proposées et sont basées sur des approches différentes pour définir le score génétique par individu (Lin, Zhang et al. 2011). Ainsi, Madsen et Browning proposent d’utiliser un système de pondération qui privilégie les variants rares (Weighted-Sum

test) (Madsen and Browning 2009). Prince et collaborateurs proposent quant à eux d’utiliser

des seuils variables de fréquences pour discriminer les variants rares, et Morris et Zeggini proposent d’utiliser des seuils fixes (Morris and Zeggini 2010). Toutes ces différentes approches constituent ce qu’on appelle les tests de type "burden" car elles supposent que

66 l’ensemble des variants rares regroupés au sein du gène candidat ont un effet sur le phénotype dans la même direction avec un degré similaire (Lee, Wu et al. 2012). Les "burden" tests sont donc plus puissants lorsque tous les variants rares ont un effet soit délétère soit protecteur (Basu and Pan 2011). Ainsi, une nouvelle classe de tests d’association de variants rares a été développée pour s’affranchir de ces hypothèses fortes pour une puissance optimale des "burden" tests ou "tests de fardeau"

I.5.6.2.1.2. Les "non-burden" tests : SKAT

Il s’agit de tests comme le C-alpha (Neale, Rivas et al. 2011) et le SKAT (Sequence

Kernel Association Test) (Wu, Lee et al. 2011). Ces tests sont optimisés pour prendre en compte

des variants avec des effets variés au sein du même gène. Le SKAT est une généralisation du C-alpha et il est représentatif des tests de type "non-burden". Il utilise une régression basée sur l’utilisation d’un algorithme d’apprentissage automatique (kernel machine regression

framework).

Il permet donc d’inclure des covariables dans le modèle de régression et il intègre également un système de pondération qui peut être modifié en fonction des connaissances préalables.

Bien souvent, l’implication de l’effet des différents variants est inconnue et choisir au préalable la bonne approche entre "burden" tests et SKAT est impossible. Une approche optimale combinant ces deux tests a été proposée par Lee et collaborateurs. Il s’agit du SKAT- O dont la performance a été démontrée par rapport au "burden" test et SKAT pris individuellement dans différents scénarios (Lee, Wu et al. 2012).

67 Ainsi, le SKAT est largement utilisé dans le cadre des études d’association de variants rares (Huyghe, Jackson et al. 2013, Kozlitina, Smagris et al. 2014) pour lesquelles il représente la méthode de référence. Le SKAT a en outre aussi connu de nombreux autres développements. Il est désormais adapté pour les échantillons de petite taille (Lee, Emond et al. 2012). Il permet aussi de tester l’association combinée de variants rares et fréquents au sein du même gène (Ionita-Laza, Lee et al. 2013), de conduire des méta-analyses d’études d’association de variants rares (Lee, Teslovich et al. 2013) et plus récemment des études d’interactions de variants rares avec les facteurs environnementaux iSKAT (Lin, Lee et al. 2016).

Notons que ces tests d'association de variants rares comme dans le cadre des GWAS permettent uniquement de mettre en évidence une association statistique pour des régions chromosomiques ou des gènes susceptibles de contenir les facteurs causatifs. Ils ne permettent pas de présumer de l’implication fonctionnelle des variants constituant la région génomique. Ainsi un gène présentant une association significative avec le trait étudié, des explorations complémentaires doivent être conduites individuellement pour chacun des variants le constituant pour démontrer des mécanismes fonctionnels permettant la preuve de causalité.

Dans le document en fr (Page 72-75)

Documents relatifs