• Aucun résultat trouvé

d’interactions gène-environnement

La puissance statistique est modeste dans la majorité des études d’interaction gène-environnement sur le risque de maladie d’origine multifactorielle, en particulier lorsque le polymorphisme est rare et/ou la fréquence de l’exposition est modeste. Sensibles à ce problème majeur des études d’interaction gène-environnement, certains auteurs ont développé des outils de calcul de puissance statistique (et de taille d’échantillon), appliqués aux études épidémiologiques, disponibles gratuitement et faciles à mettre en place. Nous devons noter que le calcul de puissance a posteriori est considéré par certains auteurs comme non informatif (Goodman et Berlin, 1994).

CALCUL DE LA PUISSANCE STATISTIQUEA POSTERIORIDANS LEPROJET.

Différentes méthodologies de calcul existent, nous choisissons d’appliquer la méthode proposée par Gauderman (2002) aux trois applications de ce projet. Nous utilisons le logiciel QUANTO Version1.0 (http://hydra.usc.edu.gxe). Il nous permet de plus de calculer les puissances statistiques des tests d’association pour chaque facteur environnemental et chaque gène. Nous présentons ces résultats en Annexe 7.

Les résultats de calculs de la puissance des tests d’interaction sont exposés dans le Tableau 43. Ils indiquent, pour chaque application, un manque évident de puissance statistique des tests de détection d’une interaction gène-environnement, lorsqu’elle est modeste. Par conséquent, il est possible que ce projet présente des résultats faux-négatifs d’interaction statistique gène-environnement, caractéristiques des études sous-puissantes. La majorité des applications de ce projet dispose cependant d’une puissance statistique de détection d’une interaction gène-environnement convenable lorsque l’interaction à détecter est forte (supérieure à 4).

D’un point de vue de l’interprétation, les résultats des tests d’interaction de ce projet semblent particulièrement incertains lorsque les polymorphismes d’intérêt, impliqués dans le métabolisme de facteur environnemental, sont possiblement associés au risque de fentes orales, quelque soit le facteur environnemental. Il s’agit des polymorphismes du gène ADH1C et du gène CYP2E1. Les effets propres de ces polymorphismes détectent alors la présence d’une interaction biologique gène-environnement. L’identification du mécanisme biologique sous-jacent est difficile, en particulier lorsque le gène d’intérêt est pléiotropique et qu’aucune interaction statistique entre le polymorphisme étudié de ce gène et ses substrats environnementaux n’est détectée.

Tableau 43: Puissance statistique calculée a posteriori d’un test d'interaction gène-environnement, pour les trois applications du projet

Paramètres requis par

de l’allèle Dominant Récessif Récessif Dominant Récessif Fréquence de l’allèle

Puissance statistique estimée pour détecter une interaction gène-environnement de :

l’application 1.6 1.2 1.8 ≈2 ≈2

Note : Compte-tenu des contraintes de QUANTO, les valeurs choisies des paramètres sont approximées par rapport aux valeurs observées dans chaque application. Nous considérons ici le gène de l’enfant. Le risque d’erreur de première espèce est fixé à 0.05.

* Pour un schéma d’étude cas-témoins non apparié, le ratio cas :témoin est 1 :1

Dominant, récessif ou hypothèse multiplicative

Calculée à partir de la population de témoins

§ La fréquence du génotype homozygote Null est de 0.56 dans la population témoins, la fréquence de la délétion est calculée à partir de l’équilibre p²+2pq+q²

# Sur la population des femmes ayant une activité professionnelle au 1er trimestre de grossesse

QUELLETAILLE DÉCHANTILLON ?

De façon générale, les maladies d’origine complexe et multifactorielle se caractérisent par des effets modestes de multiples facteurs (environnemental, gène et interaction gène-environnement). Dans ce contexte, la taille d’échantillon adéquate pour la détection d’une interaction gène-environnement avec une puissance statistique raisonnable, atteint aisément les 1 000 sujets-cas (mode de transmission dominant) ou les 10 000 sujets-cas (mode de transmission récessif a priori le plus défavorable) dans la situation d’un polymorphisme et d’une exposition peu communs (<10%) (auxquels doivent être ajoutés autant de sujets-témoins pour le schéma d’étude cas-sujets-témoins, et autant de couples parentaux pour le schéma d’étude cas-parents, Tableau 44).

Tableau 44: Simulations par QUANTO de la taille de l’échantillon requise pour un test d’interaction gène-environnement par les schémas d’étude cas-témoins et cas-parents

Prévalence de l’exposition dans la

population 0.1 0.1 0.5 0.5 0.1 0.5

Fréquence de l’allèle d’intérêt dans la

population 0.1 0.5 0.1 0.5 0.1 0.5

Risque relatif de maladie associé à l’exposition, parmi les non porteurs de

l’allèle 1.5 1.5 1.5 1.5 4 4

Risque relatif de maladie associé à l’allèle

d’intérêt parmi les non exposés 1.5 1.5 1.5 1.5 4 4

Interaction 2 2 2 2 2 2

(Risque relatif de maladie associé à l’effet

conjoint) (4.5) (4.5) (4.5) (4.5) (32) (32)

Taille de l’échantillon nécessaire (pour une puissance de détection à 80%

et un risque d’erreur de 1ère espèce à 5%) : Nombre de sujets-cas Hypothèse d’un mode dominant de transmission du gène

Cas-témoins 1 593 1 894 767 1 021 1 394 3 050

Cas-parents 1 251 1 285 858 1 063 985 4 006

Hypothèse d’un mode récessif de transmission du gène

Cas-témoins 21 51

2 1 367

10 28

2 663 17 363 933

Cas-parents 10 62

1 856 6 399 594 4 330 1 294 Calcul réalisé par le logiciel QUANTO avec les hypothèses suivantes : risque de base de la maladie dans la population = 0.001 ; Interaction multiplicative

VERS DE NOUVEAUXSCHÉMAS DÉTUDE ?

L’intérêt pour l’étude des interactions gène-environnement dans l’étiologie des maladies complexes est croissant. Des recherches récentes portent sur la construction de schémas d’étude plus performants et sur l’amélioration des méthodes d’analyse statistique associées, dans le but de maximiser la puissance statistique de détection d’une interaction gène-environnement.

Les stratégies alternatives au schéma d’étude cas-témoins traditionnel, permettant d’évaluer à la fois les effets propres et l’interaction entre un facteur environnemental et un facteur

génétique, telles que les stratégies de contre-appariement ou d’appariement flexible, s’adaptent particulièrement aux situations de facteurs rares. Elles offrent théoriquement des puissances de test d’interaction gène-environnement plus séduisantes que le schéma traditionnel cas-témoins, mais requièrent encore une taille d’échantillon importante, en particulier lorsque l’interaction est modérée (<5).

Plus récemment, Andrieu et Goldstein (2004) proposent un schéma d’étude qui exploite et combine l’information de témoins traditionnels et de témoins familiaux. Son principe est d’apparier un sujet cas à ces deux types de témoins simultanément : un témoin de population et un frère ou une sœur (sib). L’idée majeure est d’accroître la fréquence du gène d’intérêt et du facteur environnemental (si les expositions du sujet-cas et de son témoin-sib sont corrélées). Malgré la violation à une hypothèse de validité de modélisation logistique conditionnelle (J.Little, communication personnelle), les auteurs montrent que ce schéma d’étude combiné est plus efficace pour l’étude d’une interaction gène-environnement que les schémas traditionnels cas-témoins (appariés), seulement lorsque les deux facteurs sont peu fréquents (<0.20). Son efficacité relative décroît avec l’accroissement de la fréquence du facteur génétique. La taille de l’échantillon nécessaire est cependant prohibitive dans le cas de gènes rares (<0.01), et devient raisonnable seulement lorsque le facteur environnemental est commun et l’interaction est forte (>5).

D’autres schémas d’étude hybrides sont proposés dans la littérature. Ils s’intéressent essentiellement à la mesure d’une association génétique, et n’intègrent pas actuellement d’hétérogénéïté environnementale. Il s’agit des travaux de Nagelkerke et al. (2004) et Epstein et al. (2005). Certains de ces travaux incorporent des données familiales étendues (avec des familles multiplexes) et utilisent la méthode des équations estimantes généralisées GEE considérant ainsi la corrélation familiale (Slager et al. 2003).

D’autres schémas d’étude peuvent être exploités pour examiner une interaction gène-environnement ; il s’agit des études cas-témoins appariées pour lesquelles les témoins sont construits à partir de données familiales telles que les parents, les cousins ou les frères et sœurs (sibs), non atteints. Les approches cas-sibs et cas-parents sont plus performants que l’approche cas-témoins appariée traditionnelle. De façon équivalente au schéma d’étude combiné, leur efficacité est semblable à l’approche cas-témoins traditionnelle lorsque le polymorphisme n’est pas rare.

De façon générale, la majorité de ces développements est récente et encore très peu appliquée.

Lorsque l’efficacité est évaluée, elle est montrée supérieure à celle du schéma d’étude traditionnel cas-témoins, seulement dans certaines conditions spécifiques. Leur faisabilité est compromise et elle nécessite une taille d’échantillon élevée pour atteindre une puissance statistique raisonnable. Le recrutement des sujets peut devenir en pratique très complexe (stratégie de contre-appariement) et contraignant (schéma d’étude hybride).

VERS DES COORDINATIONSENTRE LES ÉTUDES ?

Les méta-analyses d’études publiées ont la possibilité de surmonter le problème du manque de puissance statistique et peuvent aider à clarifier de l’existence d’une association et de sa force.

Plusieurs méta-analyses ont déjà été réalisées dans le domaine de l’épidémiologie-génétique (Ioannidis et al. 2001, Munafò et Flint 2004). Ces outils statistiques sont cependant fortement débattus en épidémiologie, les principales critiques étant la précision sur-évaluées des résultats, la présence de biais de publication, et l’insuffisance d’ajustement sur des facteurs de confusion potentiels.

La stratégie d’étude d’interaction gène-environnement semble se situer davantage à travers des collaborations internationales par le consortium de plusieurs centres d’études déjà existantes ou par la planification d’une étude commune. Les analyses poolées s’appuient sur les données d’études individuelles (publiées ou non) et offrent ainsi plusieurs avantages comparé aux méta-analyses : une standardisation des informations et des définitions de cas et des variables, un meilleur contrôle des facteurs de confusion, une prise en compte possible de l’évolution de la maladie dans le temps, une flexibilité des effets testés, une prise en compte de l’existence possible de déséquilibre de liaison entre plusieurs loci. Ces analyses nécessitent cependant des investissements considérables de temps et de ressources, pour la collection de l’ensemble des données et la coordination complète du projet (Ioannidis et al. 2002, Little et al. 2002). Actuellement, les méta-analyses et les analyses poolées ne permettent pas de considérer simultanément différents schémas d’étude, tels que cas-témoins et cas-parents.

PUISSANCE DES ÉTUDES DINTERACTION GÈNE-ENVIRONNEMENT DANS LÉTIOLOGIE DES FENTESORALES.

L’ensemble de la littérature existante des études d’interaction gène-environnement dans l’étiologie des fentes orales, présente des tailles d’échantillon équivalentes à celle de notre étude, pour les études européennes, ou légèrement plus importantes pour les études américaines (cf Tableau 10). Cette littérature est encore peu développée et s’intéresse à une variété d’interactions potentielles. Une unique méta-analyse, à ce jour, a été réalisée à partir de 5 études cas-témoins pour examiner l’association entre le polymorphisme TGFα TaqI, la consommation maternelle de tabac, et l’interaction des deux facteurs avec le risque de fentes orales non syndromiques (Zeiger et al. 2005).

Le consortium international de la génétique des fentes orales (International Consortium of Oral Clefts Genetics, ICOCG) présente, en 2002, des lignes directrices précises et rigoureuses pour les études de l’étiologie des fentes orales non syndromiques, dans le but de faciliter les comparaisons des études et le pool de ces données a priori et a posteriori (Mitchell et al.

2002).

Discussion du choix a priori des