• Aucun résultat trouvé

IV. MATERIELS ET METHODES

4. Statistiques

Les statistiques descriptives ont été réalisées avec les logiciels Statview 5.0, PLINK et THESIAS. La représentation graphique des LD a été réalisée grâce a Haploview. La magnitude de l'association détectable dans un échantillon a été calculée grâce à PGA et les méta-analyses ont été conduites avec METAL.

○ STATVIEW

Les variables quantitatives sont décrites par la moyenne et l'écart type (DS pour déviation standard) pour les variables continues gaussiennes et par la médiane et l’intervalle interquartile (IQR pour interquartile range) pour les variables non gaussiennes.

L’évaluation de la normalité des variables a été testée avec le test de Kolmogorov Smirnov. Les variables non gaussiennes peuvent être, le cas échéant, normalisées pour permettre d’être utilisées dans les tests paramétriques ou la régression linéaire.

Analyse univariée

Les comparaisons inter-groupes ont été réalisées pour : • les variables continues :

- distribuées normalement par test t de Student ou par analyse de variance (ANOVA) en cas de plus de 2 groupes,

- non gaussiennes par test de Mann-Whithney (groupes indépendants) ou test des rangs de Wilcoxon (groupes appariés), ou le test de Kruskall-Wallis (plus de 2 groupes)

• les variables qualitatives par test du chi-carré (χ²) ou test de Fisher (en cas d’effectif attendu <5).

Le test de l’association entre 2 variables continues était réalisé pour les variables :

• distribuées normalement grâce au coefficient de corrélation de Pearson, • non gaussiennes grâce au coefficient de corrélation Rho de Spearman. Analyse multivariée

Pour l’analyse multivariée la stratégie utilisée consistait en une procédure d’élimination pas à pas descendante appliquée sur un modèle maximal contenant les variables asociées à la variable dépendante avec un p<0,10 ainsi que les variables d’intérêt. L’absence d’interactions a été vérifiée sur les modèles finaux.

Une régression linéaire multiple a été conduite pour explorer les relations entre une variable continue dépendante Y et plusieurs variables explicatives X.

Les génotypes ont été utilisés dans les modèles sous 2 formes :

• variable continue discrète à 3 modalités : 0, 1, 2 en fonction du nombre d’allèle mineur dans l’hypothèse d’un effet additif de celui-ci,

• variable continue discrète à 2 modalités : 0 pour porteur A1 ou porteur A2

et 1 pourhomozygote A2/A1 dans l’hypothèse d’un effet dominant.

L’association entre une variable catégorielle dépendante et une ou plusieurs variables indépendantes (catégorielles ou continues) a été recherchée par régression logistique. La force de l’association entre la variable indépendante X et la variable dépendante Y est quantifiée par l’OR (ou rapport de cotes) et son IC95%. Les génotypes ont été utilisés dans les modèles sous 2 formes 2 ou 3 classes.

Seuil de significativité

Nous avons considéré le seuil de significativité des tests à 0,05.

Pour tenir compte de la répétition des tests d’association (ou multiple testing) pour les n génotypes explorés, une correction de Bonferroni368 a été appliquée pour lutter contre l’inflation du risque α ainsi le degré de signification pour chacun des tests était p’≈p/n.

Randomisation méndélienne

Pour l’exploration de la causalité des hormones sexuelles et notamment de la concentration d’œstradiol sur la survenue de complications rénales, nous avons réalisé une randomisation mendelienne297 en évaluant dans une approche triangulaire (Figure 39) de manière séquencielle:

a) l’association observée entre les variants du CYP19A1 et le risque de ND, b) l’association entre l’œstradiolémie et le risque de ND,

c) l’association entre les variants du CYP19A1 et l’œstradiolémie,

d) l’association attendue entre les variants du CYP19A1 et le risque de ND. La comparaison entre OR observé (a) et OR attendu (d) est ensuite réalisée pour évaluer l’association causale entre l’œstradiolémie et risque de ND.

Taux d’œstradiol (E2) Variants du CYPA19A1 Néphropathie diabétique

c

Association observée du taux d’E2 avec les variants

du CYP19A1 chez les caucasiens

a

risque observé de ND lié aux variants de CYP19A1 chez les caucasiens

b

Risque observé de ND lié au taux d’E2

d

risque attendu de ND lié aux variants du CYP19A1 à partir de b et c

DIAB2NEPHROGENE

Figure 39 Représentation de l'approche de randomisation mendélienne envisagée dans l’étude cas-témoins DIAB2NEPHROGENE

Analyses de survie

La construction des courbes de survie a été menée selon la méthode de Kaplan-Meier. La comparaison des données de survie a été réalisée par le test de logrank ou par modèle de risque proportionnel de Cox.

THESIAS

THESIAS (pour Testing haplotype effects in association studies) est un logiciel d'analyse haplotypique développé par Tregouet et al.369.

Il bénéficie d’une interface Java qui en facilite utilisation. Il permet, en outre, l’exploration de l’association haplotype-phénotype pour des variables quantitatives et binaires (cas témoin) en présence ou non de covariables par régression linéaire ou logistique.

Les fréquences alléliques de chaque variant mais également l’estimation des fréquences haplotypiques peuvent être obtenues.

L’effet de l’haplotype sur le phénotype peut être apprécié pour les variables binaires par un OR et pour les variables continues par le coefficient « Estimate » en comparaison à l’haplotype de référence qui est celui qui présente la fréquence la plus élevée.

Le pourcentage de la variance du phénotype expliquée par les haplotypes est également donné.

Nous avons pris le parti de prendre en compte uniquement l’effet des haplotypes les plus fréquents, c'est-à-dire avec une fréquence ≥ 5%.

PLINK

Le logiciel PLINK370 a été utilisé pour tester l’équilibre de Hardy-Weinberg (HWE) pour chacun des variants explorés et réaliser simplement les analyses d’association entre les génotypes et les variables binaires (cas-témoins) ou continues (concentrations plasmatiques d’œstradiol par exemple).

La loi de Hardy-Weinberg (HW) correspond au modèle théorique central de la génétique des populations. Elle postule, qu'au sein d'une population (idéale), il y a équilibre des fréquences alléliques et génotypiques d'une génération à l'autre.

La loi de HW permet le calcul de fréquences génotypiques théoriques à partir de fréquences alléliques.

Soient A et a deux allèles d’un même locus avec fréquence allélique f(A)=p et f(a)=q=1- p. Les fréquences génotypiques en HWE sont :

f(AA)=p² f(Aa)=2pq f(aa)=q²

L’absence de différence entre les fréquences génotypiques observées et théoriques (selon l’équilibre prédit par la loi de HW) est vérifiée par un test de χ².

HAPLOVIEW

Le logiciel Haploview version 4.2 (http://www.broad.mit.edu/mpg/haploview ) a été utilisé pour rechercher les déséquilibres de liaison entre les variants et identifier les SNP représentatifs (tag SNP) d’un un bloc haplotypique132. Les

données de populations caucasiennes sont issues des données de la population CEU du projet Hapmap371-373.

PGA

Nous avons utilisé le logiciel PGA (pour Power for Genetic Association Analyses ; http://dceg.cancer.gov/bb/tools/pga) pour le calcul de puissance a posteriori pour nos études d’association génétique374. Il permet également de calculer le risque relatif minimum détectable pour les marqueurs génétiques de choix en fonction de leur fréquence allélique et la taille des populations mais également la prévalence de la maladie en population et le mode transmission génétique supposé et les risques de 1ère (α) et 2e espèces (β).

METAL

Pour ce qui concerne les méta-analyses des données provenant des différentes populations étudiées (D2NG, SDG et DBH), nous avons utilisé le logiciel METAL375 (http://www.sph.umich.edu/csg/abecasis/metal/).

Le logiciel intègre pour chaque population les données d’association (OR et p value) en les pondérant par la taille de la population pour fournir un score Z et un seuil de significativité.

POLYPHEN2

Nous avons utilisé le logiciel Polyphen2 (Polymorphism Phenotyping version 2 ; http://genetics.bwh.harvard.edu/pph2) qui est un outil informatique développé par l’Harvard University376 et permet de prédire l'impact d'une substitution d'acide aminé (mutation faux sens induite par le polymorphisme) sur la structure et la fonction d'une protéine humaine à l'aide de simples considérations physiques et comparatives.

V. TRAVAUX PUBLIES

Documents relatifs