• Aucun résultat trouvé

Conclusion générale et perspectives

7.1 Partie I : Méthode d'analyse développée dans le cadre de cette thèse

Nous avons présenté dans cette thèse, plus précisément au chapitre 3, une méthode d'analyse d'association par haplotypes qui permet d'évaluer simultanément l'association entre les haplotypes provenant de deux locus indépendants ainsi que leurs interactions

et le trait de la maladie complexe dans un échantillon populationnel. Cette méthode est une extension de la méthode de Lake et al. (124), qui tient compte aussi de l'extension rapportée par Burkett et al. (140). En plus de permettre de considérer un trait dichotomique ou continu, la méthode de Lake et al. offre aussi la possibilité d'ajuster pour les facteurs environnementaux, les haplotypes d'un seul locus à la fois et les interactions entre les haplotypes du locus considéré et les facteurs environnementaux. La principale contribution de notre modèle d'analyse est d'offrir la possibilité de faire une évaluation simultanée des effets des haplotypes provenant de deux locus indépendants et de tester l'effet conditionnel du deuxième locus sachant l'effet du premier. Afin de valider notre méthode, nous avons mené une étude de simulations. Les résultats obtenus avec une analyse simultanée des haplotypes des deux locus, présentés dans le chapitre 3, sont similaires à ceux qui ont été obtenus avec les analyses séparées des haplotypes des deux locus (un locus à la fois). Cette analyse nous a permis de valider notre méthode. Pour l'analyse de l'effet conditionnel du deuxième locus sachant l'effet du premier, nous avons obtenu des résultats acceptables avec la plus grande taille d'échantillon considérée, tant du point de vue de la puissance que de celui des autres propriétés statistiques incluant l'eireur de type I, le biais et la probabilité de couverture. Une grande taille d'échantillon est donc requise pour une analyse conditionnelle.

L'avantage de notre modèle d'analyse est de permettre d'ajuster pour les divers facteurs de risque impliqués dans la susceptibilité de la maladie complexe, notamment l'environne- ment, les gènes, les interactions gène-environnement et, finalement, l'interaction gène-gène. Par ailleurs, une amélioration de la puissance pourrait être apportée à notre modèle d'ana- lyse en regroupant les haplotypes selon leurs similarités (181; 182). De ce fait, la dimension de la matrice des haplotypes testée dans le cadre des modèles linéaires généralisés est ré- duite et, par conséquent, une augmentation de la puissance est démontrée. Le regroupement des haplotypes dans notre modèle d'analyse nous permettra aussi d'éviter le regroupement des haplotypes rares en une seule catégorie et augmentera ainsi la précision des paramètres estimés.

Dans le chapitre 3, nous avons aussi rapporté une généralisation théorique de cette méthode pour tenir compte simultanément des effets des haplotypes de plusieurs locus.

Son importance au niveau pratique est toutefois limitée par le nombre de degrés de liberté généré. Ainsi, plus le nombre de locus est élevé, plus le nombre de degrés de liberté est élevé et, par conséquent, plus la puissance est faible. Cette dernière dépend du nombre de SNPs inclus dans chaque locus, de la fréquence des SNPs et de la taille de l'échantillon. Ce problème pourra s'améliorer partiellement en regroupant les haplotypes de chaque locus selon leurs similarités, mais le nombre de locus à considérer dans le même modèle reste limité. En outre, les erreurs de génotyage (183; 184) combinées à la phase ambiguë des haplotypes pourraient augmenter le taux de faux résultats (faux positifs ou faux négatifs) dans les études d'association par haplotypes et, par conséquent, diminuer le taux de repro- ductibilité des associations détectées dans un premier échantillon. Cependant, ces issues ne sont pas spécifiques à notre modèle, mais sont communes à la plupart des méthodes mul- tilocus en statistique génétique, et en particulier aux méthodes d'analyse par haplotypes. Le test de l'équilibre de Hardy-Weinberg peut être utilisé pour détecter les SNPs qui sont en déséquilibre et les regénotyper par la suite afin d'améliorer ou au moins de s'assurer de la qualité des données. Cette procédure n'est cependant pas recommandée en général parce qu'un déséquilibre ne signifie pas toujours la présence d'erreurs de génotypage; il peut aussi indiquer la présence d'une association (185).

Dans le chapitre 4 de cette thèse, nous avons mené une étude de simulations pour évaluer le biais ou des écarts pouvant exister entre l'effet marginal détecté et la vraie valeur de l'effet lorsque le modèle d'analyse spécifié est inadéquat. Les résultats de cette étude montrent que, en présence d'une association entre le phénotype de la maladie et deux haplotypes dans deux locus indépendants, l'analyse d'un SNP à la fois au deuxième locus engendre toujours une sous-estimation de l'effet de ce locus et, par conséquent, une puissance faible pour détecter l'association comparativement à notre méthode qui permet d'étudier simultanément les haplotypes des deux locus. En présence d'une interaction entre les deux locus et selon les situations considérées, le fait de ne pas considérer l'interaction dans le modèle d'analyse simultanée pourra masquer ou surestimer l'effet au deuxième locus. En plus d'un modèle mal spécifié au deuxième locus, l'hétérogénéité des effets entre ce locus et son interaction avec le premier accentue la faiblesse de la puissance pour détecter son effet conditionnel sachant l'effet du premier locus. On peut donc conclure que le modèle spécifié ne capture pas bien l'association avec le deuxième locus, d'où l'avantage d'utiliser

notre méthode d'analyse pour compléter l'analyse des SNP individuels et pour détecter d'autres associations non représentées par un SNP à la fois.

7.2 Partie II : Étude d'association entre les me-