• Aucun résultat trouvé

Chapitre I : SYNTHESE BIBLIOGRAPHIQUE

III. Génétique d’association pour étudier les bases génétiques des caractères complexes

III.3. Cartographie de QTL par analyse d’association

III.3.1. Approche par gènes candidats ou par balayage du génome entier

Deux approches peuvent être entreprises selon l’étendue du déséquilibre de liaison. Si le DL est faible, les études peuvent être axées vers l’approche « gène candidat », en associant le polymorphisme de séquences candidates à la variation phénotypique. Si le DL est fort, l’approche « genome wide » peut être mise en œuvre. La prise en compte de la structure de la population (Q), de la matrice de kinship (K) ou de

34 la combinaison des deux (K+Q) dans l’analyse d’association dépend de la relation génétique à l’intérieur du panel et la variabilité du caractère étudié (Figure 10).

Figure 10: Schéma des approches de cartographie de QTL par analyse d’association Contraste entre gène candidat coloré en vert et génome entier, coloré en jaune

Source : Zhu et al., 2008

L’approche par gène candidat « candidate gene association mapping » consiste à étudier un ensemble de gènes dont la fonction pourrait intervenir dans le caractère étudié puis à les tester directement par association. Dans cette étude, le choix de ces gènes est à priori biologique, c’est-à-dire que la fonction de ces gènes appartient à une voie métabolique associée aux caractères d’intérêts. La génétique d’association peut aussi être utilisée pour la validation de gènes candidats dans l’intervalle d’un QTL25, permettant de limiter le nombre de marqueurs utilisés. Toutefois, même si la biologie du caractère est bien comprise et qu’on connait d’avance les gènes ou les régions chromosomiques à étudier, les approches par gène candidat ne peuvent identifier qu’une partie des déterminants génétiques, en laissant les autres régions chromosomiques non-connues.

L’approche « genome-wide » exige un très grand nombre de marqueurs. Il s’agit d’étudier une grande partie ou tout le génome sans aucun à priori sur l’identité des locus impliqués. Le GWAS (« Genome Wide Association Study ») est une méthode puissante pour détecter les régions impliquées dans le déterminisme génétique des caractères.

III.3.2. Les modèles statistiques utilisés

L’effet confondant de la structure a été le principal écueil pour le développement des approches de la génétique d’association chez les plantes. L’analyse d’association implique un risque plus élevé d’erreurs

25 Locus de caractères quantitatif

35 de type I (faux positifs) et de type II (faux négatifs) par rapport à l’analyse de QTL 26 dans un croisement biparental. Les faux positifs proviennent de la structuration de la population (Pritchard et al., 2000) en sous-groupes qui peuvent créer des covariances entre individus. Si elles ne sont pas prises en compte lors de l’analyse, elles créent des biais dans l’estimation des effets des allèles (Kennedy et al., 1992).

Dans les tests d’association, il faut rechercher le modèle le plus approprié entre un modèle linéaire généralisé (GLM) prenant en compte la structure (matrice de populations Q) (Pritchard et al., 2000) et un modèle linéaire mixte (MLM) prenant en compte les coefficients d’apparentement (matrice d’apparentement K) ou la combinaison des deux (matrice Q + K) (Meuwissen et al., 2001 ; Yu et Buckler, 2006). Cette méthode, appelée « Q+K » basée sur un modèle linéaire mixte (MLM) utilisant comme covariable la matrice de structure (Q) et la matrice de kinship (K) (respectivement comme effet fixe et effet aléatoire) a été proposée par Yu et Buckler (2006). Avec ce modèle, les risques d’erreurs de type I (détection de fausses associations) et de type II (non détection de vraies associations) sont réduits. En 2010, Zhang et al. ont proposé des approches permettant de réduire le temps de calcul : une méthode de compression (« compressed MLM ») et une méthode qui élimine la nécessité de recalculer les composantes de la variance (P3D). Ces méthodes sont disponibles dans le logiciel TASSEL.

Le modèle linéaire mixte (MLM) se présente comme suit :

Y = Xα + Pβ + Kµ + e

où Y : représente le phénotype,

X : représente le génotype,

P : représente la matrice de l’ACP 27 de la structure de la population Q, K : représente la matrice relative à l’apparentement,

Xα + Pβ : représentent les effets fixes, Kµ + e : représentent les effets aléatoires.

III.3.3. Avantages et limites de l’analyse d’association GWAS

L’analyse d’association GWAS 28 repose sur le fait de travailler sur des lignées distinctes non issues d’un croisement comme des collections, permettant ainsi de connaitre l’historique des phénotypes mesurés pendant le développement des nouvelles variétés, d’exploiter une plus grande diversité allélique et d’obtenir une plus grande résolution grâce aux nombreuses recombinaisons historiques (Zhu et al., 2008). Ceci donne aussi l’avantage de travailler en même temps sur un grand nombre d’individus représentatifs de l’espèce sans avoir à générer des populations de cartographie (Durand, 2011). L’utilisation de l’information sur la

26 Locus de caractères quantitatifs

27 Analyse en Composantes Principales

36 décroissance rapide du déséquilibre de liaison permet de travailler à l’échelle du gène évitant ainsi des expériences de cartographie fine. L’analyse GWAS, en examinant tous les chromosomes pour identifier des régions associées aux caractères d’intérêts, possède le potentiel d’identifier les polymorphismes génétiques responsables de la variation des traits importants en agriculture.

Cependant, l’analyse GWAS peut parfois induire des erreurs comme les faux positifs à cause de la structure de la population et l’apparentement entre les individus. Si le panel est structuré et que l’on n’en tient pas en compte, il existe un fort risque de faux positif en termes d’association. Les modèles statistiques ne permettent pas de s’affranchir correctement de la structure de la population, la prise en compte de la structure de la population dans les analyses permet seulement de réduire le nombre de faux positifs mais augmente le nombre de faux négatifs (Bergelson et Roux, 2010). L’analyse GWAS exige aussi un grand nombre d’échantillons pour détecter le maximum de polymorphisme responsable de la variation des caractères complexes et un grand nombre de marqueurs. A part cela, l’analyse simultanée de nombreux allèles contribuant au phénotype conduit à la difficulté d’identifier les effets des allèles rares dans la population (Flint-Garcia et al., 2005). L’analyse GWAS ne prend pas en compte l’interaction entre les locus et l’environnement. Cependant, la contribution d’un gène pour un trait peut dépendre de la condition environnementale (Korte et Farlow, 2013).