• Aucun résultat trouvé

- Revue Bibliographique -

D. Etudier l’architecture génétique des interactions plantes/virus Comme cela a déjà été discuté, le développement de variétés résistantes constitue le moyen

2 Génétique d’association

La génétique d’association ou GWA (« Genome Wide Association ») permet tout comme la précédente approche de détecter et localiser des QTL impliqués dans la variation d’un trait quantitatif d’intérêt en recherchant les associations significatives entre les génotypes et les phénotypes. La principale différence réside dans le type de population étudiée puisque ces études d’association concernent des populations sans apparentement entre les individus (Myles et al., 2009). Cette approche va donc exploiter les phénomènes de recombinaisons ayant eu lieu pendant toute l’histoire évolutive de la population étudiée. Cela constitue certainement son atout principal puisqu’en fonction du niveau de LD (« Linkage desequilibrium ») dans la population étudiée, la résolution des régions génomiques identifiées pourra être meilleure par rapport à l’approche de cartographie par liaison. De plus, les bases génétiques caractérisées ne sont plus uniquement le reflet de la variabilité entre deux parents mais correspondent à la diversité génétique globale du trait d’intérêt disponible sur l’ensemble des génotypes étudiés (Myles et al., 2009). La puissance statistique de résolution de cette approche est sous l’influence de certains paramètres tels que l’étendue du déséquilibre de liaison, de la structuration de la population ainsi que du degré d’apparentement entre les individus de la population (Fig. R.25).

2.1 Paramètres importants du GWA

Le déséquilibre de liaison (LD – « Linkage desequilibrium ») correspond à l’association non aléatoire entre les allèles de différents loci dans une population donnée. La précision des analyses en GWA dépend de la distance physique sur laquelle décroit le LD dans la population c’est-à-dire la distance à partir de laquelle l’association entre l’allèle d’un locus 1 et celle d’un locus 2 n’est plus significative. Plus le nombre de recombinaisons est grand, plus cette distance est faible et donc plus la précision dans la détection d’un QTL pour le trait d’intérêt est importante. Cette distance physique de décroissance du LD va donc avoir un impact sur la

densité des marqueurs moléculaires nécessaire et sur le niveau de résolution de détection qui peut être espéré. En effet, si le LD décroit faiblement, une faible densité de marqueurs

moléculaires suffit. Au contraire, pour un LD qui décroit fortement, il faut une densité de marqueurs plus grande. Dans cette deuxième situation la résolution de détection sera meilleure (Fig. R.24) (Xu et al., 2017).

Cette étendue du LD peut énormément varier en fonction des espèces étudiées. Cette variation peut également être importante au sein d’une même espèce. Par exemple, chez le maïs le LD peut atteindre 100kb dans les variétés commerciales d’élite alors qu’il n’est que de 2kb dans d’autres lignées pures (Remington et al., 2001).

Le LD est également affecté par d’autres facteurs tels que les mutations, les recombinaisons, la dérive génétique, la sélection, la migration. Ainsi, l’isolement génétique et la subdivision des populations créent du LD alors que la recombinaison permet de faire diminuer le LD en cassant les associations au fur et à mesure des événements de reproduction (Xu et al., 2017). Un autre facteur important dont il faut tenir compte lors des analyses de GWA est la

structuration de la population qui peut être à l’origine de faux positifs à cause des patrons de structure génétique complexes liés à l’histoire démographique des populations pouvant provoquer des associations erronées. Des méthodes ont de ce fait été développées pour corriger l’effet lié à cette structuration. Le programme STRUCTURE par exemple permet d’attribuer les individus à des groupes de structure (matrice Q) qui peuvent être ensuite utilisés comme covariables dans les tests d’association génotype/phénotype. Ces groupes de structure (matrice Q) peuvent être déterminés par d’autres outils tels que le « genomic control » ou le « structure association » qui utilisent un set de marqueurs afin de déterminer le nombre de populations existantes et déterminer la place des individus dans ces sous-groupes. Des analyses en composante principales (ACP) peuvent aussi être effectuées. S’il est très important de tenir compte de la structuration de la population, cela peut poser problème lorsque la variation phénotypique adaptative (en lien avec cette structure de la population) chevauche la variabilité génétique du trait d’intérêt entrainant l’obtention de faux négatifs.

Le degré d’apparentement entre individus peut également avoir un impact sur les variations du phénotype dont il est possible de tenir compte en utilisant une matrice de kinship (matrice K). Le coefficient de kinship correspond à la probabilité pour que deux allèles tirés au hasard

Figure R.24| Etendue du déséquilibre de liaison et densité de marqueurs moléculaires associée (D’après Rafalski, 2002)

(a) Faible décroissance du LD autour du gène responsable du phénotype (ovale orange) ce qui nécessite une faible densité de marqueurs afin d’identifier les marqueurs associés au phénotypes (flèches jaunes) (b) Forte décroissance du LD autour gène causal, une forte densité de marqueurs est requise pour identifier les marqueurs associés au phénotype

au même locus chez deux individus différents soient identiques par descendance (notion de IBD, « Identy By Descent »).

2.2 Méthodes d’analyse de génétique d’association

Un certain nombre de méthodes ont été développées afin de mener ces analyses de GWA tout en tenant compte des différents facteurs qui peuvent influencer les résultats obtenus. Ainsi, le modèle MLM (« Mix linear model ») développé par Yu et ses collaborateurs (2006) est utilisé dans de nombreuses études puisqu’il tient compte en particulier de la structure et du degré d’apparentement entre les individus de la population. Cependant ce modèle exige d’avoir des populations de grande taille et une densité de marqueurs moléculaires importante (~ 1 millions de marqueurs). Cela entraîne un temps d’analyse relativement long. C’est d’ailleurs ce paramètre qui est amélioré par les nouvelles méthodes mises en place (Xu et al., 2017). C’est le cas par exemple des modèles linéaires mixtes EMMA (« Efficient Mixed Model Association ») et GEMMA (« Genome-wide Efficient Mixed Model Association ») qui sont des méthodes exactes qui prennent en compte la variance polygénique (Kang et al., 2008; Zhou & Stephens, 2012). Le développement de ces différentes méthodes d’analyse a conduit à la réalisation d’études comparatives permettant de mettre en avant les limites et avantages de chacune d’entre elles (Eu-ahsunthornwattana et al., 2014).

2.3 Significativité de l’association

Afin de pouvoir considérer un QTL identifié comme ayant un effet significatif sur le trait phénotypique analysé différentes méthodes ont été développées afin de pouvoir disposer d’un seuil de significativité pour analyser les résultats. Plusieurs seuils de significativités peuvent être utilisés. Ainsi, le critère de Bonferonni correspond au rapport entre le seuil de significativité global souhaité (fixé généralement à 0.05) et le nombre de tests réalisés (en relation avec le nombre de SNPs). Les permutations aléatoires des phénotypes tout en

Figure R.25| Organigramme des analyses GWA (Daprès Xu et al., 2017)

Les grandes étapes de l’analyse GWA sont présentées avec au départ la constitution de la population d’étude qui devra être génotypée et phénotypée. Les différents facteurs susceptibles d’avoir un effet sur le résultat de l’analyse doivent être pris en considération : LD, la structure de la population et le degré d’apparentement entre les individus. L’analyse GWA peut ensuite être réalisée afin de tester l’association génotype/phénotype et permettre d’identifier des QTL qui devront être validés par la suite par d’autres méthodes.

conservant la structure génétique permet de tester l’hypothèse nulle de non-association. Si cette méthode donne des résultats fiables, les temps de calculs peuvent être importants. Enfin le « False Discovery Rate » (FDR) évalue la proportion de faux positifs parmi les associations déclarées comme positives (Xu et al., 2017).

2.4 Limites de l’approche

Certaines limites liées à cette approche de génétique d’association ont déjà été évoquées lors notamment de la description des facteurs dont il faut tenir compte lors d’une analyse GWA. Ainsi, la structuration de la population peut amener à considérer comme significative une association génotype/phénotype alors qu’en réalité elle ne l’est pas, ce sont les faux-positifs. Une autre limite concerne cette fois les allèles mineurs. En effet, la puissance de détection d’une association est liée à la fréquence des allèles. Ainsi, l’association entre le trait d’intérêt et les polymorphismes dont l’allèle mineur est faible ne sera pas détectée (Myles et al., 2009; Xu et al., 2017).

Enfin, l’hétérogénéité génétique et allélique peuvent entraîner une perte de puissance dans la détection des QTL. Ainsi, un même phénotype peut être associé à des locus différents conduisant à une hétérogénéité génétique (Fig. R.26a). Sur le même principe, des polymorphismes différents à un même locus peuvent conduire au même phénotype, il s’agit de l’hétérogénéité allélique (Fig. R26b) (Bergelson & Roux, 2010).

2.5 GWA un outil pour l’étude de l’architecture génétique des interactions

plantes/agents pathogènes

La première étude publiée concernant l’utilisation du GWA pour mettre en évidence des gènes de résistance a été menée sur le pathosystème A. thaliana/Pseudomonas syringae par Aranzana et ses collaborateurs en 2005. Ainsi, parmi les 35 études, identifiant des QTL en réponse à un agent pathogène par GWA, recensées par Bartoli & Roux (2017) près de la moitié ont été publiées pendant ces deux dernières années. Le boom de ces deux dernières années est certainement en lien avec le développement des NGS qui permettent de disposer d’un set de marqueurs suffisamment importants pour mener ces analyses de génétique d’association.

Figure R.26| Hétérogénéité génétique et allélique (D'après Bergelson & Roux, 2010) (a) Hétérogénéité génétique quand un même phénotype est en relation avec l’expression de différents gènes. Par exemple, le phénotype 1 peut être le résultat de l’expression du gène 1 (allèle rouge) ou du gène 2 (allèle verte) (b) Hétérogénéité allélique quand l’expression de deux allèles sur le même gène (mutations T-> A et C -> G conduisent au même phénotype 1.

En ce qui concerne les caractéristiques des pathosystèmes analysés, 2/3 des études impliquent des champignons les reste ont été menées sur des bactéries et des oomycètes. Les plantes d’étude appartiennent quant à elles à 11 espèces différentes réparties dans 3 grandes familles botaniques (Brassicaceae, Fabaceae, Poaceae). D’ailleurs, un peu plus de 60% des pathosystèmes étudiés impliquent une plante à intérêt agronomique. Cela souligne l’impact économique important de ces agents pathogènes sur les plantes cultivées et l’urgence qu’il y a à trouver de nouvelles sources de résistances pour pouvoir lutter efficacement contre ces maladies. Deux plantes modèles sont également utilisées : A. thaliana (~30% des études) et

M. truncatula (~3% des études). Enfin les conditions environnementales dans lesquelles ces études ont été menées concernent pour la majorité d’entre elles des lieux en conditions contrôlées (chambre de culture, serres). Les autres ont été effectuées au champ et pour uniquement trois d’entre elles ces deux conditions environnementales complémentaires ont été utilisées (Chang et al., 2016 ; Desgroux et al., 2016 ; Rinker et al., 2016). Un dernier point intéressant souligné par Bartoli & Roux (2017) concerne le fait qu’uniquement 6 de ces 35 études comprennent des analyses fonctionnelles des gènes candidats dans les régions génomiques identifiées par GWA. Cela pourrait s’expliquer par le fait que l’objectif principal de ces études de GWA est de pouvoir identifier des marqueurs qui pourraient être utilisés dans des stratégies de sélection assistée par marqueurs qui font partie intégrante des programmes de sélection. Cela est d’autant plus vrai dans les études conduites sur des plantes cultivées (Bartoli & Roux, 2017).

E. Acteurs de cette étude : Arabidopsis thaliana et le Turnip mosaic