• Aucun résultat trouvé

1 Introduction

1.3 Facteurs génétiques de l’hôte

1.3.4 Les approches génome entier

Ces dix dernières années, plusieurs études d’association sur l’ensemble du génome (Genome-Wide Association Study ou GWAS) ont été réalisées pour les accès palustres graves. Cette approche, contrairement aux études gènes candidats ne fait pas d’hypothèse a priori sur la région du génome ou le gène potentiellement impliqué ; elle est basée sur une recherche systématique d'une

association entre un phénotype et des centaines de milliers voire des millions de marqueurs répartis sur l’ensemble du génome. Elle utilise des panels denses de variants génétiques (jusqu’à 5 millions), génotypés par des puces à ADN (voire ces dernières années issus des résultats de séquençage haut-débit sur l’ensemble du génome). Les puces à ADN permettent de génotyper rapidement un sous-ensemble de variants du génome sur un grand nombre d’individus. Ces variants, en majorité des polymorphismes d’un seul nucléotide (SNPs pour Single Nucleotide Polymorphisms), sont

sélectionnés pour être représentatifs de l’ensemble des variants communs du génome (avec une fréquence supérieure à 5% ou 1% suivant les puces). En effet, les variants proches dans une région ne sont pas indépendants et il existe le long des chromosomes, ce que l’on appelle des blocs de

déséquilibre de liaison (DL) au sein desquels ils sont fortement corrélés.

Le principe général des GWAS est de tester l’association entre chaque variant pris individuellement et le phénotype, puis de corriger les résultats pour le grand nombre de tests effectués, afin de limiter la proportion de faux positifs. Dans le cas d’une GWAS utilisant une puce à ADN, et de manière générale dans les études d’association (que ce soit une étude gène candidat ou une étude sur l’ensemble du génome) un signal d’association au niveau d’un variant n’indique pas forcément que ce variant est impliqué dans le trait ou la maladie. Il peut être en DL avec un ou des variants

fonctionnels se trouvant dans le bloc de déséquilibre de liaison (association indirecte, Figure 1.7). Aussi des analyses fonctionnelles sont ensuite nécessaires pour identifier le variant responsable du signal d’association et son rôle dans la détermination du phénotype étudié.

La première GWAS réalisée sur les accès graves a été publiée en 2009 par Jallow et al. (Jallow et al., 2009), plusieurs années après la publication des premières GWAS (en 2004-2005), principalement réalisées sur des populations d’origine européenne. Cette étude, qui a porté sur environ 6000 enfants gambiens, a mis en avant surtout des problèmes méthodologiques pour l’application de cette approche dans les populations africaines. Elle pointe notamment le plus faible déséquilibre de liaison dans ces populations comparées aux populations européennes ou asiatiques, ainsi que la forte hétérogénéité génétique des populations africaines, même à l’échelle d’un seul pays. Les auteurs recommandent l’utilisation de puces spécifiques, plus adaptées à la diversité génétique des populations africaines, et notamment de puces plus denses permettant d'assurer une couverture plus large des variations communes du génome. Ils préconisent également l'utilisation de

l’imputation statistique des génotypes manquants à partir de données de séquences d'un panel de référence mais soulignent l'importance d'utiliser des données de référence qui soient adaptées à la population d'étude. Les données de séquençage de la population des Yoruba du Nigéria, par exemple, se sont révélées inefficaces pour l'imputation statistique des génotypes manquants dans

Figure 1.7 Association indirecte entre le variant génotypé et le phénotype

l'échantillon gambien étudié, du fait de la divergence des profils de DL entre les deux populations à certains loci du génome.

Les études suivantes ont essayé de palier ces difficultés (Band et al., 2013; Malaria Genomic

Epidemiology Network, 2019; Malaria Genomic Epidemiology Network et al., 2015; Ravenhall et al., 2018; Timmann et al., 2012), en utilisant des puces plus denses (> 1 million de SNPs), en améliorant la qualité de l’imputation et les méthodes pour prendre en compte la structure de population (facteur de confusion majeur dans les études d’association). L’étude de Timmann et al., en 2012, a porté sur une seule région, la région de Kumasi au Ghana : les étapes de découverte et de réplication ont été réalisées dans deux échantillons de cette région, avant une seconde réplication dans

l’échantillon gambien (Jallow et al., 2009). Les autres études, à l’exception de celle de Ravenhall et al., sont des études multicentriques réalisées dans le cadre du consortium Malaria Genomic

Epidemiology Network (MalariaGEN), dont l’objectif était d’augmenter la taille des échantillons afin d’améliorer la capacité de détection des effets génétiques. L’étude la plus récente, parue en

décembre dernier (Malaria Genomic Epidemiology Network, 2019), inclut des échantillons provenant de 11 pays (9 pays africains, le Vietnam et la Papouasie Nouvelle Guinée), soit environ 32 000 enfants (dont 17 000 dans l’étape de découverte). Enfin, la GWAS publiée par Ravenhall et al. (Ravenhall et al., 2018) s'est focalisée sur les données d’une étude du consortium MalariaGEN, réalisée en Tanzanie.

Toutes ces GWAS ont porté sur les accès graves et ont utilisé de grands échantillons de cas et de témoins, les cas étant recrutés dans les hôpitaux selon les critères définis par l’OMS. Comme nous l’avons vu précédemment, les accès graves constituent un ensemble hétérogène de syndromes. La plupart de ces études se sont intéressées aux cas graves dans leur ensemble sans distinction entre les sous-types. Seules deux études ont utilisé une définition restreinte des cas en se focalisant sur un sous-type ou en faisant la distinction entre plusieurs sous-types d'accès palustres graves (Malaria Genomic Epidemiology Network, 2019; Timmann et al., 2012). Timman et al. ont inclus dans la phase

initiale de leur étude (phase de découverte) uniquement les deux principaux sous-types

(neuropaludisme et anémie grave) dont la gravité était avérée par la présence concomitante d’une acidose ou d’une détresse respiratoire. Dans sa dernière étude, le consortium MalariaGEN a considéré séparément trois groupes de cas graves : les cas de neuropaludisme, les cas d'anémie sévère et un groupe incluant tous les autres symptômes.

Les différentes GWAS, à l’exception de la première, confirment l'implication des variants déjà connus des gènes HBB et ABO. Elles ont permis également de mettre en évidence plusieurs nouveaux gènes : ATP2B4, GYPA-B et récemment un nouveau locus proche du gène EPHA7. ATP2B4 a été identifié pour la première fois par Timman et al. au Ghana (Timmann et al., 2012) et son association a été répliquée depuis dans deux des quatre autres GWAS (Malaria Genomic Epidemiology Network, 2019; Malaria Genomic Epidemiology Network et al., 2015). ATP2B4 code pour un transporteur de calcium de la membrane plasmique. Tout récemment, la dernière étude MalariaGEN a identifié le probable variant causal ainsi que le mécanisme par lequel il agirait : un des SNPs associés (rs10751451) perturbe un site de fixation du facteur de transcription GATA1, situé en amont d’un premier exon. Le SNP en question affecterait de manière spécifique les globules rouges au niveau d’un site d’initiation de la transcription qui n’est actif que dans ces cellules. L’allèle associé à une protection est corrélé à une diminution de l’expression d’ATP2B4; en revanche, le mécanisme par lequel ATP2B4 affecte le parasite reste encore à élucider. Un second signal d’association a été identifié par la GWAS publiée par MalariaGEN en 2015 (Malaria Genomic Epidemiology Network et al., 2015) dans le cluster de gènes GYP. Ces gènes codent pour des glycophorines qui sont des récepteurs utilisés par P.

falciparum pour l’invasion des globules rouges. Les travaux de Leffler et al. (Leffler et al., 2017) ont montré ensuite que ce signal peut s’expliquer par des variations du nombre de copies des gènes GYPA et GYPB, une configuration particulière (DUP4) responsable du groupe sanguin Dantu, réduisant le risque de formes sévères. Enfin, un nouveau signal d’association a été identifié sur le chromosome 6 par la dernière GWAS (Malaria Genomic Epidemiology Network, 2019), en plus des 4 gènes précédemment cités. Ce signal est situé à 700kb du gène codant le plus proche (EPHA7) ; les

analyses fonctionnelles n’ont pas permis pour le moment de faire des hypothèses sur le(s) variant(s) et le(s) gène(s) en cause.

Au final ces approches génome entier mettent en évidence les deux gènes majeurs déjà connus, HBB et ABO, ce qui semble valider la méthodologie utilisée, mais identifient par ailleurs peu de nouveaux gènes en comparaison des études gènes candidats. Même si l’on sait qu’une partie des associations identifiées par les approches gènes candidats sont des faux-positifs, en particulier quand elles n'ont pas fait l'objet de réplications, des gènes parmi les plus fréquemment répliqués ne sont pas retrouvés dans les GWAS : par exemple NOS2 (nitric oxide synthase 2) et TNF impliqués dans la réponse

immunitaire ou les gènes CD36 et ICAM1, des récepteurs de l’endothélium des vaisseaux sanguins impliqués dans le phénomène de cytoadhérence. Dans leur dernière étude, le consortium

MalariaGEN estime que les gènes HBB, ABO, GYPA-B et ATP2B4 agissent largement de manière indépendante et expliquent ensemble environ 2,5 % de la variabilité totale du phénotype (soit environ 10 % de l’héritabilité des formes graves), ce qui semble indiquer que les GWAS mettent en évidence uniquement la partie émergée de l’iceberg. Dans cette dernière étude, le consortium MalariaGEN met en avant plus particulièrement une hétérogénéité des effets des variants entre les populations pour un grand nombre de polymorphismes dans leur étude, dont ceux des gènes HBB et ABO. Par exemple pour l’allèle HbS, l’effet estimé varie d’un odds-ratio (OR) de 0,10 en Gambie à un OR de 0,47 au Cameroun, une différence qui ne semble pas expliquée, d’après les auteurs, par la présence en sus de l’allèle protecteur HbC dans les populations d’Afrique de l’Ouest. Cette hétérogénéité de manière générale pourrait être liée à la fois à des différences d’intensité de

transmission du paludisme entre les pays et/ou à la variabilité génétique du parasite. Le succès relatif de ces méta-analyses pourrait également s’expliquer par la diversité génétique des populations qu’elles incluent et par l’hétérogénéité des effets entre les sous-types d’accès palustres graves. En effet, malgré la taille conséquente de l’échantillon (17 000 individus dans l’étape de découverte), l’identification de variants avec un effet modeste est rendue difficile car les variants conférant une protection ne sont pas forcément présents dans toutes les populations, leur distribution peut même

être limitée à quelques populations. C’est le cas par exemple de l’allèle HbC qui est présent

uniquement en Afrique de l’Ouest ou du variant DUP4 pour le groupe sanguin Dantu qui est rare en dehors de l’Afrique de l’Est. L’hétérogénéité des effets des variants entre les sous-types de formes graves a pu réduire par le passé la capacité des précédentes GWAS à identifier les variants d’intérêt. En même temps, l’analyse par sous-type de phénotype réduit considérablement la taille des

échantillons par pays et limite la puissance de l’analyse. Les auteurs recommandent aussi d’augmenter la taille des échantillons au sein des différents pays pour les études futures.