• Aucun résultat trouvé

III. Le polymorphisme génétique viral : origine et évolution

2. Evolution des génomes viraux à ARN

2.1. Principe

La phylogénie moléculaire est une discipline récente devenue maintenant incontournable pour reconstruire l’histoire évolutive des organismes vivants. L’augmentation considérable du nombre de séquences disponibles, la facilité croissante pour obtenir les séquences génomiques contemporaines et la puissance croissante des systèmes informatiques permettent le développement d’outils d’analyses statistiques complexes et robustes. Les virus à ARN, en particulier le VIH, les virus Influenzae ou le VHC, sont des modèles de référence qui ont largement contribué à l’essor de ces outils, ouvrant ainsi un nouveau champ d’étude de la virologie moléculaire.

En effet, l’originalité des virus à ARN réside dans leur dynamique d’évolution. Ils combinent un temps de génération court, une production de populations de grande taille et un taux de mutations élevé permettant des analyses informatives et robustes sur une échelle de temps courte « adapté au temps humain » (1 an par exemple) et de petites séquences génomiques (dès 300 nucléotides). L’échantillonnage est donc plus informatif et plus facile à obtenir qu’avec des organismes comme les eucaryotes dont le taux de substitution/site/an est un million de fois plus faible que celui des virus à ARN [339, 340]. Ces virus appartiennent avec les ADN mitochondriaux anciens à la catégorie des « measurably evolving populations » (MEPs), population d’intérêt majeur en termes d’analyses d’évolution [341]. Les séquences génétiques des MEPs peuvent être échantillonnées à différents temps (très rapprochés (ARN viraux) ou très éloignés (ADNmt anciens)) et présentent un nombre de mutations statistiquement significatifs. L’accumulation des mutations dans le temps et leur fixation dans la population peut être estimée et calculée, et permet des descriptions évolutives pertinentes. La notion de temps et d’horloge moléculaire est ainsi intégrée dans les modèles d’analyses phylogénétiques.

La large diffusion des outils de phylogénie moléculaire permet d’explorer de très nombreux aspects de la biologie virale, depuis l’épidémiologie des populations, l’investigation des transmissions, jusqu’à l’analyse des populations virales dans les compartiments chez un individu. Quel que soit la méthode utilisée, il est nécessaire de réaliser un alignement des séquences avec une grande minutie pour ne pas compromettre la fiabilité

84

des résultats. Ces jeux de données sont ensuite soumis à un codage informatique permettant leur utilisation dans des algorithmes statistiques. Ces algorithmes testent plusieurs hypothèses jusqu’à obtenir l’hypothèse la plus vraisemblable qui sera reconstruite sous la forme d’un arbre.

2.2. Intérêt pratique

L’ensemble des méthodes de phylogénie permettent d’aborder l’évolution d’une part à l’échelle de la population (inter-hôte) et de se concentrer alors sur les processus de transmission, la dynamique d’évolution est plus « neutre » dans ce cas, et d’autre part à l’échelle de l’individu (intra-hôte) au niveau duquel les processus de sélection sont alors plus finement étudiés.

Les outils les plus récents combinent la notion d’évolution et de processus écologique. En d’autres termes, les principes de phylogénie et de génétique des populations sont utilisés mais tiennent compte de l’évolution du pathogène au cours de l’infection et des processus de transmission (passage de barrière d’espèce ou transmission inter-hôte). Ces méthodes ont été développées pour répondre à différentes problématiques en utilisant une échelle de temps adaptée selon les modèles (notion d’horloge moléculaire) et en délimitant une zone géographique ou spatiale de travail.

Ainsi la notion de phylodynamie a ainsi émergée récemment [342]. Il peut s’agir de l’exploitation de ces méthodes à une échelle globale pour analyser l’influence des flux migratoires et des déplacements humains, pour reconstruire l’historique d’épidémies ou l’émergence de nouveaux virus. L’étude systématique de milliers de séquences d’isolats de virus grippaux à l’échelle mondiale et de façon annuelle a ainsi permis de montrer une complexité de la dynamique des épidémies composées d’épidémies hivernales en zones tempérées et de cas sporadiques tout au long de l’année en zone tropicale. La ré-émergence saisonnière est alimentée par une source persistante d’influenzae A virus en Asie du Sud-Est qui suit les réseaux de transports aériens et dissémine l’épidémie hivernale [343]. Les analyses de diversité ont montré aussi des pressions de sélection exercée par l’immunité de l’hôte à l’origine d’un taux d’évolution très élevé sur les acides aminés des sites antigéniques de l’hémagglutinine alors que les dynamiques d’évolution sont plus variables à l’échelle du génome entier [344, 345]. La dynamique d’évolution des virus grippaux est la résultante de la

85

combinaison de processus écologiques et de facteurs d’évolution intrinsèque. L’histoire d’autres épidémies a aussi pu être analysée et reconstruites. Nous pouvons citer par exemple, l’explosion de l’épidémie du VHC au 20ème

siècle, virus implanté chez l’homme depuis plusieurs siècles, à travers l’avènement des pratiques transfusionnelles [346]. De même, les analyses de reconstruction phylogénétiques de l’histoire de la pandémie à HIV1 ont permis l’identification de multiples passages de barrière d’espèces, évènements fondateurs survenus en Afrique, de la dissémination à l’échelle mondiale et la datation du début de l’épidémie à la 1ère moitié du 20ème siècle [347, 348].

Une épidémie localisée à l’échelle d’une communauté (quelle que soit la taille de la communauté : une collectivité, une ville, un pays ou un continent) est aussi l’objet d’études de phylodynamie, il s’agit alors d’un cluster d’infection au niveau phylogénétique. Les objectifs peuvent être de déterminer la source de l’épidémie lors de l’émergence d’un nouveau virus comme cela a été le cas avec le SARS en 2003. Les analyses ont permis d’identifier une première source, la civette, puis le réservoir primaire, la chauve-souris et enfin le passage de barrière d’espèce a été daté à 4 ans grâce aux outils d’horloge moléculaire [349, 350]. Il est aussi possible de reconstruire le schéma d’invasion de la souche et d’établissement de la souche dans la population, ce qui est particulièrement intéressant en médecine vétérinaire.

Enfin, l’analyse des clusters de transmission et des chaines de transmission, que l’histoire de transmission soit connue ou inconnue, est menée à l’aide de ces outils. Ces analyses permettent de mesurer des taux d’évolution, permettent aussi de valider les outils développés (validation des modèles d’horloge moléculaire) ou à l’inverse peuvent montrer la survenue d’incohérence dans ces modèles. La cohorte irlandaise « anti-D », qui correspond à un groupe de femmes transfusées accidentellement par le même lot de produit sanguin contaminé par du VHC à la même période, a permis ce type d’étude fournissant des conclusions robustes [351]. Quand l’histoire de transmission n’est pas connue, les objectifs peuvent être alors de rechercher la date de début d’épidémie ou la source épidémique.

L’évolution virale intra-hôte, c’est-à-dire à l’échelle de l’individu, représente le stade ultime d’expression de la diversité génétique et concerne particulièrement les virus à ARN à l’origine d’infection chronique de plusieurs mois à plusieurs années, permettant des échantillons itératifs dans le temps et des analyses de dynamique d’évolution virale pertinentes. Ces études concernent en premier lieu le VIH et le VHC. Ainsi, la dynamique

86

d’évolution du VIH chez l’hôte est principalement guidée par la sélection naturelle exercée par le système immunitaire. L’analyse des quasiespèces a montré que la diversité génétique est relativement basse quel que soit le moment de l’infection [352], cependant cette diversité génétique augmente progressivement au cours de l’infection chronique et est corrélée à l’évolution clinique [353] et au niveau d’échappement du VIH aux anticorps neutralisants [354]. Les analyses ont même montré des évolutions différentes des quasiespèces virales du VHC selon les compartiments cellulaires chez un même individu [355].

Ces analyses menées à l’échelle globale, locale ou intraindividuelle tendent vers des modélisations avec intégration des modèles mathématiques qui sont communes. En effet, en considérant la cellule ou le compartiment à l’échelle de l’hôte comme un individu à l’échelle populationnelle, les mêmes modèles intégrant les processus d’évolution et les processus écologiques peuvent être appliqués [356].

87