• Aucun résultat trouvé

Pour associer la présence et le nombre de MIF par espèce avec des paramètres de mode de vie (autotrophie, hétérotrophie, parasitisme de plantes ou d’animaux) et l’environnement (terrestre, marin, eau douce), les données correspondantes ont été récoltées pour 803 espèces eucaryotes. Il faut noter que la détermination du nombre de gènes MIF par espèce n’a pas toujours été possible, en fonction de l’accessibilité et de la qualité de l’assemblage des génomes. De ce fait, dans ce travail nous n’analysons pas le nombre de copies de gènes MIF, mais le nombre de séquences protéiques différentes identifiées à l’issue d’une recherche in silico. L’ensemble des données est représenté dans le tableau en annexe (Tableau 8 – Listes des espèces eucaryotes utilisées pour l’étude).

Ce premier criblage montre que le nombre de MIF varie globalement de 0 à 5 sur l’ensemble des organismes eucaryotes ( Figure 10). Des espèces possédant des protéines MIFs se trouvent dans l’ensemble des clades phylogénétiques, à l’exception des Rhizaria. Cependant, l’absence de MIF dans ce groupe taxonomique est incertaine car seules les séquences de génomes de cinq espèces sont actuellement disponibles.

Page 62 sur 194

Figure 10 – Arbre de vie simplifié des eucaryotes

Arbre des eucaryotes basé sur Burki et al., 2014 [167], montrant, entre crochets le nombre de protéines MIFs présentes dans les espèces de chacun des clades. Les différents clades ont été distingués par des couleurs qui seront reprises dans l’ensemble des phylogénies présentées dans cette étude.

La suite de l’analyse a été réalisée uniquement sur les séquences de bonne qualité, et les groupes suffisamment importants. Ainsi, les groupes ne comportant qu’un faible nombre d’espèces séquencées tel que les Haptophytes, les Parabasalia et les Apusozoa pour lesquels il n’y a qu’un seul génome décrit ont été éliminés. Au total, 677 espèces sur les 803 espèces criblées ont été retenues pour la suite du travail. Trois analyses complémentaires ont été réalisées : une analyse « pas à pas » (stepwise) par régression linéaire généralisée, une analyse multiple de correspondance et une analyse discriminante.

L’analyse « pas à pas » des données par régression linéaire généralisée a été réalisée dans le but de déterminer les paramètres (mode de vie, environnement, taxon) qui expliquent le mieux la répartition du nombre de MIF par espèce. Cette analyse indique que l’environnement ne constitue pas un paramètre déterminant pour prédire le nombre de MIF par espèce. A

Page 63 sur 194

l’inverse, les paramètres « taxons » et « mode de vie » expliquent mieux les données que ne le ferait le hasard selon le critère d’information d’Aikaide, AIC.

L’analyse multiple de correspondance (ACM) (Figure 11) permet d’analyser les éventuels regroupements entre un mode de vie spécifique et un nombre de MIF particulier. Cette analyse a pu mettre en évidence la séparation distincte entre les différents modes de vie : les espèces autotrophes, hétérotrophes et parasites de plantes et d’animaux sont clairement regroupées en 3 grands groupes distincts. Cette forte séparation peut être expliquée par deux phénomènes :

(i) Le fait que les espèces autotrophes sont en grande majorité représentées par le groupe des Archaeplastida. Or, dans ce groupe, la majorité des espèces possèdent trois MIFs.

(ii) Le fait que 68% des parasites de plantes sont des champignons et que la majorité des champignons ne possède pas de MIF.

Page 64 sur 194

L’analyse discriminante (Figure 12) met en avant les groupes (taxons spécifiques, modes de vie spécifiques) ayant le plus d’influence dans la biais de répartition du nombre de MIF par espèce que l’on a pu observer dans les deux analyses précédentes. Cette analyse nous indique le rôle majeur des champignons, des Archaeplastida et des espèces autotrophes dans cette répartition. Les observations réalisées au sein des parasites de plantes et des espèces autotrophes sont donc potentiellement influencées par l’impact des champignons et des Archeoplastida.

Figure 11 – Analyse multiple des correspondances

Représentation graphique de l’analyse multiple des correpondances (ACM), montrant séparément la distribution du nombre de protéines MIFs par espèces, les environnements, les taxa et les modes de vie des espèces (chaque point représente une espèce). Les éllipses délimitent le centroïde autour de chaque variable. Les axes F1 et F2 présentent des inerties ajustées de 52.54% et 15.64%, respectivement.

Page 65 sur 194

Afin de limiter l’impact et le biais créé par les Archeoplastida et les champignons sur l’analyse, nous avons poursuivi cette étude en nous focalisant sur des groupes taxonomiques autres que

Archeoplastida et champignons, et comprenant à la fois des espèces libres et parasites. Il

s’agit des Alvéolates, Straménopiles, Nématodes et insectes (Figure 13).

Figure 12 – Analyse discriminante de la répartition du nombre de protéines MIFs

Analyse discriminante montrant en (A) la répartition des différents nombres de protéines MIFs en fonction des taxons, des environnements et des modes de vie de chaque espèce et en (B) l’importance des différents paramètres (taxons, mode de vie et environnement). Les taxons sont représentés en bleu, les modes de vie en vert et les environnements en rouge. L’importance de chaque variable est notée par la proximité de l’extrémité de l’axe avec le cercle noir. Les critères compris dans le cercle en pointillés sont considérés comme ayant un rôle mineur dans la détermination du nombre de protéines MIFs par espèces.

Page 66 sur 194

Contrairement à l’analyse globale (incluant les Archeoplastida et les champignons), cette étude montre que les espèces parasites de plantes possèdent un plus grand nombre de MIF (mediane=3) que les espèces parasites d’animaux.

Ainsi, l’ensemble de ces analyses indiquent que:

(i) les plantes (Archeoplastida, espèces libres autotrophes) ont une médiane de trois MIFs, ce qui est plus élevé que le nombre médian de MIF des espèces ayant un autre mode de vie ou appartenant à un autre taxon.

(ii) les espèces parasites de plantes, à l’exception des champignons, possèdent également un nombre médian de trois MIFs

(iii) les espèces libres hétérotrophes et parasites d’animaux possèdent un nombre plus faible et/ou variable de MIFs.

Figure 13 – Boxplot de la répartition du nombre de MIFs

Analyse de la répartition du nombre de protéines MIFs en fonction du mode de vie dans quatre taxons différents : Alvéolates, Straménopiles, Insectes et Nématodes. L’axe vertical correspond au nombre de protéines MIF par espèces. Chaque boite est délimitée par les quartiles Q1 et Q3, qui correspondent à 50% de la distribution des protéines MIFs. La ligne horizontale dans le centre de la boite correspond à la médiane de la répartition du nombre de protéines MIFs dans chaque groupe. Les deux barres verticales correspondent aux valeurs des premiers et derniers centilles (C1 et C99) et délimite 98% de la répartition. Les valeurs extrêmes (outliers) sont indiquées par un point et correspondent à moins de 2% de la répartition des protéines.

Page 67 sur 194

Ces résultats soulèvent donc la question de contraintes évolutives particulières chez les plantes et les parasites de plantes, en terme de nombre de MIF.

Reconstruction phylogénétique des MIFs