• Aucun résultat trouvé

Pour les deux types de séquences de cytochrome b (séquences totales de 357 bp et séquences regroupant les positions 1 et 3 des codons) les méthodes de reconstruction utilisées sont les suivantes:

¾ Maximum Likelihood (ML): le programme DNAML du pack PHYLIP est utilisé avec une valeur du rapport Transitions / Transversions de 2,0 pour les séquences totales et de 1,9 pour les séquences partielles. L'arbre final est obtenu après réarrangements globaux. L'analyse est répétée 10 fois en utilisant à chaque fois un ordre aléatoire d'introduction des séquences.

¾ Maximum Parsimony: le programme DNAPARS du pack PHYLIP est utilisé soit en prenant en compte tous les types de substitutions (MP), soit en ne considérant que les transversions (MPV). Le ou les arbres les plus parcimonieux sont obtenus après réarrangements globaux. L'arbre final est le consensus strict des arbres les plus parcimonieux (traitement par le programme CONSENSE du pack PHYLIP). Comme dans le cas de l'analyse ML le traitement est répété 10 fois avec un ordre aléatoire d'introduction des séquences.

¾ Parsimony Ratchet (PR): le traitement est effectué à l'aide du logiciel WINCLADA en utilisant 500 réplications et le rééchantillonnage, à chaque réplication, de 20 % des caractères. Un seul arbre est retenu à chaque itération. L'arbre final est obtenu par consensus strict des arbres les plus parcimonieux.

¾ Neighbor-Joining: le traitement est effectué dans le logiciel MEGA. Chaque arbre est calculé à partir de 5 000 réplications, en utilisant les distances de Tamura-Nei pour les séquences totales, et celles de Kimura-2-paramètres pour les séquences partielles. Une reconstruction est effectuée en prenant en compte les transitions et les transversions (NJ) et une seconde en ne prenant en compte que les transversions (NJV).

Les résultats obtenus à partir des séquences de 357 bp sont présentés à la Figure 18: (a) pour l'arbre ML, (b) pour l'arbre MP, (c) pour l'arbre MPV, (d) pour l'arbre PR, (e) pour l'arbre NJ et (f) pour l'arbre NJV.

Figure 18 : Reconstructions phylogénétiques utilisant le cytochrome b (357 bp)

Ceux obtenus à partir des séquences partielles sont reproduits dans la Figure 19: (a) pour l'arbre ML, (b) pour l'arbre MP, (c) pour l'arbre PR, (d) pour l'arbre NJ et (e) pour l'arbre NJV. Pour ce type de séquences l'analyse MPV n'a pas été possible.

Figure 19 : Reconstructions phylogénétiques utilisant le cytochrome b (positions 1 et 3)

Pour les séquences de 357 bp, l'arbre MP est le consensus de 244 arbres et celui reconstruit à partir des séquences partielles est le consensus de seulement 6 arbres. L'arbre MPV, obtenu à partir des séquences totales, est unique. Dans le cas des reconstructions PR, pour les deux types de séquences, les arbres obtenus correspondent au consensus de 6 arbres.

Ces différentes topologies ont été comparées en utilisant le programme BASEML du pack PAML avec un test de bootstrap comprenant 10 000 réplications, d'une part par la méthode RELL (170), et d'autre part en utilisant la méthode de Shimodaira et Hasegawa (1999) avec une correction pour les comparaisons multiples. Ces tests ont été menés en considérant, ou non, l'existence d'une horloge moléculaire globale. Les résultats sont présentés aux Tableaux 46 (séquences totales) et 47 (séquences partielles).

Sans horloge Avec horloge Topologie LnL pSH pRELL LnL pSH pRELL ML - 4083,994 - 1,000 0,629 - 4138,413 - 1,000 0,494 MP - 4090,506 0,737 0,282 - 4152,653 0,570 0,103 MPV - 4232,034 0,000 0,000 - 4369,876 0,000 0,000 PR - 4100,311 0,484 0,042 - 4154,823 0,481 0,018 NJ - 4100,754 0,482 0,048 - 4140,480 0,840 0,386 NJV - 4202,209 0,000 0,000 - 4261,763 0,000 0,000 - 1,000 pour une valeur pSH indique que le calcul n'est pas possible

Tableau 46 : Comparaison des topologies (cytochrome b 357 bp) Sans horloge Avec horloge Topologie LnL pSH pRELL LnL pSH pRELL ML - 3684,718 - 1,000 0,648 - 3734,547 - 1,000 0,815 MP - 3692,586 0,675 0,173 - 3763,185 0,195 0,006 PR - 3696,875 0,543 0,113 - 3758,191 0,263 0,016 NJ - 3706,251 0,320 0,060 - 3667,901 0,491 0,163 NJV - 3818,869 0,000 0,000 - 3876,883 0,000 0,000 - 1,000 pour une valeur pSH indique que le calcul n'est pas possible

Pour les deux types de séquences, que l'on prenne ou non en compte l'existence d'une horloge moléculaire, la topologie ML apparaît comme étant celle représentant l'arbre 'correct'. Dans celle reconstruite à partir des séquences de 357 bp (Figure 18a) les séquences des groupes EUL, HAP et VAR se trouvent réunies dans un cluster qui se présente comme étant le cluster frère d'un second dans lequel sont regroupées les séquences MGA et CHE. Les séquences du groupe IND forment un cluster situé à la base de l'ensemble précédent. La séquence DMA se trouve à la base des Lemuriformes et enfin le groupe TUP occupe la position la plus basale dans cette topologie.

Par contre pour la reconstruction effectuée à partir des séquences partielles (Figure 19a) on trouve, comme précédemment, un cluster formé des séquences EUL, HAP et VAR. Le groupe IND se trouve à la base de ce cluster, puis on trouve dans l'ordre, les groupes MGA, CHE et enfin la séquence DMA. Comme pour la topologie ML avec les séquences totales, dans le cas des séquences partielles le groupe TUP occupe la position la plus basale.

Lorsque l'on prend en compte l'existence d'une horloge moléculaire la topologie NJ est la plus probable après la topologie ML. Dans le cas des séquences de 357 bp (Figure 18e) on trouve un cluster formé par les groupes EUL, HAP et VAR qui est le cluster frère d'un second dans lequel sont regroupées les séquences des groupes IND et MGA. Le groupe CHE se trouve à la base de l'ensemble précédent. Enfin la séquence DMA et le groupe TUP forment un cluster dont la position est la plus basale dans la topologie. Le cluster regroupant Lemuridae, Indriidae et Megaladapidae est supporté par une valeur de bootstrap de 77 % et celui formé de DMA et TUP par une valeur de bootstrap de 48 %. Dans le cas des séquences partielles (Figure 19d) la topologie générale est identique avec toutefois des valeurs de bootstrap légèrement plus faibles.

Dans les reconstructions qui sont totalement résolues, c'est à dire celles ne présentant aucune multifurcation, le sub-fossile MED est toujours trouvé associé au cluster formé par les séquences de Lepilemuridae et occupe une position basale par rapport à ce cluster. Une seule exception à cette disposition a été trouvée pour la topologie NJ reconstituée à partir des séquences partielles, dans laquelle le sub-fossile est associé à la séquence LMU.

On peut également constater que les reconstructions NJV fournissent des topologies dont la disposition générale est identique à celle des topologies ML. Mais la crédibilité de ces topologies NJV est très faible.

Le choix entre la topologie ML et la topologie NJ est guidé par les résultats obtenus précédemment par d'autres auteurs, ainsi que par l'étude des longueurs des branches principales de chacune de ces topologies. Ces longueurs sont estimées pour les reconstructions effectuées tant avec les séquences totales qu'avec les séquences partielles (Tableau 48).

Séquences totales Séquences partielles Branches

Arbre ML Arbre NJ Arbre ML Arbre NJ

Longueur totale 3,13447 3,22088 4,72417 4,78532

IND – MGA (4,85 %) 0,152 (6,39 %) 0,206 (5,82 %) 0,275 (6,50 %) 0,311 IMG – EHV (2,14 %) 0,067 (1,37 %) 0,044 (1,08 %) 0,051 (1,65 %) 0,079 CHE – GRA (2,14 %) 0,067 (2,86 %) 0,092 (7,76 %) 0,178 (3,34 %) 0,160 DTU – GRB (3,64 %) 0,114 (3,63 %) 0,117 (2,88 %) 0,136 (3,09 %) 0,100

Les valeurs entre parenthèses représentent le pourcentage de la longueur de la branche par rapport à la longueur totale de l'arbre.

Tableau 48 : Longueurs des branches principales des topologies ML et NJ (cytochrome b 357 bp)

On peut constater qu'en général les branches sont mieux définies, c'est à dire que leur longueur représente un pourcentage plus important de la longueur totale de l'arbre, avec les séquences partielles.

Le logiciel PHYLTEST est également utilisé afin de tester, au moyen de l'analyse quatre clusters, la crédibilité des différentes topologies constituées de quatre ensembles de séquences. Les principaux résultats de ces test sont indiqués dans le Tableau 49.

Topologie Séquences Branche interne CP Probabilité

357 bp 0,00442525 0,251 NS (IND,HAP), (MGA,VAR) 238 bp 0,00104022 0,0876 NS 357 bp 0,00533065 0,281 NS (IMG,CHE+DTU), (HAP,EUL+VAR) 238 bp 0,00974687 0,528 NS 357 bp 0,00507973 0,0956 NS (EUL,VAR), (HAP,IMG) 238 bp 0,0100814 0,205 NS 357 bp 0,0276895 0,959 < 5 % (TUP,DMA), (CHE,IMG+EHV) 238 bp 0,031438 0,847 < 20 % 357 bp 0,0801632 1,000 < 0,1 % (MED,LEP), (IND,EHV) 238 bp 0,121091 1,000 < 0,1 % 357 bp 0,0134725 0,959 < 5 % (IMG,EHV), (CHE,DAM+TUP) 238 bp 0,0253644 0,957 < 5 %

Tableau 49 : Test des branches internes pour les topologies cytochrome b (357 bp)

Ces résultats indiquent d'une part que l'association du sub-fossile MED et des séquences de Lepilemuridae est crédible avec une très forte probabilité et d'autre part que les séquences des groupes composés des Indriidae et Megaladapidae et des Eulemurs, Hapalemurs et Varecia ont une importante probabilité de former deux clusters associés. Parmi les groupes dont l'association est fortement improbable on trouve: Indriidae et Hapalemurs; Megaladapidae et Varecia; l'ensemble Indriidae, Megaladapidae et l'ensemble Cheirogaleidae, Daubentonia, Tupaia.

En fonction de ces résultats la topologie considérée comme la plus probable doit être représentée par celle fournie en utilisant la méthode NJ. Elle peut être représentée de la manière suivante (sans prendre en compte la séquence LTA utilisée comme outgroupe):