Th´eorie de l’´evolution

(1)

Th´ eorie de l’´ evolution

Tous les organismes vivants dérivent d’un ancêtre commun Diversité due

`

a la spéciation (séparation d’une espèce en deux espèces)

Pas d’information directe sur le passé. Reconstruction d’une phylogénie basée sur des modèles simplifiés utilisant des données incomplètes.

Idée de base: Les caractères sont transmis d’une génération à l’autre, et au cours de l’évolution, ces caractères subissent une série de mutations En général les caractères étudiés sant des positions ou des régions de

l’ADN. Utilise les méthodes de comparaisons de séquences de nucléotides ou d’acides aminés.

(2)

Arbres enracin´es et non enracin´es

Arbre enraciné: Direction représentant le temps d’évolution: plus un nœud est proche de la racine, plus il est vieux.

racine

H C G O B

Arbre non-enracin´e: Ne permet pas de d´eduire des relations de descendance.

C

H

G O

B

racine possible qui donne lieu a

l’arbre du haut

Plusieurs méthodes de construction d’arbres de phylogénie génèrent des arbres non-enracinés. Il faut ensuite trouver un “outgroup”

pour enraciner l’arbre.

(3)

Type de donn´ees

Deux types de données: les caractères (trait, caractéristique) et les distances.

Caractères généralement représentées par une matrice X = (x_ij), où x_ij est l’état du caractère i dans l’espèce j.

Hypothèse généralement considérée: Chaque caractère évolue indépendamment des autres.

Evolution d’un ensemble d’esp`´ eces déduite à partir de caractères homologues. Par exemple, gènes homologues (orthologues ou

paralogues).

(4)

Caractères les plus utilisés pour les études d’évolution: séquences de nucléotides ou d’acides aminés. Caractères représentés par les positions, et l’état d’un caractère est le nucléotide (ou l’AA)

observé à la position considérée. Par exemple, position 139 est le caractère, et ‘A’ est l’état du caractère 139.

N´ecessite un alignement des s´equences.

S´equences de nucl´eotides:

Vache AGTGACAACTAGGCCATAATGTACGA Eponge ACTGTCAACTACGCTTTGATGTACGT Mouche AGAGTCATCCACGCTTTAATCTTCGA

S´equences d’acides amin´es:

Vache RTGMAALTPRWACDLKINHIYR Eponge ASGMTALSPKYTCELRMNHLYR Mouche TTGMSALSPRWSCDLKIEHIWK

(5)

Construction d’arbres de phylog´enie

Trois m´ethodes principales.

Méthodes de distance: Input du problème −→ ensemble de distances (par exemple distance d’édition). Construire l’arbre de phylogénie en

“accord” avec cet ensemble de distances.

Distances ultramétriques ou additives donnent lieu à des problèmes faciles à traiter. Heuristiques pour le cas général: arbre qui fournit la

“meilleure approximation”. Pas de consensus sur la d´efinition de

“meilleure”.

Méthodes de parsimonie: Arbre qui explique l’évolution des espèces par un nombre minimal de mutations. Deux composantes principales:

• Calcul du score d’un arbre donn´e.

• Recherche, parmi tous les arbres, de l’arbre de score minimal.

Parsimonie maximale = Nombre minimal de mutations.

M´ethodes de maximum de vraisemblance: M´ethode probabiliste.

Trouver la s´equence de nœuds internes la plus probable.

(6)

M´ethodes de distance

n s´equences; D_i,j: distance entre les deux s´equences i et j.

Algorithme de clustering, UPGMA: Procéder par regroupement des séquences les plus proches. À chaque étape, les deux regroupements les plus “proches” sont fusionnés.

d_i,j: Distance entre deux regroupements C_i et C_j. Moyenne des distances des paires de s´equences entre les deux regroupements:

d_i,j = 1

|C_i||C_j|Σ_p∈C_i_,q∈C_jD_p,q

Si C_k = C_i ∪ C_j, et C_l un autre regroupement, alors:

d_kl = d_il|C_i| + d_jl|C_j|

|C_i| + |C_j|

(7)

3 5

7 (III)

1: A T G T T C G 2: A T C T T T G 3: G G C T A C G 4: G C C T T G C 5: G C A T T C G

3 5

7 1

2 d68

1 2

6 3

7

5 8

4 9

5

1 2 3 4

1 2 3 4 5

2 4 5 3

4 4 4

4 3

3

1 2

3

1 2

6 1

2d12 6

(I)

4 5

I

1 2

3

1 2

6 6

(I) 3 4

3 4 5 6

5 6

4 3 4

3 4.5

3.5 4 5

7

3 7

5

1 2

6 6

4 3

4 6 7

4

7

4.5 3.5 3.75

7

5 8

4 1 2 d47

9

1 2

6

4 6 8

1 2 d35

(IV) 6

6 4.12

8

(8)

Algorithme UPGMA:

Initialisation:

D´efinir n regroupements, chaque regroupement Ci contenant la seule s´equence numero i;

D´efinir un arbre T restreint `a un ensemble n de feuilles, une feuille pour chaque regroupement. Toutes les feuilles sont de hauteur 0;

It´eration:

Consid´erer deux regroupements C_i, C_j tels que d_i,j soit minimal;

D´efinir un nouveau regroupement C_k = C_i ∪ C_j, et d´efinir les dkl, pour tout l;

D´efinir un nouveau nœud k de fils i, j, et placer le `a une hauteur d_ij/2;

Rajouter C_k dans l’ensemble des regroupements, et ´eliminer C_i et C_j; Fin:

Lorsqu’il ne reste plus que deux regroupements Ci, Cj, placer la racine

(9)

Arbre ultram´etrique

Construction d’un arbre par UPGMA sous-entend un modèle d’évolution faisant intervenir l’hypothèse de l’horloge moléculaire: taux de mutation constant

−→ Tous les chemins d’un nœud particulier `a n’importe quelle feuille, ont la mˆeme longueur.

UPGMA trouve LE bon arbre ssi il existe un arbre ultramétrique pour D Arbre ultramétrique: Arbre T enraciné vérifiant:

1. T contient n feuille, chaque feuille étiquettée par une ligne de D (une espèce).

2. Chaque nœud interne étiquetté par une case de D, et à au moins deux fils.

3. Le long d’un chemin quelconque de la racine à une feuille, les valeurs des étiquettes des nœuds décroissent strictement.

(10)

4. Pour deux feuilles quelconques i, j, D(i, j) est l’´etiquette du dernier ancˆetre commun de i et j dans T.

T, s’il existe, est une repr´esentation compacte de D.

E D C B A A B C D E

0 8 8 5 3

0 0

0 0 8 8 3

8 8

5 (a)

B C

D E

A

5 3

8

(b) 3

Figure 1: (a) Matrice symétrique D. (b) Arbre ultramétrique associé

` a D.

Remarque: T a au plus n − 1 nœuds internes. Donc, si D `a plus de n − 1 valeurs, il n’existe pas d’arbre ultram´etrique pour D.

(11)

Distance ultram´etrique

Une matrice symétrique D définie une distance ultramétrique ssi, pour trois indices qqes i, j, k, le maximum de D(i, j), D(i, k), D(j, k) n’est pas unique.

Si D peut être représenté par un arbre ultramétrique, alors D est ultramétrique.

k v

u

i j

Théorème 1: D peut être représentée par un arbre ultramétrique ssi D est ultramétrique.

(12)

Théorème 2: Si D est une matrice ultramétrique, alors l’arbre ultramétrique de D est unique.

Preuve: Dans la construction de l’arbre, les classes sont “forcées”, i.e. ne peuvent pas être déterminées autrement, et les positions de ces classes sont forcées également.

Conséquence: Si D reflète effectivement la distance d’évolution entre les espèces, alors l’arbre obtenu est nécessairement le vrai arbre.

Théorème 3: Si D est ultramétrique, alors l’arbre ultramétrique peut être construit en un temps O(n²). D’autre part, on peut

d´eterminer en un temps O(n²) si une distance est ultram´etrique ou non.

(13)

Comment obtenir des donn´ees ultram´etriques

Distances étiquettant les nœuds des arbres ultramétriques supposées refléter le temps qui s’est écoulé depuis la séparation des deux espèces.

Théorie de l’horloge moléculaire (1960): Pour une protéine donnée, le taux de mutations acceptées par intervalle de temps est constant. Ce taux de mutations n’est pas le même pour deux protéines différentes.

Avec cette théorie, si k mutations acceptées entre les protéines A et B, alors peut estimer à k/2 le nb de mutations survenues pour chaque espèce depuis la divergence. Permet d’obtenir des données ultramétriques

Le plus souvent, les données réelles ne sont pas ultramétriques. Lorsque les données sont ultramétriques (ou presque) cela constitue une preuve forte de la pertinence des données. Si non, une possibilité est de les modifier de fa¸con minimale de telle sorte qu’elles le deviennent.

(14)

Distances additives

Autre hypoth`ese sous-entendue dans la construction d’un arbre par UPGMA: distance additive.

D: Matrice symétrique n × n dont la diagonale ne contient que des zéros, et les autres cases des réels strictement positifs

T: arbre contenant au moins n nœuds (dont les feuilles), chaque ligne (espèce) de D correspond à un nœud différent, et les arcs sont étiquettés.

T arbre additif pour D si, pour toute paire de nœuds (i, j), le poids total du chemin de i `a j est D(i, j).

(15)

A

B

C 2

1 4

A 2 B C

A B C

0

0 5 8 5

Probl`emes: Trouver un arbre additif pour D, ou d´eterminer qu’un tel arbre n’existe pas.

Distance additive: Contrainte moins forte que la contrainte

ultramétrique. Cependant, les données réelles sont rarement additives.

Un vaste domaine de recherche: comment effectuer la plus petite

“d´eviation” possible sur les donn´ees pour qu’elles deviennent additives?

(16)

Test d’additivit´e, condition des quatre points

Arbre additif pour D: Distance entre deux feuilles qqs de l’arbre = somme des poids des arcs du chemin joignant ces deux feuilles.

Pour tout ensemble de 4 ´el´ements i, j, k, l, deux des distances

d_ij + d_kl, d_ik + d_jl, d_il +d_jl sont égales et supérieures à la troisième

i

j

k

l

i

j

k

l

i

j

k

l

i

j

k

l

(17)

M´ethode de construction d’un arbre additif

Paire de feuilles voisines: Deux feuilles de T ayant le mˆeme p`ere.

• Choisir deux objets i, j garantis d’ˆetre voisins dans un arbre additif

• Supprimer i, j de la liste des objets, et rajouter le nœud k

correspondant au p`ere commun de i et j. Distance de k `a une feuille quelconque m: D(k, m) = ¹₂(D(i, m) + D(j, m) − D(i, j)).

De cette fa¸con, nb de feuilles réduit de 1 à chaque étape, jusqu’à arriver

`

a un ensemble restreint `a 2 feuilles.

m k

i

j

3 4

2 1

0.1 0.1

0.1

0.4 0.4

(18)

Comment déterminer, à partir de d, deux feuilles qui sont nécessairement voisines dans un arbre additif e D? Il ne suffit pas de choisir une paire d’objets dont la distance est minimale.

L: Ensemble des objets (feuilles d’un arbre additif)

Pour tout (i, j) ∈ L, D(i, j) valeur obtenue en soustrayant de D(i, j) la distance moyenne de i et j `a tous les autres objets:

D(i, j) = D(i, j) − (ri + rj)

ri = 1

|L| − 2

X

k∈L\i,j

D(i, k)

Th´eor`eme: Si T arbre additif pour la distance additive D, si (i, j) paire d’objets telle que D(i, j) est minimal parmi toutes les paires d’objets, alors i et j sont voisins dans T

(19)

Algorithme Neighbour-joining

Initialisation:

T ensemble de toutes les feuilles, une pour chaque objet, et L = T. It´eration:

Consid´erer une paire (i, j) de L telle que D(i, j) est minimal.

D´efinir un nouveau nœud k et poser:

D(k, m) = ¹₂(D(i, m) +D(j, m) − D(i, j)) pour tout m ∈ L.

Rajouter k dans T, cr´eer deux arcs (i, k) et (j, k) de poids D(i, k) = ¹₂(D(i, j) + r_i − r_j) et D(j, k) = D(i, j) − D(i, k).

Supprimer i et j de L et rajouter k.

Fin:

L contient exactement deux feuilles i, j.

Cr´eer un arc (i, j) de poids D(i, j).

(20)

1

2(D(i, j) + r_i − r_j): moyenne de ¹₂(D(i, j) + D(i, m) − D(j, m)) pour toutes les feuilles m. Chacune de ces expressions repr´esente exactement D(i, k)

Remarque: Pour une distance additive, il n’existe pas un seul arbre additif

Heuristique: Appliquer l’algorithme plusieurs fois en modifiant aléatoirement l’ordre des objets dans L (des ordres différents entrainent des choix différents d’objets voisins). Trouver un consensus pour l’ensemble des arbres obtenus.

Lorsque la distance n’est pas additive, on peut quand meme

appliquer Neighbour-Joining, mais pas garantie sur la qualit´e de l’arbre obtenu.

(21)

Enraciner les arbres

Contrairement à l’algorithme UPGMA, Neighbour-joining construit un arbre non enraciné. Pour raciner l’arbre, il suffit de rajouter un outgroup, i.e. une espèce très éloignée des autres espèces

consid´er´ees

giant panda

lesser panda

orignal

goshawk vautour canard

alligator axolotl

Autre stratégie: Choisir le milieu d’un plus long chemin dans l’arbre. Hypothèse de l’horloge moléculaire considérée

(22)

M´ethodes de parsimonie

Méthode générale:

• Considérer l’ensemble T de toutes les topologies d’arbres possibles ayant les objets (séquences) pour étiquettes des racines.

• Calculer un poids pour chaque arbre T de T .

• S´electionner un arbre de T de poids minimal.

Pondération d’un arbre: Affecter des séquences aux nœuds internes de telle sorte à minimiser le poids total de l’arbre (somme des

distances entre les nœuds voisins)

(23)

Si on a un alignement des s´equences, proc´eder colonne par colonne.

Hypothèse: Chaque colonne a évolué séparément des autres.

Sous-problèmes pour des séquences réduites à un caractère de Σ ∪ {−}

AAG

AAA AAA

1 1

AAA AGA AAA GGA

AAG AGA

AAA AAA

1

GGA AAA AAA

AAG AAA

GGA AGA AAA

AGA AAA

1 1

AAG 1

AAAGGA

AGA ² ² ¹

Problème: Trouver un étiquettage des nœuds internes qui minimise le nombre de nœuds adjacents ayant des étiquettes 6=

(24)

Parsimonie pond´er´ee

On ne compte pas juste le nombre de substitutions, mais un poids S(a, b) pour la substitution de a en b.

Etiquetter les nœuds internes de telle sorte `´ a minimiser le poids total de l’arbre

Par récurrence: étiquette d’un nœud déduite des étiquettes des nœuds fils.

S_k(a): poids du sous-arbre de racine k, sous la condition que k est

´etiquett´e par a.

(25)

Algorithme parsimonie pond´er´ee:

Initialisation:

Poser k = 2n − 1, le num´ero de la racine;

R´ecurrence - Calculer S_k(a) pour tous les a:

Si k est une feuille

Poser S_k(a) = 0 pour a ´etiquette de k, S_k(a) = ∞ si non;

Si k n’est pas une feuille

Calculer S_i(a), S_j(a) pour tous les a, o`u i, j sont les fils de k;

Poser S_k(a) = min_b(S_i(b) + S(a, b)) + min_b(S_j(b) + S(a, b));

Fin:

Poids minimal de l’arbre = min_a S_2n−1(a);

(26)

Pour retrouver les nucl´eotides aux nœuds internes, garder des

pointeurs l_k(a), r_k(a), pour chaque a et chaque nœud k, et rajouter les deux instructions suivante dans le bloc de r´ecurrence:

Poser l_k(a) = argmin_b(S_i(b) + S(a, b));

Poser r_k(a) = argmin_b(S_j(b) + S(a, b));

Pour retrouver une assignation correcte pour les nœuds internes, choisir un nucléotide a à la racine qui donne lieu à un poids

S_2n−1(a) minimal, et suivre les pointeurs

(27)

Parsimonie traditionnelle, Algorithme de Fitch

Minimiser le nombre de substitutions de caractères. Garder à chaque nœud une liste de nucléotides “valides”. C: Poids courant de l’arbre.

Initialisation:

Poser k = 2n − 1, le num´ero de la racine, et C = 0;

R´ecurrence:

Si k est une feuille

Poser Rk = {´etiquette de k};

Si k n’est pas une feuille

Calculer R_i, R_j, o`u i, j sont les fils de k;

Si Ri ∩ Rj 6= ∅, poser Rk = Ri ∩ Rj; Si non, R_k = Ri ∪ Rj et incr´ementer C; Fin:

Poids minimal de l’arbre = C;

(28)

A B

{A,B}

A

Pour retrouver les nucléotides des nœuds internes: Choisir un nucléotide dans R_2n−1, puis déscendre dans l’arbre. Si on a choisit a pour k, Alors, pour le fils i de k, choisir a si possible, si non, choisir un nucléotide au hasard dans Ri.

Complexit´e: O(n|Σ|), o`u n est la taille de l’arbre (nombre de nœuds).

Problème de la parsimonie traditionnelle: Certaines assignations possibles des nœuds internes ne sont jamais considérées.

(29)

A B

A A

A B

A A

A B

B

B {1,1}

{1,2}

{2,2}

Observation: Le poids minimal d’un arbre, calculé par la méthode de parsimonie traditionnelle, est indépendant du choix de la racine.

Cons´equence: on n’a pas besoin de tester tous les arbres racin´es possibles.

(30)

Enum´´ eration de tous les arbres possibles

Arbres binaires enracin´es de n feuilles:

n feuilles =⇒ n − 1 nœuds internes

=⇒ Nombre total de nœuds et feuilles = 2n − 1

=⇒ 2n − 2 arcs.

Arbre sans racine: 2n − 2 nœuds et 2n − 3 arcs.

Pour former un arbre enracin´e, on rajoute une racine au milieu d’un des 2n − 3 arcs =⇒ 2n − 3 arbres enracin´es

3 fa¸cons de former un arbre sans racine de 4 feuilles `a partir d’un arbre sans racine de 3 feuilles.

5 fa¸cons de former un arbre sans racine de 5 feuilles `a partir d’un arbre sans racine de 4 feuilles· · ·

(31)

Par r´ecurrence: (3).(5).(7).· · ·(2n − 5) arbres sans racine de n feuilles.

=⇒ (3).(5).(7).· · ·(2n − 5)(2n − 3) = (2n − 3)!! arbres enracin´es de n feuilles

Le nombre d’arbres croˆıt tr`es rapidement en fonction de n.

Exemple: Pour n = 10, ∼ 2000000 arbres. Pour n = 20,

∼ 2.2 × 10²⁰ arbres.

(32)

S´election d’arbres `a tester

Premi`ere m´ethode stochastique: Etant donn´´ e un arbre T, permuter

al´eatoirement des branches dans T, et choisir l’arbre obtenu si son score est meilleur que le score courant. Pas garanti d’obtenir un arbre optimal.

Deuxi`eme m´ethode stochastique: Construire l’arbre en rajoutant un arc

`

a chaque ´etape.

• Construire un arbre T non enraciné à partir de trois objets choisits aléatoirement (2 objets dans le cas d’un arbre enraciné).

• Pour T contenant r feuilles, choisir al´eatoirement un r + 1`eme objet, et le rajouter dans T de fa¸con optimale.

Pas garanti , non plus, d’obtenir un arbre optimal. Des ordres différents pour les objets donnent lieu à des arbres différents, de scores différents.

(33)

Troisième méthode: Branch and Bound Rajouter des feuilles à l’arbre courant, et s’arrêter dès que l’arbre a un nombre maximal de feuilles, ou dès que le score dépasse un certain seuil (score du meilleur arbre obtenu jusque la). Correct car le nombre de mismatches ne peut qu’augmenter avec le nombre d’arcs.

Tous les arbres non-enracinés sont énumérés dans le tableau

[i₃][i₅][i₇]· · ·[i_2n−5], o`u chaque case i_k prend les valeurs de 0 `a k.

Signification: Construire l’arbre contenant les trois premiers objets (3 arcs). Rajouter un arc pour le 4`eme objet sur l’arc d’indice i3. Le

nouveau nombre d’arcs est alors 5. i₅ détermine l’indice de l’arc où doit être rajouté un arc pour le 5ème objet, etc.

1. Considérer la case la plus à droite du tableau, et l’incrémenter

jusqu’`a obtenir la valeur 2n − 5. Remplacer alors cette valeur par 0.

Incrémenter la case précédente jusqu’à obtenir la valeur 2n − 7. La remplacer par 0, etc.

(34)

2. Lorsque l’on arrive à une situation où l’on n’a que des 0 à droite d’une certaine case, on incrémente simultanément toutes ces cases.

[3] - - - - [7][0][0][0][0]

[3] - - - - [7][1][1][1][1]

3. Commencer avec le tableau [1][0][0]· · ·[0]. Soit C le score du meilleur arbre obtenu `a l’´etape courante de l’algorithme. Si on

obtient un arbre T de score supérieur à C, alors aucun arbre optimal ne peut être obtenu en rajoutant des arcs à T. Dans ce cas, si toutes les cases du tableau à partir d’un certain indice i ne contiennent que des 0, alors il suffit d’incrémenter i.

[3] - - - - [7][0][0][0][0]

[3] - - - - [8][0][0][0][0]

(35)

Inconsistance du mod`ele de parsimonie

Consistance d’une méthode d’estimation: Capacité à converger vers une bonne valeur (ici, le vrai arbre de phylogénie) avec

l’augmentation des donn´ees.

En considérant un modèle d’évolution simple, la méthode de parsimonie peut entrainer une fausse estimation de l’arbre (Felsenstein)

Supposons que la vraie phylog´enie d’un groupe de 4 taxons soit:

(36)

A A

A A (3)A (2) GC

AA

GG GA

(1) Type de motif (4)

I Non−informatif (constant) II Non−informatif

III Non−informatif IV Information fausse

(A)

Taille des branches reflète le taux d’évolution. Taux d’évolution accéléré pour les branches menant à (1) et (4). Les deux autres branches si

courtes qu’il n’y a presque pas de difference entre (2) et (3).

4 classes possibles pour les nucl´eotides de (1) et (4). I, II, III ne

fournissent aucune information permettant de clairement favoriser cet arbre par rapport `a tous les autres. IV: seule classe permettant de favoriser un arbre particulier. Malheureusement, favorise le mauvais arbre:

(37)

(1)

(4)

(2)

(3) (3)

(2)

(1) (4)

(B) (C)

Felsenstein appelle une telle situation positively misleading car plus on a de caract`eres (plus les s´equences sont longues), plus on est sur d’obtenir un arbre faux.

Lorsqu’on est dans la zone Felsenstein, le seul espoir d’obtenir un bon arbre est de séquencer suffisamment peu de caractères, de sorte à être induit en erreur le moins possible. Phénomène appelé attraction des longues branches.

(38)

Diff´erence entre parsimonie et likelihood Arbre non-enracin´e:

1 2

Temps

A A A

A A A A A C G (A)

Comment deviner le nucl´eotide de l’ancˆetre (1)?

Algorithme de Fitch: On peut attribuer `a (1) n’importe lequel des nucl´eotides A, C ou G avec un poids de 2 pour l’arbre. T augmente ce poids de 1.

D’autre part, une nouvelle séquence avec C, A, ou G peut être insérée avec un poids de 2 à n’importe quelle branche. Également, nouvelle séquence contenant T peut être insérée avec un poids de 3

(39)

`

a n’importe quelle branche. Dans tous les cas, s´equence non informative (ne favorise aucun arbre)

A C C G

A C

G A

C C G

C (D)

(C) (B)

Maximum de vraisemblance: Choisir l’hypothèse qui maximise la probabilité d’observer le nucléotide obtenu.

Modèle d’évolution choisit: Taux de substitution identique pour tous les nucléotides; nombre moyen de substitutions le long d’une branche proportionnel á la longueur de la branche.

Observation: Tous les descendants de (2) ont des A. Donc, taux de mutation faible. D’où, phylogénie entrainant peu de mutations plus probable que phylogénie entrainant beaucoup de mutations. Donc,

(40)

présence d’un A à l’ancêtre (2) beaucoup plus probable que

présence d’un C, G ou T (mais hypothèse d’un C,G,T non rejetée).

Nucléotide à l’ancêtre 1? A, C ou G? Supposons un A à (2). Plus probable que la substitution ait eu lieu sur la branche longue.

Donc, plus probable d’avoir un A en (1). Plus généralement, ordre de probabilité: A > C > G > T.

Rajout d’une s´equence avec un C: arbre (C) plus probable que les autres, car pour les arbres (B) et (D), deux substitutions A → C seraient n´ecessaires.

La taille des branches est une information importante pour la m´ethode de maximum likelihood, et donc pas de probl`eme

d’attraction des longues branches. Dans ce cas, arbre (8B) tr`es probable.