• Aucun résultat trouvé

Optimisation des param`etres libres du mod`ele de substitutions

Dans le document Docteur de l’Universit´ e Montpellier II (Page 60-63)

3.2 M´ethodes bas´ees sur la vraisemblance

3.2.2 Optimisation des param`etres libres du mod`ele de substitutions

Les param`etres libres du mod`ele de substitution sont g´en´eralement ajust´es ind´ependamment des lon-gueurs de branches. Les algorithmes de la «section d’or»et de Brent (1973) peuvent ˆetre appliqu´es pour ce probl`eme (voir Annexe B pour un exemple). Ceux-ci sont d´ecrits ci-dessous.

M´ethode de section du nombre d’or

La m´ethode de la section d’or permet d’ajuster la valeur d’un unique param`etre.xi,yi etzi sont trois valeurs de ce param`etre, telles quexi < yi < zi. Ces trois valeurs constituent un triplet not´e (xi, yi, zi).

L’indiceiest le nombre d’it´erations effectu´ees. Les vraisemblances en ces trois points sont not´ees L(xi), L(yi) etL(zi), et on aL(yi)> L(zi) etL(yi)> L(xi) quel que soiti(Figure 3.4).

Consid´erons queyi est une fractionR du chemin entrexi etzi : R= yziixxii et 1−R= zziiyxii

Supposons `a pr´esent qu’un pointaest plac´e entreyi etzi, d´efinissant ainsi une nouvelle fractionS : S= a−yi

zi−xi

SiL(a)> L(yi), le nouveau triplet (xi+1, yi+1, zi+1) correspond `a (yi, a, zi). La distance entrexi+1etzi+1

est alors ´egale `a 1−R. Si L(a)< L(yi), le triplet (xi+1, yi+1, zi+1) correspond `a (xi, yi, a). La distance entre xi+1 et zi+1 est alors ´egale `aR+S. Ainsi, `a l’´etapei+ 1, les valeurs du param`etre encadrant le maximum de la fonction d´efinissent soit un intervalle de taille 1−R(si L(a)> L(yi)), soit un intervalle de tailleR+S (siL(a)< L(yi)). Afin de converger vers un maximum en un nombre d’´etapes minimum,

il est souhaitable que la diminution de la taille de l’intervalle encadrant le maximum soit la mˆeme lorsque celui-ci mesure 1−R ouR+S `a l’´etapei+ 1. Le choix le plus raisonnable pour placer aest donc de d´efinirS tel que 1−R=R+S. On a alors :

S= 1−2R (3.9)

S est positif seulement si R < 0.5 et le point a est donc plac´e dans le plus grand des deux segments.

Cependant, il reste encore `a d´eterminer la position pr´ecise de a sur ce segment. Pour cela, il suffit de remarquer qu’`a l’´etape i, le point yi a ´et´e plac´e de fa¸con optimale. Cette similarit´e d’´echelle permet d’´ecrire :

S

1−R =R (3.10)

D’apr`es les ´equations 3.9 et 3.10, on en d´eduitR= 325 '0.382. Ainsi, `a chaque ´etapeide l’algorithme, le rapport yzixi

ixi est ´egal `a 0.382 et le rapport zziyi

ixi est ´egal `a 0.618. Ces deux fractions correspondent aux fameuses «sections d’or».

Ces ´etapes de mises `a jour du triplet encadrant un maximum sont r´ep´et´ees jusqu’`a ce que la distance entre les deux extrema de l’intervalle passe en de¸c`a d’un certain seuil. La convergence vers le maximum estlin´eairecar, `a chaque ´etape, la taille de l’intervalle encadrant l’extrema est multipli´ee par un facteur 0.618.

M´ethode de Brent (1973)

La section d’or est une approche prudente de l’optimisation d’une variable. Le nombre d’it´erations avant d’atteindre un maximum est relativement ´elev´e mais les hypoth`eses sur la forme de la fonction sont r´eduite. La m´ethode de Brent (1973) repose sur l’hypoth`ese que la fonction est de forme parabolique

`

a proximit´e du maximum. Si une parabole s’ajuste parfaitement `a cette zone, il existe une expression analytique simple donnant l’abscisse correspondant au maximum de la parabole.

La Figure 3.5 d´ecrit deux ´etapes successives de ce processus d’ajustement. Reprenons les notations pr´ec´edentes. `A l’´etapei, le triplet de points (xi, yi, zi) encadrant le maximum sont les abscisses des points 1, 2, et 3 figurant sur la courbe. Par ces trois points passe la parabole A. Les coordonn´ees du point 4, dont l’abscisse correspond au maximum de cette premi`ere parabole, sont obtenues par interpolation parabolique inverse. Le nouveau triplet (xi+1, yi+1, zi+1) est alors constitu´e des abscisses des points 1, 2 et 4 par lesquels passe la nouvelle parabole B. Pour cet exemple, l’abscisse correspondant au maximum de cette derni`ere parabole est une bonne approximation de la valeur du param`etre maximisant la fonction.

Lorsque la parabole s’ajuste `a la fonction de mani`ere satisfaisante, la proc´edure est rapide. En effet, dans cette situation la convergence est quadratique. Ceci signifie que, pr`es d’un z´ero de la fonction, le nombre de chiffres significatifs de la solution approxim´ee par cette m´ethode, double `a chaque ´etape. En revanche, dans certains cas, l’ajustement parabolique peut ˆetre bien plus lent, et surtout moins sur, que

- Algorithmes de reconstruction d’arbres phylog´en´etiques

-PSfrag replacements

1

2

3 4

A

B

x lnL

x

Fig. 3.5 – Ajustement parabolique it´er´e. Les points 1, 2 et 3 d´efinissent une premi`ere parabole A.

Le point 4 est une projection du maximum de cette parabole sur la fonction. La parabole B passe par les points 1, 2 et 4. L’abscisse de son maximum est une bonne approximation du maximum delnL.

PSfrag replacements

x lnL

Fig. 3.6 –Ajustement parabolique dans un cas d´efavorable. La convergence vers le maximum de lnLest ici tr`es lente.

l’algorithme du nombre d’or. Le Figure 3.6 illustre une telle situation. Ainsi, en pratique, la m´ethode du nombre d’or est appliqu´ee jusqu’`a ce qu’un crit`ere mesurant l’ajustement d’une parabole `a la fonction soit satisfait et l’ajustement parabolique prend alors le relais.

Application `a la phylog´enie

Ces deux m´ethodes d’optimisation reposent sur le calcul de la vraisemblance de la phylog´enie pour diff´erentes valeurs du param`etre `a ajuster. En pratique, ni la topologie, ni les longueurs de branches de l’arbre vrai ne sont connues. La surface de vraisemblance d´eduite de l’arbre estim´e est donc tr`es fr´equem-ment distincte de celle de l’arbre vrai. Cependant, pour une phylog´enie inf´er´ee r´ealiste, cet ´ecart entre les deux fonctions n’est g´en´eralement pas p´enalisant et les valeurs optimales des param`etres peuvent ˆetre approxim´ees de mani`ere tr`es satisfaisante. Par exemple, Yang (1996) signale que la valeur du param`etre de forme de la loi gamma, mesurant la variabilit´e des vitesses d’´evolution entre sites, n’est sous-estim´ee

que lorsque l’estimation est effectu´ee `a partir d’une phylog´enie aberrante. Une phylog´enie estim´ee rapi-dement par une m´ethode de distances constitue un support efficace pour l’ajustement de ce param`etre et d’autres, comme le ratio transition/transversion. Cette approche est g´en´eralement satisfaisante lorsque la finalit´e est l’inf´erence d’un arbre par maximum de vraisemblance. Lorsque l’objectif est plutˆot d’obtenir une estimation tr`es pr´ecise des param`etres du mod`ele, les valeurs ajust´ees peuvent ˆetre utilis´ees pour la construction d’un arbre `a partir duquel sont `a nouveau optimis´ees les valeurs des param`etres. Ces deux

´etapes sont it´er´ees jusqu’`a l’obtention d’une phylog´enie et des valeurs de param`etres stables. La m´ethode d’inf´erence d’arbre d´ecrite au chapitre 5 suit cette strat´egie.

Dans le document Docteur de l’Universit´ e Montpellier II (Page 60-63)