• Aucun résultat trouvé

Nombre maximum d’it´ erations dans un graphe

Dans l’implantation de la m´ethode, il y a une option pour arrˆeter la construc- tion de graphes trop longs (selon le nombre d’´etapes). Quand la construction d’un graphe est stopp´ee de cette mani`ere, la vraisemblance associ´ee `a ce graphe de- vient nulle, autrement dit le poids de ce graphe est 0, mais on tient ´evidemment compte de “l’annulation” de ce graphe dans le calcul de la vraisemblance. Soit ν le nombre maximum d’´ev´enements permis pour la construction d’un graphe.

Dans l’application de la m´ethode, nous prenons une valeur tellement grande de ν qu’en pratique la construction d’un graphe n’est jamais arrˆet´ee. Notons que le r´esultat du programme pr´ecise le nombre de graphes ainsi abandonn´es.

Dans la construction des graphes, il y a de grandes diff´erences entre les poids des diff´erents graphes, de telle sorte que seulement une faible proportion des graphes contribuent r´eellement `a la vraisemblance. Bien qu’il n’existe pas de relation directe entre le poids d’un graphe et le nombre d’´etapes n´ecessaires `a sa construction, nous pouvons tenter d’am´eliorer la vitesse du programme en arrˆetant tˆot la construction des graphes contenant trop d’´etapes. Notons qu’un proc´ed´e similaire est utilis´e dans Griffiths et Marjoram (1996), mais le proc´ed´e pour arrˆeter la construction des graphes n’est pas clairement pr´ecis´e.

Une des fa¸cons les plus simples d’´evaluer l’effet d’une telle m´ethode est de la simuler. Nous prendrons trois exemples, et pour chacun d’eux, nous calculerons la vraisemblance de fa¸con usuelle, mais aussi pour diff´erents niveaux de ν, et ceci sur les mˆemes graphes. Soit ¯ν le pourcentage des graphes dont le nombre d’´etapes est inf´erieur ou ´egal `a ν. Nous allons choisir 10 valeurs de ν correspon- dant approximativement `a des valeurs de ¯ν de 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, et 5%. Le tableau 5.4.2 pr´esente pour chacun des trois exemples, les valeurs de ν, les valeurs correspondantes de ¯ν, et les temps de calcul qui en d´ecoulent. La derni`ere ligne du tableau est une r´ef´erence afin de pouvoir com- parer les temps de calcul; cette r´ef´erence est calcul´ee avec une grande valeur de ν de telle sorte que ¯ν = 100%. Notons que pour l’exemple D, la r´ef´erence utilis´ee est ¯ν ≈ 70%; pour cet exemple, ρ est tr`es grand, les graphes peuvent ˆetre tr`es longs, et la version rapide du programme est utilis´ee (cf. section 4.7), ce qui a pour cons´equence que 30% des graphes ont des poids inf´erieurs `a la pr´ecision de la machine, et ne peuvent ˆetre calcul´es. Dans la colonne du temps, on trouvera un petit graphique indiquant le gain de temps que l’on r´ealise `a utiliser une valeur particuli`ere de ν: une barre compl`etement noire indique la r´ef´erence, et une barre enti`erement blanche exprime que deux fois moins de temps est n´ecessaire pour

faire le mˆeme nombre d’it´erations. Les estimations de ¯ν sont bas´ees sur 5M de simulations pour les exemples B et C, et sur 500m simulations pour l’exemple D; notons que ces proportions sont tr`es stables, quel que soit le nombre de simula- tions. Ensuite, 10 ´evaluations de la vraisemblance ont ´et´e effectu´ees pour chacune des valeurs de ν, et une autre ´evaluation pour servir de r´ef´erence de telle sorte que l’on ait ¯ν = 100%.

Tableau 5.4.2. ´Evaluation du pourcentage de graphes rejet´es (¯ν) et du gain de temps de calcul en modifiant le nombre d’it´erations permis (ν) pour reconstruire un graphe pour les exemples B, C et D.

B C D

ν ¯ν Temps ν ¯ν Temps ν ¯ν Temps

45 91.2 7m32s 136 91.1 9m8s · · · 40 77.9 7m20s 131 83.0 9m5s · · · 37 71.0 7m10 128 70.1 8m47s · · · 35 62.7 6m59s 125 61.9 8m46s 630 61.34 15m55s 33 53.2 6m47s 123 52.6 8m27s 515 49.31 14m22s 31 42.7 6m32s 121 42.7 8m18s 442 40.07 13m6s 30 31.9 6m25s 120 32.8 8m11s 378 30.41 11m46s 27 21.7 5m54s 118 23.6 7m56s 319 19.92 10m34s 25 13.0 5m31s 114 9.5 7m24s 263 9.41 9m4s 23 6.4 5m32s 112 5.1 7m7s 232 4.39 8m4s Ref 100 7m46s Ref 100 9m9s 9000 69.07 16m59s

Le nombre moyen d’´etapes n´ecessaires pour la construction des graphes est 33.5 ± 8.1 pour l’exemple B, 123.3 ± 8.4 pour C, et 424.5 ± 143,6 pour D (moyennes calcul´ees sur des graphes construits sans contrainte). On peut voir que le gain de temps commence `a ˆetre appr´eciable seulement pour de petites valeurs de ν, c’est-`a-dire quand on stoppe tr`es tˆot la construction des graphes. Le gain est de l’ordre d’une fois et demi pour les deux premiers exemples, mais le gain peut ˆetre fort appr´eciable (deux fois) pour le dernier exemple.

La figure 5.4.1 montre les ´evaluations de la mˆeme vraisemblance pour l’exem- ple B effectu´ees pour les diff´erentes valeurs de ν du tableau 5.4.2. Nous avons pour cela modifi´e le programme afin qu’il calcule la vraisemblance selon ν; ainsi,

on peut appr´ecier exactement l’effet de cette approximation. Onze courbes sont repr´esent´ees sur chacun des graphiques (a) et (b), mais certaines ne sont pas visibles, car elles sont surimpos´ees sur la courbe la plus fonc´ee, qui est la courbe r´ef´erence. Chacune de ces courbes est une ´evaluation de la mˆeme vraisemblance. Les trois courbes les plus basses de (a) correspondent respectivement aux valeurs de ¯ν de 5%, 10% et 20%. Plus ¯ν est petit, plus le nombre de graphes abandonn´es est grand, et plus la vraisemblance est basse. Il est int´eressant de noter que les courbes correspondant aux valeurs de ¯ν sup´erieures `a 30% sont assez semblables `

a la courbe de r´ef´erence. `A ¯ν = 30%, cela signifie qu’environ 70% des graphes sont abandonn´es, donc que seulement 30% d’entre eux contribuent r´eellement `a la vraisemblance. Si l’on observe la figure (b) qui correspond `a 5M d’it´erations, on observe qu’`a partir de ¯ν ≈ 70%, la vraisemblance est la mˆeme. Elle montre donc un profil l´eg`erement diff´erent. Seules les courbes correspondant aux valeurs 70%, 80% et 90% de ¯ν sont similaires `a la courbe de r´ef´erence. Cela signifie que 70% des graphes contribuent `a la vraisemblance. Il est int´eressant de noter que les courbes pour des valeurs de ¯ν d’au moins 20% sont quand mˆeme assez proches de la courbe de r´ef´erence, en ce qui concerne la hauteur et la position du maximum. -21.3 -21 -20.7 -20.4 -20.1 -19.8 -19.5 -19.2 -18.9 -18.6 0.001 0.003 0.005 0.007 0.009 0.011 (a) -22 -21.6 -21.2 -20.8 -20.4 -20 -19.6 -19.2 -18.8 0.001 0.003 0.005 0.007 0.009 0.011 (b)

Figure 5.4.1. Courbes de vraisemblance pour l’exemple B, pour les 10 niveaux de ν du tableau 5.4.2: a) 1M d’it´erations, b) 5M d’it´erations.

Les figures 5.4.2 (a) et (b) pr´esentent des profils tr`es similaires pour l’exemple C: seules les courbes correspondant aux valeurs de 5% et 10% de ¯ν sont visi- bles: les 8 autres courbes sont confondues avec la courbe de r´ef´erence. On peut donc en d´eduire que l’on pourrait utiliser une valeur de ¯ν de 20% sans affecter l’estimation, c’est-`a-dire omettre 80% des graphes.

-93.6 -93 -92.4 -91.8 -91.2 -90.6 -90 -89.4 -88.8 -88.2 0 0.012 0.024 0.036 0.048 (a) -94.2 -93.6 -93 -92.4 -91.8 -91.2 -90.6 -90 -89.4 -88.8 0 0.012 0.024 0.036 0.048 (b)

Figure 5.4.2. Courbes de vraisemblance pour l’exemple C, pour les 10 niveaux de ν du tableau 5.4.2: a) 1M d’it´erations, b) 5M d’it´erations. Pour notre dernier exemple (D), nous avons une profil un peu diff´erent: pour les deux cas, 100m et 1M d’it´erations, toutes les sept courbes sont confondues avec notre courbe de r´ef´erence; la vraisemblance est ainsi la mˆeme pour ¯ν ≈ 70% que pour ¯ν≈ 5%, ce qui veut dire que peu de graphes, moins de 5%, contribuent en fait `a la vraisemblance (cf. fig. 5.4.3 (a) et (b)). Ceci peut s’expliquer en partie par le type de l’exemple: ce sont des donn´ees r´eelles, et la distribution propos´ee qui construit les graphes est probablement moins efficace dans ce cas: ainsi, on g´en`ere beaucoup de graphes ayant un grand nombre d’´etapes et un petit poids associ´e, et peu de graphes courts ayant des poids plus grands. La vraisemblance ´

etant d´efinie par la moyenne des poids, on voit ainsi que si l’on abandonne en cours d’´evaluation les graphes ayant un grand nombre d’´etapes, et qu’on leur assigne un poids nul, cela ne fait pratiquement aucune diff´erence, c’est comme si on avait continu´e la construction des ces graphes jusqu’au MRCA afin d’avoir une juste ´evaluation de la vraisemblance. Donc, `a toute fin pratique, le poids de

ces longs graphes abandonn´es est nul par rapport au poids des autres graphes. En conclusion, on constate que peu de graphes contribuent en fait `a la vraisemblance. L’utilisation de cette option peut nous faire gagner un temps important. On a vu que pour l’ensemble de donn´ees D, par exemple, nos estima- tions peuvent ˆetre obtenues deux fois plus rapidement en utilisant une valeur de ν

-373.2 -372.6 -372 -371.4 -370.8 -370.2 -369.6 -369 -368.4 -367.8 -367.2 0.3 0.34 0.38 0.42 0.46 (a) -367.2 -366.3 -365.4 -364.5 -363.6 -362.7 -361.8 -360.9 -360 0.3 0.34 0.38 0.42 0.46 (b)

Figure 5.4.3. Courbes de vraisemblance pour l’exemple D, pour les 7 niveaux de ν du tableau 5.4.2: a) 100m d’it´erations, b) 1M d’it´erations.. menant `a ¯ν ≈ 5%. Compte tenu que plusieurs jours, voire plusieurs semaines, peuvent ˆetre n´ecessaires pour obtenir des r´esultats stables, il est plus que tentant de restreindre le nombre d’´etapes des graphes. La valeur de ¯ν `a utiliser n’est cependant pas facile `a d´eterminer. Plusieurs essais comme l’on vient de le faire montrent assez clairement la valeur maximum `a ne pas utiliser.

Documents relatifs