• Aucun résultat trouvé

3.3 Annexe

4.1.1 Pr´ eliminaires

Sous-arbres et plongements

On donne une d´efinition ´equivalente en termes de plongement. Un plonge- ment de S dans T est une application φ : N (S) → N (T ) telle que :

1. φ pr´eserve feuilles et noeuds internes : (i) si l est une feuille de S d’´etiquette x, alors φ(l) est une feuille de T d’´etiquette x, (ii) si u est un noeud interne de S, alors φ(u) est un noeud interne de T ;

2. (i) si u, v sont deux noeuds de S tels que u <S v, alors φ(u) <T φ(v) ; (ii)

si u, v sont deux noeuds de S incomparables par <S, alors φ(lcaS(u, v)) =

lcaT(φ(u), φ(v)).

On a alors : S ≤ T si et seulement si il existe un plongement de S dans T . Cette d´efinition est illustr´ee ci-dessous :

a b d e a b c d e f r s t v w u S T

Fig. 4.1 – Deux arbres S, T tels que S ≤ T . Le plongement φ de S dans T est tel que φ(s) = v, φ(r) = t, comme indiqu´e par les fl`eches en pointill´e.

On a les propri´et´es suivantes :

Observation 4.1. 1. L’identit´e est un plongement de T dans T ;

2. Si φ est un plongement de S dans T , et φ0 est un plongement de T dans U , alors φ0◦ φ est un plongement de S dans U ;

3. Si φ est un plongement de S dans T , alors φ|N (S|L0) est un plongement de S|L0 dans T |L0.

Du lemme 4.1, il r´esulte que la relation sous-arbre jouit des propri´et´es suivantes : Lemme 4.2. (i) ≤ est une relation d’ordre ; (ii) si S ≤ T , alors S|L0≤ T |L0.

Arbres d’accord, probl`eme MAST

Soit T = {T1, ..., Tk} une collection d’arbres sur un mˆeme ensemble d’´etiquettes

L. Soit S un arbre sur L0 ⊆ L. On dit que S est un arbre d’accord de T si et seulement si S ≤ Ti pour tout i. On dit que T est isomorphe si et seulement si

elle admet un arbre d’accord S tel que L(S) = L (alors tous les arbres Ti sont

4.1. PROBL `EME MAST 45 Lemme 4.3. (i) Si T est un arbre d’accord de T et si S ≤ T , alors S est

un arbre d’accord de T ;

(ii) Si T est un arbre d’accord de T , alors T |L0 est un arbre d’accord de T |L0;

(iii) Si T est isomorphe, alors T |L0 est isomorphe. L’exemple suivant illustre la notion d’arbre d’accord :

a b c d e f r s t T1 a b c d e f u w x v T2 a b e f S

Fig. 4.2 – Une collection de deux arbres T = {T1, T2} sur l’ensemble d’´etiquettes

L = {a, b, c, d, e, f }, et un arbre d’accord maximum S.

Le probl`eme Mast consiste `a chercher un arbre d’accord de taille maxi- mum d’une collection donn´ee en entr´ee. En remarquant qu’un arbre d’accord est d´etermin´e par son ensemble d’´etiquettes, on choisit de d´efinir formellement le probl`eme de la mani`ere suivante : ´etant donn´ee une collection d’arbres T sur L, trouver L0 ⊆ L de cardinal maximum tel que T |L0 soit isomorphe. On

d´efinit ´egalement le probl`eme compl´ementaire CMast : ´etant donn´ee une col- lection d’arbres T sur L, trouver L0 ⊆ L de cardinal minimum tel que T \L0

soit isomorphe. On note M AST (T ), resp. CM AST (T ), le coˆut d’une solution optimale pour Mast, resp. CMast.

On consid´erera ´egalement Mast comme un probl`eme param´etr´e, les pa- ram`etres d’int´erˆet ´etant les suivants : le nombre d’´etiquettes n, le nombre d’arbres k, le degr´e maximum d. Etant donn´e un entier k ≥ 2, on notera k − Mast la restriction du probl`eme Mast aux collections de k arbres.

Plusieurs algorithmes pour Mast pr´esent´es dans le suite reposent sur ca- ract´erisation simple des collections isomorphes en terme de conflits. On d´efinit deux types de conflits : un s-conflit entre T est un triplet uvw tel que uv|w ∈ rt(Ti) et uvw ∈ f (Tj) ; un h-conflit entre T est un triplet uvw tel que uv|w ∈

rt(Ti) et vw|u ∈ rt(Tj) ; un hs-conflit entre T est soit un s-conflit, soit un

h-conflit entre T . On peut montrer :

Lemme 4.4 ([4]). (i) Deux arbres T1, T2 sont isomorphes si et seulement si il

n’existe pas de hs-conflit entre T1, T2; (ii) Une collection T est isomorphe si et

seulement si il n’existe pas de hs-conflit entre T . Historique et nouveaux r´esultats

Le probl`eme Mast sur deux arbres a ´et´e introduit dans [20], o`u est ´egalement d´ecrite une heuristique pour le probl`eme de complexit´e temporelle O(n5). [34]

46 CHAPITRE 4. PROBL `EMES MAST ET MCT ont d´ecrit un algorithme sous-exponentiel pour 2 − Mast restreint aux arbres binaires, de complexit´e temporelle O(nc log n). Le premier algorithme polynomial

exact pour 2 − Mast a ´et´e d´ecrit dans [37] ; grˆace `a une optimisation d´ecrite par [18], sa complexit´e temporelle est O(n2,5log n) pour des arbres de degr´e non

born´e, et O(d2,5n2log n) pour des arbres de degr´e born´e.

Par ailleurs, plusieurs auteurs [18, 14, 36, 32, 33] ont pr´esent´e des algorithmes sous-quadratiques pour 2 − Mast, et des algorithmes quasi-lin´eaires pour le cas du degr´e born´e. Ainsi, [18] d´ecrivent un algorithme de complexit´e temporelle O(n1,5log n) ; [14] d´ecrivent un algorithme de complexit´e O(n log n) pour deux

arbres binaires, et [36] a tent´e de g´en´eraliser cet algorithme aux arbres de degr´e d, obtenant un algorithme de complexit´e O(√dn log n). Le meilleur algorithme pour le probl`eme est dˆu `a [33], sa complexit´e est O(n1,5) dans le cas d’arbres de

degr´e non born´e, et O(√dn log2nd) dans le cas d’arbres de degr´e born´e. L’´etude du probl`eme Mast sur un nombre d’arbres non born´e a ´et´e initi´ee par [4, 17]. [4] ont montr´e la NP-difficult´e de 3−Mast dans le cas d’arbres de degr´e non born´e. [4, 11, 17] ont montr´e que le probl`eme ´etait soluble en temps polynomial si l’un des arbres ´etait de degr´e born´e d, aboutissant `a un algorithme de complexit´e O(nd+ kn3).

L’approximabilit´e du probl`eme a ´et´e ´etudi´ee par plusieurs auteurs. Dans le cas d’arbres de degr´e non born´e, [4] montrent que 3 − Mast est APX-dur, et [29] montrent que 3 − Mast n’est pas approximable `a un facteur constant si P 6= NP. En s’inspirant des r´esultats de [22], [8] d´ecrivent des algorithmes de 3-approximation pour le probl`eme compl´ementaire CMast : ils utilisent la ca- ract´erisation du Lemme 4.4 pour r´esoudre le probl`eme par ´elimination de conflits disjoints, et obtiennent des algorithmes de complexit´e temporelle O(kn3). Dans

[6] et [24], nous avons adapt´e la strat´egie d’identification des conflits de mani`ere `

a obtenir un algorithme en temps lin´eaire O(kn).

Le probl`eme a ´et´e ´egalement ´etudi´e sous l’angle de la complexit´e param´etrique. En utilisant le Lemme 4.4, [12] obtiennent des algorithmes FPT par rapport `a p, de complexit´e respective O(3pkn log n), O(kn3+ 2.27p). [8] am´eliorent le pre-

mier algorithme pour obtenir une complexit´e temporelle O(3pkn). Dans [25],

nous obtenons de nouveaux r´esultats sur la complexit´e param´etrique de Mast. D’une part, nous d´ecrivons des algorithmes FPT pour les paires de param`etres (k, d) et (k, q), de complexit´e respective O(22kdn3) et O(2O(kq)n3). D’autre part, nous montrons que le probl`eme est Wl[1]-dur pour la paire de param`etre (q, d).

Une cons´equence de ce r´esultat est que Mast ne peut pas ˆetre r´esolu en temps Φ(d)No(d) sous l’hypoth`ese ETH (o`u N est la taille de l’instance). Ceci sugg`ere l’optimalit´e asymptotique de l’algorithme en O(nd+ kn3).