• Aucun résultat trouvé

Difficulté de la reconstruction dans le cas général

2.2 Reconstruction à partir de quadruplets

2.2.2 Difficulté de la reconstruction dans le cas général

Nous nous focalisons maintenant sur la reconstruction d’un réseau non enraciné de niveaukqui contient un ensemble donné de quadruplets.

Problème 1 (LEVEL-kQUARTETCONSISTENCY)

Entrée : un ensembleQde quadruplets.

Sortie : OUI s’il existe un réseau non enraciné de niveaukqui contient tous les quadruplets

deQ, NON sinon.

Steel a prouvé en 1992 que le problème LEVEL-0 QUARTET CONSISTENCY est NP-

complet [Steel, 1992], nous généralisons ci-dessous sa preuve au niveau 1.

Tout d’abord, nous prouvons que pour le niveau 1, ce problème est équivalent si l’on ajoute la restriction que le réseau à reconstruire doit être simple. Dans ce cas nous parle- rons du problème SIMPLELEVEL-1 QUARTETCONSISTENCY.

Lemme 3 SoitQun ensemble de quadruplets. S’il existe un réseau non enracinéNde niveau 1 qui contientQ, alors il existe un réseau simple non enracinéN0de niveau 1 qui contientQ. Démonstration. Considérons un réseau non enracinéNde niveau 1 qui contientQ, et un réseau simple non enracinéN0= Simple(N)de niveau 1 (voir la définition 1.23, page 56 et la figure 1.8, page 29). Pour tout quadrupletad|bcdeQ, commeQest contenu dansN

alors il existe un arbre non enraciné contenu dansNet qui contientad|bc. En particulier, cet arbre contient la bipartitionA|A¯ telle quea, d∈Aetb, c∈ ¯A. Ainsi, la bipartitionA|A¯

est contenue dansN, et donc dansN0d’après le lemme 2, doncad|bcest contenu dans

N0. 

Théorème 5 LEVEL-1 QUARTETCONSISTENCYest un problème NP-complet.

Démonstration. Comme il est possible de vérifier en temps polynomial qu’un ensemble de quadruplets est bien contenu dans un réseau non enraciné de niveau 1 d’après le théo- rème 4, le problème LEVEL-1 QUARTETCONSISTENCYest dans NP.

Pour prouver qu’il est NP-difficile, on réduit grâce au lemme 3 le problème SIMPLE

LEVEL-1 QUARTET CONSISTENCY, qui est NP-difficile, comme nous allons le prouver par

réduction du problème BETWEENNESS, qui est NP-difficile [Opatrny, 1979]. Rappelons que le problème BETWEENNESSconsiste à décider, pour une collectionCde séquences de trois

parC, où(a, b, c)∈Csignifie quea<b<cou bienc<b<a. On peut supposer que tout élément deAapparaît dans au moins une contrainte deC.

Étant donné une instance (A, C) du problème BETWEENNESS, on construit une ins- tance(X,Q(C))du problème SIMPLELEVEL-1 QUARTETCONSISTENCY, oùXest l’ensemble

des feuilles etQ(C)l’ensemble des quadruplets, de la manière suivante : – X = A∪{α,β,α1, β1}∪Si∈[1..|C|]Xi, oùXi={pi, qi},

– à chaque contrainteci= (a, b, c)∈Cd’une instance de BETWEENNESS, poura, b, c∈

A, on associe un ensemble de quadrupletsQi={βpi|qia, αqi|pia, βpi|qib, αqi|pib,

βpi|qic, αqi|pic, pib|cqi, pia|bc}.

– Q(C) = Q0(C)∪Q00(C), oùQ0(C) =S

i∈[1..|C|]Qi, etQ00(C) ={αα1|ββ1, αβ|α1β1}∪



ββ1|xα, αα1|xβ, α1β1|xβ,∀x∈A∪Xi}.

⇒ : si un ordre σ de A respecte les contraintes de C, alors pour chaque contrainte

ci= (a, b, c)∈C:

– sia<σb<σc, définissonsri= pietsi= qi,

– sic<σb<σa, définissonsri= qietsi= pi.

Considérons le réseau simple non enracinéNde niveau 1 constitué d’un cycle à4 +|A| + 2|C| sommets, chacun adjacent d’une feuille, tel que les feuilles sont apparaissent dans l’ordre suivant : α1αr1. . . r|C| puis σ puis s1. . . s|C|ββ1. Ce réseau montré en figure 2.4

contientQi pour touti de [1..|C|], et il contient tous les quadruplets de Q00(C), donc il

contientQ(C). AinsiNest une solution du problème SIMPLE LEVEL-1 QUARTET CONSIS-

TENCY.

FIGURE2.4 : Réseau simple de niveau 1 non enraciné construit à partir d’une solutionσde

BETWEENNESS.

⇐: inversement, supposons qu’il existe un réseau simpleNnon enraciné de niveau 1 qui contientQ(C), alorsNest composé d’un cycle de 4 +|A| + 2|C|sommets, chacun adjacent à une feuille. Pour toute feuillex, appelonsx0 le sommet voisin dex. Comme

Q(C)contient{αα1|ββ1, αβ|α1β1}, ceci forceα0,α10,β10 etβ0à apparaître dans cet ordre

dans le cycle deN. Nous allons maintenant déterminer les positions des autres sommets dans cet ordre circulaire. Appelons respectivementI1,I2,I3etI4les intervalles de cet ordre

circulaire entreα10 et β10, entreβ10 etβ0, entreβ0 etα0, et entreα0 etα10, comme montré en figure 2.5(i).

Pour toute feuillexdeA∪S

i∈[1..|C|]Xi, commeββ1|xα∈Q(C),x0n’appartient pas à l’in-

Le sommetx0est donc dans l’intervalleI3. Déterminons à présent les ordres possibles de

tous les sommets situés dans l’intervalleI3.

Fixonsiet considérons les sommets{a0, b0, c0, p0

i, qi0}oùci= (a, b, c). Fixons les posi-

tions depi0etqi0entreα0etβ0. Il y a deux possibilités comme montré sur les figures 2.5(ii) et (iii). Dans le premier cas, on appelle respectivement J1, J2 etJ3 les intervalles]α0, pi0[,

]p0

i, qi0[,]qi0, β0[. Dans le deuxième cas, on appelle respectivementJ3,J2etJ1les intervalles

]α0, qi0[,]qi0, pi0[,]pi0, β0[. Dans les deux cas, commeαqi|pia∈Q(C),a0n’est pas dans l’inter-

valleJ3. Commeβpi|qia∈Q(C),a0n’est pas dans l’intervalleJ1. Toutefois ces deux qua-

druplets autorisenta0à être placé dansJ

2. De même,b0etc0sont aussi dans l’intervalle

J2.

Enfin, étudions les positions relatives dea0,b0etc0. Le quadrupletpib|cqiet le fait que

b0etc0sont dans l’intervalleJ

2entrepi0etqi0forcentpi0,b0,c0etqi0à être placés dans cet

ordre le long du cycle deN. De plus, commepia|bc∈Q(C),pi0,a0,b0,c0etqi0sont placés

dans cet ordre, comme montré dans les figures 2.5(iv) et (v). Dans tous les cas,b0apparaît toujours placé entrea0etc0. Ainsi, l’ordre dans lequel les feuilles deAsont attachées au

cycle deNrespecte les contraintes deC. 

(i) (ii) (iii)

(iv) (v)

FIGURE 2.5 : Gadgets pour la réduction de BETWEENNESS à SIMPLE LEVEL-1 QUARTET

CONSISTENCY: les structures imposées par{αα1|ββ1, αβ|α1β1}(i), en ajoutant{ββ1|xα,

αα1|xβ,α1β1|xβ}pourx∈Xi(ii,iii), et en ajoutant les quadruplets restants deQi(iv,v).

Pour reconstruire un réseau non enraciné de niveau 1 à partir de quadruplets, nous pouvons proposer une première approche heuristique. En effet, l’algorithme QNet [Grü- newald et al., 2007] est une heuristique de reconstruction d’un ensemble circulaire de bi- partitions à partir d’un ensemble de quadruplets pondérés. D’après le théorème 3, il serait donc possible de représenter son résultat par un réseau de niveau 1 qui contient ces bipar- titions, ce qui fournirait une première méthode heuristique de reconstruction de réseaux explicites (non enracinés de niveau 1) à partir d’un ensemble de quadruplets.