Un algorithme plus rapide pour le probl`eme LCS

Soient X et Y deux suites de longueur n et m respectivement, avec n ≤ m. Nous constru-irons dans cette section un algorithme qui trouve un élément deLCS(X, Y)en temps et espace O(mp), où m est la longueur de Y et p = lcs(X, Y). Rappelons que l’algorithme pour le problème LCS vu dans la section 4.4.2 avait un temps de parcoursO(mn).

Nous commençons par étudier l’ensemble M = {(i, j)| Xi = Yj}de tous les éléments qui se correspondent dansXetY.

Exemple: Si X = hB, D, C, A, B, Aiet Y = hA, B, C, B, D, A, Bi(Comme pour l’exemple de dans la section 4.4.2), l’ensembleM peut être représenté par les points dans le diagramme suivant:

Consid´erons la relation≪sur(N×N)d´efinie comme suit:

(k, l)≪(k^′, l^′) ⇐⇒ k < k^′∧l < l^′.

Cette relation d´efinit un ordre partiel sur l’ensembleM. (Rappelons qu’un ordre partiel est une relation transitive et asym´etrique.)

Remarque: Comme≪n’est pas un ordre total, il se peut queM ait des ´el´ements non-comparables.

Par exemple, pour(4,1),(3,3)∈M nous n’avons ni(4,1)≪(3,3), ni(3,3)≪(4,1).

Un sous-ensembleC ⊆M ne contenant que des ´el´ements comparables s’appelle une chaˆıne.

Une antichaˆıne A ⊆ M est un sous-ensemble dans lequel il n’y a pas deux ´el´ements qui sont comparables.

Exemple. Quelques chaˆınes:

Algorithmique - Semestre d’Automne 2011/2012

Il est clair qu’une chaˆıne correspond à un élément dansCS(X, Y). Ici nous avons 1 =b hB, Di

Notre but est donc de trouver une chaˆıne de longueur maximale. Nous regardons d’abord un lien intéressant entre chaˆınes et antichaˆınes. Pour expliquer ce lien, nous avons besoin de la notion de décomposition d’un ensemble fini et partiellement ordonné. C’est un ensemble d’antichaˆınes{A₁, A₂, . . . , A_k}tel que chaque élément deM est contenu dans au moins une des Ai:

M =A1∪ · · · ∪Ak.

Une d´ecomposition minimale est une d´ecomposition contenant aussi peu d’antichaˆınes que pos-sible.

Théorème 4.3 Dans un ensemble fini et partiellement ordonnéM, la longueurpd’une chaˆıne maximale est égale à la taille d’une décomposition minimale deM.

Preuve. Soit{A1, . . . , Ak}une décomposition minimale de M, et soitC une chaˆıne maximale avec p éléments. Sik < p, alors il existec, c^′ ∈ C, c 6= c^′, tels quecetc^′ sont dans la même antichaˆıne (par le principe des tiroirs). C’est impossible, et donck ≥p.

Pour montrer que k ≤ p, nous construisons une décomposition enpantichaˆınes. Ainsi s’il existe une décomposition enpantichaˆınes, alors une décomposition minimale aura certainement au pluspantichaˆınes. Pourc∈M, soitℓ(c)la longueur d’une chaˆıne maximale avec plus grand

´el´ementc. Siℓ(c) =ℓ(c^′), alorscetc^′sont incomparables (Pourquoi?). Donc A_i :={c|ℓ(c) =i}, 1≤i≤p

formentpantichaˆınes qui couvrentM.

La construction de la preuve dans notre cas est comme suit:

Le lemme suivant suggère qu’il est facile de calculer une chaˆıne maximale à partir de cette décomposition.

Lemme 1 Soit{A1, . . . , Ap}la d´ecomposition minimale deM telle que Ai :={c|ℓ(c) = i}, 1≤i≤p,

comme d´ecrite ci-dessus. Soit2≤i≤p. Alors nous avons

∀ci ∈Ai ∃ci−1 ∈Ai−1 tel queci−1 ≪ci.

Algorithmique - Semestre d’Automne 2011/2012

Pour obtenir une chaˆıne de longueur maximale, nous commençons avec un élémentcp ∈Ap

quelconque, puis nous choisissonscp−1 ∈Ap−1aveccp−1 ≪cp; ensuite nous choisissonscp−2 ∈ Ap−2 aveccp−2 ≪cp−1, etc. Ceci nous fournit une chaˆıne compl`ete de longueurp:

c1 ≪c2 ≪ · · · ≪cp−1 ≪cp, et par conséquent un élément deLCS(X, Y).

Il ne reste donc plus qu’à trouver une décomposition minimale{A₁, . . . , A_p}de notre ensem-bleM. Nous Pour ce, Nous construisons nos antichaˆınes de haut en bas. Nous parcourons M ligne par ligne, en ajoutant le point(i, j) à l’antichaˆıneAk si et seulement s’il ne se trouve pas à droite du point le plus à gauche deA_k. Nous appelonss_kla colonne du point le plus à gauche de Ak.

Pour l’exemple ci-dessus nous obtenons:

• Ligne 1: Nous ajoutons (1,4)et(1,6) `aA₁, et nous avons doncs₁ = 4. Pour l’instant nous n’avons qu’une seule antichaˆıne non vide:

3 l’ajoutons donc àA1. Le prochain point est (2,5), cette fois comme5 > s1 nous ne l’ajoutons pas àA1. Par contre l’antichaˆıneA2 est vide nous ajoutons donc(2,5) àA2. Ainsi maintenant s1 = 1ets2 = 5. Nous avons donc deux antichaˆınes non vides:

•Ligne 3: Le seul point sur la ligne3est(3,3). Comme3> s₁nous ne l’ajoutons pas `aA₁. Par contre3≤ s2, nous ajoutons donc(3,3) `aA3. Ainsi maintenants1 = 1 ets2 = 3. Nous avons toujours deux antichaˆınes non vides:

Cette procédure est réalisée par l’algorithme suivant:

Dans cet algorithme nous avons

• ireprésente la ligne actuelle deM étudiée.

• A[k]repr´esente l’antichaˆıneA_k.

• s[k]repr´esente la colonne actuelle la plus `a gauche de l’antichaˆıneAk.

On rappelle ´egalement que le minimum d’un ensemble vide est∞. On utilise ce fait `a la ligne14 pour garantir que l’algorithme termine.

Algorithmique - Semestre d’Automne 2011/2012

Algorithme 31 FASTLCS(X, Y)

Input: SuitesX etY, de longueursnetm.

Output: La décomposition minimale(A₁, . . . , A_p)deM, telle queA_i ={c|ℓ(c) = i}, oùℓ(c) est la longueur d’une chaˆıne maximale avec plus grand élémentc.

1: Construire l’ensembleM ={(i, j)|Xi =Yj}

2: fork = 1. . . ndo

3: s[k]←n+ 1

4: A[k]← ∅

5: end for

6: fori= 1. . . mdo

7: l ←min{k |(i, k)∈M}

8: k ←1

9: whilel ≤ndo

10: ifl ≤s[k]then

11: A[k]←A[k]∪ {(i, j)∈M |l≤j ≤s[k]}

12: temp←s[k]

13: s[k]←l

14: l ←min{j |(i, j)∈M ∧j >temp}

15: end if

16: k←k+ 1

17: end while

18: end for

19: p←max{k |s[k]≤n}.

20: return (A[1], . . . , A[p]).

Remarquons que s[j] = n + 1 si et seulement siA_j est vide. A la fin de l’algorithme, le nombre d’antichaines non vides est ´egal `a

p= max{k |s[k]≤n}, et les antichaˆınes construites sont stock´ees dansA[k],1≤k ≤p.

Théorème 4.4 L’algorithme ci-dessus a un temps de parcours deO(mp), oùp=lcs(X, Y).

Preuve. Exercice.

Remarque: Une fois que nous avons trouvé cette décomposition minimale(A1, . . . , Ap)deM nous utilisons le Lemme 1 pour en déduire une chaˆıne de longueur maximale. Nous la constru-isons de la droite vers la gauche.

Dans l’exemple ci-dessus nous commençons par prendre un élément deAp = A4, disons(6,6).

Puis le Lemme nous dit qu’il existe un élément (i, j) ∈ A3 avec (i, j) ≪ (6,6), prenons par exemple(4,5). Ensuite il nous faut un élément deA2, (prenons(3,3)) et finalement un élément deA2(prenons(2,1)).

Puisque nous l’avons construite en commenc¸ant `a droite, notre chaine est

(2,1),(3,3),(4,5),(6,6)

, et donc la sous-suite commune correspondante est

hB, C, B, Ai.

5

Algorithmes gloutons

Pour résoudre certains problèmes d’optimisation, il suffit de faire un choix localement optimal à chaque pas de l’algorithme. En effet, dans certain cas, une famille de choix localement optimaux mène à une solution globalement optimale. Ce fait est au cœur des algorithmes gloutons: un algorithme glouton fait toujours le choix qui lui semble le meilleur sur le moment. Après l’étude d’un exemple typique, nous étudierons les aspects principaux de stratégies glouton. Ces straté-gies seront illustrées à l’aide des exemples du problème de sac à dos et du code de Huffman, utilisé dans la compression des données.

5.1 EXEMPLE: HORAIRES DE SALLES DE COURS

Cet exemple concerne le problème de l’ordonnancement de plusieurs activités qui rivalisent pour l’utilisation exclusive d’une ressource commune, l’objectif étant de sélectionner un ensemble de taille maximale d’activités mutuellement compatibles.

Problème: n professeurs veulent utiliser la même salle de cours. Chaque professeur a une préférence pour un intervalle de temps: Le professeur i veut utiliser la salle dans l’intervalle [si, fi).

La tˆache de l’organisateur est de trouver un plus grand sous-ensemble (c.`a.d. un ensemble de taille maximale)AdeS={1, . . . , n}tel que pouri, j ∈A,i6=j, on a

[si, fi)∩[sj, fj) =∅. (5.1) La strat´egie gloutonne est la suivante:

Nous trions d’abord les intervalles selon leur temps d’arrˆetfi, afin d’avoir f1 ≤f2 ≤ · · · ≤fn.

On peut faire ce tri en tempsO(nlog(n)). Puis l’algorithme op`ere de la mani`ere suivante:

Théorème 5.1 L’algorithme GREEDYSELECTORsatisfait le nombre maximal de préférences.

Algorithme 32 GREEDYSELECTOR(s, f) Call: GREEDYSELECTOR(s, f)

Input: setf sont des tableaux de longueurn,f1 ≤ · · · ≤fn. Output: Sous-ensembleAde{1, . . . , n}v´erifiant (5.1).

1: n ←length[s]

2: A ← {1}

3: j ←1

4: fori= 2, . . . , ndo

5: ifsi ≥fj then

6: A←A∪ {i}

7: j ←i

8: end if

9: end for

10: return A

Nous donnons maintenant une preuve de ce th´eor`eme.

Preuve. SoitS ={1,2, . . . , n}l’ensemble des indices des préférences. La préférence 1, réalisée par l’algorithme, a le temps d’arrêt le plus tôtf1. Nous montrons qu’il y a une solution optimale avec le premier choix fait par l’algorithme, que nous appelons “choix glouton 1”.

Soit A ⊆ S une solution optimale. Supposons quek ∈ Aa le temps d’arret minimal dans cette solution, i.e.,kv´erifiefk ≤fj ∀j ∈ A. Sik = 1, nous avons fini. Sik >1, nous pouvons remplacerAparA^′ = (A\ {k})∪ {1}, commef1 ≤fkpar hypoth`ese. Ainsi, il y a une solution optimale avec le choix glouton1que nous noterons de nouveau avecA.

Après ce choix, nous appliquons la même stratégie aux préférences restantes.

S^′ :={i∈S |s_i ≥f₁}.

Alors, A\ {1} est une solution optimale pour S^′: si la solution optimale B^′ pour S^′ est plus grande queA\ {1}, alorsB^′∪ {1}serait une solution pourSavec plus d’éléments queA, ce qui contredit l’hypothèse queAest de taille maximale.

En appliquant une induction, on prouve le th´eor`eme.

Dans le document Semestre d’Automne 2010-2011 (Page 124-132)