Dureté du problème d’inclusion sous contraintes

L’objectif de cette section est de proposer des conditions suffisantes pour que le problème d’inclusion de requêtes sous contraintes de mots soit décidable.

Notre corollaire90nous assure que si le système de réécriture associé aux contraintes préserve la régularité et est descendant-limité alors l’inclusion de re- quêtes RPQ sous contraintes de mots est décidable.

Nous utilisons un algorithme qui construit (quand il termine) un automate qui reconnaît les ancêtres d’un langage régulier en complétant naïvement des transitions pour chaque règle de réécriture.

Pour chaque run étiqueté parr deq àq0tel qu’il existel avec(l , r )dansR on construit un nouveau run étiqueté parldeq àq0.

Ainsi, siAreconnaît le langageLalors cette transformation permet de reconnaître tous les motsmtel qu’il existew ∈ Lavecm w. On noteTR(A)l’automate obtenu. On rappelle que désigne la réécriture parallèle (voir définition32)

Afin de contrôler un minimum la taille de l’automateTR(A)nous allons "factori- ser" les chemins :

Si plusieurs runs commencent par un même étatq et reconnaissent tousr, alors on construit un unique run qui reconnaîtl privé de sa dernière lettre, puis de ce nouvel état on relie ce run à tous les états atteints par les run qui reconnaissentr.

De même, nous devons distinguer si l est de longueur1 ou non : sil est de longueur1alors aucun état n’est ajouté.

On commence par définir l’ensemble des états accessibles depuis un étatq en suivant un run qui lit un motr = b1...bm fixé.

Afin de ne pas ajouter des runs à des runs dont l’ajout a déjà été effectué au- paravant nous annotons les transitions de symboles+et−. Si une transition a été créée alors nous l’annotons+, toutes les autres seront annotés−, ainsi un run n’a pas déjà construit un nouveau run si et seulement si il contient au moins une transition annotée+. Nous dirons qu’un tel run est positif.

Nous donnons deux exemples avec le systèmeR = {(bc, ab),(a,cc)}(on associe1 à la règle(bc, ab)et2à la règle(a, cc)) :

- S’il existe un run qui litabi.e. de la formeq1aq2bq3et qu’une des transitions est positives (on a soit(q1, a, q2, +) ∈ δsoit(q2, b, q3, +) ∈ δ) alors on ajoute un nouveau run entreq1etq3qui litbc. Nous notons le nouvel état st(q1, 1, 2)(le second membre est1car il s’agit de la règle numéro1) pour construire le runq1bst(q1, 1, 2)c q3. Les deux nouvelles transitions sont considérées positives.

- S’il existe un run quiccdonc de la formeq1c q2c q3alors on ajoute la transition (q1, a, q3, +)à l’automate.

Une fois tous les runs possibles ajoutés, toutes les transitions de l’automate (avant complétion) passent à des transitions négatives. Sinon, par exemple, le run qui litab

construirait à chaque étape un nouveau run qui litbc.

On étend donc la notion d’automate avec des transitions signées :

Un automate signé est un quintupletAs= (Q, Σ, δs, I , F )oùQest un ensemble d’états,Σun alphabet,I etF respectivement les états initiaux et finaux etδs

les transitions signées, i.e. un sous-ensemble deQ × Σ ×Q × {−,+}.

Le langage reconnu par As est le langage L(As) reconnu par l’automate (Q,Σ,δ, I,F )_oùδ_{est la projection de}δssur ses trois premières composantes.

Définition 95

Les transitions dont la quatrième composante est+sont dites positives.

À tout automateA = (Q,Σ,δ, I ,F ), on associe de façon injective un automate signé

A₊_{défini par}(Q,Σ,δ₊, I , F )avecδ+= {(q, a, q0, +),(q, a, q0) ∈ δ}.

SoitAs un automate signé. Un run sur Aest une suite d’états et de lettres

q0a0q1...qnanqn+1telle que pour touti,(qi, ai, qi +1, −)ou(qi, ai, qi +1, +)est une transition deA(i.e.∈ δ).

Un runq0a0q1...qnanqn+1est dit positif (resp. strictement positif ) s’il existe une transition positive dans le run (resp. toutes les transitions du run sont positives).

Définition 96

Nous explicitons maintenant comment nous allons compléter l’automate for- mellement pour calculer les ancêtres :

SoientA = (Q,Σ,δ, I ,F )un automate signé,q ∈ Q eta1...anun mot deΣ∗on pose :

Paths+(A, q, a1...an) = {q0∈ Q, il existe un run positif

q a1q2a2...qnanq0dansA}

Définition 97

L’idée est alors la suivante : on considère un automate signéA. Pour tous les run positifs qui lisent unr tel que(l , r )est dansR, on construit un run qui litl.

Mais s’il existe deux runs qui lisent le même r et partent du même état, on construit qu’une seul fois les nouveaux états. Par exemple, avec la règle(cc, ab)si on aq aq0bq00etq aq20bq200alors on construit un nouvel état st(q, k, 2)et une transition (q, c,_st(q, k, 2))_{puis deux transitions}(_st(q, k, 2), c, q00)_et(_st(q, k, 2), c, q₂00)_{au lieux de} créer deux états et deux runs complets.

On a donc 4 cas à gérer :

- si le membre gauche est de longueur1alors on ajoute juste une transition sans créer d’état (c’estδ4).

- sinon alors il y a l’état à créer et à relier depuisq(c’estδ2). Puis le run entre les états créés (c’estδ1) et enfin relier le dernier état créé avec toutes les fins de run commeq00etq200dans l’exemmple (c’estδ3).

On fait cela en parallèle, d’où les union.

Chaque état nouvellement créé est dénoté par un st(q, k, j )oùqdésigne le premier état du run,kdésigne le numéro d’une règle deR(la règle(lk, rk)) etjla position de la lettre.

SoientAs= (Q, Σ, δs, I , F )un automate signé,Run système de réécriture sur Σ. On définit parTR(A)l’automate signé(Qnew,Σ,δnew, q0, F )où :

Qnew= Q ∪ [ q∈Q (lk ,rk )∈R Paths+(A,q,rk )6=;∧|lk |>1 Ã |lk| [ j =2 {_st(q, k, j )} ! δnew= δ−∪ δ1∪ δ2∪ δ3∪ δ4 avec : δ−= {(q, x, q0, −),∃s ∈ {+,−},(q, x, q0, s) ∈ δ} δ1= [ q∈Q (lk ,rk )∈R Paths+(As ,q,rk )6=;∧|lk |>2 Ã |lk|−1 [ j =2 {(st(q, k, j ), lk[ j ],st(q, k, j + 1),+)} ! δ2= [ q∈Q (lk ,rk )∈R Paths+(As ,q,rk )6=;∧|lk |>1 {(q, lk[1],st(q, k, 2), +)} δ3= [ q∈Q (lk ,rk )∈R |lk |>1 Ã [ q0_∈_Paths +(As,q,rk) {_st(q, k, |lk|), lk[|lk|], q0, +))} ! δ4= [ q∈Q (lk ,rk )∈R |lk |=1 Ã [ q0_∈_Paths +(As,q,rk) {(q, lk[|lk|], q0, +))} ! Définition 98

On peut appliquer de manière itérative la construction de l’automate pour définir à partir d’un automateAun automateT_Ri(A).

SoientRun système de réécriture, A = (Q,Σ,δ, q0, F )un automate non dé- terministe signé. On noteQi l’ensemble des états deTRi(A). On a :

#Qi≤ #Q × |R|i

Théorème 99

Démonstration. On a tout d’abord l’inégalité#R ≤ |R|. Montrons le résultat par récurrence :

Initialisation :

On aQ0= Qet#Q × |R|0= #Q, ce qui prouve l’initialisation.

Récurrence : Supposons que#Qi≤ #Q × |R|i. On a Q_{i +1}= Qi∪ [ q∈Q (lk ,rk )∈R Paths(A,q,rk )6=;∧|lk |>1 Ã_|l k| [ j =2 {st (q, k, j )} ! Donc#Qi +1≤ #Qi+ #Qi×¡P(lk,rk)∈R(|lk| − 1)¢ ≤ #Qi+ #Qi× (|R| − #R) ≤ #Qi× |R|

Par hypothèse de récurrence on a#Qi≤ #Q × |R|i donc : #Q_{i +1}≤ #Q × |R|i× |R| = #Q × |R|i +1

Ce qui achève la preuve.

Malheureusement, de manière générale, il n’existe pas toujours de k tel que

T_Rk+1(A) = T_Rk(A)_{pour tout}A_{. Par exemple : le système}a → aa. En effet si on considère les automatesAnqui lisenta2

en un unique run, alors il faut calculerTn(An)pour terminer la complétion. Donc il n’existe pas de telk.

Nous nous intéressons aux systèmes de réécriture dont la complétion termine. Certaines de ces classes seront étudiées au chapitre suivant.

Nous proposons une première classe qui assure la terminaison de la construction : les systèmes NR (non-récursif ) puis nous montrons que cette classe peu expressive suffit à montrer la dureté du problème d’inclusion sous-contrainte.

On associe une arête entre les lettres des membres gauches deRet celles des membres droits. Pour définir NR on impose que ce graphe soit acyclique.

a b c d e {abe → c,bb → ccd}est NR a b c d e

{aa → bc,dd → aea,c → d}ne l’est pas

SoitRun système de réécriture. Le graphe-lettre deRnotéGR est le graphe (Σ,E)_oùE _{contient tous les couples}(a, b)_{tels qu’il existe}(u, v) ∈ R aveca une lettre deuetbune lettre dev.

Définition 100

Un système de réécriture est dit NR si son graphe-lettre est acyclique.

Définition 101

SoitRun système de réécriture,

R ∈NR si et seulement siR−1∈NR

Proposition 102

Démonstration. On a clairementG_R−1= G_R−1_{, or l’inverse d’un graphe acyclique est}

acyclique.

Pour pouvoir utiliser la classe NR dans le contexte de l’inclusion de requêtes RPQ sous contraintes de mots nous devons démontrer que les systèmes NR sont descendant-limités.

Nous montrerons que si un système est dans MBmax(k)alors la complétion admet

un point fixe aprèskétapes.

Nous montrerons au théorème142que les systèmes non-récursifs (NR)ont une complexité parallèle bornée par|R|. En particulier les systèmes NR sont terminants, donc descendants-limités et :

Pour tout systèmeRdans NR on aT_R|R|+1(A) = T|R|(A)pour tout automateA.

Théorème 103

Il suffit donc de calculerTR|R|(As)pour reconnaître Anc(L0)avecAun automate

qui reconnaîtL0et Asl’automate signé correspondant.

Nous évaluons la complexité de calcul de l’automate des ancêtres :

SoientRun système de réécriture,Aun automate, etkun entier en unaire. Le calcul deTRk(A)s’effectue en EXPTIME.

Proposition 104

Démonstration. SoitA_{un automate non déterministe, pour chaque état}q_{et chaque}

règle(lk, rk)deR on souhaite déterminer lesq0tels queq0∈Paths+(A, q, rk)pour ajouter le nouveau runqlkq0. L’ajout d’un run est linéaire par rapport à la longueur maximale des|lk|deR.

Le calcul de Paths+(A, q, m)pour un motmet un étatqest un calcul d’accessibilité qui se fait en temps#Q2× |m|.

Donc la construction deTR(A)s’effectue en≤ #Q2×#R×(max(lk,rk)∈R|rk|+max(lk,rk)∈R|lk|) ≤

#Q3× |R|2carmax(lk,rk)∈R|rk| + max(lk,rk)∈R|lk| ≤ |R|et#R ≤ |R|.

D’après la proposition99, la taille deT_Ri(A)est majorée par#Q × |R|i. Ainsi, on a une complexité totale égale à :

k X i =0 |TRi(A)|3× |R|2= |R|2× #Q3× k X i =0 |R|3i

Donc la construction deTRk(A)s’effectue en EXPTIME.

Ainsi on en déduit que :

On a :

PROBLEME : Inclusion de requêtes RPQ sous

contraintes NR

INSTANCE : C un système de contraintes de mots NR,Q = xLyetQ0= xL0ydeux RPQ

QUESTION :Q vCQ0?

COMPLEXITE : EXPSPACE Théorème 105

Démonstration. Nous savons que tout système NR est terminant donc descendant- limité et d’après le théorème90il suffit de tester l’inclusionL ⊆AncR(L0)oùRest le système de réécriture associé àC.

SoitAl’automate qui reconnaîtL0.

PuisqueRest NR, l’automate des ancêtres de tout langage régulier est calculable en EXPTIME d’après104et est de taille exponentielle d’après99.

L’inclusion de deux langages réguliers sous formes d’automates non déterministe est en PSPACE en la taille des automates, ce qui permet de conclure.

Nous montrons maintenant que le problème d’inclusion de requêtes RPQ sous contraintes issues d’un système de réécriture NR est EXPSPACE-complet.

On rappelle le problème de décision suivant :

PROBLEME : reconnaissance du mot vide par une machine

de Turing de mémoire exponentielle

INSTANCE : M _{une machine de Turing déterministe de}

taillemet de ruban de longueur2m

avec un unique état final

QUESTION :M _reconnaît²_?

COMPLEXITE : EXPSPACE-complet

L’objectif est de réduire le problème de reconnaissance du mot vide dans le problème d’inclusion¬(L ⊆ AncR(L0))oùLetL0sont des langages réguliers etRun système de réécriture NR.

Soit$le symbole blanc du ruban. On poseΣ$= Σ ∪ {$}.

SoitM = (Q,Σ,δ, q0, qf)une machine de Turing de taillemoùQest l’ensemble des états deM,Σest l’alphabet du ruban,δest une fonction deQ ×Σ$dansQ ×Σ×{←,→}. La machine travaille sur un ruban de taille exponentielle : on peut supposer le ruban de longueur2m

Une configuration est l’ensemble des symboles inscrit sur le ruban, l’état dans lequel se trouve la machineM et la position du ruban désignée par la tête.

On modélise une configuration par un mot de longueur2ndu langage : Σ∗_{(Q × Σ$}₎_Σ∗_$∗

La position de l’unique lettre de la configuration qui appartient àQ × Σ$ indique la position de la tête de lecture, la première composante de cette lettre indique l’état dans lequel se trouve la machineM.

Définition 106

La configuration initiale deM est le mot(q0, $)$2

n_−y1

SoientCi etCi +1deux configurations deΣ∗(Q × Σ$)Σ∗$∗.

Soit jla position de la tête de lecture deCi. Si(q, a)est la j-ième lettre deCi

(c’est l’unique lettre deQ × Σ$) alors(Ci,Ci +1)est une transition valide si et seulement si :

— Ci +1[ j ] = x,Ci +1[ j −1] = (q0,Ci[ j −1])etCi +1[k] = Ci[k]pourk ∉ {j, j − 1}siδ(q,a) = (q0, x, ←)a

— Ci +1[ j ] = x,Ci +1[ j +1] = (q0,Ci[ j +1])etCi +1[k] = Ci[k]pourk ∉ {j, j + 1}_siδ(q,a) = (q0, x, →)b

a. autrement dit, la machine a écritxsuraet s’est déplacée à gauche en passant à l’état

b. autrement dit, la machine a écritxsuraet s’est déplacée à droite en passant à l’état

Définition 107

Par définition nous avons la proposition suivante :

M_reconnaît²_{si et seulement s’il existe une séquence finie de configurations} C0, ...,Ct telle que

— C0est la configuration initiale — Pour touti < t,(Ci,Ci +1)est valide — Ct est la configuration(qf, $)$2

−1a

a. On peut supposer que la tête de lecture termine tout à gauche quitte à ajouter des

transitions de déplacement de la tête vers la gauche à partir de l’état final qui efface les lettres en$.

Proposition 108

Soit#un symbole qui n’appartient pas àΣ$.

L’idée est de considérer le langage des configurations consécutives qu’une machine de Turing peut parcourir que l’on concatène entre elles par le nouveau symbole #_.

On pose alors :

L = #(q0, $)$∗#(#Σ∗(Q × Σ$)Σ∗$∗#)∗#(qf, $)$∗#

On introduit un symbole d’erreure.

Nous allons introduire alors deux systèmes de réécrituresRl etRv.

- Le premier,Rl, permet de tester si tous les facteurs entre deux#qui ne com-

portent pas de#(a priori les configurations) sont bien de longueur2n: on montre qu’il existe une dérivation dont le but est un mot contenant le symboleesi et seule- ment si une des a priori configurations n’est pas de la bonne longueur.

- Le second,Rv, permet de tester si deux configurations successives, i.e. un facteur d’un mot deLde la forme#C ##C0#, forment un couple valide pourM: on montre qu’il existe une dérivation dont le but est un mot contenant le symboleesi et seulement si(C ,C0)n’est pas valide.

On pose alorsR = Rl∪ Rv on aura ainsi :

Pour tout motudeL, il existe une dérivation d’origineuet de but un mot conte- nantesi et seulement siMne reconnaît pas le mot vide.

SoitRlle système de réécriture défini par : — a → l0pour touta ∈ Σ$∪Q × Σ — lili → li +1pouri < n + 1 — ln+1→ e — #li→Ii pouri ≤ n — Iilk→Ik pourk < i ≤ n — Ik# → epourk < n Définition 109

Pour tout motmdeL.

Il existe un facteur demde la forme#w #tel quewne contient pas de#et de longueur6= 2net< 2n+1ou il existe un facteurw demne contenant pas de# de longueur2n+1si et seulement s’il existe une dérivationm →∗Rl m

avecm0 qui contiente.

Lemme 110

Démonstration. 1)

Montrons par récurrence surtque si il existe une séquence finie d’entiers positifs (i0, ..., it)tous distincts telle que|w| = 2i0+ 2i1+ ... + 2it. alors il existe une dérivation

w →∗li0li1...lit.

On remarquera qu’on aw →∗l0|w|.

- Initialisation : Sit = 0alors on a|w| = 2i0alorsw →∗l02i0 →∗l2

i0−1

1 →∗l2

i0−2

2 ... →∗

li0.

- Hérédité : On suppose la propriété vraie pour t − 1, montrons la pourt. On a|w| ≥ 2it donc il existew0 etw00 tels que w = w0w00 avec|w0| = 2it, donc|w00| = 2i0_{+ ... + 2}it_{− 2}it _{= 2}i0_{+ ... + 2}it −1_.

On a doncw0→∗lit et par hypothèse de récurrencew00→∗li0...lit −1 ainsi, on a

w →∗li0...lit.

Ce qui termine la récurrence. 2)

Montrons maintenant par récurrence surtque

Pour tout uplet d’entiers (i0, i1, ..., it)tel quen ≥ i0> i1> i2... > it il existe une dérivation#li0li1...lit →∗Iit.

- Initialisation : soitt = 0, on considère un uplet(i0)avecn ≥ i0> i1on a#li0→Ii0.

- Hérédité : supposons la propriété vraie au rangt − 1. On considère un uplet (i0, i1, ..., it)tel quen ≥ i0> i1> i2... > it. Par hypothèse de récurrence on a

#li0li1...lit# →∗Iit −1lit# →Iit#. Ce qui termine la récurrence.

On suppose que|w| < 2n+1.

Pour tout entierx < 2n+1il existe un unique uplet(i0, i1, ..., it)avecn ≥ i0> i1>

i2> ... > it tel quex = 2i0+ ... + 2it. On posex = |w|.

Montrons maintenant que :

sit > 0oui0< nalors il existe une dérivation de la forme#w # →∗e.

On suppose quet = 0on a alorsi0< n. On ax = 2i0, donc d’après 1) on ax → li0

donc#x# →∗#li0# →Ii0# → ecari0< n.

On suppose maintenant que t > 0. D’après 1), il existe une dérivationw →∗

li0...lit. Puis d’après 2) il existe une dérivation#li0...lit →∗ Iit, on a it < n. Donc

#w # →∗#li0...lit# →∗Iit# → e.

Soitmun mot deL. Supposons qu’il existe un facteur de la forme#w #dansm tel quewne contiennent pas de#, dont la longueur vérifie6= 2n.

Si la longueur est< 2n+1, d’après 3), il existe un unique uplet(i0, i1, ..., it)avec

n ≥ i0> i1> i2> ... > it tel que|w| = 2i0+ ... + 2it. Comme|w| 6= 2n, on a soitt = 0et

i0= n, soitt > 0. Donc il existe une dérivation#w # →∗e. Or#w #facteur dem, donc il existe une dérivationm →∗m0avecelettre dem0.

Supposons maintenant que m admet un facteur w sans#tel que |w| ≥ 2n+1 alorsw se décompose enw0w00avec|w0| = 2n+1donc il existe une dérivation#w # → #l_n+1w00# → #ew00#_.

Réciproquement, supposons qu’il existe une dérivation de la formem →∗m0 avecelettre dem0.

Comme le système est non-récursif (i.e.∈ N R), il existe un facteurudemtel que

u →∗e_.

e _{ne peut être produit que par des règles de la forme}

1. ln+1→ e

2. #li# → e

3. Ik# → e

Premier cas :ln+1→ e:

le symboleln+1apparaît dans la dérivation alors comme l’unique règle de pro- duction deli +1estlili → li +1 pour touti. Aucune lettreli n’appartient àm, donc pour avoirln+1il faut2n+1lettres consécutivesl0puisqu’aucune lettre deu n’est réécrite en autre chose quel0et queuest l’origine de la dérivation, on en déduit que

u →∗l₀2n+1_{, donc de longueur}2n+1_. Second cas : Ik# → e:

— #li→Ii

— Iilk→Ik

Il existe t ≥ 0tel que la seconde règle a été appliquée exactementt fois pour produire successivement Ii0, ...Iit avecit = k.

Par récurrence sur j entretet0, montrons qu’il existe un mot de la dérivation qui admet le facteur Iijlij +1...lit#et on aij> ij +1... > it etij +1< n.

- Initialisation : Si j = t alors on a Iit# → e, et cette règle est appliquée sik < n

donc la propriété est vraie.

- Hérédité : Soit j entre1etttel qu’il existe un mot de la dérivation qui admet le facteur Iijlij +1...lit#et on an > ij > ij +1... > it. Alors Iij est produit soit par une

règle de la forme#li→Ii soit de la forme Iilk→Ik. La première est exclue car il y a exactementtfois application de la première règle.

Ainsi, la règle Iilk→Ik a été appliquée pour produire Iij, on poseij −1l’entieri,

comme la règle a été appliquée on aij −1> ij etij −1< n. On a alors : Ii_{j −1}lijlij +1...lit# →Iijlij +1...lit#

Ce qui achève la récurrence.

Il existe donci0, ..., it tels quei0> i1> ... > it,i1< net un mot de la dérivation qui contient un facteur de la forme Ii0li1...lit#. Or la seconde règle a été appliquéetfois,

il reste donc la première règle.

La règle#li0→Ii0a donc été appliquée, on a donci0≤ n, de plus :

Il existe un facteur de la forme#li0li1...lit#dans la dérivation et on an ≥ i0> i1>

... > it. Or aucune des lettreslij n’apparaît dansu, et pour produire unlij il faut un

facteur de la formel02i j. De même, lesl0ne sont pas dansu, et les lettres deu ne peuvent devenir que desl0doncuest de la forme#w #avec|w| =Pt_{j =0}2ij < 2n+1qui ne contient pas de#..

Commeuest facteur dem, le lemme est prouvé.

SoitRv le système de réécriture défini par : — a → L0pour touta ∈ W

— LiLi→ Li +1pouri < n

— (q, a)bLncd → epour touta, b, c ∈ Σ$,d ∈ Q × Σ$,q ∈ Q tels quex 6= c oud 6= (q0, b)oùδ(q,a) = (q0, x, →)

— a(q, b)Lncd → epour touta, b, d ∈ Σ$,c ∈ Q × Σ$,q ∈ Qtels quex 6= d ouc 6= (q0, a)oùδ(q,b) = (q0, x, ←)

— aLcd → e pour touta, c ∈ Σ$aveca 6= c

Définition 111

SoientCetC0deux configurations :

(C ,C0)_{n’est pas valide si et seulement s’il existe une dérivation de la forme} #C ##C0# →∗_R_vm_avece _{lettre de}m_.

Lemme 112

Démonstration. Tout d’abord, on remarquera que les seules règles de productions deL0sont depuis les lettresa deW. De plus, chacune de ces lettres n’est jamais produite par aucune règle. La seule règle qui produitLi +1est la règleLiLi→ Li +1. Le système étant NR, il existe une dérivationµwµ0→ µLnµ0si et seulement si|w| = 2n. Ensuite puisqueC etC0sont des configurations on a|C | = |C0| = 2n, et il existe une unique lettre deC (resp.C0) qui appartient àQ × Σ, on note j sa position.

On posem = #C ##C0#. Par définition on am[ j + 1] ∈ Q × Σ. Et on a pour touti entre1et2n,m[i + 1] = C [i ]etm[i + 2n+ 1] = C0[i ].

On pose(q0, x, f ) = δ(m[ j + 1])(=δ(C[j])). On suppose que f =←alors par définition :

(C ,C0)_{est non valide si et seulement l’un des trois conditions est vérifiées} 1. ∃k ∉ { j − 1, j },C [k] 6= C0[k]

2. C0[ j ] 6= x

3. C0[ j − 1] 6= (q0,C [ j − 1])

Ces conditions sont respectivement équivalentes aux conditions 1. ∃k ∉ { j − 1, j }aveckentre1et2ntel quem[k + 1] 6= m[k + 2n+ 1] 2. m[ j + 2n+ 1] 6= x

3. m[ j + 2n] 6= (q0, m[ j ])

Implication :

Supposons que(C ,C0)n’est pas valide.

- Premier cas :∃k ∉ { j − 1, j }aveckentre1et2ntel quem[k + 1] 6= m[k + 2n+ 1]et tel quem[k + 2n+ 1] ∈ Σ$.

Par hypothèse comme l’unique lettre deC qui appartiennent àQ × Σ$est celle de position j, alors la seule lettre dem dont la position est entre2et2n+ 1 qui appartiennent àQ × Σ$estm[ j + 1], doncm[k + 1]appartient àΣ$.

On am = µawcµ0avecµ = m[1]...m[k],a = m[k + 1],w = m[k + 2]...m[k + 2n],

c = m[k + 2n+ 1],µ0= m[k + 2n+ 2]...m[|m|]. On a|w| = 2ndoncm →∗µaLncµ0.

Par hypothèse on am[k +1] 6= m[k +2n+ 1]donca 6= cdonca 6= cdoncaLnc → e. Ainsim →∗µeµ0.

- Deuxième cas :∃k ∉ { j − 1, j }aveckentre1et2ntel quem[k + 1] 6= m[k + 2n+ 1] et tel quem[k + 2n+ 1] ∈ Q × Σ$

Puisqu’il existe une unique lettre deC0de la formeQ × Σ$, donc une unique position> 2n+ 1qui appartienne àQ × Σ$

Puisquek ∉ {j − 1, j }on ak 6= j − 1doncm[ j + 2n] ∉ Q × Σ.

On am = µa(q,b)wcdµ0avecµ = m[1]...m[j − 1],a = m[j ],(q, b) = m[ j + 1],w =

m[ j + 2]...m[j + 2n+ 1],c = m[j + 2n],d = m[j + 2n+ 1]etµ0= m[ j + 2n+ 2]...m[|m|]. On a donca(q, b)Lncd avecc ∉ Q × Σ$doncc 6= (q0, a), donca(q, b)Lncd → e. On a|w| = 2ndoncm →∗µabLncdµ0.

Ainsim →∗µeµ0.

- Troisième cas :m[ j + 2n+ 1] 6= x.

On am = µa(q,b)wcdµ0avecµ = m[1]...m[j − 1],a = m[j ],(q, b) = m[ j + 1],w =

m[ j + 2]...m[j + 2n− 1],c = m[j + 2n],d = m[j + 2n+ 1]etµ0= m[ j + 2n+ 2]...m[|m|]. On a|w| = 2ndoncµa(q,b)wcdµ0→∗µa(q,b)Lncdµ0.

Or on ad 6= xdonca(q, b)Lncd → e. Ainsim →∗µeµ0.

- Quatrième cas :m[ j + 2n] 6= (q0, m[ j ]).

On am = µa(q,b)wcdµ0avecµ = m[1]...m[j − 1],a = m[j ],(q, b) = m[ j + 1],w =

m[ j + 2]...m[j + 2n− 1],c = m[j + 2n],d = m[j + 2n+ 1]etµ0= m[ j + 2n+ 2]...m[|m|]. On a|w| = 2ndoncµa(q,b)wcdµ0→∗µa(q,b)Lncdµ0.

Or on ac 6= (q0, a)donca(q, b)Lncd → e. Ainsim →∗µeµ0.

Réciproque :

Supposons qu’il existeµetµ0tel quem →∗µeµ0avecµ,µ0∈ W∗.

Les règles qui produisente sont de la forme (on rappelle qu’on est dans le cas

f =←) :

— aLnc → eaveca, c ∈ Σ$eta 6= c

— a(q, b)Lncd → eavecx 6= d ouc 6= (q0, a)

- Premier cas : on aaLnc → eaveca, c ∈ Σ$eta 6= c. Les lettresa, cne sont jamais produites, il existe donc un facteurwtel que|w| = 2net

awc →∗aLnc → e

Notonsk + 1la position dea. On am[k + 1] 6= m[k + 2n+ 1]car|w| = 2n. On ak entre1et2ncarm[1] = # ∉ Σ$eta ∈ Σ$, et|C | = 2n.

Sik = j alorsa = m[k + 1] = m[j + 1] ∈ Q × Σ$, contradiction.

Sik 6= j −1, il existek ∉ {j −1, j }entre1et2ntel quem[k +1] 6= m[k +2n+1], donc

C [k] 6= C0[k]_{. Donc}(C ,C0)_{non valide.}

Sik = j − 1, alorsm[ j + 2n] = c ∉ Q × Σ$, doncm[ j + 2n] 6= (q0, a), doncC0[ j − 1] 6= (q0,C [ j − 1]). Donc(C ,C0)non valide.

- Deuxième cas : on aa(q, b)Lncd → eaveca, b, d ∈etc ∈ Q × Σ$tels quex 6= dou

c 6= (q0, a)_{. Les lettres}a, b, c, d _{ne sont jamais produites, il existe donc un facteur}w

tel que|w| = 2net

a(q, b)wcd →∗a(q, b)bLncd → e

Supposons(C ,C0)valide. Par définition, on aC0[ j ] = xetC0[ j − 1] = (q0,C [ j − 1]). Orj ≤ 2ndoncm[ j +1] = (q,b)car c’est l’unique lettre entre les positions1et2ntelle quem[k + 1] ∈ Q × Σ$.

On a doncm[ j ] = a, commeCest une configuration, on am[ j +2n+1] = C0[ j ] = x etm[ j + 2n] = C0[ j − 1] = (q0, m[ j ]) = (q0, a).

Or|w| = 2ndoncm[ j + 2n+ 1] = cetm[ j + 2n] = d, on a doncx = detc = (q0, a), contradiction.

Ainsi(C ,C0)est non valide.

Les mêmes cas apparaissent pour f =→et sont similaires à prouver.

On pose alorsΩl’ensemble des lettres qui apparaissent dans les systèmesRlet

Rv, i.e.Ω = W ∪ Sn_{i =0}{li} ∪Sn_{i =0}Li∪Sn_{i =0}Ii. On pose alorsL0l’ensemble des mots qui contiennent un symbolee, i.e.L0= Ω∗eΩ∗.

Dans le document Dialogue entre la procédure du chase et la réécriture sur les mots (Page 68-85)