1 Pourquoi ´ etudier les automates - [PDF] Tutoriel Programmation et Algorithmique en PDF

Ce chapitre est une très succincte introduction à la théorie des automates que vous aurez l’occasion de voir de fa¸con détaillée si vous choisissez un cursus d’informatique. Ce chapitre est, par nature, un peu plus “théorique” et un peu moins algorithmique que les précédents.

Les automates sont des objets mathématiques, très utilisés en informatique, qui permettent de modéliser un grand nombre de systèmes (informatiques). L’étude des automates a commencé vers la fin des années cinquante. Elle se base sur de nombreuses techniques (topologie, théorie des graphes, logique, algèbre, etc.). De fa¸con très informelle, un automate est un ensemble “d’états du système”, reliés entre eux par des “transitions” qui sont marquées par des symboles. Étant donné un “mot” fourni en entrée, l’automate lit les symboles du mot un par un et va d’état en état selon les transitions. Le mot lu est soit accepté par l’automate soit rejeté.

Avant de donner une d´efinition plus formelle des concepts d´ecrits ci-dessus, citons quelques exemples classiques d’utilisation d’automates :

V´erification d’un circuit ´electronique

Recherche d’occurrence dans un texte (moteur de recherches sur le web, etc.) V´erification de protocoles de communication

Compression de donn´ees Compilation

Biologie (g´enomique)

En dehors de ces utilisations “pratiques” des automates, notons qu’ils sont aussi utilisés pour modéliser les ordinateurs et pour comprendre ce qu’un ordinateur peut faire (décidabilité) et ce qu’il sait faire efficacement (complexité). C’est donc une notion fondamentale de l’informatique.

2 Rappel : alphabets, mots, langages et probl`emes

Nous reprenons ici les notations du chapitre VI. L’alphabet Σ est un ensemble de caractères (ou symboles). un mot est une suite finie de caractères. L’ensemble des mots sur Σ est noté Σ∗_. Un langage est un sous-ensemble de Σ∗, c’est-à-dire un ensemble particulier de mots. Parmi les mots de Σ∗ on distingue le mot vide noté ǫ. Le mot vide est l’unique mot de longueur zéro.

3 Automates finis d´eterministes

Un automate fini déterministe est un quintuplé (Q, Σ, δ, q0, F ) constitué des éléments suivants un alphabet fini (Σ)

un ensemble fini d’´etats (Q)

une fonction de transition (δ : Q∗ Σ → Q) un ´etat de d´epart (q0 ∈ Q)

un ensemble d’´etats finaux (ou acceptant) F ⊆ Q

3.1 Fonctionnement d’un automate fini d´eterministe

L’automate prend en entrée un mot et l’accepte ou la rejette. On dit aussi qu’il le reconnaˆıt ou ne le reconnaˆıt pas. Le langage associé à un automate est constitué de l’ensemble des mots qu’il reconnaˆıt. Voici comment l’automate procède pour décider si un mot appartient à son langage.

Le processus commence à l’état de départ q0

Les symboles du mot sont lus les uns apr`es les les autres.

A la lecture de chaque symbole, on emploie la fonction de transition δ pour se déplacer vers le prochain état (en utilisant l’état actuel et le caractère qui vient d’être lu).

le mot est reconnu si et seulement si le dernier état (i.e., l’état correspondant à la lecture

du dernier caract`ere du mot) est un ´etat de F .

De fa¸con plus formelle, pour définir exactement le langage reconnu par un automate, nous introduisons la fonction de transition étendue aux mots, ˆδ. Elle se définit récursivement comme suit.

A partir d’un ´etat q en lisant le mot vide ǫ on reste dans l’´etat q, i.e., ∀q ∈ Q, ˆδ(q, ǫ) = q

Etant donn´e un mot c se terminant par a_{∈ Σ (i.e., c = c}′_{a avec c}′ _{∈ Σ ∪ {ǫ}), et un ´etat} q de Q, ˆδ(q, c) = ˆδ(q, c′a) = δ(ˆδ(q, c′), a)

Nous pouvons maintenant définir le langage L(A) accepté par un automate fini déterministe A = (Q, Σ, δ, q0, F ).

L(A) ={c|ˆδ(q0, c)∈ F }

3.2 Des repr´esentation “compactes” des automates

On peut associer à un automate une table de transition qui décrit de manière extensive la fonction de transition δ :

Une colonne correspond `a un caract`ere de l’alphabet.

Une ligne correspond à un état de l’automate (l’état initial est précédé d’une flèche “→” ;

l’´etat final d’une ´etoile “∗”)

La valeur δ(q, a) pour q _{∈ Q, a ∈ Σ correspond à l’état indiqué à l’intersection de la ligne q et} de la colonne a. Notons qu’à partir de cette table il est aisé de retrouver l’ensemble des états ainsi que l’alphabet et donc d’identifier exactement l’automate.

Exemple 1 Consid´erons la table de transition ci-dessous. a b → 1 1 2 ∗ 2 1 2 Il correspond `a l’automate (Q, Σ, δ, q0, F ) avec

Q ={1, 2} Σ ={a, b}

δ(1, a) = 1, δ(1, b) = 2, δ(2, a) = 1, δ(2, b) = 2 q0 = 1

F ={2}

Il est facile de voir que le langage de cet automate est constitu´e exactement des mots compos´es de a et de b qui se terminent par un b.

Pour représenter de fa¸con très intuitive un automate fini déterministe (Q, Σ, δ, q0, F ), on peut utiliser un graphe de transition constitué des éléments suivants :

Un ensemble de sommets (chaque sommet représente un élément de Q).

Un ensemble d’arcs entre les sommets valu´es par un symbole de σ (un arc entre les ´etats

q et q′ valu´e par le symbole s signifie que δ(q, s) = q′).

L’état initial q0 est marqué par une flèche entrante. Les états finaux F sont entourés d’une double ligne.

L’automate de l’exemple 1 est ainsi repr´esent´e sur la figure 1.

a 2 b

Fig. 1 – Un automate fini d´eterministe

Pour simplifier encore cette représentation, un arc entre deux sommets q, q′ peut être valué par plusieurs symboles s1, ..., snséparés par des virgules. Cette dernière convention signifie sim- plement que ∀i ≤ n, δ(q, si) = q′ et elle permet d’éviter une multiplication d’arcs sur le graphe. La figure 2 illustre une telle simplification.

1 a 2 a b b 1 a 2 a, b b

Fig. 2 – Deux représentations équivalentes du même automate fini

Exercice 1 Quel est le langage reconnu par l’automate de la figure 2 ? Solution. Tous les mots qui contiennent un “b”.

Exercice 2 ´Ecrire la table de transition de l’automate suivant. Quel est le langage reconnu ?

A 1 B 0 C 0, 1 0 1

Solution. La table de transition de l’automate est 0 1 → A B A

B B C

∗ C C C Cet automate reconnaˆıt les mots qui contiennent “01”.

δ 0 1 → ∗ q0 q2 q1 q1 q3 q0 q2 q0 q3 q3 q1 q2 Dessiner l’automate et montrer qu’il accepte “110101”.

Solution. _q 0 q1 q2 q3 1 1 0 0 1 1 0 0

Exercice 4 Construire un automate fini d´eterministe qui reconnaˆıt le langage L ={x ∈ {0, 1}∗|n1(x)≡ 0 mod 4}

o`u n1(x) est le nombre d’occurrence du symbole 1 dans le mot x. Solution. A B C D 0 0 0 0 1 1 1 1

Exercice 5 Construire les automates finis déterministes qui reconnaissent les langages suivants L1={m ∈ (a + b)∗|chaque a de m est immédiatement précédé et immédiatement suivi d’un b} L2={m ∈ (a + b)∗|m contienne à la fois ab et ba}

L3={m ∈ (a + b)∗|m contienne exactement une occurrence de aaa}

4 Automates finis non-d´eterministes

Un automate fini non-déterministe est un automate tel que dans un état donné, il peut y avoir plusieurs transitions avec le même symbole. le fonctionnement d’un tel automate n’est donc pas totalement (( déterminé )), car on ne sait pas quel état l’automate va choisir.

Les automates non-déterministes permettent de modéliser facilement des problèmes complexes. Ils peuvent être convertis en des automates finis déterministe. Ces derniers peuvent être exponentiellement plus grand que les automates non déterministe dont ils sont issus.

Un automate fini non-d´eterministe est un quintupl´e : (Q, Σ, δ, q0, F ) un alphabet fini (Σ)

une fonction de transition δ qui associe `a tout ´etat q∈ Q et tout symbole s ∈ Σ un sous

ensemble de Q not´e δ(q, s).

un ´etat de d´epart (q0)

un ensemble d’´etats finaux (ou acceptant) F

C’est la fonction de transition δ qui diffère ici de celle utilisée par les automates finis déterministes. Remarquons que tout automate fini déterministe est aussi un automate fini non-déterministe.

Les représentations compactes des automates finis déterministes s’étendent naturellement aux automates finis non-déterministes. Une cellule de la table de transition contient un sous- ensemble d’états (éventuellement vide).

4.1 Fonctionnement d’un automate fini non-d´eterministe

Comme pour un automate fini déterministe, l’automate prend en entrée un mot et l’accepte ou le rejette. Le langage associé est constitué de l’ensemble des mots qu’il reconnaˆıt.

Exemple 2 Voici automate qui reconnaˆıt les mots d´efinis sur l’alphabet {a, b, c} qui commencent par a et qui finissent par c.

q0 q1

a, b, c

a c

La table associ´ee `a cet automate est alors :

a b c

→ q0 {q1} ∅ ∅ q1 {q1} {q1} {q1, q2}

∗ q2 ∅ ∅ ∅

Comme pour les automates déterministes, nous nous introduisons la fonction de transition étendue aux mots, ˆδ. Elle se définit récursivement comme suit.

A partir d’un ´etat q en lisant le mot vide ǫ (le mot vide ne contient aucun symbole et est

toujours not´e ǫ), on reste dans l’´etat q, i.e.,_{∀q ∈ Q, ˆδ(q, ǫ) = {q}}

Etant donn´e un mot c se terminant par a∈ Σ (i.e., c = c′_{a avec c}′ _{∈ Σ ∪ {ǫ}), et un ´etat} q de Q,

δ(q, c) = ˆδ(q, c′a) = [ p∈ˆδ(q,c′₎

δ(p, a)

Nous pouvons maintenant définir le langage L(A) accepté par un automate fini déterministe A = (Q, Σ, δ, q0, F ).

L(A) =_{c|ˆδ(q0, c)∩ F 6= ∅}

Exercice 6 Construire l’automate fini non-déterministe associé à la table ci-dessous.

a b → 0 {0, 1, 3} {2} 1 ∅ {3} 2 {3} ∅ ∗ 3 ∅ {1} Solution.

0 1 2 3 a a a b b a b

Exercice 7 Construire un automate fini non-d´eterministe qui reconnaˆıt les mots qui contiennent “church” ou “chomsky”. Solution. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Σ Σ Σ c h o m s k y c h u r c h

Exercice 8 Construire un automate finis non-d´eterministe qui reconnaˆıt les mots de l’alphabet {a, b} qui terminent par bab.

Solution.

0 1 2 3

b a b

Exercice 9 Construire un automate fini non-déterministe et un automate fini déterministe qui reconnaˆıt les mots sur l’alphabet{a, b, c} décrits par l’expression régulière (a+b+c)∗_{b(a + b + c).} Exercice 10 Construire un automate fini non-déterministe qui reconnaˆıt les nombres dont le dernier chiffre n’apparaˆıt qu’une fois.

Exercice 11 Modélisation d’un jeu (d’après la page de Jean-Eric Pin). Le joueur a les yeux bandés. Face à lui, un plateau sur lequel sont disposés en carré quatre jetons, blancs d’un côté et noirs de l’autre. Le but du jeu est d’avoir les quatre jetons du côté blanc. Pour cela, le joueur peut retourner autant de jetons qu’il le souhaite, mais sans les déplacer. A chaque tour, le maˆıtre de jeu annonce si la configuration obtenue est gagnante ou pas, puis effectue une rotation du

plateau de zéro, un, deux ou trois quarts de tours. La configuration de départ est inconnue du joueur, mais le maˆıtre de jeu annonce avant le début du jeu qu’elle n’est pas gagnante. Chaque annonce prend une seconde, et il faut 3 secondes au joueur pour retourner les jetons. Pouvez-vous aider le joueur à gagner en moins d’une minute ?

4.2 D´eterminisation d’un automate fini non-d´eterministe

Un automate fini déterministe est aussi non-déterministe. Donc tout langage reconnu par un automate fini déterministe est reconnu par un automate fini non-déterministe. Plus surprenant, la réciproque est aussi vraie (Théorème de Rabin-Scott).

Considérons un automate fini non-déterministe An = (Qn, Σ, δn, q0, Fn) et construisons un automate fini déterministe Ad= (Qd, Σ, δd,{q0}, Fd) qui reconnaˆıt exactement le même langage.

Les alphabets de An et de Ad sont identiques.

Les états de départ sont respectivement q0 et le singleton{q0}. Qdest constitué de tous les sous-ensembles de Qn.

Fd est l’ensemble des sous-ensembles de Qn qui contiennent au moins un élément de Fn. Etant donné un sous ensemble S de Q´ n et un symbole a ∈ Σ, on définit la fonction de

transition δd(S, a) de la mani`ere suivante δd(S, a) =

[

q∈S

δn(q, a).

Nous illustrons le th´eor`eme de Rabin-Scott sur quelques exemples.

Exemple 3 reprenons l’exemple de l’exercice 8. Il s’agissait de construire un automate fini non-déterministe reconnaissant les mots de l’alphabet{a, b} qui terminent par bab. L’automate suivant répond à la question.

0 1 2 3

b a b

Essayons maintenant de le déterminiser en construisant un nouvel état à partir de chaque sous ensemble d’état possible.

{0} {0, 1} {1, 3} {0, 1, 3} a b a b a b a b {1} {2} {3} {0, 2} {0, 3} {1, 2} {2, 3} {0, 1, 2} {1, 2, 3} {0, 2, 3}

Remarquons que les états{1}, {2}, {3}, {0, 2}, {0, 3}, {1, 2}, {2, 3}, {0, 1, 2}, {1, 2, 3}, {0, 2, 3} sont inatteignables et peuvent être “retirés” de l’automate.

En pratique, lors de la conversion, on ne crée pas immédiatement tous les états de l’automate fini déterministe. Les états “utiles” sont crées quand on en a besoin en suivant la méthode de construction ci-dessous :

Qdest initialisé à ∅ et soit E un ensemble d’états initialisé à E = {{q0}} Tant que E est non vide,

– choisir un élément S de E (S est donc un sous ensemble de Qn), – ajouter S à Qd,

– pour tout symbole a_{∈ Σ,} + calculer l’´etat S′ =S

q∈Sδn(q, a)

+ si S′ n’est pas déjà dans Qd, l’ajouter à E

+ ajouter un arc sur l’automate entre S et S′ _{et la valuer par a} Exercice 12 D´eterminiser l’automate de l’exercice 7 (long).

4.3 Les ǫ transitions

Rappelons qu’ǫ représente le mot vide. Une ǫ transition (notée ǫ sur l’arc d’un automate) permet de passer d’un état à l’autre d’un automate sans lire de symbole. Cette facilité permet de programmer facilement des automates complexes.

Une table de transition peut être associée à un automate contenant des ǫ transition. La table est identique à celle utilisée pour un automate fini non-déterministe à ceci près qu’on la complète d’une colonne associée au caractère vide ǫ.

Exemple 4 Pour illustrer les ǫ transitions, construisons un automate fini non déterministe qui reconnaˆıt les nombres décimaux. Rappelons qu’un nombre décimal est un nombre réel qui est le quotient d’un entier relatif par une puissance de dix. Plus précisément, on souhaite pouvoir écrire le nombre décimal en commen¸cant par un “+” ou un “-’, suivi d’une suite de chiffres, d’une virgule et d’une suite de chiffres. Bien entendu, le “+” ou le “-” sont optionnels, la première chaˆıne de chiffres ne peut pas être vide et ne commence pas par “0” (sauf si le nombre décimal est 0). La seconde chaˆıne ne se termine pas par “0”. Si seconde chaˆıne est vide, on omet la “,”.

A B C D E F ǫ, +,₋ 1,_{· · · , 9} 0,_{· · · , 9} , 0,_{· · · , 9} 1, 9 0

La transition de l’état A à l’état B est régie par ǫ, +,−. Ainsi, on peut passer de A à B soit en lisant +, soit en lisant _{− soit enfin en ne lisant rien.}

La table de transition associ´ee `a cet automate est alors :

ǫ + − , 0 1 2 · · · 9 → A {B} {B} {B} ∅ ∅ ∅ ∅ · · · ∅ B _∅ _∅ _∅ _∅ _{{F }} _{C} _{C} _{· · ·} _{C} C _∅ _∅ _∅ _{{D} {C}} _∅ _∅ _{· · ·} _∅ D _∅ _∅ _∅ _∅ _{{D} {D, E} {D, E} · · ·} _{{D, E}} ∗ E ∅ ∅ ∅ ∅ ∅ ∅ ∅ · · · ∅ ∗ F ∅ ∅ ∅ ∅ ∅ ∅ ∅ · · · ∅

Exercice 13 On cherche `a construire un automate qui reconnaˆıt les mots qui se terminent par bab ou qui commencent par aba.

On sait construire un automate qui reconnaˆıt les mots qui se terminent par bab (exercice 8) :

0 1 2 3

b a b

il est facile de construire un automate qui reconnaˆıt les mots qui commencent par aba.

4 5 6 7

a, b

a b a

Il suffit alors d’assembler ces automates avec une simple ǫ transition.

0 1 2 3 a b b a b 4 5 6 7 a, b a b a i ǫ ǫ

L’introduction des ǫ transition ne change pas la nature des langages reconnus par les automates. Comme pour les automates non-déterministes que l’on peut toujours déterminiser, il est toujours possible d’éliminer les ǫ transition et d’obtenir un automate fini déterministe équivalent. Nous n’aborderons pas ici cette élimination.

Dans le document [PDF] Tutoriel Programmation et Algorithmique en PDF | Cours informatique (Page 155-163)