C AHIERS DE
TOPOLOGIE ET GÉOMÉTRIE DIFFÉRENTIELLE CATÉGORIQUES
P IERRE D AMPHOUSSE Automates et langages
Cahiers de topologie et géométrie différentielle catégoriques, tome 33, no3 (1992), p. 217-222
<http://www.numdam.org/item?id=CTGDC_1992__33_3_217_0>
© Andrée C. Ehresmann et les auteurs, 1992, tous droits réservés.
L’accès aux archives de la revue « Cahiers de topologie et géométrie différentielle catégoriques » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
Automates et Langages
Pierre Damphousse1
CAHIERS DE TOPOLOGIE ET GEOMETRIE DIFFERENTIELLE
CATEGORIQ UES
VOL UME XXXIII
3ème
trimestre 1992ABSTRACT : The classical notion of finite deterministic automata is extended in a natural way so as to reveal
interesting categories
of automata and
languages.
Un
langage
L dans unalphabet E
est, dans la théorieclassique
des lan-gages, un sous-ensemble L du monoïdes libre Z* . Deux
questions
naturelles seposent
alors.(1)
Existe-t-il unalgorithme qui,
étant donné x EZ*,
déter minesi x est dans L ou non ’?
(2)
Existe-t’il unalgor ithme qui per met d’engendrer
une suite d’éléments de E* formée exactel11ent des éléments de L ? L’essentiel de la théorie des
langages
est l’étude de différentes classes de L caractérisées chacune par le faitqu’il
existe une classe de "mécanismes" d’untype parti-
culier soit pour reconnaître soit pour
engendrer
L. A ce corpus, nous faisons deuxreproches.
Le
premier reproche
est que cette notion delangage
- un sous-ensemble d’un monoïde libre - estbeaucoup trop
pauvre pour rendrecompte
desplus simples
structures internes rencontrées dans l’élaboration et lamanipulation
de
langages
formels. Unlangage compr end
engénéral
une donnée de relationsd’incidence, d’emboîtements,
dedécoupages,
...qui
ont un lien intime avecles mécanismes de reconnaissance et de
génération
de ses mots.Le second
reproche
estdavantage
de natur emathématique.
Les notionsde théorie des
langages correspondent
leplus
souvent à desob j ets
extérieursaux
langages
eux-lnêlnes et aux monoïdes libresqui
leshébergent.
Par exem-ple,
unlangage
est ditrégulier
s’il existe un "mécanisme" pour le construire(v.g.
unegramlnaire régulière),
ou bien s’il existe un "mécanisme" pour le reconnaître(v.g.
un automatedéterministe),
ou bien s’il existe dans leméta-langage
uneexpression générique
de ses éléments(v.g.
une expres- sionr égulièr e),
et la théorie sepréoccupe
del’équivalence
de ces faits. En1 Université de Tours, "damphous@frutrs51.bitnet"
revanche,
elle ne sepr éoccupe
pas des liens de ces faits avec des notions in- ternes au monoïdes libre E*. Desurcroît,
la notiond’homomorphisme,
faitepour comparer des
objets,
estquasiment
absente de lathéor ie ;
par exem-ple,
comment sont"organisés
entre eux" les automates déter ministesqui
reconnaissent un même
langage ?
Pourexpliquer
la nature de ce deuxièmereproche
par uneanalogie,
disons que c’est comme si un espace vectoriel était considéré comme la donnée d’unpartie génératice
ou un gr oupe la donnée d’uneprésentation,
et que l’on se soucie très peu de notionsd’algèbre
linéaireou de la théorie des groupes
plus
structurelles ou"intrinsèques".
Notre
objectif
ici est uneapproche
de la théorie deslangages
àlaquelle
on ne
peut
pas faire le secondreproche,
etqui
est la lJase d’une théorie à l’abri dupremier reproche,
mais que nous nedéveloppons
pas ici.1 Catégories de langages et d’automates
Se donner une
partie
L de Z* revient à se donner une relationd’équivalence découpant
Z* en auplus
deux classes. Nous étendons naturellement la notionclassique
delangage
comme suit : unlangage
est unepaire (Z,L), où
L est unerelation
d’équivalence
sur Z* . Cette notion delangage
est encorebeaucoup tr op
pauvre pouréchapper
aupremier reproche,
mais elle est suffisante pourl’objectif
de cette note.Nous
appelons morphisme
delangages
de(Z1 , L1)
dans(E2, L2 )
un I110r-phisme
demonoïdes Z*1 -> Z*2
induisant uneapplication Z1/L1 -> Z2/L2
parpassage au
quotient.
Leslangages
ainsi définis forment unecatégorie
quenous notons
La ng.
Rappelons qu’un
automate déterministe fini est essentiellement untriplet (Z, Q, L)
où(1) Z
est unalphabet, (2) Q
est un Z*-ensemblepointé transitif, appelé
ensembled’états,
et(3)
L est undécoupage
deQ
en(au plus)
deuxclasses -la classe des états finaux et celle des autres,
qui lJeut
éventuellement être vide. Lepoint
de base deQ,
l’ "étatinitial" ,
sera notéq.
On convient de noter à droite l’action de Z* surQ.
Nous observons que :1 : La donnée d’un tel automate détermine
canoniquement
une sur-jection
Z*->o Q,
à savoir ,t@ Hqx.
Cettesurjection
induit à son tourdeux relations
d’équivalence
surE* ;
lapremière correspond
àl’image
réciproque
dudécoupage
L deQ
en auplus
deux classesd’équivalence,
la seconde au
découpage
de Z* en libres au-dessus des états. Notons L lapremière
et E la seconde. Il est clair quea : E C L
(i.e.
que E estplus
fine queL) ;
b :
E est invariante à droite par l’action deE*,
i.e. si x E y, alors pourchaque z
eZ*,
xz E yz.2 :
Inversement,
supposons donnée sur E* unepaire ( E, L )
de r elationsd’équivalence
satisfaisant(a)
et(b) ci-dessus,
telles que Ldécoupe
Z*en au
plus
deux classes. Parce que E est invariante àdroite,
l’actionnaturelle de Z* sur lui-même détermine une action à droite de Z* sur
le
quotient Z* /Z E ;
, d’autrepart,
Z* a natur ellement unpoint
de baseson élément neutre E -, si bien que
-7-,*/E
est aussi un ¿:*-ensel11blepointé,
dont lepoint
de base est la classe de 6. Letr iplet
où
L/E
est la relationd’équivalence
induitesur Z*/E
parL,
est donc un automate ; lasurjection 0 :
Z* ->Q
que détermine cet autolnate n’est autre que leprojecteur canonique,
et les deux relationsd’équivalence que .0
détermine sont E et L.3 :
Finalement,
si E et Lproviennent
de la donnée d’un automate(Z, Q, L),
alors labijection o : Z*/E -> Q provellallt
del’application
Z*
->o Q
est unisomorphisme
d’automates au sens leplus
fort que l’onpuisse
concevoir : unebijection compatible
avec l’action de E* et la donnée de L.Se donner un automate déterministe fini revient donc à se donner deux re-
lations
d’équivalence
L et E sur Z* satisfaisant(a)
et(b),
avec enplus
lespropriétés
que E induit unquotient
fini et que Ldécoupe
Z* en auplus
deuxclasses.
Nous étendons maintenant naturellement la notion d’automate détermi- niste en oubliallt ces deux dernières conditions. Un automate
(déterlniniste)
abstrait est un
triplet (E, E, L)
où E et L sont des relationsd’équivalence
surE* satisfaisant
(cx)
et(b)
ci-dessus. Nousappelons morphisme
d’autolnates de(Z 1, E 1, L 1 )
dans(Z2 , E2, L2 )
unmorphisme
demonoïdes Z*1 ->f Z*2 qui
induit deux
applications
par passage aux
quotients.
Les automates et leursmor phismes
forment unecatégorie,
que l’on note Auto. Etant donné un automate déter ministe abstrait(Z, E, L),
letriplet (Z; E*/E, L/E)
seraappelé
sa réalisation.Il existe deux foncteurs évidents Auto -
La ng,
à savoir les foncteurs oubliqui
envoient surrespectivement.
Quand
notre notion d’automate se traduit dans le contexteclassique,
le pre- mier de ces foncteurs associe à un automate lelangage qu’il reconnaît ;
pour cetteraison,
nousl’appelons
le foncteur"Langage- reconnu-par".
Il est cepen- dant un autre foncteur oubliqui
est duplus grand intérêt,
que nous décrivons maintenant.2 L’automate minimal
Soit
(Z, L)
unlangage.
Considérons l’ensemble D des relationsd’équivalence
E sur E*
qui
sontplus
fines que L et invariantes à droite. Cet ensemble D n’est pas vide car il contientl’égalité.
Ses éléments sont lesobjets
de troiscatégories
que nous notonsrespectivement Di , Da
etDq (lire D-inclusion,
D-automate et
D-quotient,
où D est le "D" de "invariante àDroite").
e
Di
est lepr é-ordre
des relationsd’équivalence
invariantes à droites etplus
fines que L. DansDi,
il y a donc unmorphisme El
->E2
si etseulement si
El
CE2.
e Les
morphismes E1
1 ->E2
dansDa
sont lesendomorphismes
demonoïdes
Z* ->f
E*qui
sontcompatibles
avec la relation L et in- duisent uneapplication f : Z*/Z1 -> Z*/E2.
Cettecatégorie
est lasous-catégorie pleine
deslangages
reconnaissant L.e
Finalement, D qest
lacatégorie quotient
obtenue àpartir
deDa
en identifiant les
morphismes f qui
donnent la mêmeapplication f : Z*/Z1 -> Z*/E2
par passage auquotient.
Ces trois
catégories
sont reliées entre elles dans une"pr ésentation" canonique
par deux foncteurs
où I envoie
El
CE2
sur lemorphisme
deD,,
donné par lemorphisme
identitésur E*
(dire
que ce dernierpeut
passer auquotient
revient à dire queEl
CE2),
et où P envoie
E1 ->f E2
sur sa classeEl l E2.
Le foncteurcomposé
P - Ienvoie essentiellement
E1
cE2
sur leprojecteur canonique Z*/Z1 -> Z*/E2-
La
catégorie Di
contient unobjet initial,
à savoirl’égalité.
Dupoint
de vue de la
catégorie
des automates,(Z, "égalité", L)
est leplus
mauvaisautomate
possible,
car sa réalisation donne essentiellement lelangage qu’il
doit reconnaître
[i.e. (Z, Z*, L)].
Di
contient aussi unobjet
terminal. Eneffet,
étant donnée une famille{Ei}iEI
de relationsd’équivalence
invariantes à droite etplus
fines queL,
onvérifie ilnmédiatelnent que la relation E
engendrée
par lesE, (i.e. l’enveloppe
des
Ei )
est aussi invar iante à droite etplus
fine que L. On en déduit que la relatiollEo engendrée
par tous lesobjets
deDi
est unobjet
maximu1(i.e.
terminal)
deDi .
Cet automate(Z, E0, L )
estappelé
"autonlate minimal re-connaissant L" car sa réalisation est le
plus petit
automate(au
senshabituel) qui
reconnaît lelangage
donné par L.Comme
Di
est unordre,
ses classesd’isoll10rphie
sont chacune réduite àun
objet.
Dire que l’autolnate minimal estunique n’apporte
donc en ce sensaucun
profit ;
saminimalité,
et non son unicité découle de son caractère final.Le foncteur I
plonge Di
dansDa .
Il est clair que l’autolate minimal n’est pas terminal dansDa,
car son grouped’automorphismes
n’estgénéralement
pas trivial
(Exemple :
si L est ledécoupage
de Z* enpalindromes
et nonpalindrome,
le groupe desautomorphismes (dans Da)
de l’auto1ate minimal contient le gr oupe despermutations
deE).
Il y acepelldant
un fait fortqui
reste vrai :
Da
etD.
sont chacune leur propresquelette.
Faute deplace
etde
temps,
nous 111011trollS ici seulement que l’aLltOlllate minimal est seul danssa classe
d’isolnorphie
dansDa
et dansDq.
Soit
Eo
la relation maxim1m dansDi ,
et soitE1
I unob j et
deDi.
Nousmontrons que
Eo
etEl
ne sont pasisomorphes
dansDy
et doncqu’elles
ne le sont pas dans
Da.
Soit
f un morphisme
dansDa
induisant dansDq
unisomorphisme 1 :
Eo
->EI.
Pardéfinition, f
est unmorphisme
de monoïdes E* -> Z* rendantle
diagramme
suivantcommutatif, f
étant unebijection :
(où
les flèches verticales sont lesprojecteurs).
SoitEg
la relationd’équiva-
lence sur Z* donnée par
image réciproque
parf
de la relationEo
sur E*. Ilest
clair,
au vu de la commutativité dudiagr amme ci-dessus,
quee
Eo
estplus
fine que L(car,
avec l’abus de notationévident, E’
=f-1(E0)Cf-1(L)CL).
e
Eo
est invariante à droite(car
elle estl’il11age réciproque
d’unerelation
d’équivalence
invariante àdroite).
On en déduit donc que
E’
=Eo,
carEo
estmaximal, puis
queEl
=Eo.
3 Conclusion
Nous avons
"déménagé"
la notion d’automate à l’intérieur des monoïdes li-bres, palliant
ainsi au secondreproche
fait à la théorie deslangages,
et cefaisant,
le souci del’expression
fo11elle minimale et de la naturalité(v.g.
éviter les contraintes accessoires du
type
"... en au moins deuxclasses")
nous anlène un
gain
structurel de clareté et desilnplicité.
Ainsi les auto-mates reconnaissant un
langage
donné formentcanoniquel11ent
untreillis,
et l’existence et l’unicité de l’autolnate lninimal deviennent presque tau-
tologiques (indépendamment
de toutar gument
de finitude surl’alphabet
et les
états).
Université de Tours Faculté des Sciences Parc de Grandmont Tours 37200