M ATHÉMATIQUES ET SCIENCES HUMAINES
L UC B OASSON M AURICE N IVAT
Transductions et familles de langages
Mathématiques et sciences humaines, tome 35 (1971), p. 31-37
<http://www.numdam.org/item?id=MSH_1971__35__31_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1971, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme
TRANSDUCTIONS ET FAMILLES DE LANGAGES
par
Luc BOASSON et Maurice NIVAT1
La théorie des
langages formels
a desapplications
évidentes dans lechamp
deslangages
deprogrammation
et l’on peut
s’interroger
sur son utilité pour une meilleurecompréhension
des mécanismes deproduction
et de reconnaissance d’une
langue
naturelle.Or,
leproblème
del’analyse syntaxique
d’unephrase
consisteà décrire les
algorithmes
de reconnaissancequi
permettent dedécider, lorsqu’on
connaît lesrègles
deformation
des
phrases
d’unlangage,
si cettephrase
donnéeappartient
ou non aulangage
etensuite,
en cas deréponse favorable,
à donner une suite derègles
au moyendesquelles
cettephrase
peut êtreformée.
C’est pourrépondre
à ce
problème
que l’on a introduit lestransductions, applications
d’un monoïde libre dans un autremonoïde, qui
sont desgénéralisations
naturelles deshomomorphismes
de monoïde libre. Les résultats obtenus dans la théorie deslangages formels,
n’ont certes pas tous uneinterprétation linguistique immédiate,
mais c’est unexemple
de théoriemathématique
où :1~ Les concepts
mathématiques
sont idéalisés(langage formel, grammaire formelle, syntaxe)
àpartir d’objets linguistiques
nonmathématiques ;
20 On pousse « les
conséquences jusqu’au
bout » et étudie parl’algèbre
lesconséquences qui
peuvent devenir des résultats(positif
ouplus
souventnégatif);
voir « 1"attitudeformalisante
enlinguistique »,
Math.Sci.
hum.,
no34, qui
serviront à testerl’adéquation
d’un modèlelinguistique.
J. P. Desclés
L’utilisation
systématique
de la notion de transductions rationnelles dans l’étude des familles delangages (en particulier
delangages algébriques [5])
permet desimplifier
ungrand
nombre de définitions et de résultats. Nous donnons ci-dessous définitions et résultats concernant les AFL ou familles abstraites delangages
introduites dans[3].
Et nous décrivonsquelques problèmes qui
fontl’objet
de travauxen cours.
I. TRANSDUCTIONS RATIONNELLES
Rappelons qu’un
monoide est un ensemble muni d’une loi decomposition
associative que nous noteronsmultiplicativement
et d’un élément neutre pour cette loi que nous noterons e.1. Institut de Programmation, Faculté des Sciences, Paris.
Dans l’ensemble des
parties
d’un monoideM,
on définit lesopérations d’union, produit,
étoileet étoile
tronquée
de lafaçon
suivante :- l’union est l’union
ensembliste,
- le
produit
de A et B noté AB estégal
à :et
- l’étoile
tronquée
de A noté A+ estégale
à :- l’étoile de A notée A * est
égale
à :Très
généralement,
onappelle partie
rationnelle deM,
tout élément de laplus petite
famille departies
de M contenant lesparties
finies et fermée pour lesopérations d’union, produit
et étoile.Les
parties
rationnelles du monoide libre X*engendré
parl’alphabet
fini sont aussiappelées langages rationnels, langages réguliers
oulangages
de Kleene.Nous
appelons
transduction du monoide libre X* dans le monoide libre Y* touteapplication
de X*dans l’ensemble des
parties
de Y*.Si ï est une transduction de X* dans
Y*,
nous notons T le sous-ensemble de X* X Y* défini par :la transduction de Y* dans X* définie par :
pour tout g E Y*.
La transduction T de X* dans Y* est dite :
-
d’image finie,
si et seulementsi,
i( f )
est un sous-ensemble fini de Y* pour toutf
EX*,
-
fidèle
si et seulementsi,
T-1 estd’image finie,
- propre si et seulement
si,
r( f )
c Y Y* pour tout f dansX*,
- rationnelles si et seulement
si, T
est unepartie
rationnelle de X* X Y*.Les transductions rationnelles ont été introduites par
Elgot
et Mezei[1]
et étudiées par Nivat[5]
qui
en donne la caractérisation suivante : Théorème 1La transduction T de X* dans Y* est rationnelle si et seulement s’il existe un
alphabet Z,
unlangage
rationnel K dans Z et deux
homomorphismes alphabétiques
cpet ~
de Z’* dans X* et Y*respectivement
tels que :
On
rappelle
quel’homomorphisme
qp de Z* dans X* estalphabétique (resp.
strictementalpha- bétique,
resp.continu)
si et seulement si :On peut alors écrire :
et
pour E X* et g e Y*.
Nous donnons ci-dessous trois lemmes nouveaux
permettant
depréciser
cet énoncé :Lemme 1
On peut
toujours
supposer, dans l’énoncé du théorème1,
que pour tout z EZ,
l’un au moins des deuxmots y (z) et Ç (z)
n’est pas vide.(Ce
lemme nous a étésuggéré
par J.Berstel.)
Lemme 2
On peut
toujours
supposer, dans l’énoncé du théorème1,
que Z ne contient pas deux lettresdistinctes zl
et x2 telles que :
et
Lemme 3
La transduction rationnelle T de X* dans Y* est
fidèle
et propre si et seulement s’il existe unalphabet Z,
un
langage
rationnel K surZ,
unhomomorphisme ?
de Z* dans X* et unhomomorphisme ~
strictementalphabétique
de Z* dans Y* tels que : Démonstration du lemme 31)
La condition estsuffisante.
Nous savons que : pour tout g dans Y*.Si ~
est strictementalphabétique,
tout mot h de Z’* telque ~ (h)
= g est de mêmelongueur
que g.Mais
alors,
si M =max { (z) 1 ; z
E,Z~ ~ ;
on saitque 1 cp (h) 1
>M. 1 h I .
On en déduit que tout motf
dans X* élément de
(g)
est borné enlongueur
par M .1
gI.
On en déduit que -r-1(g)
est un sous-ensemble fini de X*
quelque
soit g dans Y* et donc que T est fidèle.2)
La condition est nécessaire. T étant une transductionrationnelle,
on peut trouver unalphabet Z,
unrationnel K sur Z’ et deux
homomorphismes alphabétiques
y et F de z* dans X* et Y*respective-
ment, tels que :
pour
tout f
E X*.Soit
No
l’entier associé au rationnelK,
tel que :avec
tel que
Soit enfin :
et
D’après
le lemme1,
on peut supposer que si z EZ’o,
y(z)
est non vide.oc)
K ne contient pas de mot admettantplus
deNo
lettres deZo
consécutives : eneffet,
supposonsqu’il
existe un mot h dans K tel que :Alors,
on sait que :et
et
Or: o
et
Donc :
f1 cx. f2 C
r-1(g)
et r n’est pasfidèle,
cequi
contreditl’hypothèse.
P)
Soit alors unalphabet
T =Tl
UT2
défini par :--
et
et
On définit les deux
homomorphismes cp’
et~’
dans X* et Y*respectivement
par :Notons
qu’alors ~’
est strictementalphabétique.
Soit
6, l’homomorphisme
T* dans Z* défini par :Soit enfin K‘ = 6-1 K n
T2 T~.
On vérifie que la traduction rationnelle T de X* dans Y* définie par 1"’( f )
=~’ ( f ) ~ K’),
estégale
à 1". En effet :II. FAMILLES ABSTRAITES DE LANGAGES
Nous traduisons par
famille
abstraite delangages, l’expression
« abstractfamily
oflanguages »
enabrégé AFL,
introduite parGinsburg
et Greibach[3].
Nous dirons nous aussi AFL pourabréger.
Lessemi-AFL ont été introduits par Greibach
[4].
Dé finition
1Une famille w de
langages
est dite constituer un semi-AFL(resp.
semi-AFLplein)
si et seulementsi,
elle est fermée par
homomorphisme
continu(resp. homomorphisme), homomorphisme inverse,
inter-section avec un
langage
rationnel et union.Nous noterons Or
(~ ) (~))
la famille deslangages
de la forme(L)
où L e e et r estune transduction rationnelle
(resp.
une transduction rationnellefidèle).
On vérifie immédiatement.Propriété
1La famille ~’ de
langages,
fermée par union est un semi-AFL(resp.
un semi-AFLplein)
si et seulementsi,
97 =
(resp..~’
_ .%"Dé finition
2Une famille fF de
langages
est dite constituer un AFL(resp.
AFLplein)
si et seulementsi,
c’est un semi-AFL
(resp.
semi-AFLplein)
fermé parproduit
et étoiletronquée (resp. étoile).
On vérifie immédiatement la
Propriété
2La famille e de
langages,
rationnellementfermée,
est un AFL(resp.
un AFLplein)
si et seulementsi,
,~’ = e+
(resp.
fF _ !T(e».
La famille sr est dite rationnellement fermée si et seulementsi,
F est fermée par
union, produit
et étoiletronquée.
La théorie des
langages
fournit un nombre considérable d’AFL et d’AFLpleins ;
engénéral,
iln’est pas difficile d’établir
qu’une
famille delangages
est un AFL ou un AFLplein.
Par contre, une ques- tiongénéralement
difficile est de déterminer pour un AFL(resp.
AFLplein)
donné .91 lessystèmes
minimaux de
générateurs,
c’est-à-dire les sous-familles minimales de .91 telles que .s~ soit leplus petit
AFL
(resp.
AFLplein)
contenant e. Pour toute famillee,
nous notons ~ leplus petit
AFLplein
contenant e. Dans cette
étude,
un rôleimportant
est dévolu aux AFLprincipaux.
Définition
3Un AFL
plein
e9I est ditprincipal
si et seulement s’il existe unlangage
L telque a/ = Remarque
Il est bien connu que l’ensemble de tous les
langages context-free (que,
conformément à la termi-nologie d’Eilenberg,
nous dénommonslangages algébriques)
constitue un AFLplein.
C’est même unAFL
plein principal
comme il résulte directement du théorème deChomsky-Schützenberger;
unlangage générateur
est parexemple
l’ensemble deDyck
sur quatrelettres, c’est-à-dire,
surl’alphabet { a, b, a, b }
la classe
d’équivalence
du mot vide pour la congruenceengendrée
par :Un
exemple
d’AFLplein
nonprincipal
nous est fourni par l’ensemble deslangages quasi-rationnels
que l’on définit
simplement
de.lafaçon
suivante :- la
grammaire algébrique
G est diteinexpansive
si et seulement s’il n’existe pas desymbole
non terminal v
qui
se dérive en un mot de laforme f1 v f2 v f3 avec fl f2 fa =1=
e ;- le
langage
L est ditquasi-rationnel
si et seulement s’il estengendré
par unegrammaire algé- brique inexpansive.
Le fait que ceslangages
constituent un AFLplein
se vérifie sanspeine. Que
cetAFL soit non
principal,
résulte du théorème 3.2. de[4].
Le théorème suivant est dû à Greibach et
Ginsburg [2].
Théorème 2
Le
plus petit
AFLplein
e9I contenant lelangage
L sur X peut se mettre sous la !!7«Loc)*)
où ce est un
symbole quelconque n’appartenant
pas à X.Démonstration
1)
On sait que tout rationnel est élément de ~a/ car .~ est un AFLplein.
Enconséquence,
la fermeture parproduit
et étoile assure que(Lx)*
E ~. Maisalors,
comme un AFLplein
est formé par transductionrationnelle,
on a :2)
Pour démontrer l’inclusion inverse, nous allons montrerque 9’ ((Lx)*)
est rationnellement fermé.Soient
LI
etL2
deuxlangages
éléments de 1((L(x)*).
On peut donc trouver unalphabet Zi,
un rationnelKt
surZI,
et deuxhomomorphismes alphabétiques
de Z* dans X* etY~
tels que :pour
Alors, si qp et ~ désignent
leshomomorphismes
de(Zl
UZ2) *
dans X* et( Yl
UY2) *
naturellement définies âpartir
de cpl,~l,
~2 et~2,
on a :On
peut
supposer queKl
= avec ~1(~3)
= aet p
est unsymbole
nefigurant
pas dans lesmots de
K~.
Eneffet,
soitZa = { x
E1
~1(zi)
= oe j. On peut évidemment supposer queK,
estinclus dans
Zi Z~.
Soit alors ensembledisjoint
deZl U { ~
}. On définitKr
par :On pose :
On a alors :
avec
Ki
=.9,’ g.
Alors :
et
III.
REMARQUES
EN GUISE DE CONCLUSIONIl est bien évident que s’il existe une transduction rationnelle Tl de X* dans Y* telle que Tl =
L2
etune transduction "t’2 de Y* dans X* telle que "t’2
(L2)
=LI
les deux AFLpleins principaux engendrés
parLI
etL2
sontidentiques.
Nous disons dans ce cas queLi
est rationnellementéquivalent
àL2.
Le
problème
de montrer que deuxlangages
donnés sont ou ne sont pas rationnellementéquivalents
est un
problème
difficile. C’est actuellement lesujet
de travaux de L. Boassonqui
a démontré que l’en- semble deDyck
sur deux lettres n’est pas rationnellementéquivalent
à l’ensemble desemi-Dyck également
sur deux lettres(l’ensemble
deDyck (resp. semi-Dyck)
sur { a,b }
est la classed’équivalence
de e pour la congruence
engendrée par ab
= ba = e(resp.
ab =e)).
C’est aussi le
sujet
de travaux de J. Berstelqui
décrit les classes de cetteéquivalence
rationnelle pour leslangages
bornés.Signalons
enfin les travaux récents de S. Greibach[4].
BIBLIOGRAPHIE
[1] ELGOT,
C. etMEZEI, J.,
"On relations definedby generalized
finite automata", IBMjournal of
research and
development, 9, 1965,
pp. 47-68.[2] GINSBURG,
S. etGREIBACH, S., "Principal
A FL",
Journalof
computer systemsciences, 4, 1970,
pp. 308-338.
[3] GINSBURG, S., GREIBACH,
S. etHOPCROFT, J.,
Studies in abstractfamily of languages,
memoirs ofthe American math. Soc.
1969,
p. 87.[4] GREIBACH, S.,
"Chains of full AFL",
Mathematical systemtheory,
4(3),1970,
pp. 231-242.[5] NIVAT, M.,
"Transduction deslangages
deChomsky",
Ann. Inst.Fourier, Grenoble,
18(1), 1968,
pp. 339-456.