M ATHÉMATIQUES ET SCIENCES HUMAINES
M. C. B ARBAULT J. P. D ESCLÉS
Vers une formalisation des grammaires transformationnelles
Mathématiques et sciences humaines, tome 34 (1971), p. 27-41
<http://www.numdam.org/item?id=MSH_1971__34__27_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1971, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
VERS UNE FORMALISATION
DES GRAMMAIRES TRANSFORMATIONNELLES1
par
M. C. BARBAULT2 et J. P.
DESCLÉS3
Une
transformation formelle
est vue dans cet article comme un passage d’un motaccompagné
de l’histoire de saproduction
à un autre mot, lui-mêmeaccompagné
de sa propre histoire.Étant
donné unsystème formel,
une
transformation formelle
sera donc unerègle qui « transforme»
la démonstration d’un théorème t en unedémonstration d’un théorème t’. Les auteurs étudient ici les
transformations«
d’arbres enarbres»,
c’est-à-dire lesrègles
de passages entre démonstrations(ou
histoires deproduction)
structurées en arbres. Cestransfor-
mations «d’arbres en arbres» sont les seules
transformations envisagées
par N.Chomsky [5], [6]
dans lesthéories
transformationnelles (voir
l’articleprécédent
dans ce mêmenuméro) qu’il
propose.1. EXTENSION DU CALCUL DANS UN
MONOÏDE
LIBRE1.1. Calculer à l’intérieur d’un monoide
libre,
c’est effectuer une série detransformations
entre mots;la transformation la
plus générale
est une transformation dite semi-thuienne de la forme(voir
Gross-Lentin
[13]):
où
g, d, m, m
e .91*(.91*
est le monoïde libre surl’alphabet .91).
On dit que le mot m se transforme
(ou
estréécrit)
en un autre mot m dans le contexteg,
d.1.2. Ce calcul ainsi défini ouvre la voie aux
grammaires formelles (cf. [7], [8], [13]) :
soit V(vocabulaire),
l’ «
alphabet»
dusystème formel; si { VN, YT }
est unepartition
deV,
on peut apporter des restrictionsaux transformations semi-thuiennes entre mots
(cf. [8], [10], [13]):
1.2.1.
Règles
de Kleene(ou régulières) :
1. Les auteurs remercient A. Lentin des critiques et améliorations qu’il a proposées.
2. Centre Humaines, CNRS.
1.2.2.
Règles
C.F.(ou indépendantes
ducontexte) :
1.2.3.
Règles
C.S.(ou contextuelles) :
Une
grammaire
formelle G est alors la donnée duquadruplet V, VT, P, ~
> avec P un élémentdistingué
deV N,
dit « axiomes de lagrammaire
et éo un ensemblefini
derègles
d’un même type : soit deKleene,
soitC.F.,
soitC.S.; on’ a alors,
selon le type derègles,
uneK-grammaire,
uneC.F.-grammaire,
une
C.S.-grammaire (cf. [7], [8], [10], [13]).
Lelangage produit
par unegrammaire
G est l’ensemble:1.3. Nous allons étendre le calcul à l’intérieur d’un monoïde
libre,
par uncalcul « plus général»
nonplus
sur des mots mais sur des suites finies d’arbresétiquetés
sur un vocabulaire ou dendrons en défi- nissant le binoïdelibre,
c’est-à-dire un ensemble deséquences
finies d’arbresétiquetés
- ou motsd’arbres
étiquetés
- où s’effectueront toutes lestransformations «
d’arbres en arbresétiquetés ».
De mêmeque l’on définissait un
langage (formel)
comme unepartie
d’un monoidelibre,
on définira unbilangage
comme une
partie
d’un binoïde libre. Unegrammaire
transformationnelle GT aura pour but d’énumérerexactement un
bilangage
et d’en caractériser leséléments;
elle sera définie par la donnée d’unquadruplet V,
&1, 1, à > oùV,
levocabulaire,
déterminera l’universlinguistique (et formel)
danslequel
onse
place; ~ s’appellera
la base de lagrammaire:
engénéral,
un ensemble d’arbresétiquetés,
histoiresdes
productions
des motsqui appartiennent
à unlangage produit
par unegrammaire
C.F. ou autre;1 sera un
ensemble fini
de transformations entre arbres ou mots d’arbres et ~, unensemble,
éventuel-lement
vide,
de conditions restrictives. Une transformation par GT consiste àpartir
d’un ensemble de la base et à luiappliquer
une série de transformations de ~; le calcul s’arrêtelorsqu’aucune
transfor-mation n’est
plus applicable.
2. ARBRES ET DENDRONS
2.1.
Puisque
nous transformons desarbres,
il nous faut en donner une définitionprécise
et commode.La structure d’arbre est bien connue et
employée
souvent, parexemple
dans la constitution d’un dic- tionnaire ou d’unlivre;
eneffet,
la suite desymboles
3.7.2.10.5 peutreprésenter «
lechapitre 3,
la sec-tion
7,
la sous-section2,
leparagraphe 10,
le verset 5» et fournit l’adresseprécise
d’unrenseignement
que désire obtenir un lecteur de
l’ouvrage;
la recherche neprésente
aucune difficulté parce que le lecteurexploite
la structure d’arbre du dictionnaire.2.2. Soit N+ l’ensemble des entiers strictement
positifs;
on construit le monoide libre X degénérateur N+,
dont le neutre est0, puis
on munit X d’une relation d’ordreH, qui
se lit«n dépend hiérarchiquement
de ùî»;
Autrement
dit,
sur le monoïde libre X, entre m etn,
il existe la relation H si et seulementsi,
«
m
estun facteur gauche
den»
ou« n admet m comme facteurgauche>y.
Toute
partie finie
D de X telle que:est un domaine structuré en arbre que, par la suite et par abus de
langage,
nousappellerons simplement
arbre. Notons que dans la « théorie des
graphes» [3],
lapartie
D définit ce que nousappelons
ailleurs« arborescence doublement
orientée» [1] ;
nous avons en effet deux ordres: un ordrehiérarchique
oude
dépendance
et un ordre sur les successeurs immédiats dechaque
sommet; parce que nous avons cedeuxième ordre
(séquentiel),
nous sommes autorisés à tracer sur une feuille depapier
ou sur un«listing»
l’arborescence doublement orientée D où l’on
distingue
lagauche
de la droite. Il résulte de l’axiome(al)
que si D contient
n,
D contient nécessairement tous les facteursgauches
stricts de n. L’adresse d’un élément deD, appelée
sommet ounoeud,
parexemple
l’adresse3.7.2.10.5., indique
très clairement le cheminqu’il
faut suivre pour atteindre ce noeud : c’est unalgorithme
derecherche,
car on démontrequ’entre
la racine 0 et un sommetquelconque n
d’un arbreD,
il existe un cheminunique.
Ce concept d’arbres formalisel’analyse
en constituants immédiats[5]
ou encore lesgraphes
dedépendance
deTesnière
[6].
Dans cesanalyses linguistiques, chaque
noeud porte uneinformation,
c’est-à-dire uneétiquette:
on introduit alors le concept d’arbreétiqueté
sur un vocabulaired’étiquettes V;
c’est leconcept de dendron sur V que l’on
appellera,
si aucuneambiguïté n’apparaît, simplement
dendron.2.3. Soit V le
vocabulaire, disjoint
de .IV dans laplupart
descas;~un
dendron sur V est la donnée d’uneapplication
oc d’un domaine structuré en arbre D dans V. On notera D(a),
le domaine de a et Y l’en- semble de tous les dendrons surV,
ouforêt étiquetée
sur V.Proposition
1. A tout dendron surV,
on associecanoniquement
un mot du monoïde libre(V
U ~~, ~ ~) *.
En
effet,
un dendron sur Vs’exprime
sous forme d’uneséquence
linéaire en « ouvrant» et en« fermant» des
parenthèses ( ], [ )
souschaque
noeud(cf, infra 8.3.).
Nous supposons que cette associationcanonique
est connue du lecteur. La notation cedésignera
aussi bienl’application
de D dans V que lemot associé
canoniquement. Désignons également
par Y lelangage
construit à l’aide desrègles :
(iii)
tout mot des est construit avec lesrègles (i)
et(ii)
et elles seulement.On se définit deux
applications
racine et terminaux :où m n’est facteur
gauche
strict d’aucun autreélément,
soit:3.
OPÉRATIONS ÉLÉMENTAIRES
SUR LES DENDRONSCes
opérations (cf. ~1~, [4], [17]) agissent
soit sur lesarbres,
ce sont alors des transformationsstructurelles,
soit directement sur les dendrons.
3.1. COUPE AU Noeud a
Soit a E
D; l’opération«
coupe en a», notéela,
définit un autre domaine àpartir
de D:On notera les noeuds
b’,
tels que b = a .b’,
parbla.
3.2. SOUS-DENDRON DE (X AU Noeud a
Soit a E D
(a) ; l’opération « sous-dendron»,
notée aussila
est une transformation:3.3. REMPLACEMENT DE SOUS-DENDRON
oc/a
PAR LEDENDRON ~
Soit a e D
(a) ;
la transformation «remplacement »
substitue au sous-dendronoela,
ledendron ~
accrochéau noeud a et l’on note cette
opération :
a -j3 :
3.4.
Le « remplacement»
deà
par un dendron réduit à un élément(b,
ce(a))
est le « sur-dendron »restant
après
la coupe au noeud a. Nous noteronsoc-oc/a
l’effacement de(X/a
dans ce.4.
BINOÏDE
SUR VIntroduisons,
à la suite de C. Pair[14],
le binoïde surV;
un binoïde B sur V est la donnée d’unquadruplet
S
(B), ~, A, A
> où S(B)
est un ensemble(l’ensemble sous-jacent
àB)
muni de deux lois:- la concaténation
~, opération interne,
associative dont l’élément neutre est A(suite vide,
delongueur nulle) ;
- l’enracinement
A, opération
externe àopérateur
dans V:Tout élément de B
s’appelle polydendron
1: c’est un mot, c’est-à-dire uneséquence
ordonnéeet
finie, composée
d’éléments de S(B).
Toutepartie
de Bs’appelle
unbilangage ([14]).
1. Ce terme est dû à A. Lentin.
4.1.
REMARQUES
1)
C.Pair [14] (cf.
article de C. Pair dans cenuméro) appelle rami fication
ce que nous nommonspolydendron.
2)
La concaténation ~ dans la suite de cet article ne recevra, comme il estfréquent,
aucune marquespécifique
dans uneexpression
où elle occurre;ainsi,
ce que l’on devrait écrire:s’écrira :
4.2. PROPOSITION 2. Le monoïde libre
~’*,
dont legénérateur
est Y, est un binoïde libre sur V.La preuve est laissée à l’initiative du lecteur. On démontre que Y’* est effectivement un
objet
libre.
Remarquons
que la forêt ~’ est un ensemble de dendrons et que Y’* est un ensemble de mots al, a2 ... (ln, c’est-à-dire depolydendrons.
On peuttoujours«
enraciner» deuxpolydendrons
pour formerun nouveau
dendron,
élément du binoïdelibre,
à condition des’imposer
les identifications naturelles:V c 1/ c ~’*.
Ainsi:
Fig. 1
Étendons
lesapplications
RAC et TER à Y*:Ainsi,
dansl’exemple
ci-dessus:5. CALCUL DANS LE
BINOÏDE
LIBRE Y’*On va établir un calcul«
plus général»
que le calcul des mots, en calculant sur despolydendrons.
5.1. Soit p un
polydendron
deY*;
on dit quep’
occurre dans p si et seulement si :Une transformation T
qui opère
dans le binoïde libre ~’~‘ est une donnée d’uncouple (i (T),
t
(T))
avec:i
(T)
E ’~’~‘ source(ou initial)
de Tt
(T)
E Y’* but(ou terminal)
deT,
on note alors:
5.2. Une transformation T est
applicable
aupolydendron
p pour donner le résultatp’
si et seulement si:on note:
ou encore:
Appliquer
T aupolydendron
p, c’est donc vérifier que i(T)
occurre dans ppuis
substituer à i(T)
le
polydendron
t(T) qui
occurre alors dansp’, polydendron
«transformé
de» p par la transformation T.Le calcul dans un binoïde libre est«
plus
riche» que le calcul dans un monoïdelibre;
pour s’enconvaincre,
il suffit d’identifier toute lettre 1 de V avec un dendron sur
V,
d’où l’inclusion : V* c~*;
toute transfor-mation entre mots de V* sera une transformation entre
polydendrons
de ~’*.5.3. Soit
~ _ ~ T1,
...,T~ }
un ensemble de transformations entrepolydendrons.
Lepolydendron p’,
est dit
transformé
dupolydendron
p par l’ensemble EX en p pas decalcul,
si et seulement si:On écrit alors:
La
notation ~ p ~
est la donnée del’ensemble {
1,2,
...,p ~;
parcontre ~ p J
est la donnée de l’ensemble{ 0,
1,2,
...,p }.
Nous avons défini une transformation de p en
p’
enappliquant
une transformationTi.
de ~,transformation
qui
a donné pour résultat 0"1;appliquant
une transformationT~2
de 1 à a~, on obtient a2;finalement,
enappliquant T fp
à crp-i, on obtientP’.
6. GRAMMAIRE TRANSFORMATIONNELLE
Soit GT =
V,
&1,1, W
> unegrammaire
transformationnelle(cf.
supra1.3.);
nous savons main-tenant ce que
signifient
les transformations successivesopérées
par lagrammaire
G T. Le vocabulaire V définit l’universlinguistique
~’*: c’est le binoïde libre surV; é3
est unbilangage
contenu dans f-*:c’est le
bilangage
debase ;
9- est un ensemblefini
de transformations entrepolydendrons
de’~’ * ; ~
estun ensemble de conditions restrictives.
6.1. Le
bilangage
transformé par GT àpartir
dubilangage
de base & est:6.2. Le
langage produit
par G Test :7.
PROBLÈME
CENTRALDes motivations
linguistiques
nous ont amenés à définir lestransformations formelles.
Nous pouvons énoncer unproblème
central de la théorie desgrammaires
transformationnellesformelles, problème qui
aura, nous le verrons à la fin de cetarticle,
desconséquences théoriques
pour la « théorielinguistique
naïve» des
grammaires
transformationnelles.7.1. Soit G une
grammaire formelle,
de Kleene ou C.F.qui produit
unlangage
L(G).
A tout mot mde
L (G)
est associée une « histoire deproduction»,
c’est-à-dire undendron;
on associe ainsi au lan- gage L(G)
unbilangage
LL(G),
ditbilangage
induit par G. Soit maintenant unegrammaire
transfor-mationnelle
GT,
dont la base 9 est LL(G) ;
lagrammaire
GT transforme lebilangage
LL(G)
en unbilangage
LL(GT)
et lelangage
L(GT)
est ditlangage transformé
dulangage
L(G)
par GT. S’il existeune
grammaire
G’qui produit
exactement le mêmelangage,
on dit alors que GT induit G’ àpartir
de G.On résume ceci par le schéma:
7.2. PROBLÈME
Étant
donné une classe 5i degrammaire G,
trouver unegrammaire
transformationnelleGT,
telle
qu’il
existe dans la classe 5i au moins unegrammaire
G àpartir
delaquelle
GT induise unegrammaire
G’qui n’appartienne plus
à la classe On dit que GT augmente lapuissance
ou, si l’on veutpréciser, fait
sortir de la classe 5i.7.3. Deux
grammaires appartiennent
à la classe 5i(classe
desK.- grammaires,
desC.F.- grammaires,
des
C.S.-grammaires...)
si toutes lesrègles
sont du même type(de Kleene, C.F., C.S...., cf.
supra1.1.).
Une
grammaire
Gn’appartient
pas à une classe :J{ si lelangage
L(G) produit
parG,
ne peut êtreproduit
par aucunegrammaire
G’ de la classe .~’: G est dite«plus puissante»
que toutegrammaire
G’de Jr ; il en résulte que les
règles
de G ne sont pas du typerequis
pour la classe 5r.Ainsi,
toute gram- mairequi produit Lnn =
{ anbn; n >. 1 } n’appartient
pas à la classe desK-grammaires;
lagrammaire Gnon qui produit Lnnn
= { an bn c~; n >1 } n’appartient
pas à la classe des C.F.grammaires
et elleest
plus puissante
que lagrammaire Gnn qui produit Lnn.
On
parlera,
parextension,
de la classe deslangages,
desbilangages
associés à une classe degrammaires.
8. GRAMMAIRES TRANSFORMATIONNELLES SIMPLES
Ce type de
grammaires
transformationnelles que l’onappelle
aussirégulières (cf. [4], [14], [16])
ainsique les résultats
qui
suivent ont été introduits à peuprès
simultanément par Brainerd[4],
Thatcher[16]
Pair
[14]
et Barbault-Desclés[1].
8.1. UNE GRAMMAIRE TRANSFORMATIONNELLE SIMPLE
GTS est un
triplet V, W, 1
> où W est sous-ensemble de la forêt ~’ et 1 un ensemblefini
detransformations entre dendrons dites transformations
simples,
définies ci-dessous : 8.1.1. On a unetransformation
sous le noeud a :8.1.2. On a une
transformation
directe entre dendrons :8.1.3. On a une
transformation
entre dendrons :Une GTS transforme un dendron en un dendron par
remplacement
d’un dendronqui «
occurre sousun noeuds ».
8.2. Un
bilangage .9
estsimple
ourégulier
si et seulemcntsi,
il existe une GTS =Y, A,
e > telle que:8.3 EXEMPLE
Soit le vocabulaire V = {
Si, SN, Noémon,
... }; on donne le dendron a sous lareprésentation
linéaire(cf. proposition 1) (on
introduit diversesparenthèses
pour une meilleurecompréhension).
Voici troistransformations
simples :
alors :
P { Marie
SV]
aime SN(Noémon) [ }
e LL(GTS).
8.4. Le lecteur remarquera que dans
l’exemple précédent,
les transformationsTl (i
=1, 2, 3)
n’ont pasd’interprétation linguistique.
La transformationT2
est non-C.S.puisque
le mot i(T2)
construit surV U {
], ] }
estplus long
que le mot t(T2),
cequi
est contraire à la définition(cf.
supra1.2.3.).
Les trans-formations
simples
entre dendrons n’ont apriori
aucunerestriction,
et onpourrait
penser que les GTS feront sortir de la classe W.Or,
le théorèmeauquel
nous amènent les résultats obtenus par W. S. Brai- nerd[4],
C. Pair et A.Quère [14]
etJ.
W. Thatcher[15], répond
par lanégative
à notreespoir:
sortirde la classe des
langages
C.F. enemployant
unegrammaire
transformationnellesimple.
8.4.1.
Proposition
3. Soit une GTS =V,
-q, 1 >quelconque;
l’ensemble des mots, construits surV U {
], [ }
associéscanoniquement
aux dendrons sur V de LL(GTS)
peut êtreproduit
par une C.F.-grammaire.
8.4.2.
Proposition
4. Soit & unbilangage simple;
lelangage
L(f!Ã) = { m E V* ;
3 oc E .9: m = TER(oc)
est un
langage qui
peut êtreproduit
par uneC.F.-grammaire.
8.4.3.
Proposition
5. Soit 2 unlangage produit
par uneC.F.-grammaire quelconque;
il existe un bilan-gage
simple §#
tel que L(e) ==
~.8.4.4.
Proposition
6. Si é3 la base d’une GTS est unbilangage simple,
alors LL(GTS)
est aussi unbilangage simple.
Nous obtenons ainsi le:
8.4.5. Théorème 1. Les
grammaires
transformationnellessimples
ne font pas sortir de la classe des C.G.-grammaires.
8.5. Revenons à la
proposition 3;
bien que lesrègles
semblent de typequelconque,
enparticulier non-C.S.,
nous leur
imposons cependant
une condition restrictive: les deux membres de larègle
sont des dendrons.Le théorème 1 se
comprend
intuitivement en remarquantqu’effectuer
une transformationsimple
revientà
appliquer
successivement toute une série derègles
de type C.F. au noeud aétiqueté 1 puisque
l’onsubstitue le dendron t
(T)
au dendron î(T);
onremplace
ainsi tout un ensemble derègles
C.F. par unautre ensemble de
règles toujours
C.F. et il est normal que l’on ne sorte pas de la classe C.F. Ce type detiques.
Par le théorème 1, on sait en effet que l’on ne peut pas énumérer certainesphrases produites uniquement
à l’aide degrammaires non-C.F.; ainsi,
lelangage L~n~
ne pourrajamais
êtreproduit
àpartir
d’une composante de basequi
serait C.F. et transformée ensuite par une certaine GTS. Il estnécessaire de trouver des
grammaires
transformationnellesqui
soient non seulementeffectives,
au sensde calculables par une machine de
Turing,
mais encoreopérationnelles,
c’est-à-diresusceptibles
de« passer» en machine réelle
(cf. [2]).
9. GRAMMAIRES TRANSFORMATIONNELLES AVEC PILE
Nous avons
remarqué qu’une
transformationlinguistique
chez N.Chomsky
ne porte pas sur toute l’histoire de laproduction,
mais sur unepartie
seulement:Pour utiliser la
partie « utile »,
nous avonsimaginé
le concept de souchequi,
outrel’interprétation linguistique qu’il
pourraavoir,
rendraéconomique,
doncplus opérationnelle
notregrammaire (cf.
infra 10.2).
9.1. DÉFINITION 1
Une souche est la donnée d’un
couple d’applications (x, a),
où xest,
uneinjection
de D(a)
dans N*(entiers),
telles que lediagramme
suivant commute:’
Fig. 3
La souche est un dendron où l’on porte une information
supplémentaire:
un numéroqui
vapermettre de conserver la
mémoire, après transformation,
del’origine
d’un noeudétiqueté (cf. infra 9.4.).
Remarque :
Pour éviterquelques
difficultés dans les définitionssuivantes,
on supposera que D(c)
a un cardinal strictementsupérieur
à un; sinon il faudraitprendre
desprécautions supplémentaires.
9.2. DÉFINITION 2
Un dendron oc a une souche
(x, 6),
ou(x, 0")
est une souche de oc, si et seulement si:9.3. DÉFINITION 3
La transformation
Ts
entre souches(x, a)
et(x’, cru)
induit latransformation
T entre dendrons ce et oc,si et seulement si:
(Ti)
« a une souche(x, a),
oc’ a une souche(x’, ci’),
(T2)
pour tout i de N+qui
occurre à la fois dans TER(x)
et TER(x’)
avec x(a)
= i et x’(a’)
=i,
on a:
ex’ / a’ = «/a.
Ainsi,
le sous-dendronoc/a «
accroché» au noeud a,étiqueté i
parl’application
x, esttransporté
par T au noeud
a’, étiqueté
i par x’. Nous avons introduitl’application x
pour traiter des transformations du type suivant:induite par la transformation entre souches:
9.5. Une
grammaire transformationnelle
avec souchesV,
-q,/7,
i s > sera bien définie si on se donneun ensemble /7 restreint de
souches,
engénéral fini,
et un ensemblefini .9-
s de transformations entresouches;
lecouple (~, 9- S),
même fini peutcependant
induire un nombrepotentiellement
infini detransformations entre dendrons et ainsi formaliser les relations
susceptibles
d’exister entre deuxséquences
munies de leurs histoires
respectives.
9.6. DÉFINITION 4
Une
pile
de dendrons sur Y est un ensemble Il de mots construits sur la forêt ~l~’ considérée commevocabulaire,
à l’aide de la« concaténation àdroite»,
notée 0, définie par:Si 7T = OC1 o a2
0 ... o anl~ le «
dessus depile»
d(7t)
= an et le cc dessous depile »
g(7r)
= (Xl 0 ... osont bien définis.
...
9.7. Soit A ...une
partie
de V etA
un sous-ensembledisjoint
de V enbijection
avec A(y
1 E A: 1 1-->1
EA);
notons Y la forêt des dendrons
pointés
sur V = V u A. Si EXdésigne
un ensemble desouches, P f/
estun ensemble
d’applications
oupointages P (X:
On introduit de
plus l’application
dedépointage :
..
9.8. Soit
II
unepile
de dendrons surY;
on se donne deuxopérations:
..
9.8.1.
L’élagage (ELA) :
c’est uneopération
définie suril
X 1/ parl’application :
..
où (1..a
désigne
un dendronpointé
au noeud a,i.e., ayant
un noeud aétiqueté
par une lettre deA ; {
oc -(1.. /
a }adésigne
le dendron (x où l’on a effacé le dendron(1.. /
a sous le noeud aétiqueté
par une lettrepointée ~:
c’est lecomplémentaire
du dendron(1../a
par rapport à oc,complémentaire
dont un des termi-naux est nécessairement
étiqueté
par 1.9.8.2.
L’écussonnage (ECU) :
c’est une relation entreII
X ny etII
Xny
définie parl’application:
Condition Ecu :
si:
Alors on a:
On a par
conséquent
définioc(d (7r) oc)
en «écussonnant o 3
sur chacun des terminaux(as, 1)
de d
(7r)
à condition que la racinede p
porte la mêmeétiquette,
à unpointage près,
que ces terminaux.Par
élagage,
il est alorspossible
dedégager
une souchede EX ;
on stocke sur lapile fi
le dendron oc - en conservant,grâce
aupointage,
la mémoire du noeud terminal d’où l’on aélagué
ledendron
oela qui, nécessairement,
a une souche dans Y.L’écussonnage
permet ensuite de raccrocher le dendronoela
au noeud terminal d’où l’on étaitparti.
9.9. On définit maintenant une
grammaire
transformationnelle avecpile
GTP par la donnée du12-uple:
I/opération(
concaténation à droite » sur ~, lesapplications P,, P, ELA,
ECU ont été définies ci-dessus.Appelons
l’ensemble de cesopérations
etapplications.
La « concaténation à droite»permet
...
de construire une
pile TI
de dendronssur V
= V UA; grâce
àP 9"
onpointera
des racines de souchesdégagées
ensuite parélagage; l’écussonnage accrochera, après
transformationséventuelles,
les dendronsaux terminaux des dessus de
pile,
terminaux dont on agardé
la mémoire par lepointage.
1. On peut aussi écrire :
Va (vocabulaire d’arrêt) c V;
A cV;
V définit la forêt ~’.f1l est la base de la
grammaire:
c’est unbilangage
contenu dans ~’.~
est uneapplication
de f!4 dansFI qui
détermine des états initiaux depile:
~ est un ensemble de
souches,
engénéral fini;
9- s est un ensemblefini
de transformations entresouches de
~, qui
induisent des transformations entre dendrons de ~’.Si l’on connaît un état de
pile ~ (ce),
associé à un dendron oc de on cherche à transformer ocpar les transformations induites en utilisant tour à tour
pointages
etpile.
Les calculs s’arrêtentors que :
- soit aucune transformation n’est
applicable:
il y a alorsbloquage;
- soit le dendron
obtenu, après transformations,
est entièrementétiqueté
surYa
et deplus,
lecontenu de la
pile
est réduit au mot vide A.9.10. Soit ,I’
l’ensemble,
éventuellementinfini,
des transformations induites par l’ensemble fini f-s;- ..
on note 1 la relation sur II X Y, associée à 9-
Si Y’a est la forêt
étiquetée
surV a,
alors:9.1 l.l.
Proposition
7. Lagrammaire
G’induite par une GTP àpartir
d’uneK-grammaire
peutappartenir
à une clause
plus
élevée dans la hiérarchie desgrammaires.
On peut transformer le
langage
de KleeneLn
= { anb; n >, 1 } en Lnn
= { an1 } qui
ne peut être
produit
par aucuneK-grammaire.
9.11.2.
Proposition
8. Lagrammaire
G‘ induite par une GTP àpartir
d’uneC.F.-grammaire
peutappartenir
à une classeplus
élevée dans la hiérarchie desgrammaires.
Au dendron oc.. histoire du mot an bn de
Lnn,
on associe par une GTP un dendron ocnnn; seulsces dendrons oennn
appartiennent
aubilangage produit
par la GTP de baseLnn
et:9.11.3. Théorème 2. Les
grammaires
transformationnelles àpile
augmentent lapuissance
en faisantmonter dans la hiérarchie des
grammaires
àpartir
des classes de Kleene et « Context-free ».10.
GÉNÉRALISATION
DES GRAMMAIRES TRANSFORMATIONNELLES AVEC PILE 10.1. Pour formaliser les transformationslinguistiques,
nous avions commeobjectif (cf.
8.6.supra)
deformationnelles avec
pile
en introduisant des souches depolydendrons
et transformations entre souches depolydendrons qui
induiront des transformations entrepolydendrons (cf. [1]).
10.2. On peut introduire certaines restrictions
supplémentaires
en se donnant des contraintes sur l’ordred’application
destransformations;
on introduit pour cela un automate finiqui
contrôle le déroulement du calcul(voir Ginsburg-Partee [11]). Moyennant quelques complications
mineures dans lesdonnées,
notre démarche semble être une
approche
d’une formalisationadéquate
auxgrammaires
transforma- tionnelles « naiveso de N.Chomsky [5], [6] (et peut-être
de Z. S. Harris[12]),
bienqu’elle
soit moins fidèle à la lettrequ’une
formalisation comme celle deGinsburg-Partee [11].
Ces derniers ne fontappel qu’aux
concepts directementsuggérés
par le modèle et l’onpourrait
penser apriori
que notre formali- sation est moinséconomique
etplus
abstraitepuisque
nous avons introduit des concepts nouveauxcomme la
souche,
les transformations entre souchesqui
induisent des transformations entrepolyden-
drons. Il se pose en effet le
problème d’adéquation
dusystème
formel de la théorie naïve. Ce sont « des bonnes raisons» issues del’expérimentation
du modèle transformationnel(cf.
supra9) qui
nous ont faitintroduire ces nouveaux concepts
qui
ne se trouvent pasexplicitement
chez N.Chomsky.
Les concepts de souches et transformations entre souches ont-ils uneinterprétation linguistique ?
Et doit-on les considérer comme desopérateurs linguistiques ?
Sioui,
ils’agit
alors de caractériser à la suited’analyses linguistiques,
un ensemble de souchese,
un ensemble de transformations .Is,puis
deprocéder
à uneréduction de ces ensembles en vue
d’optimiser
lesystème
en prenant pour critère 1 la commodité desalgorithmes
deproduction
et de reconnaissance. Il est évident que les critères sonthiérarchisés;
lescritères
linguistiques
ont lapréséance
sur les critères decommodité; cependant, après réduction,
on peuts’interroger
sur lasignification linguistique
des ensembles réduits etenvisager
d’examiner si cesensembles réduits
n’appartiennent
pas à un niveauplus profond
etplus
abstrait que l’ensemble déterminé par lapremière analyse linguistique.
C’est par un balancementdialectique
entre différentesexigences
que l’on déterminera les « bons» ensembles. C’est
justement
à cause de laplus grande
abstraction desgrammaires
transformationnelles àpile
que nous pensonsqu’elles
contiennent unepartie isomorphe
auxgrammaires
transformationnelles formelles deGinsburg-Partee
et lesdépassent,
tout en étantpeut-être plus opérationnelles.
Nous devions nous assurer que les
grammaires
transformationnelles avecpile
nous sortaient dela classe C.F.
(cf.
théorème2),
ce que lesgrammaires
transformationnellessimples
nepermettraient
pas(cf.
théorème1);
ces dernières étaient unsystème
formelinadéquat
pour toute théorie naïve deslangues
naturelles mais fournissaient un résultat
négatif
intéressant:(C)
lestransformations simples
ne sont passuffisantes
pour caractériser àpartir
d’une base C.F.toutes les
phrases
d’unelangue
naturelle.Il nous fallait par
conséquent compliquer
la nature destransformations;
lapile
a introduit cettecomplication
enopérant
nonplus
desimples
substitutions aux noeuds des dendrons mais enopérant
localement à l’intérieur d’un dendron
grâce
aucouple
de concepts(pile, souche).
10.3. Plusieurs
problèmes
intéressants et ouverts se posent.10.3.1.
Interpréter
d’une manière satisfaisante la souche et examiner sapertinence linguistique (cf.
discussion en
10.2).
10.3.2. Lors d’un calcul
transformationnel,
peut-on dire que lapile
ait uneinterprétation linguistique?
~
1. Pour réduire, voire augmenter les ensembles sP et vs, d’autres critères devront intervenir : par exemple, le critère fourni par la génétique... C’est un faisceau de critères qui amènent à choisir les « bons» ensembles.
10.3.3. Peut-on décrire toutes les
phrases
d’unelangue
donnée avec un nombre raisonnable de soucheset transformations entre souches ? Y a-t-il des relations entre
phrases
dont les GTP ne rendront pascompte ?
10.3.4.
Guinsburg-Partee
annoncent, dans une remarque, que le modèle formelqu’ils
proposent[11]
engendre
tous les ensembles récursivement énumérables. Il serait intéressant de savoir si lesgrammaires
transformationnelles avec
pile produisent
les mêmesensembles;
il faudrait deplus
caractériser des restrictions sur la nature des transformations pour énoncer des résultats soitpositifs,
soitnégatifs (ce qui
estbeaucoup plus facile)
du genre: les restrictions du type... sont nécessaires pour caractériser unelangue
ou les restrictions du type... ne sont passuffisantes
pour caractériser unelangue.
10.4. Devant des
problèmes linguistiques
comme lesanaphoriques,
les diverses relatives(restrictives
ou
qualificatives...)
certains enchaînements d’énoncés dans lediscours,
certainsproblèmes
de subordi-nation,
nous songeons à utiliser desgrammaires transformationnelles « plus puissantes»
que les gram- maires transformationnelles àpile qui
y seront contenues. Pourcela,
on pense travailler par uneapproche catégorielle qui s’inspire
des travauxd’Eilenberg
etWright [9]
sur des structuresplus complexes
que le dendron et lapile:
la treille et la cascade(cf. [1], [2]).
BIBLIOGRAPHIE
[1] BARBAULT,
M. C. etDESCLÉS, J. P., "Approches
structurelle etcatégorielle
dusystème
de transitionavec
application
à la science du calcul et à lalinguistique mathématique",
thèses 3ecycle,
Facultédes
Sciences, Paris, 1970. [2]
"Vers un traitementautomatique
destextes",
àparaître 1972,
Revuede
linguistique appliquée.
[3] BERGE, C.,
Théorie desgraphes
et sesapplications, Paris, Dunod,
1958.[4] BRAINERD,
W.S.,
"Treegenerating regular systems", Information
andcontrol, 14, 1969,
pp. 217-231.[5] CHOMSKY, N., Syntactic
structures, LaHaye, Mouton,
1957(traduit
enfrançais :
Structures syn-taxiques, Paris, Seuil, 1969).
[6]
2014Aspects of the theory of
syntax,Cambridge, Mass.,
MITPress,
1965.[7]
"Formalproperties
ofgrammars",
Handbookof
mathematicalpsychology,
D.Luce,
E. Bush.E. Galanter
(eds.),
NewYork, John Wiley,
1963.[8] CHOMSKY,
N. etMILLER,
G.L’analyse formelle
deslangues naturelles, Paris, Gauthier-Villars/
Mouton,
1968.[9] EILENBERG,
S. etWRIGHT, J. B.,
"Automata ingeneral algebras", Information
andControl, 11, 1967,
pp. 452-470.[10] FRIANT, J.,
"Leslangages ’Context-Sensitive’ ",
Ann. Inst. HenriPoincaré,
Vol.III,
n° 1,1967,
pp. 35-180.
[11] GINSBURG,
S. etPARTEE, B.,
"A mathematical model of transformationalgrammars", Information
and
Control, 15, 1969,
pp. 262-334.[12] HARRIS,
Z.S.,
"Mathematical structure oflanguage", Inter-science,
NewYork, John Wiley,
1968.[13] GROSS,
M. etLENTIN, A.,
Notions sur lesgrammaires formelles, Paris, Gauthier-Villars,
1970.[14] PAIR,
C. etQUÈRE, A.,
"Définition et étude desbilangages réguliers", Information
andControl,
13, 1968,
pp. 565-593.[15] TESNIÈRE, L., Éléments
de syntaxestructurale, Paris, Klincksieck,
1966.[16] THATCHER, J.W., "Characterising
derivation trees of Context-Free grammarsthrough
agenerali-
zation of finite automata