J EAN -P IERRE D ESCLÉS I SMAIL B ISKRI
Logique combinatoire et linguistique : grammaire catégorielle combinatoire applicative
Mathématiques et sciences humaines, tome 132 (1995), p. 39-68
<http://www.numdam.org/item?id=MSH_1995__132__39_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1995, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LOGIQUE
COMBINATOIRE ETLINGUISTIQUE :
GRAMMAIRE
CATÉGORIELLE COMBINATOIRE
APPLICATIVEJean-Pierre
DESCLÉS1,
IsmailBISKRI1
RÉSUMÉ 2014
La Grammaire Catégorielle CombinatoireApplicative
étend la GrammaireCatégorielle
Combinatoire de Steedman par une association canonique entre les
règles
et des combinateurs de Curry d’une partet l’utilisation de métarègles qui contrôlent les opérations de changement de type d’autre part. Ce modèle est inclus dans le modèle
général
de la GrammaireApplicative
etCognitive
(Desclés) avec trois niveaux de représentation : (i) lephénotype
(expressions concaténées) ; (ii) legénotype
(expressionsapplicatives) ;
(iii) les représentations cognitives (sens desprédicats linguistiques). L’objectif de
cet article est : (i)l’analyse
automatiquedes expressions phénotypiques ; (ii) la construction des expressions applicatives sous jacentes aux énoncés analysés. L’analyse théorique est appliquée aux
problèmes
de lapseudo-ambiguité
et de la coordination.SUMMARY 2014 Combinatory logic and linguistics : applicative and combinatory categorial grammar
Applicative and
Combinatory
Categorial Grammar is an extension of Steedman’sCombinatory
CategorialGrammar
by
a canonical association between rules and Curry’s combinators on one hand and metarules which control type-raising operations on the other hand. This model is included in the general framework ofApplicative
and Cognitive Grammar (Desclés) with three levels of representation : (i) phenotype (concatened expressions) ; (ii) genotype (applicative expressions) ; (iii) the cognitive representations (meaning oflinguistic predicates).
The aim of the paper is : (i) an automatic parsing ofphenotype expressions that areunderlying
tosentences ; (ii) the
building
of applicative expressions. The theoreticalanalysis
isapplied
to spuriousambiguity
and coordination.
1.
LINGUISTIQUE
ETTHÉORIE
DE LADÉMONSTRATION
Sous
sa forme
observable(représentation concaténée),
un énoncépeut
être considéré comme une suite de mots ordonnés selon desrègles syntagmatiques qui
ne reflètent pas forcément l’ordre danslequel
les motss’appliquent
les uns aux autres pour construirel’interprétation sémantique
fonctionnelle. Cette dernière estexprimée
par une structuresous-jacente
à l’énoncé(pour
nous : une structureapplicative),
construite au moyen del’opération fondamentale
del’application
d’unopérateur
à unopérande.
Il n’est pastoujours
facile de reconstituer lastructure
applicative sous-jacente
à un énoncéobservable,
carplusieurs phénomènes
destructurations
linguistiques
sontintriqués
dans la chaînesyntagmatique.
1 Centre
d’Analyse
et de Mathématique Sociales,équipe
de recherche LaLIC, Université de Paris-Sorbonne.Nous reprenons une distinction
proposée
par S. K.Shaumyan (1965, 1977, 1987), reprise puis
étendue ultérieurement par J. P. Desclés(1990).
Une telledistinctioni
met enparallèle
deux niveaux dereprésentation
etd’analyse
deslangues :
lephénotype
et legénotype.
- Le niveau du
phénotype
est ce que nouspourrions appeler
un "niveau de surface"(représentation concaténée)
assez directement observable. Il est caractérisé par l’ensemble des traitsspécifiques
à unelangue particulière (morphologie, syntaxe, etc.).
Il faitapparaître
entreautres en
particulier
l’ordre et laposition
des mots dans unephrase.
- Le niveau du
génotype,
selon S.K.Shaumyan, comprend
unepartie organisée
comme unlangage
formelappelé
"lelangage génotype".
S.K.Shaumyan
cherche à décrire et à formulertous les invariants
sémiotiques
constitutifs deslangues
naturelles sous formed’opérations
et derelations. En outre,
l’interprétation sémantique
fonctionnelle d’unephrase
estreprésentée
parune
expression applicative
dulangage génotype.
Lelangage génotype
est alorsengendré
parune
grammaire
dite"applicative" qui
se veut "universelle". Ce dernier terme estpris
au doublesens suivant :
(i)
caractériser des invariants et établir desformulations
universelles descatégories grammaticales
deslangues (c’est
à direindépendantes
desencodages morpho- syntaxiques
dans unelangue particulière) ; (ii)
caractériser de manière idéale la fonctionlangagière qui
"s’incarne" danschaque langue
naturellespécifique
en établissant unmorphisme
du
langage génotype
vers les différenteslangues phénotypiques.
Lelangage génotype
estencodé dans
chaque langue particulière
par desprocédures spécifiques. Chaque langue
estreprésentée
au niveau dugénotype
par desexpressions métalinguistiques.
Nous sommesamenés à
adopter
la démarche(Desclés, 1990 : 216) qui
associe à toutephrase
d’unelangue
naturelle une
expression applicative :
étant donnée unelangue
naturelle(LN)
que l’onpeut
considérer comme un ensemble dephrases empiriques (au
moins enpremière approximation), chaque phrase
de LN est alorsreprésentée
par uneexpression applicative
d’unsystème applicatif
Nous ne considérons pas les énoncés comme de
simples
suites concaténées de mots, maiscomme des
organisations
d’unitéslinguistiques qui
fonctionnent comme desopérateurs appliqués
à desopérandes.
Cetteorganisation applicative
n’est pas directement observable dans lephénotype sous-jacente
auxphrases
et auxénoncés ;
elle devientcependant explicite
dans legénotype.
Eneffet,
dans lephénotype,
lesopérateurs
ne sont pastoujours contigus
à leursopérandes puisque l’organisation phénotypique
desphrases dépend
despropriétés d’encodage
du
génotype
dans lephénotype (ordre
des mots,morphologie, ...). Cependant,
même sil’organisation applicative n’apparaît
pas directement au niveau duphénotype,
la dichotomieopératoire qui analyse
certaines unitéslinguistiques
dans un énoncé comme desopérateurs
etd’autres comme des
opérandes serait, elle,
constitutive dulangage.
Cette dichotomie devraitnous
permettre
de reconstituer par uneprocédure explicite
l’ordreapplicatif, sous-jacent
auxénoncés. Le
principe
d’unecorrespondance
entre un ordre concaténé duphénotype
et un ordreapplicatif
dugénotype peut
être formulé comme suit : tout énoncé estreprésentable
par uneexpression applicative (opérateur-opérande) qui
reconstruit l’ordreapplicatif
des unitéslinguistiques
concaténées dans l’énoncé.Les
problèmes
que nous devons résoudre sont :1) Quelle
est laprocédure
effective(éventuellement programmables) qui permettrait
d’associer àun énoncé sa
représentation applicative sous-jacente ?
1 Zlatka Guentcheva-Desclés (1976) associe la distinction
phénotype/génotype,
proposée parShaumyan,
à ladistinction qui existe entre langue et langage. La
langue
est organisée dans un systèmelinguistique
composéessentiellement de signes. Cette organisation est sujette à des critères propres à une communauté
linguistique
donnée. Le
langage
est la capacité de l’homme à exprimer et à communiquer des idées. Cette capacité est mise enoeuvre au moyen d’un système de signes vocaux
(paroles)
ou graphiques.ii) Étant
donnée uneexpression
bien formée dulangage génotype,
commentengendrer
l’énoncédans une
langue phénotypique particulière ?
Le
premier problème
est uneanalyse qui
conduit à unereprésentation,
le second est unproblème
degénération.
Nousallons,
dans cetarticle,
montrerquelles
sont lespropriétés formelles
mises en oeuvre dans laprocédure
effective que nous proposons. Dans la résolutiondu
premier problème,
nous souhaitons résoudre en même temps deuxsous-problèmes :
i)
construire pourchaque
énoncé uneanalyse syntaxique
correcte(dans
le cadre que nous allonspréciser) ;
ii)
construire unereprésentation applicative qui
donnera uneinterprétation
fonctionnelle de l’énoncé.L’interprétation
fonctionnelle des deux énoncés élémentaires suivants :( 1 )
Jean aime Marie(2)
Marie aime Jeanconduit à deux
représentations
distinctes. Eneffet,
lalangue française place
engénéral
lesujet
avant le
verbe ;
cette indication nouspermet
decomprendre
que lapremière phrase signifie
"Jean aime une personne
prénommée
Marie". La secondephrase signifie
que "Marie aime une personneprénommée
Jean". Dans legénotype,
nous avons deux constructionsapplicatives
distinctes
qui
sont deuxinterprétations sémantiques
fonctionnelles de(1)
et de(2).
( l’ ) ((aime Marie) Jean) (2’ ) ((aime Jean) Marie)
Dans cette
interprétation sémantique fonctionnelle,
le "verbe" transitifaime,
est considérécomme
opérateur
"à deuxplaces" ;
ils’applique
à"l’objet"
defaçon
à construire un autreopérateur qui
lui mêmes’applique
au"sujet"
pour construire laproposition sous-jacente
à laphrase.
Un certain nombre de modèles fondés sur les
types syntaxiques
existent. Le modèlequi correspond
à laconceptualisation
des unitéslinguistiques
commeopérateur
ouopérande,
celuides Grammaires
Catégorielles,
utilise des méthodeslogiques
pour rendrecompte
de lasyntaxe
deslangues (et, particulièrement,
de lasémantique).
Les travaux deAjdukiewicz (1935),
Bar-Hillel
(1953), Curry (1958),
Lambek(1958, 1961), Montague (1974),
Geach(1972), Shaumyan (1987),
Steedman(1982, 1989), Moortgat (1988),
Bach(1984),
utilisent uneanalyse syntaxique
sansrègles
de réécriture comme les modèleschomskyens
ou modèlesapparentés
le font. Les GrammairesCatégorielles
substituent un calcul sur destypes
à un traitement sur des unitéslinguistiques.
Un intérêtparticulier
fut réservé auxdéveloppements
desGrammaires
Catégorielles depuis
les travaux de M. Steedman(1982, 1989)
et d’E. Bach( 1981, 1984).
Les Grammaires
Catégorielles conceptualisent
leslangues
comme dessystèmes d’agencement
d’unitéslinguistiques (mots, morphèmes, lexies, ...)
dont certaines fonctionnentcomme des
opérateurs
alors que d’autres fonctionnent comme desopérandes,
cequi
se traduitpar une
assignation
àchaque
unité(en général lexicale)
d’un ou deplusieurs types qui précisent
d’une
part,
si l’unité fonctionne comme unopérateur
ou unopérande
et d’autrepart,
commentun
opérateur s’applique
unopérande.
Les Grammaires
Catégorielles présentent
un défautmajeur :
lapseudo-ambiguïté (spurious ambiguity).
Unephrase simple
nonambiguë peut
avoirplusieurs analyses syntaxiques possibles qui
necorrespondent qu’à
une seuleinterprétation sémantique
fonctionnelle. Prenons
l’exemple
de laphrase
Jean aimeMarie ;
nous pouvons vérifier que le verbe(aime)
estprécédé
par unsujet (Jean), puis
que le constituant formé par ces deux unités(Jean
etaime)
est suivi par unobjet (Marie).
Nous pouvonségalement
vérifier que le verbe(aime)
est suivi par unobjet (Marie), puis
que le constituant formé par les deux unités(aime
etMarie)
estprécédé
par lesujet (Jean).
Nous avons donc deux calculspossibles qui
vérifient que laséquence
Jean aime Marie estsyntaxiquement
correcte. Ces deuxanalyses syntaxiques
ontcependant
une seuleinterprétation sémantique,
laphrase
n’étant pasambiguë (ni syntaxiquement,
nisémantiquement).
Comme lesignale (Lecomte, 1994),
les différentesanalyses
issues duproblème
de lapseudo-ambiguïté correspondent
en fait à des déductions différentes dans lesystème catégoriel employé,
maiscorrespondent
à un même "théorème". D note aussi que ceproblème
n’est pas propre à lalinguistique,
car on le retrouve aussi dans la théorie de la démonstration enlogique.
Plusieurs voies sont
explorées
pour résoudre cettequestion,
nous citerons entre autrescelle des réseaux de preuve
(Roorda, 1992) (Lecomte, 1992, 1993)
ou encore celle que nousenvisageons :
unestratégie d’analyse quasi-incrémentale
degauche à
droite. Cette dernièrestratégie
est motivée parplusieurs facteurs2 :
i)
Lapossibilité
de construire une seule déductionparmi
l’ensemble des déductionspossibles
sans nous faire
perdre
d’informations : toutes les déductions démontrent un même "théorème"correspondant
autype
d’unephrase syntaxiquement
correcte ; cettestratégie
élimine lapseudo- ambiguïté.
ii)
L’efficacité"computationnelle" .
L’efficacité de laprocédure
estthéorique puisque
nousconstruisons une seule
déduction ;
l’efficacité estpratique puisque
lastratégie
retenue conduit àune
implémentation opératoire économique.
Il a été
proposé
dans(Biskri, 1995)
l’automatisation d’une méthodeeffective.qui
relie unénoncé du niveau
phénotypique
à uneanalyse applicative sous-jacente exprimée
dans legénotype.
La GrammaireCatégorielle
CombinatoireApplicative (GCCA)
est unsystème3
quenous allons décrire dans
l’article,
(i)
reconnaît lesphrases syntaxiquement
correctes ;(ii)
construit uneinterprétation sémantique
fonctionnelle de l’énoncé. La construction de cetteinterprétation
se fera au moyen des combinateurs de lalogique
combinatoire deCurry
introduitsprogressivement
par desrègles
d’introduction.Techniquement,
une associationcanonique
sera établie entre desrègles
inférentielles surles
types (interprétables
par descatégories syntaxiques
et des combinateurs de lalogique
combinatoire de
Curry (1958).
Une
analyse
fondée sur la GrammaireCatégorielle
CombinatoireApplicative (GCCA)
s’effectue en deux
grandes étapes :
2 Des études obtenues en psychologie semblent montrer que notre compréhension d’une phrase est plutôt quasi- incrémentale, autrement dit
l’acquisition
du sens est graduelle etchaque
mot dans une phrase contribue à cette construction graduelle du sens (Haddock, 1987) (Steedman, 1989) (au moins lorsque nous procédons à une analyse syntaxique de la phrase).3 Ce système fonctionnera comme une compilation.
(i)
Lapremière étape
s’illustre par la vérification de la bonne connexionsyntaxique
et laconstruction de structures
applicatives
avec des combinateurs introduitsprogressivement
àcertaines
positions
de la chaînesyntagmatique.
Desmétarègles
seront utilisées pour contrôler le déclenchement de certainesrègles
d’introduction.L’expression
obtenueappartient
aulangage génotype.
(ii)
La deuxièmeétape
consiste à utiliser lesrègles
deP-réduction
de lalogique
combinatoire defaçon
à construire une autre structureapplicative
en éliminant successivement tous les combinateurs introduits à lapremière étape
defaçon
à construire la "forme normale"(c’est
àdire
irréductible) ;
cette dernièreexprime l’interprétation sémantique
fonctionnelle de l’énoncé d’entrée. Ce dernier calculs’effectue
entièrement dans legénotype.
La GCCA et les combinateurs inscrivent ce travail dans une
approche
fondée sur unethéorie de la preuve considérée comme un outil de traitement
linguistique.
Nous avons pourobjectif
l’établissement de liens solides entrelinguistique théorique,
théorie descatégories,
théorie de la
démonstration, informatique théorique,
afin de faireémerger
despropriétés mathématiques
etlogiques qui
seraientsous-jacentes
aux structureslinguistiques.
2. LES GRAMMAIRES
CATÉGORIELLES
Nous retrouvons les
origines philosophiques
des Grammairescatégorielles
dans les travaux duphilosophe
Husserl(1913).
Cedernier, reprend
uneopposition
traditionnelledepuis
les Grecset
distingue
lesexpressions catégorématiques
desexpressions syncatégorématiques.
Il est eneffet
impossible
d’admettre selon lui quen’importe quel symbole grammatical
soit doué d’unesignification indépendante
des éléments surlesquels
ilporte :
lessyncatégorèmes
ont unesignification "incomplète".
C’est ainsi que lesexpressions qui
sont pourvues d’unesignification
sont lesexpressions catégorématiques,
ellesapparaissent
sous formes desyntagmes
nominaux ou d’énoncés et lesexpressions qui
ne sont pas pourvues d’un senscomplet
sont lesexpressions syncatégorématiques.
Avec cesexpressions
unesignification complète
n’est obtenue queconjointement
avec lessignifications partielles
d’autresparties
dudiscours.
Pour sa part, le
logicien polonais
Lesniewski aexpliqué
que saconception
descatégories sémantiques esquissée
par lui en 1922reprenait
la tradition descatégories aristotéliciennes,
desparties
du discours de lagrammaire traditionnelle,
etenfin,
descatégories
designification développée
par Husserl. Il a retenu deux sortesd’expressions:
les noms et lespropositions.
Lesnoms sont des
expressions linguistiques qui
servent àdésigner
des entitésobjectales
ou desclasses de telles entités. Les
propositions
sont desexpressions linguistiques qui
sont construites par une énonciation visant àreprésenter
un "état de chose" comme"objet
intentionnel". En dehors de ces deux sortes decatégories fondamentales,
les autresexpressions
dulangage
serontdes
syncatégorèmes.
’
Partant de cette
classification,
nous pouvons constater que lesexpressions syncatégorématiques fonctionnent
comme desopérateurs qui
contribuent à constituer desexpressions catégorématiques.
C’est enreprenant
cetteclassification,
ébauchée donc par Husserl etLesniewski,
que K.Ajdukiewicz (1935), puis
Y. Bar-Hillel(1953)
et enfin J.Lambek
(1958, 1961)
ontproposé
différentssystèmes
formels pour vérifier la bonne connexionsyntaxique
desexpressions linguistiques.
Cessystèmes formels,
que nous dironsclassiques,
sontdésignés
sous le nom de : "GrammairesCatégorielles".
Ilscomportent
un ensemble decatégories
divisées en deux classes : lescatégories
de base et les différentescatégories d’opérateurs, également appelées
foncteurs.Les Grammaires
Catégorielles assignent
descatégories
aux unités(lexicales
etmorphèmes)
du dictionnaire. La bonne connexionsyntaxique
est vérifiée ensimplifiant
successivement les
catégories.
Unephrase
est une unitélinguistique qui
a une bonne connexionsyntaxique qui
sesimplifie
en unecatégorie
dephrase.
Une Grammaire
Catégorielle
est donc définie pour la donnée d’uneassignation
descatégories
à ses unitéslinguistiques.
Lasimplification
descatégories
revient à effectuer uncalcul inférentiel sur les
catégories
et non pas sur les unitéslinguistiques.
Onconceptualise
donc les Grammaires
Catégorielles
comme dessystèmes inférentiels
de types en considérantchaque catégorie
comme un type.Une Grammaire
Catégorielle
est donc déterminée par différentstypes
d’unitéslinguistiques (on
dira différentes unitéstypées).
Toute l’information pour vérifier la bonne connexion desphrases (plus généralement
dessyntagmes)
est donnée par lestypes assignés
aux unités
linguistiques
de lagrammaire.
Système inférentiel
de typesOn considère donc maintenant les
types
de base et lestypes
dérivés.L’ensemble des
types
est défini comme suit :(To)
lestypes
de base sont destypes ;
(Ti )
Si X et Y sont destypes
alors X/Y et XBY sont destypes ; (T2)
Si X et Y sont destypes,
X-Y est untype.
Une entité "e"
(unité linguistique
parexemple) qui
est detype X,
sera notée"[X : e]".
Les
types
dérivés X/Y et XBY se lisentrespectivement
"X sur Y" et "X sous Y".L’interprétation
de cestypes
dérivésest fonctionnelle :
ilsreprésentent
letype
d’unopérateur qui
a pour argument une entité detype
X etqui
donne pour résultat une entité detype
X.L’interprétation
fonctionnelle se déduit des deuxrègles applicatives (avant
etarrière)
suivantes :Nous nous donnons deux
règles
d’inférences sur lestypes,
directement associées auxrègles applicatives précédentes :
Les
règles signifient
que des deuxtypes contigus
etprésents
dans cet ordre dans laprémisse,
on en infère letype
de la conclusion.La
concaténation,
notée’-’,
destypes peut s’interpréter
comme une concaténation ou unproduit
cartésien. ’A titre
d’exemple élémentaire, assignons
aux unités lexicales suivantes leurscatégories :
,où N
désigne
lacatégorie
des unités nominales et S lacatégorie
desphrases.
La vérification de la bonne connexionsyntaxique
de laphrase
Jean admire Marie s’effectue comme suit :puis
l’on a lessimplifications
suivantes :Un calcul sur les types est caractérisé par le
système
suivant :où To est un ensemble de
types
debase ;
-,/, B
sont desopérations
constructeurs detypes ;
-est une relation de
préordre
sur lestypes
de Tengendré
par les constructeurs àpartir
de To. Larelation - est une réduction entre
types.
Le calcul de Lambek L est un calcul sur les
types
tel que l’on ait les trois axiomes et lesrègles
d’inférence suivantes :4 En substituant à T ou à ‘1’ le symbol de
l’implication
‘~’ et sanss’occuper
de l’ordre des hypothèses de la prémisse, on obtient le schéma du nwdus ponens propositions :Cette analogie est à la base de
l’isomorphisme
deHoward-Curry.
Réflexivité
Associativité de la concaténation Associadvité de la concaténation
Transitivité
Curryfication à droite
Cunyfication à gauche
Décurryfication à droite
Décurryfication à gauche
On en déduit les théorèmes suivants :
Application
Changement de type
Composition fonctionnelle de types Division des types
Permutations
Règles dérivées
Ces théorèmes
expriment
de nouvelles réductions sur lestypes spécifiques
au calcul deLambek. Tous ces théorèmes sont déduits des axiomes et des
règles précédents.
REMARQUE.
Outre la réductionapplicative qui
estexprimée
par le théorème(TL2), l’originalité principale
du calcul de Lambek se trouve dans l’introduction des théorèmes(TL3)
et(TL4).
Le théorème(TL3) (changement
detype)
estappelé
dans la littérature"type-raising". TI
aété
proposé
par Lambek dans sonanalyse
des pronoms(Desclès, 1990)6.
5 M. Hepple (1991) et M. Moortgat (1988) désignent cette règle par : règle d’associativité.
L’appelation
est dangereuse,l’interprétation
fonctionnelle des types n’est pas associative.Nous verrons dans la section 5 que cette règle introduit
plutôt
la notion depermutation.
6 Nous invitons le lecteur à consulter le livre de Jean Pierre Desclès (1990) pour avoir une appréciation plus complète sur le sujet. Il y trouvera certainement plus de détails sur les motivations
syntaxiques
etsémantiques
du changement de type et de la composition.La Grammaire
Catégorielle
Combinatoire(Steedman 1982, 1987, 1989)
tend àgénéraliser
les GrammairesCatégorielles
deAjdukiewicz,
Bar-Hillel et de Lambek. Cettegénéralisation reprend
l’idée des GrammairesCatégorielles classiques,
que les unités deslangues
naturelles sont des foncteurs et desarguments
de différentstypes ;
elle se donne enoutre certaines
opérations
sur lestypes (opérations
unaires etbinaires).
Les
opérations7
que nous décrivonsplus
loin sont :· La
composition fonctionnelle8 (opération binaire)
et lechangement
detype (opération unaire)
dont l’inclusion dans la
syntaxe
destypes
a unprécédent
avec les travaux de Lambek(1958, 1961)
et Geach(1972).
- La substitution fonctionnelle
(opération binaire) proposée
par Szabolcsi(1987).
Le calcul sur les
types
est donné par lesrègles
d’inférence suivantes :Dans le cadre de la Grammaire
Catégorielle
Combinatoire lescatégories
sont vues à la foiscomme des
objets syntaxiques
etsémantiques.
elles sontreprésentées
par une structure de donnéeinformatique unique
dans le but de réaliser uneimplémentation
d’unanalyseur,
baséesur l’unification
(Zeevat, Klein, Calder, 1986), (Pareschi, Steedman, 1987). Ainsi,
à uneanalyse syntaxique,
fondée sur un calcul inférentiel sur lestypes
est associé un calcul fondé surle lambda-calcul pour construire
l’interprétation
fonctionnelle. La construction del’interprétation
fonctionnelle estparallèle
à la constructionsyntaxique.
7 Ces nouvelles opérations permettent
d’analyser
des énoncés d’une façon quasi-incrémentale.8 L’introduction
d’opérations
fonctionnelles telle que la composition a l’effet de généraliser la notion de constituant de surface en ce sens que les verbes et les syntagmes verbaux ne sont pas les seuls constituants. Desséquences comme peut écrire et Jean peut le sont aussi. Prenons le cas de peut écrire, un verbe comme pouvoir
est un foncteur qui prend comme argument un syntagme verbal, il est donc permis de le composer avec un autre foncteur ayant un type approprié comme écrire qui est une fonction de N dans SBN.
Dans cette
optique
lacatégorie
du verbe aimer est la suivante :Avec cette notation
(Steedman, 1989),
les typessyntaxiques
sont en lettresmajuscules,
les constantes
sémantiques
portent dessymboles (’),
les lettres minuscules sont des variablessémantiques.
Chaque règle
est en même tempssyntaxique
etsémantique.
Lesrègles
combinatoires que propose donc Steedman sont :Aux
règles
ettypes syntaxiques proposés
parSteedman,
sont associées desinterprétations sémantiques qui
nouspermettent
de rendrecompte
del’aspect
fonctionnel des énoncés. Steedman propose un calcul fondé sur le lambda-calcul et l’unification pour construirel’interprétation sémantique.
L’effet immédiat de la
règle
dechangement
detype
est depermettre
autype
fonctionnel obtenu àpartir
dutype
del’argument
Jean de se composer avec letype
duprédicat aime ;
cequi
déclenche uneopération
d’unification. Cettecomposition
detypes
étantpermise
par lesrègles
decomposition
fonctionnelle.Les
principaux objectifs
visés par Steedman avec le modèle de la GrammaireCatégorielle
Combinatoire sont d’une
part
éliminer leproblème
de lapseudo-ambiguïté
par unestratégie d’analyse quasi-incrémentale
de"gauche
à droite" et d’autrepart analyser
des énoncés que le modèle deAjdukiewicz-Bar-Hillel
nepeut
pasanalyser.
3. LA GRAMMAIRE
CATÉGORIELLE
COMBINATOIRE APPLICATIVEComme nous l’avons annoncé au début de cet
article,
notre travail consiste à relier lephénotype
au
génotype
à travers l’utilisation d’unsystème
formel : la GrammaireCatégorielle
Combinatoire
Applicative (GCCA).
Nous considérons dans la GCCA que les
règles
de la GrammaireCatégorielle
Combinatoire dé Steedman introduisent les
combinateurs9 B, C *,
S dans laséquence syntagmatique.
Cette introductionpermet
de passer d’une structure concaténée à une structureapplicative.
Plus
concrètement,
GCCA établit une associationcanonique
entre lesrègles catégorielles
combinatoires de Steedman et les combinateurs de la
logique
combinatoire deCurry.
Lesrègles catégorielles
auront pour rôle de vérifier la correctionsyntaxique
des énoncés. L’introduction des combinateurs dans la chaînesyntagmatique
dans unpremier temps
conduit à la construction desexpressions applicatives
dans un secondtemps
avec la réduction des combinateurs.L’association des
règles catégorielles
avec les combinateurs atteste que les deuxapproches,
enl’occurrence : la Grammaire
Catégorielle
Combinatoire deSteedman,
les deux niveaux dereprésentations
deslangues proposés
par S.K.Shaumyan
et J.P.Desclés, peuvent
êtrecomplémentaire.
Parailleurs,
nous soutenons aussi leprincipe (trivial peut être)
que la GrammaireCatégorielle
Combinatoireagit
sur des structuresconcaténées,
alors que les combinateursagissent
sur des structuresapplicatives.
Les
règles
de la GCCA sont :9..Voir
en annexe la notion de combinateur.Les
prémisses
desrègles
sont desexpressions
concaténéestypées ;
les résultats sont desexpressions applicatives (typées)
avec éventuellement introduction d’uncombinateur.
Lechangement
detype
d’une unité u introduit le combinateurC*;
lacomposition
de deux unités concaténées introduit le combinateur B et S. Avec cesrègles
nous pouvonsanalyser
unephrase
au moyen d’unestratégie quasi-incrémentale
"degauche
à droite". Le choix d’une tellestratégie
est motivé par le contrôle duproblème
de lapseudo-ambiguïté (Pareschi, Steedman, 1987) (Steedman, 1989).
Exemple :
La
première règle (>T) appliquée
à l’unitétypée [N : Jean]
transformel’opérande
enopérateur.
Elle construit une structureapplicative (C* Jean)
ayant pourtype S/(SBN).
L’introduction du combinateur
C*
illustre dans lareprésentation applicative
lechangement
detype : (C* Jean)
fonctionne comme unopérateur
avec sontype
fonctionnel. Larègle (>B)
combinent les unités
linguistiques typées [S/(SBN) : (C* Jean)]
et[(SBN)/N : aime ]
avec lecombinateur B de
façon
àpouvoir
composer les deux unités fonctionnelles(C* Jean)
et aime.Un traitement
complet
basé sur la GrammaireCatégorielle
CombinatoireApplicative
s’effectue en deux
grandes étapes :
(i)
lapremière étape
s’illustre par la vérification de la bonne connexionsyntaxique
et laconstruction de structures fonctionnelles avec des combinateurs introduits à certaines
positions
de la chaîne
syntagmatique,
(ii)
la deuxièmeétape
consiste à utiliser lesrègles
deP-réduction
des combinateurs defaçon
àformer une structure fonctionnelle
sous-jacente
àl’expression phénotypique. L’expression
obtenue est
applicative
etappartient
aulangage génotype.
La GCCAengendre
des processusqui
associent une structureapplicative
à uneexpression
concaténée duphénotype.
Il nous resteà éliminer les combinateurs de
l’expression
obtenue defaçon
à construire la "forme normale"(au
senstechnique
de la#-réduction) qui exprime l’interprétation sémantique fonctionnelle.
Cecalcul s’effectue entièrement dans le
génotype.
Le traitement que nous proposons donc
prend
la forme d’une"compilation"
dont lesétapes
sont résumées dans lafigure
ci-dessous :Traitons un
exemple simple :
Jean aime MarieStructure concaténée
typée
duphénotype
Structure applicative
typée
dugénotype
Forme normale du
génotype
Le
changement
detype (>T)
affectantl’opérande
Jeanpermet d’engendrer l’opérateur (C* Jean)
que larègle
fonctionnelle(>B)
compose avecl’opérateur
aime.L’opérateur complexe (B (C* Jean) aime) s’applique
àl’opérande
Marie pour formerl’expression applicative
dugénotype ((B (C* Jean) aime) Marie).
La réduction des combinateurs dans legénotype
construitl’interprétation sémantique
fonctionnellesous-jacente
àl’expression phénotypique
en entrée.3.1. La
réorganisation
structurelleL’analyse syntaxique
"degauche
à droite" soulève leproblème
du non-déterminisme introduit par laprésence
dans lalangue,
de modifieurs arrièresqui
sont desopérateurs qui s’appliquent
àl’ensemble ou une
partie
d’une structurepréalablement
construite.Si dans le
premier
cas l’utilisation d’unerègle d’application permet
lapoursuite
del’analysel°,
il en est autrement pour le second cas oùl’analyse "patine".
Pour unephrase
comme Jean aime Marie tendrement
l’analyseur produit
dans unpremier temps
le constituant[S : ((B(C* Jean) aime) Marie)].
Ce dernier n’est pas combinable avectendrement,
detype (SBN)B(SBN).
Eneffet,
tendrement est unopérateur qui
a commeopérande (aime Marie) positionné
à sagauche.
Uneanalyse quasi-incrémentale
de"gauche
à droite" favorisel’application
d’unerègle
combinatoire dès quepossible.
Ce facteur a pourconséquence
directed’
"enchâsser" 11
aime et Marie dans((B (C* Jean) aime) Marie),
cequi
évidemment ne nouspermet
pas de construire directementl’opérande (aime Marie).
Le
problème posé
revient à lapossibilité
d’un retour arrière. Mais ce retour arrière est denature à accroître le coût
"computationnel" (mémoire
ettemps d’exécution)
d’uneanalyse syntaxique. Cependant,
un retour arrière"intelligent" (que
nous allons proposerplus loin)
peutnous
permettre
de réduire considérablement ce coût tout en construisant desanalyses sémantiques
correctes et en éliminant lespseudo-ambiguïtés.
Ainsi un tel retour arrière
décomposera
le constituantdéjà
construit en deuxcomposantes
dont une se combine forcément avec le modifieur arrière.Formellement,
cetteopération
deréorganisation
structurelle s’effectue par les deuxétapes
successives suivantes: ’
a - La
réorganisation
du constituantdéjà
construit isole àchaque
fois deuxsous-catégories,
etteste si le modifieur arrière se combine à
gauchel2,
ou pas, avec une de ces deux sous-catégories.
Nousprocédons
ensuite à la réduction des combinateursjusqu’à
ce que le test nousdonne une valeur
positive.
A la fin du processus nousrécupérons
une nouvelle structureapplicative typée "équivalente"
à lapremière.
Exemple.
Dans le cas de l’énoncé Jean aime Marietendrement,
lesétapes
de laréorganisation
sont :Le constituant construit :
[S : ((B (C* Jean) aime) Marie)]
Les deux
sous-catégories
sont :[S/N : (B (C* Jean) aime)] ; [N : Marie]
Test :
[S/N : (B (C* Jean) aime)]
ne se combine pas àgauche
avec[(SBN)B(SBN) : tendrement]
[N : Marie]
ne se combine pas àgauche
avec[(SBN)B(SBN) : tendrement]
Réduction du combinateur B :
[S : ((C* Jean) (aime Marie))]
Les deux
sous-catégories
sont :[S/(SBN) : (C* Jean)] ; [SBN : (aime Marie)]
1o Prenons
l’exemple
de la phrase Jean frappa Marie hier où le modifieur arrière hier opère sur l’ensemble de laphrase
Jean frappa
Marie ; hier étant de type syntaxique SBS, il suffit, pour poursuivrel’analyse, d’appliquer
hierà Jean frappa Marie par la règle «).
11 C’est à dire que Marie
n’apparait
pas commel’opérande
directe del’opérateur
aimer.12 Dans notre
terminologie,
ul se combine à gauche avec u2 si une des règles suivantes , B, Bx, S, Sx, peut composer les types de u2 et ul ou si une des règles combinatoires peut composer les types de(C*
u2) et ui .Test :
[S/(SBN) : (C* Jean)]
ne se combine pas àgauche
avec[(SBN)B(SBN) : tendrement]
[SBN : (aime Marie)]
se combine àgauche
avec[(SBN)B(SBN) : tendrement]
Arrêt du processus de réduction des combinateurs. Nous
récupérons
en sortie lacatégorie:
[S : ((C* Jean) (aime Marie))].
b - La
décomposition
réaliséegrâce
aux deuxrèglesl3 :
Nous lisons ces
règles
comme suit :- Pour
(>dec):
Si nous avons une structureapplicative (u 1 u2)
detype X,
avec u 1 detype
X/Yet u2 de type
Y,
alors nous pouvons construire une nouvelleexpression
concaténée formée des deuxcatégories [X/Y : u 1 ]
et[Y : u2].
- Pour
«dec):
Si nous avons une structureapplicative (u 1 u2)
detype X,
avec u 1 detype
X1Yet u2 de
type Y,
alors nous pouvons construire une nouvelleexpression
concaténée formée des deuxcatégories [Y : u2]
et[XBY : ul].
Ces deux
règles
nous permettent de reconstruire un nouvel agencement concaténé de la structureopérateur/opérande
issue de laréorganisation.
Pour la
phrase
Jean aime Marie tendrement ladécomposition
estappliquée
à la structurequi
résulte de laréorganisation :
Avec la
règle (>dec),
nousproduisons l’agencement
concaténé :Ces deux
étapes
entrent dansl’analyse complète
de laphrase
Jean aime Marie tendrementcomme suit
(étape
5 pour laréorganisation
etétape
6 pour ladécomposition) :
13 Notons que les deux règles (>dec) et (dec) sont respectivement inverses des règles
d’application
fonctionnelle (>) et «).