A ARNE R ANTA
Structures grammaticales dans le français mathématique : I
Mathématiques et sciences humaines, tome 138 (1997), p. 5-56
<http://www.numdam.org/item?id=MSH_1997__138__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1997, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
STRUCTURES GRAMMATICALES DANS LE
FRANÇAIS MATHEMATIQUE :
I.Aarne
RANTA1
RÉSUMÉ 2014
Un système derègles grammaticales
estprésenté
pouranalyser
un fragment du français permettant l’expression de théorèmes et de preuves mathématiques. Pour cetobjectif,
ondéveloppe
une version dela grammaire de
Montague,
avec des catégories syntaxiques relatives au contexte et aux domaines d’individus. Cesystème peut être
interprété
dans la théorie constructive des types deMartin-Löf.
Il est appliqué, d’abord, au français sanssymboles mathématiques,
avec une attentionspéciale
aux restrictions de sélection et auxdépendances
par rapport à un contexte. Le fragmentcomprend
des verbes et desadjectifs,
des formesplurielles,
des propositions relatives, et des syntagmes coordonnés. Ensuite, la grammaire est étendue ausymbolisme
mathématique et à son usage dans le texte français. Lefragment comprend
desformules
arithmétiques, la notation décimale, les conventions deparenthèses,
les variablesexplicites,
des énoncés de théorèmes et des structures textuelles de preuves. Onfinit
par étudierquelques applications
de la grammaire, basées surl’implémentation
déclarative de la grammaire dans ALF, un éditeur de preuves.
SUMMARY 2014 Grammatical Structure in Mathematical French: I.
A system of
grammatical
rules ispresented
toanalyse
a fragment of French that permits the expression ofmathematical theorems and proofs. To this end, a version of Montague grammar is
developed,
with syntactic categories relativized to a context and to domains of individuals. This system can beinterpreted
in theconstructive type theory of Martin-Löf. It is first
applied
to French without mathematicalsymbols,
paying special attention to selectional restrictions and todependencies
on context. The fragment includes verbs andadjectives, plurals,
relative clauses, and coordinated phrases ofdifferent
categories. Second, the grammar is extended to mathematicalsymbolism
and itsembedding
in French text. The fragment comprises arithmeticalformulae,
decimal notation,parenthesis
conventions,explicit
variables, statementsof
theorems, and textualstructures of
proofs. Finally,
someapplications
of the grammar are studied, based on a declarativeimplementation
in theproof editor
ALF.INTRODUCTION
Le
langage mathématique peut
être décrit par deuxtypes
derègles.
Lesrègles
de gram-maire,
dans le senstraditionnel,
concernent le textemathématique
commen’importe quel
texte : sa construction
grammaticale
doit être correcte. Mais la correctiongrammaticale,
dans le sens
traditionnel,
ne suffit pas pourqu’un
textemathématique
soitcomplètement
correct. Il lui
faut, aussi,
satisfaire à certainesrègles mathématiques.
Parexemple,
si on1 Département de
Philosophie,
B.P. 24, 00014 Université d’Helsinki, Finlande.Cet article est une synthèse du travail
dont j’ai
eu l’occasion de présenter des extraits à Paris et à Nancy en février1996. Je suis reconnaissant aux publics de ces conférences pour leurs remarques et, en particulier, à M. Bourdeau
et J.-P. Desclés, de l’Université de Paris-Sorbonne, à D. Lacombe, de l’Université de Paris VII, et à C. Retoré, de l’INRIA Lorraine, pour les entretiens privés sur les thèmes de l’article. P. Martin-L~f, de l’Université 0153 Stockholm, m’a aidé pendant tout le travail par ses critiques et conseils. U.
Egli,
de l’Université de Constance, A. Lecomte, de l’Université de Grenoble et P.Màenpàg
de l’Université d’Helsinki ont lu la première version 0153 l’article et fait des remarques pertinentes sur le contenu. En outre, M. Bourdeau et A. Lecomte ont corrigé le français des versions préliminaires. Les fautes qui restent dans la version finale sont miennes.parle
de lafonction
inverse def,
il faut quef
soitbijective. Autrement, l’expression
lafonction
inverse def
nedésigne
aucunobjet mathématique.
Ces conditions
mathématiques peuvent
être caractérisées comme des conditions sé-mantiques :
elles concernent lasignification
desexpressions plutôt
que leur structuregrammaticale.
Mais si onaccepte l’objectif classique
de lagrammaire, qui
est de décrireles
expressions
de lalangue
commesignifiantes
- ou, en termesmodernes,
lalangue
comme un
système
de communication - on voitqu’il
y a des conditionssémantiques qui
concernent la constructiongrammaticale.
Un nom doitdésigner
unobjet individuel,
une
phrase
doitexprimer
uneproposition,
etc. - Uneexpression qui
nedésigne
aucunobjet
dutype qu’il
lui faudrait est mal formée.C’est surtout dans la
linguistique
formelle que lesquestions
designification
sontparfois séparées
de lagrammaire, qui
est conçue comme« syntaxe
pure », pour être étudiéesplus tard,
dans un« composant sémantique ».
Lagrammaire
deMontague
estune
exception remarquable.’
SelonMontague,
une telleapproche
n’estguère possible,
parce
qu’une syntaxe
construite sans considérationssémantiques ignore
des distinctions essentielles : lesrègles
choisies à cause de leursimplicité superficielle
sonttrop simples
pour
qu’une sémantique
soit définissable pourelles.’
Uneleçon importante
deMontague
est que l’introduction de la
sémantique
dans lagrammaire
ne la rend pasplus
vague,mais,
aucontraire,
la force d’êtreplus rigoureuse
etplus explicite.
Même la
grammaire
deMontague
est insuffisante pour notreobjectif d’analyser
lelangage mathématique,
surtout pour la raisonqu’elle
est fondée sur la théoriesimple
destypes, qui
n’est pascapable d’exprimer
tout le contenumathématique
que nous voulonsexprimer.
C’est la théorie constructive destypes, développée
par Martin-Lôfdepuis
les années
70,~ qui
a ouvert lapossibilité
d’uneanalyse plus
exacte. Lesquestions qui peuvent
être étudiées dans cettethéorie,
mais non dans la théoriesimple
destypes,
incluent les restrictions desélection,
ladépendance
desexpressions
parrapport
à uncontexte,
etl’interprétation
des textes de démonstration.Les
grammaires logiques
sont habituellement formulées comme des théories de lalinguistique générale,
c.-à-d. sans se borner à lalangue mathématique.’
Mais si unegrammaire logique
estpossible
- cequi
est souvent mis enquestion
par ceuxqui pensent
que lalangue
naturelle « n’est paslogique » -
elle devrait l’être pour lefragment mathématique
de lalangue,
parce que c’est le domainepour lequel
lalogique
modernea été
développée originellement.
Toutes cesquestions d’ontologie,
depragmatique,
etd’ambiguïté, qui
sont tellement troublantesquand
on étudie lalangue
dans satotalité, peuvent
être bienappréhendées
dans lalangue mathématique.5
On n’a pas besoin defaire des idéalisations tout le
temps :
onpeut
donner unereprésentation
fidèle de lalangue elle-même. 6
1 Cf, la collection
Montague (1974),
ainsi que Chambreuil(1989).
ZCf.
Montague (1974,
p.210).
3Cf. Martin-Ldf
(1984).
4L’auteur de cet article n’est pas une exception. Ainsi Ranta
(1994)
puise ses exempleslinguistiques
dans le corpus
du langage
quotidien familier de beaucoupd’ouvrages linguistiques
et philosophiques.Mais les articles Ranta
(1995, 1996)
ont l’anglais mathématique comme leur thème. Lefragment
del’anglais
analysé dans ces articles-là est, cependant, plus limité que lefragment
du français que nous allons discuter dans cet article-ci.5Par exemple, il n’est pas évident que les objets de la vie quotidienne forment des ensembles, dans le sens mathématique, ce qui serait, pourtant, nécessaire pour que la quantification sur ces objets soit
bien définie.
’Si on veut donner une représentation fidèle d’une phrase telle que Jean airne Marie, on doit expliquer
la référence contextuelle des noms Jean et Marie - parce qu’il n’y a pas de personnes uniques qui
Toutefois,
il nous semble que la recherche sur lalangue mathématique
est intéressante aussi dupoint
de vue de lalinguistique générale,
comme une sorte de travail de labora-toire,
où onpeut
se concentrer sur desaspects
bien définis et isolés. Si lalangue,
danssa
totalité,
n’est paslogique,
une étudepartant
de cequi
estlogique
montrera avec unegrande précision
où les limites se trouvent.Nous n’avons pas rencontré
beaucoup
de recherche sur lalangue
informelle des mathé-matiques.
Une référenceimportante
sont les oeuvres de deBruijn, depuis
les années 60.Dans ses articles et dans ses conférences non
publiées,
il y abeaucoup
d’observationssur la structure du texte
mathématique.
Lasynthèse
de ce travail n’est pas,pourtant,
une étude
linguistique,
mais unlangage artificiel,
le vernaculairemathématique ( math-
ematical
vernacular), qui s’approche
aussiprès
de lalangue
naturelle quepossible
sanscompromettre l~univocité.7 .
-Une
grande part
de la recherche en théorie destypes
concerne ledéveloppement
des
systèmes
interactifs de preuve, tels queALF, Coq
etLEGO.g Puisque
les preuvesproduites
par cessystèmes
sontexprimées
enlangage formel,
elles ne sont lisibles que par desspécialistes
de la théorie destypes.
Ainsi on a étudié lapossibilité
de traduire les démonstrations formelles enlangue
naturelle. De tels programmes pourl’anglais
etpour le
français
ont été réalisés comme fonctions d’interface dessystèmes
depreuve.9
Uneapplication possible
de notre travail est un programmesemblable,
mais nousenvisageons
aussi la
possibilité
de traduire les textes informels en théorie destypes:
eneffet,
lagrammaire
que nousprésenterons
estsymétrique
parrapport
de ces deux tâches. En tout cas, laprécision
nécessitée par lesapplications computationnelles
sera un critèresous-entendu de notre
grammaire. L’implémentation
se réalise d’unefaçon
naturelle par l’utilisation de la théorie destypes
commelangage
deprogrammation.10
Tout en visant à la
précision sémantique,
nous ne voulons pascompromettre
l’exac- titude de lamorphologie,
ni nous contenter d’unelangue
trèsréduite,
ou minimale pour les besoinsd’expression. L’objectif
estd’analyser
toutes les combinaisons naturelles descatégories grammaticales
considérées. Enconséquence,
notregrammaire
pourra connaîtreplusieurs
milliersd’expressions
synonymes pour uneproposition
dequelque complexité.
Nous ne pensons pas que nous
puissions
direquelque
chose de nouveau sur lesgrands problèmes
de la structuresyntagmatique, qui jouent
un rôlemajeur
dans la rechercheen
syntaxe
formelle. Nous nous concentreronsplutôt
sur les structureslogiques qui échappent complètement
à lagrammaire syntagmatique.
En mêmetemps,
notreanalyse
des structures
syntagmatiques s’approche
de lagrammaire traditionnelle,
ou bien dela
grammaire
deMontague.
Lesrègles plus généralisantes
dessyntaxes contemporaines,
telles que la
grammaire syntagmatique généralisée,
noussemblent,
toutsimplement, trop
difficiles à combiner avec unesémantique
assez détaillée et fiable.La structure de l’article est la suivante : la section 1 discute
quelques questions générales
concernant la recherchegrammaticale.
La section 2 étudie lefrançais général,
c.-à-d. sans
symboles
ou autres structuresspécifiquement mathématiques.
La section3
présente
desrègles d’usage
dusymbolisme mathématique
dans le texte informel. Las’appellent ainsi - la référence implicite qu’elle fait au temps, et
l’ambiguïté
potentielle du verbeaimer. L’analyse de la phrase 3 est supérieur à 2 est beaucoup plus facile à compléter.
7Cf. la collection de Brui,in
(1994).
Le système antérieur et mieux connu de de Bruijn, Automate,introduit plusieur structures désormais centrales de la théorie des types, dont les types
dépendants
etles objets-preuves.
’V. les volumes 806 et 996 de
Springer
Lepture Notes in Computer Science.~Cf. Coscoy, Kan et Théry
(1994).
10Cf. Nordstrôm et al.
(1990).
section 4 contient des
exemples
et desapplications pratiques.
Cet article ne contient pas d’introduction à la théorie constructive des
types,
pourlaquelle
il y aplusieurs
textes facilement accessibles.Cependant,
le reste de cette in-troduction contient des définitions de caractère
général, qui
sont utilisées dans lesrègles grammaticales.
Ces sections peuvent êtresautées, puis
consultéesaprès
coup au besoin.Les
opérations logiques
Pour les
opérations mathématiques
etlogiques,
nous suivons la notationmathématique
conventionnelle
et,
s’iln’y en
a pas, la notation de Martin-Lof( 1984). Toutefois,
letypage
des
opérateurs syntaxiques
et de leursinterprétations
nécessite la théorie destypes
dite du niveausupérieur, qui n’y
est pasprésentée.
Ainsi nous suivons la notation de Ranta(1994), qui est,
en cequi
concerne la théorie du niveauinférieur, compatible
avecMartin-Lôf
(1984).
Il y a uneexception importante:
pour la substitution des termes al, ... , an aux variables Xl, ... , zn dans un terme c, nous écrivonsau lieu de
c(al, ... , an)
etc(al/xl,
...,an/ xn), qui
sont les notationsemployées
dansMartin-Lôf
(1984)
et Ranta(1994).
La nouvelle notation est celle du calcul des substi- tutions. Cette extension récente de la théorie destypes
estindispensable
à notre travailen formalisant la notion du
contexte,
et nous allons en résumer lesparties
utilisées dans la section suivante. Dans cettesection-ci,
nous résumons les définitions desopérations logiques.
Les
règles
du niveausupérieur comprennent
lesrègles
de la formation destypes, qui
sont le
type
desensembles,
dont chacun est lui-même untype,
ainsi que lestypes
defonctions,
où letype
d’arrivéepeut dépendre
del’argument
de la fonction :set :
type,
Le
type
despropositions
est identifié avec letype
des ensembles. Letype
des fonctionssans
dépendence
est défini comme un casspécial :
Les
règles générales
de la construction desobjets
sontl’application
et l’abstraction :Ces
opérations
sont reliées par deuxrègles
deconversion, {3
et q:Ces
règles
ne connaissent que des fonctions à uneplace,
mais lesfonctions
àplusieurs places
sont introduites par la convention notationnelleLa théorie du niveau inférieur - comme
n’importe quelle
théoriemathématique
-
peut
être introduite par desjugements
du niveausupérieur,
sansajouter
derègles
d’inférence. Les
opérateurs logiques
utilisés dans cet article sont définis àpartir
desopérateurs
par les
équations
Par
exemple,
la formuleest
écrite,
dans sa formeprimitive,
La
sémantique
des constanteslogiques
est définie par les formescanoniques
de leurspreuves,
qui correspondent
auxrègles
d’introduction :L’ensemble 1 n’a pas de
règles d’introduction,
cequi
le définit comme l’ensemble vide.La notation conventionnelle du niveau inférieur est définie par les
équations
qui suppriment
lesarguments
detypage.
Les
règles
d’éliminationcorrespondent
à des constantesnon-canoniques, qui
sontdéfinies par l’induction structurale sur les
arguments canoniques.
Nous en avons em-ployées
lesprojections gauche
et droite ainsi quel’application, 11
11 pour les autres règles d’élimination, par les constantes E, D et Ro, qui ne sont
employées
que dans la section 3.7, nous renvoyons. aux oeuvres de référence citées ci-dessus.dans les formes définies par les
équations
Les nombres naturels
canoniques
sont 0 et les successeurs,La
règle d’élimination,
c.-à-d. d’inductionmathématique,
permet
la définitionexplicite
desopérations arithmétiques
telles que l’addition et lamultiplication,
Les chiffres
1, 2, 3,...
sont utilisés comme abréviations des nombrescanoniques ;
la gram- maire de cette convention n’est pas tout à faitsimple,
comme montré par la section3.3.
Bien
entendu,
la notation bidimensionnelle desrègles
estbeaucoup plus
facile pour le lecteur humain queles jugements
du niveausupérieur,
et nousl’employons
dans toutesles
règles grammaticales.
La transformation d’unerègle
en unjugement
et vice-versasera évidente : les
prémisses correspondent
auxtypes
dedépart
et la conclusion autype
d’arrivée. Parexemple,
lejugement
introduisantl’opérateur pair
estexprimable
par larègle
- - 1 -1 . -Dans
quelques
cas, il est utile de traiter lescatégories syntaxiques,
ainsi que letype
set(et
prop,qui
est identifié aveclui)
comme dessystèmes
définis par induction. Il serait pos- sible de formaliser cela parcodage
dans des univers. Nous ne le faisons pas dans letexte,
parce que cela rendrait la notation très
lourde,
mais nousrappelons
cetteprécondition quand
elle estsupposée,
et renvoyons le lecteur intéressé au code del’implémentation
enALF
(cf.
section4.1),
où lecodage
estexplicite.
Les contextes
Pour les contextes dans la théorie des
types,
nous utilisons une notationprésentée
par Martin-Lof dans une série de conférences sur le calcul des substitutions en 1992. Cette notation diffère des nota.tions mieux connues,publiées
par Tasistro(1993)
etNlagnusson (1994).
Nous écrivons’
pour dire que F est un
contexte,
uneséquence d’hypothèses,
de la formeoù n =
0,1, 2, ...
etchaque Ak
est un ensemblequi dépend
deshypothèses jusqu’au
n = k - 1. Nous écrivons
pour un
jugement
J dans le contexteI‘,
où J an’importe quelle
desquatre
formes dejugement
de Martin-Lof(1984).
Les contextes
peuvent
êtreengendrés
d’une manièreinductive, partant
du contextevide, (),
par l’additiond’hypothèses,
Dans la seconde
règle, x
doit être une variable fraîche. Pour éviter l’accumulation deparenthèses,
nous suivons les conventions d’écrirer,~:~4aulieude(r,~- : A),
x : A au lieu de
(),
x :A,
ce
qui explique
la notation moins formelle pour les contextes dans la théorie destypes
avant le calcul des substitutions.
Les
objets
donnés dans un contextecomprennent,
comme labase,
toutes lesvariables du contexte :
Toutes les
opérations
de la théorie destypes
sontapplicables
dansn’importe quel
con-texte. Par
exemple,
la formation de ladisjonction
est valide dans la formeEnfin,
si le contexte A est une extension du contexter,
c.-à-d. si A contient toutes leshypothèses
du r - nous pouvonsdésigner
ce fait parruz -
alors toutjugement
dans F est aussi valide dans
A,
Le contexte dans un
contexte,
est une
séquence d’hypothèses qui peuvent dépendre,
non seulement deshypothèses antérieures,
mais aussi de celles de F. Il devrait être facile de se former uneimage
intuitive de cette
structure,
mais parcequ’elle
n’est pasprésentée
dans lalittérature,
nous lui consacrons
quelques lignes.
La définition inductivepart
du contextevide,
maisl’extension doit être définie simultanément avec l’addition des
contextes,
L’addition est définie par les
équations
Enfin,
nous avons besoin de l’addition des contextes dans uncontexte,
définie par les
équations
Mais la seconde
équation
n’est pas bien formée sans larègle
de l’associativité del’addition,
qui,
à sontour,
estjustifié
par l’induction sur la structure de l’addition : pour l’additionvide,
pour l’addition
étendue,
supposons(F + A)
+ 0 - r +(A
+0 ) ;
alorsoù
chaque
pas est une instance deséquations définissantes,
sauf ledeuxième, qui
utilisel’hypothèse
d’induction.La
quantification
sur les nouvelleshypothèses ajoutées
à un contexte retourne uneproposition
dans le contexteoriginel :
3(A, C)
estanalogue.
Toutes les
opérations
définies icipeuvent
être facilement modifiées pours’appliquer
aux extensions
explicites (cf.
section3.2).
,Les
opérations
sur les listesLes listes habituelles de la théorie des
types
sont basées sur la liste vide et croissent vers lagauche.
Les nôtres ont au moins un élément et croissent vers la droite :L’application
d’une fonction aux éléments d’une liste est définie commed’habitude,
L’ensemble
liste4)
des listes d’au moins deux éléments et lesopérations
correspon-dantes, bs2,
cons2 et map2, sont définis d’une manièreanalogue. Puisque
toute liste d’aumoins deux éléments est
représentable
comme une liste d’au moins unélément,
toutesles
opérations
définies pourlistl s’a,ppliquent
aussi àlist2.
L’ensemblelist3(A)
des listesd’au moins trois éléments est
analogue.
La notation énumérativeest
employée
pour tous lestypes
de listes.L’application
d’un connecteur à une liste depropositions
- conçues comme des éléments d’ununivers,
pour que la listepuisse
être formée - est définie par récurrence pour C :(prop)(prop)prop,
L :listi(prop) :
La
quantification
sur les éléments d’une liste est définie d’une manière évidente pour A :set, B : (A)prop, 1 : listl (A) :
Pour A :
set,
C :(A)(A)prop,
1 :list2(A),
nous définissons par récurrenceLa
proposition
est donc la
conjonction
de toutes lespropositions C(x, y)
à unedirection ;
un élémentn’est pas relié à lui-même sauf si la liste le
répète.
La clôturesymétrique
seraitexprimée
par
mais dans une
application typique,
la relation C estdéjà symétrique
en soi.Dans la
grammaire
des déclarations(section 3.5),
nous avons besoin des contextes étendus par des listes de variables du mêmetype.
Cetteopération
estdéfinie,
pour F :cont,
1 :listi(symb),
A :set/F,
par leséquations
où x doit être fraîche relative à r étendu
par 351 :
A.Les
opérations
sur les chaînesÀ un certain niveau de
l’implémentation,
les chaînes doivent être définies comme des listes decaractères,
pourqu’il
soitpossible
de définir lesopérations
sur leschaînes,
àpartir
de la concaténation. Nousprésupposons simplement
ceniveau,
etexprimons
laconcaténation par la
juxtaposition
des matièresgraphiques. 12
l2Dans l’implémentation, nous représentons les chaînes par code LA’I~
(Lamport 1986),
qui permet lecodage
linéaire des notations bidimensionnelles telles que les exposants.Les définitions
présentées
dans cette section sont communes àplusieurs langues.
D’autres, qui
sontspéciales
aufrançais,
sont trouvées dans la section 2.1.Une liste de chaînes est un
objet plus
articuléqu’une
chaîne. Ellepeut
êtreimplosée
en une chaîne par la concaténation de tous ses éléments. Il y a des versions modifiées
d’implosion : l’opération qui ajoute
des blancs entre leséléments ;
une autrequi
yajoute
des
virgule
et desblancs ;
unequi
introduit uneconjonction
à l’intérieur de la dernièrepaire d’éléments ; et, finalement,
unequi ajoute
despoints
et met lamajuscule
àchaque
élément.
La
présence
d’unemajuscule
estdésignée
parsoulignement.
1
CONSIDÉRATIONS GÉNÉRALES
SUR LA GRAMMAIRE 1.1 Lef ormalisme
et lalangue informelle
Dans une
grammaire logique,
nous étudions lesrapports
entre deuxsystèmes.
D’unepart,
nous avons unelangue informelle,
dont lesexpressions
sont des énoncés nonformalisés,
ou, dupoint
de vuemathématique,
des chaînes decaractères,
construites parl’opération
de concaténation. De l’autrepart,
nous avons unmodèle,
unsystème d’ob jets mathématiques,
tels que desensembles,
des éléments de cesensembles,
despropositions,
et des fonctions individuelles ainsi quepropositionnelles. L’opération qui
associe un
objet
du modèle à une chaîne donnée estl’interprétation.
L’opération
inverse - de trouver uneexpression linguistique
pour unobjet
mathé-matique -
n’a pas de nométabli,
mais nousl’appellerons l’énonciation. 13
Ainsi nouspouvons dessiner un
diagramme :
13 Le terme énonciation doit être conçu comme dans les locutions « énoncer les faits >, « l’énoncé d’un problèmes, et non comme production individuelle d’une phrases.
Dans
l’enseignement
de lalogique formelle,
ondéveloppe
une faculté intuitive d’effectuerces
opérations.
Dans lalinguistique formelle,
on cherche desrègles précises
pour le faire.Ces deux tâches sont
plus générales
que la méthode choisie ouqu’un
modèleparticulier :
elles sont manifestées dans presque toute recherche
linguistique.
Ainsi le modèlepeut
êtreun
système
assezvaguement
défini de« significations »
ou d’« idées » ou de« concepts ».
Parfois,
onparle
de lasémasiologie, qui « part
desmots,
dusignifiant,
pour en étudier lasignification »,
et del’onomasiologie, qui « part
desconcepts,
dessignifiés,
pour voircomment la
langue
lesexprime » (Grevisse, § 5).
Un énoncé informel n’a pas, en
général, d’interprétation unique,
maispeut
en avoirplusieurs
ou aucune. Dans lepremier
cas, l’énoncé estambigu ;
dans le second cas, il est dénué de sens. Parexemple,
la chaîne6 est
pair
et divisible par 4 ’ou divisible par 3 estambiguë,
parcequ’elle
a les deuxinterprétations
tandis que la chaîne
6 est
impair
par 4n’a pas de sens, parce que
l’adjectif impair
n’est défini que comme unprédicat
à uneplace.
Il en est de même à propos de l’énonciation :
typiquement,
uneproposition
donnéepeut
êtreexprimée
parplusieurs phrases
informelles. Parexemple,
la seconde des propo- sitions ci-dessus est aussiexprimable
par lesphrases
6 est
pair
et divisible par 4 ou par3,
6 est
pair
et fi est divisible par 4 ou par3,
qui
sont donc synonymes. Ilpeut
aussi y avoir despropositions qui
sont sicompliquées qu’il
estimpossible
de trouver desphrases
de lalangue
pour lesexprimer.
Parexemple,
la
proposition
est difficile à
exprimer
enfrançais
pur, sans l’aide du formalismemathématique.
Il est donc assez clair que ni
l’interprétation
des chaînes nil’expression
desobjets
ne sont des
fonctions,
maisqu’elles
sont deux faces d’une relation entre lesobjets
et leschaînes. Cette
relation,
la chaîne c
exprime
laproposition A, peut
être formalisée comme unprédicat
à deuxplaces,
Expr(c, A) (c : chaîne,
A :prop).
Ce
prédicat
est la structure fondamentale de lagrammaire minimaliste,
dans sa versionlogique
telle que conçue par Morrill(1994) :
lagrammaire
est,exactement,
un calculqui
définit ce
prédicat
pour établir unrapport
entre les chaînes et lesobjets
du modèle. Onn’emploie
pas d’autres structuresgrammaticales
que les chaînes et lemodèle."
L’interprétation
et l’énonciation sont ainsi desproblèmes
de recherche : pour inter-préter
une chaîne c, il faut trouver uneproposition
A telle queExpr(c, A)
soit vraie.Pour
exprimer
uneproposition A,
il faut trouver une chaîne c telle queExpr(c, A).
Cesproblèmes peuvent
être formalisés dans la théorie destypes
par laquantification
exis-tentielle
;15
Il est une
propriété
souhaitable de lagrammaire
que les solutions de cesproblèmes
soientefiectives,
mais ellesn’appartiennent
pas à la définition de lagrammaire.
La
grammaire
minimalistepermet
une définition naturelle de la traduction entre deuxlangues
naturelles : pour traduire unephrase française
enanglais,
onl’interprète et, ensuite,
onexprime
laproposition
obtenue comme unephrase anglaise.
Le modèle - ou, pour être
précis,
le formalismemathématique
danslequel
il est défini- fonctionne ici comme une
interlingua, qui exprime
les contenussémantiques qui
doivent être fidèlement transmis dans la traduction. Ainsi la
préservation
du contenusémantique
estgarantie
- pourvu que le modèle soitcapable d’interpréter
tout cequ’on
veut
exprimer
enfrançais.
Cette condition doit être une difficulté insurmontable pour la traduction de lalangue générale
par uneinterlingua :
les formalismes lesplus
avancés delogique arrivent,
avecpeine,
àexprimer
tout le contenu des textesmathématiques,
mais sion sort du
fragment mathématique,
iln’y
a aucun formalismecomparable. Toutefois,
dèsqu’on
trouve un formalismesémantique
pour lefragment
pourlequel
on veut construireun
système
detraduction,
cette méthode est assezattirante.17
Formellement,
la traductionpeut
être définie comme leproblème
de trouver unechaîne
qui exprime
la mêmeproposition
enanglais
que la chaîne donnéeexprime
en14Le prédicat
Expr(c, A)
présenté comme ici s’applique seulement aux chaînes interprétées comme des propositions, c.-à-d. aux phrases complètes. Pour analyser les expressions de toutes lescatégories,
ondoit définir un prédicat à trois
places, Expr(a,
c,a),
où a est unecatégorie,
c est une chaîne, et a est un objet formel du type sémantique correspondant à a. C’est ainsi que fait Morrill, utilisant la notationc - a : a.
15Pour être précis, le type prop dans ces définitions doit être borné à un univers U, qui est un ensemble
défini par l’induction; cf. Martin-Ldf
(1984,
pp.87-91).
16 Une opération
générale d’interprétation
produit une liste de propositions plûtot qu’une seule propo-sition,
Si la liste est vide, la chaîne n’a pas de sens
logique ;
sielle
a plus qu’un élément, la chaîne est ambiguë.De la même façon, le problème de l’énonciation a une liste de solutions.
17 On n’a pas de contrôle sur la structure
grammaticale,
parce que toute variation entre lesexpressions
synonymes est supprimée dans l’interprétation - ainsi beaucoup de phrases
françaises
peuvent avoir lamême traduction
anglaise.
français
(les
indicesf,
pour lefrançais,
et e, pourl’anglais, indiquent
les deux versions duprédicat Expr).
1.2 Les arbres
syntaxiques
Nous
avons étudié une structurebipartite
de lagrammaire
dans notre livre Ranta(1994),
mais il est devenu évident
qu’une
structure avec un troisièmeélément,
que nous ap-pellerons
les arbressyntaxiques, permet
unedescription grammaticale beaucoup plus précise.18
Un arbresyntaxique
est unesynthèse
de toute l’informationqu’il
y a dansune
expression française
et dans soninterprétation.
Ainsi un arbre détermine et salinéarisation en une
chaîne,
et soninterprétation
comme unobjet
du modèle :Cette structure est la même que la structure de la
grammaire
deMontague (1974).
Dansl’article « The
Proper
Treatment ofQuantification
inOrdinary English »,
les arbres syn-taxiques s’appellent analysis trees ;
le modèle est un modèle de lalogique
intensionnelle basée sur la théoriesimple
destypes. L’interprétation s’appelle interpretation,
mais iln’y
a pas de termetechnique
pour lalinéarisation.19
L’arbre
syntaxique
est unesynthèse
de l’informationsémantique, qui
est nécessairepour
l’interprétation,
et de l’informationgrammaticale, qui
l’est pour la linéarisation.Pour
analyser
laphrase
citée dans la sectionprécédente,
6 est
pair
et divisible par 4 ou divisible par3,
il y a donc deux arbres
différents,
que nous nommons A etB, correspondant
aux deuxinterprétations possibles.2° Désignant l’interprétation
d’un arbre par uneétoile,
et salinéarisation par
uncercle,
nous écrivonsl’La
grammaire
de Ranta(1994)
est plus minimale que celle de Morrill(1994),
parce qu’elle ne connaîtque les catégories
logiques,
sans distinctions syntaxiques; cf. section 1.8 ci-dessous.i9En anglais, il y a un mot argotique, sugaring, qui signifie l’opération inverse du parsing, et que nous
avons trouvé très exact pour
l’usage
engrammaire.
Ce mot n’est pas inconnu parmi les informaticiensfrançais non plus.
2°Les définitions des arbres A et B deviendront évidentes plus tard.