S OLOMON M ARCUS
Mathématique et linguistique
Mathématiques et sciences humaines, tome 103 (1988), p. 7-21
<http://www.numdam.org/item?id=MSH_1988__103__7_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1988, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
MATHEMATIQUE
ETLINGUISTIQUE
Solomon
MARCUS1
DEUX PRECURSEURS : DESCARTES ET LEIBNIZ.
L’histoire des relations entre
mathématiques
etlinguistique
commence bien avantl’apparition
dece
.qu’on appelle, depuis quelques décennies,
lalinguistique mathématique
et continue mêmelorsqu’on
cesse deparler
de ce domaineinterdisciplinaire.
Il y a d’abord lalongue période qui précède l’apparition
de lalinguistique
commediscipline scientifique.
On sait que cet événement s’estproduit
dans le sièclepassé
et s’identifie avec ledéveloppement
de lalinguistique historique,
notamment des méthodes de lagrammaire comparée indo-européenne.
Mais desidées
logiques
etmathématiques
dans l’étude et la construction deslangues apparaissent quelques
sièclesauparavant.
L’ancienrêve,
dontl’origine
estl’épisode
de la Tour deBabel,
seprolonge
par leprojet
de construction delangages
artificiels pour la communication internationale. Lepremier projet scientifique
de cetype appartient
à René Descartesqui,
en1629,
propose la création d’unelangue
reposant sur unegrammaire
formée derègles logiques
etnumériques
et ne connaissant aucuneirrégularité.
Des tentatives similaires sontreprises
auXVIIème siècle par
Dalgano, Urquhart,
Wilkins et Leibniz. Ils’agit
desystèmes
artificiels apriori,
dont la finalitéprincipale
est de permettre et de stimuler la réflexionphilosophique, (pour plus
dedétails,
voir Mario A.Pei, "Artificial languages ;
International(auxiliary)",
in CurrentTrends in
Linguistics (ed.
Th. A.Sebeok),
vol.12, XX,
LaHaye - Paris, Mouton, 1974,
p.999-1017).
Il est
important
de remarquer que les tentatives de Descartes et de Leibniz seproduisent justement
au cours de lapériode
oùprend
naissance lelangage mathématique
comme une entitébien différente de la
langue
naturelle. Certainsphilosophes contemporains
voient dans cemoment le commencement du divorce entre le
langage scientifique
et lelangage
humain. C’est cequ’affirme,
parexemple, Georges
Steiner(dans
son livreLanguage
andSilence,
NewYork, Atheneum, 1967 ;
versionfrançaise, Paris,
Editions duSeuil, 1969),
pourqui
l’histoire dulangage scientifique
est celle d’une déshumanisation et d’une incommunicabilitéprogressive.
Enopposition
avec cetteattitude,
l’histoire récente dulangage scientifique
montre quebeaucoup
delangages
artificiels sont, dans un certains sens,plus
humains que leslangues
naturelles. Eneffet,
comment détermine-t-on le caractèreplus
ou moins humain d’unlangage ?
Selon sagenèse,
son contenu, sa structure, sa finalité ou bien selon sondegré
d’accessibilité ?1 Université de Bucarest, Faculté de
Mathématique,
14 Academici str., 70109 BUCAREST, Roumanie.L’accessibilité est le résultat d’un processus
d’apprentissage
et d’une accommodationprogressive.
Cequi
détermine le caractère humain d’unlangage
c’est son contenu et sa finalité.On ne peut pas opposer les
langages
artificiels auxlangages
naturels de la mêmefaçon qu’une prothèse
ne peut êtreopposée
àl’organe qu’elle prolonge
ouremplace.
L’ESSOR DES LANGAGES ARTIFICIELS.
La
géométrie analytique
de Descartes et le calcul différentiel etintégral
de Newton et Leibnizmarquent
uneétape
où le raisonnementscientifique
a besoin d’uneprécision
et d’unerigueur
que lalangue naturelle,
formée dans la communicationspontanée
des gens, nepeut plus
satisfaire.Remarquons
que Descartes et Leibniz sont, comme on l’arappelé ci-dessus, justement
lespremiers
auteurs deprojets
delangages logiques ;
cette coïncidence donnebeaucoup
à réfléchir.Mais si la
langue
naturelle n’estplus suffisante,
il ne faut pas oublierqu’elle
restetoujours
nécessaire dans toutes les
étapes
de l’activitéscientifique.
Il estprouvé
que l’élaboration des idéesscientifiques
repose sur lalangue
naturelle. La communicationscientifique,
même enmathématique,
doit seprévaloir
de lalangue
naturelle pour au moins50%,
si elle veut se rendreefficace
(voir
Paul R.Halmos,
How to writeMathematics).
Mais si les
langues
naturelles ont besoin d’êtreprolongées
et renforcées par laprothèse
deslangages artificiels,
notamment dulangage mathématique,
alors le mêmemariage
est nécessairelorsqu’on
édifie lemétalangage
utilisé dans l’étude deslangues
naturelles. Si l’onaccepte
que des sciences comme laphysique,
la chimie ou labiologie
aient besoin d’unmétalangage mixte,
dont une
composante
est naturelle et l’autre estformelle,
alors on nepeut
dénier cette mêmeexigence
à lalinguistique.
C’est là une motivation fondamentale de lalinguistique mathématique.
L’intérêt de
plus
enplus grand
accordé auxlangages
artificiels formels renouent maintenantavec les traditions du XVIIème siècle. Le terrain était
préparé
par G.Peano, qui
vers la fin duXIXème siècle
tentait,
pour lapremière fois,
de formaliser la composante naturelle dulangage mathématique.
De telles tentatives sont restéesjusqu’à aujourd’hui
sansrésultat, peut-être
parce que lalangue
naturelle estorganiquement impliquée
dans notre comportement et nepeut
pas êtreremplacée,
dans sonintégralité,
parquelque
chose deplus simple.
Avec B.Russel,
A.N.Whitehead et D.
Hilbert,
on formalise l’idée de démonstration et on prouvequ’il s’agit
ici de cequ’on appelle,
dans laterminologie actuelle,
une structure delangage
formel. Eneffet,
unsystème
formel est une collection dequatre objets :
un vocabulaire V etquatre langages LI, L2,
T et A sur le vocabulaire
V,
tels queLi
etL2
sontdisjoints
et A c T cL2, Li
est l’ensembledes termes,
L2
l’ensemble desrelations,
T est l’ensemble des théorèmes et A est l’ensemble des axiomes. Onindique
aussi uneprocédure
constructive pour obtenir lesthéorèmes,
à l’aide d’unsystème
K derègles.
Onappelle
textedémonstratif
toute suite finie de relations oùchaque
relation est ou bien un
axiome,
ou bien se déduit des relationsprécédentes
dans lasuite,
à l’aide dusystème
K.Chaque
relationqui
est un terme d’un texte démonstratif constitue un théorème. Mais lestextes démonstratifs
forment,
à leur tour, unlangage
et on constate ici comment les idées deHilbert
anticipent
celles deChomsky.
Les textes démonstratifs sontremplacés
par lesdérivations,
lesrègles
de déduction sontremplacées
par lesrègles
dedérivation,
les théorèmessont
remplacés
par des suites correctement formées.Si, grâce
à G.Boole,
lalogique
a reçu, au sièclepassé,
un modèlemathématique, grâce
àHilbert,
elle a reçu, au cours de notresiècle,
unestructure de
langage
formel. Comme uneconfirmation,
labiologie
et lapsychologie
moderneplacent
les activitéslogiques
etlinguistiques
sous le contrôle del’hémisphère
cérébralgauche,
comme variantes des activités de nature
séquentielle.
Lelogique
et lelinguistique
vont ensemblepour des raisons bien
plus profondes
que cellesqu’on pouvait
soupçonner.MATHEMATIQUE
DE LA PHONOLOGIE.Mais l’intérêt pour les
langages
artificiels formels sedéveloppe
maintenant dans des directionsmultiples.
Il faut d’abordsignaler
la diffusion de la méthodeaxiomatique-déductive,
nonseulement dans les sciences
naturelles,
mais aussi dans les sciences humaines. Pour lalinguistique,
il faut mentionner L.Bloomfield,
"A setof post
slates for the science oflanguage"
(Language,
vol.2,1926,
p.26-31), qui précède
de onze ans la tentative de H.Woodger (The
Axiomatic Method in
Biology, Cambridge
Univ.Press,1937)
d’axiomatiser labiologie.
Maisla tentative de
Bloomfield,
assez naïve,rappelant
la manière dont BaruchSpinoza essayait,
auXVIIème
siècle,
d’axiomatiserl’éthique,
est suivie dequelques
tentativesplus approfondies
pour axiomatiser la
phonologie :
B. Bloch("A
set ofpostulates
forphonemic analysis", Language,
vol.24, 1948,
n°1 ),
J.H.Greenberg ("An
axiomatization of thephonologic
aspect oflanguage", Symposium
onSociological Theory,
ed. L.Gross,
NewYork, Evanston, 1959),
pour culminer dans les travaux deslogiciens
comme TadeuszBatog ("Logiczna rekonstrukcja pojecia fonemu",
StudiaLogica,
vol.11, 1961,
p.139-183)
etStig Kanger ("The
notion of aphoneme",
Statistical Methods inLinguistics, 1964,
n°3,
p.43-48),
deslinguistes
comme G.Ungeheur ("Das logistiche
Fundament binârerPhonemklasifikationen",
Studia
Linguistica, 1959,
n°2,
p.69-97),
R.G. Piotrovskii("Esco raz
odifferencialnyh priznakah fonemy", Voprosy Jazykoznanÿa, 1960,
n°6),
S.K.Saumjan ("Problemy teoreticésko-1 fonologi",
Izd. Akad. NaukSSSR, Moscou, 1962),
V.N. Belcozerov("Formulnoe opredelenie fonemy", Voprosy Jazykoznanja, 1964,
n°6,
p.54-60),
1.1. Revzin("K logi~eskomu obosnovaniju
teoriifonologi~eskih priznakov", Voprosy Jazykoznanya, 1964,
n°5,
p.59-65).
V.A.Vinogradov ("Nekotorye
voprosy teoriifonologi~eskih oppozic
ineutralizacci", Problemy lingvistiteskogo analiza, Izd. Nauka,
Moskva1966,
p.3-25),
M.I.Lekomceva
("K opisaniu fonologiceskoi sistemy staroslavianskogo jazyka
na osnoveternarnogo
principy", Lingvisticeskie issledovanija
poobscei
i slavianskoitipologii,
Izd.Nauka, 1966,
p.117-123)
et F.H.H. Kortlandt(Modelling
thePhoneme,
LaHaye, Mouton, 1972), qui
donne unesynthèse critique
de toutes les contributions del’Europe
de l’Est dans le domaine de laphonologie,
et des mathématiciens comme Solomon Marcus("Un
modelmatematic al
fonemului",
Studiiçi
CercetiiriMatematice, vol. 14, 1963,
n°3,
p.405-421 ;
"Surun ouvrage de
Stig Kanger
concernant lephonème",
Statistical Methods inLinguistics,1966,
n°
4),
V.A.Uspenskii ("Odna
modeldlja ponjatija fonemy", Voprosy Jazykoznanijy, 1964, n°6,
p.39-53),
LadislavNebesky ("K
odnoi matematiceskoi modelifonemy",
Revue Roumaine deMathématiques
Pures etAppliquées,
vol.11, n’4 ;
"On the notion of relevantfeatures", Prague
Bulletinof
MathematicalLinguistics,
vol.6, 1966,
p. 35-43 et Barron Brainerd("On
Marcus definition
of phoneme",
Cah. deLing.
thé. etappl.,
vol.6,1969, p.15-41 ).
Une mention
spéciale
pour le modèleproposé
parBrainerd,
où l’on trouve un traitementgénéral
de la distinction entre unitéétique
et unitéémique,
entresystème étique
etsystème émique,
formalisant etgénéralisant
la distinction bien connue, maisjamais complètement clarifiée,
entrephonétique
etphonémique.
Il est intéressant devoir,
dans la succession de cesmodèles,
comment laprésence
de lasémantique
devient deplus
enplus
forte. Lasémantique
estabsente dans le modèle de
Revzin,
faible dans le modèle deMarcus,
forte dans le modèle deNebesky.
A ces travaux, on doit
ajouter
les collaborationsinterdisciplinaires,
d’abord le fameux article de E.C.Cherry,
M. Hall et R. Jakobson("Toward
thelogical description
oflanguages
in theirphonemic aspects", Language,
vol.29, 1953, nOl), puis
F.Harary,
H.H.Paper ("Toward
ageneral
calculus ofphonemic distribution", Language,
vol.33, 1957, p.143-169),
S. Marcus - E. Vasiliu("Théorie
desgraphes
et consonantisme de lalangue roumaine",
Revue deMathématiques
Pures etAppliquées,
vol.5, 1960,
n° 2 et n°3-4),
G.E. Peterson - F.Harary (Foundations of phonemic theory, Proceedings
of theSymposia
ofApplied Mathematics,
vol.2, 1961,
p.139-165).
Nous insistons sur
l’exemple
de laphonologie,
car il est l’une des meilleures réussites de collaboration de lalinguistique
avec lalogique
et lamathématique.
Toutes les théoriesphonologiques importantes
ont bénéficié de modèlesmathématiques.
Desquestions
crucialestelles que : comment
choisir, parmi
les traitsacoustiques
ou articulatoires d’un son dulangage,
ceux
qui
sontpertinents
dupoint
de vuelinguistique ? (point
de vue deJakobson)
ou : dansquelles
conditions deuxséquences
sonorescorrespondent-elles
à un mêmephonème (point
devue de la
linguistique descriptive) ?,
ont reçu desréponses profondes
et révélatrices(bien
que pas encore élaborées dans tous lesdétails).
On amontré,
parexemple
que, contrairement à cequ’on attendait,
la relation binairequi
s’établit entre deuxséquences
sonores définissant unmême
phonème
n’est pas une relationd’équivalence,
car elle n’est pas transitive. Enfait,
lestatut même du
phonème,
comme entitéconceptuelle,
s’est clarifié seulementaprès
l’intervention desmathématiques,
bien que certaines zones restent encore obscures ou controversées. Il y a, parexemple,
enphonologie,
unedialectique
trèsfine,
entre le discret et lecontinu, qui
aengendré
desstratégies
d’unegrande
diversité. Certains chercheursjaponais (M. Iri,
"Thelogarithmic
voweltriangle
based on thephonetic-geometrical
structure of theJapanese
andEnglish languages",
RAAG Memoirsof
theUnifying Study of
Basic Problems inEngineering
andPhysical
Sciencesby
meansof Geometry,
vol.3,
DivisionH, 1962,
p. 551-566 ;
K.Kondo,
"Ageometrical analytical approach
to the mathematical foundation ofPhonetics", ibidem,
p.567-606 ;
K.Kondo, "Quaternionion Phonology", ibidem,
p. 606-646 ;
K.Kondo,
M.Takata,
Schun-ichiAmari, "Analytical
structures ofspeechsounds
mechanical
composition
anddecomposition
ofphonemes
and thedesign principle
ofprimary phonetical automata", ibidem),
ontemployé
lagéométrie analytique
et différentielle pourexplorer systématiquement
la réalitéphonétique
et son évolution vers une réalitéphonologique.
Une autre
représentation
continue de la réalitéphonétique
se trouve chez TadeuszBatog (op.
cit.),
où l’onemploie
dans ce but laméréologie
deLesniewski, qui
concerne les relations dutype partie-tout,
très différentes des relations du type élément-ensemble. Il est intéressant de remarquer que la mêmeméréologie
de Lesniewski est à la base del’axiomatique proposée
par J.H.Woodger (op. cit.)
pour labiologie
et del’axiomatique proposée
par V.F.Rickey (A
survey
of Lesniewski’s logic, Dept
ofMath., Bowling
Green State Univ.Ohio, 1976)
pour la syntaxe. Il y a ici uneréplique
à Ferdinand de Saussure.L’objet
de lalinguistique
est-ilseulement le discret de la
langue
ou bien aussi le continu de laparole et
le passage de celui-ci au discret de lalangue ?
L’évolution des dernières décennies a écarté le
phonème
dupremier plan
de laphonologie,
car, comme on le
sait,
Roman Jakobson et NoamChomsky
ontchoisi,
pour des raisons différentes les traits distinctifs binaires comme l’informationphonologique pertinente
etopérationnelle.
Mais lephonème
reste néanmoins un desconcepts-clé
de lalinguistique.
BENZECRI ET THOM
Parmi les
partisans
d’une vision continue il faut mentionner Jean-PaulBenzécri, qui
utilise lathéorie de la mesure,
l’analyse
factorielle et latopologie algébrique ("Physique
etlangue",
LaTraduction
Automatique,
vol.4, 1963,
n°2,
p.31-50 ; Linguistique Mathématique,
Universitéde
Rennes, 1964)
et surtout RenéThom, qui,
il y avingt
ans, commence àpublier
une série detravaux consacrés surtout à la
sémantique
etqui
se réclame d’unephilosophie
où le continu est enpremier plan.
Thom a réussi à prouver que le discretperceptible
dans lasémantique
du verbefrançais
est l’effet d’un processus dont ladynamique
nepeut
être saisie que dans un contexte continu. Engénéral,
onpeut
dire que le continulinguistique
est chez Thom ce quedepuis longtemps l’analyse mathématique
est pour la théorie des nombres. Les travaux delinguistique
et de
sémiotique
de René Thom sontréunis,
avec certains autres articles du même auteur etconsacrés,
tous, à la théorie descatastrophes,
dans son livre Modèlesmathématiques
de lamorphogénèse (Paris,
ChristianBourgois, 1980).
L’attitude de René Thom doit êtreanalysée
dans un contexte
plus général,
où seplace,
parexemple,
aussi sonpoint
de vue en cequi
concerne
l’enseignement
de lagéométrie.
Il faut remarquer que laplaidoirie
de René Thom pourl’utilisation,
enbiologie
et enlinguistique,
des modèles de latopologie
différentielle estconcomitante avec une
plaidoirie
similaire de S. Smale en ce concerne les scienceséconomiques.
Peut-être doit-on
placer
dans le même ordre d’idées l’utilisation del’analyse
non-standard de Abraham Robinson dans l’étude des économiesd’échange.
Toute cette offensive du continudans les sciences de l’homme se
développe après
unepériode
où laplupart
des chercheurs considéraient que les sciences humaines et sociales ont besoin surtout desmathématiques discrètes,
car elles ont à résoudre leproblème
de bien choisir leurs unités fondamentales etétudier la combinatoire de ces unités. La
provocation
que René Thom a lancée au mondescientifique
est d’autantplus
audacieusequ’elle
se passe à un momentoù,
stimulées parl’informatique,
lesmathématiques
discrètes connaissent undéveloppement
sansprécédent
et oùbeaucoup
d’auteurs lesplacent,
enimportance,
avant lesmathématiques
continues(voir,
parexemple, Anthony Ralston,
"The Decline of Calculus - The Rise of DiscreteMathematics",
inMathematic
Tomorrow,
editorLynn
ArthurSteen,
NewYork, Springer,1981,
p.213-229).
Ilfaut aussi
prendre
en considération les résultats récents de labiologie
et de lapsychologie, qui
attribuent à
l’hémisphère gauche
du cerveau humain unepriorité
en cequi
concerne le contrôle des activités de natureséquentielle,
dont lelangage
et lalogique
sont lesplus importantes.
Maisjustement
ce dernier fait peut nous orienter dans le débat si délicat sur le discret et le continu. On accepteaujourd’hui qu’une
des conditions de santépsycho-somatique
de l’homme soit celle del’équilibre
entre les activités des deuxhémisphères cérébraux,
donc entre les activitésséquentielles
et les activitésnon-séquentielles,
de concomitance(où
sont incluses lesémotions,
les intuitions etl’affectivité).
Il y adonc,
au niveaubiologique,
une solidarité entre le continu etle
discret,
un besoind’équilibre
entre eux.Chaque
mathématicien sait quel’analyse mathématique
utilise desapproximations
discrètes et mêmesfinies,
tandis quel’algèbre
et lathéorie des nombres ont besoin de
l’analyse. Que
serait la théorie des nombrespremiers
sansl’hypothèse
de Riemann ? On l’a vudéjà ci-dessus,
mais nous allons le voir encore : l’étude du discretlinguistique
a bénéficié del’apport
del’analyse,
de latopologie
et de la théorie de lamesure. L’interaction du discret et du continu est inévitable. Voir
maintenant,
à cesujet,
JeanPetitot-Cocorda,
Lescatastrophes
de laparole,
de Roman Jakobson à RenéThom, Paris, Maloine, 1985.
DEUX SOURCES DE L’AXIOMATISATION EN
LINGUISTIQUE
Le
développement
de lapensée axiomatique
enphonologie
a deux sources, cephénomène
étantvalable pour l’ensemble de l’abord
axiomatique -
déductif enlinguistique.
Ils’agit,
d’une part, du fait que l’axiomatisation et la formalisation sont à la mode dans notresiècle,
à la suite dudéveloppement
de lalogique
et de lamathématique.
Ils’agit,
d’autre part, du fait que ledéveloppement
de lalinguistique structurale,
avec Ferdinand de Saussure et l’Ecole dePrague,
en
Europe,
avec E.Sapir,
L.Bloomfield,
Z. Harris etd’autres,
enAmérique,
apréparé,
àl’intérieur de la
linguistique,
la voie vers la mathématisation. En cequi
concerne les modèlesmathématiques
enphonologie,
on peut dire que les travaux deBatog
etKanger
ont uneorigine
du
premier
type tandis que ceux deBloch,
Revzin etSaumjan
sont du deuxièmetype.
Mais dans lesplupart
des recherches les deux types secombinent,
cequi explique
aussi lafréquence
destravaux
qui
résultent de collaborationsinterdisciplinaires.
Nous allons suivre cesdéveloppements,
mais il faut remarquer une troisièmeligne
depensée, peut-être
laplus importante.
Avec le
développement
moderne de lalinguistique structurale,
laplupart
desapplications
desmathématiques
enlinguistique
concernaientl’aspect statistique
au niveau du vocabulaire.Certains dictionnaires de
fréquences
datent du commencement de notre siècle et même du sièclepassé.
Lesmathématiques
sontaristocrates ;
elles aident mieux les riches. Plus unediscipline
estmûre, plus
elle peut bénéficier desidées,
des résultats et méthodesmathématiques.
Plus unescience est
capable d’expliciter
ces aspects structuraux,plus
elle seprête
à êtreexplorée
à l’aidedes
mathématiques.
Il se trouve que ledéveloppement
de lapensée
structurale est presqueparallèle
enlinguistique
et enmathématique.
Lalinguistique
a sonBourbaki,
oupeut-être
plusieurs Bourbaki,
car le structuralismelinguistique européen
adéveloppé
son proprejargon,
bien différent de l’américain.
LES ANNES
CINQUANTE
Dans les années
cinquante
de notresiècle,
ledéveloppement
de lacybernétique,
de la théorie del’information et des ordinateurs concrétise une commande sociale de
plus
enplus
pressante,concernant le besoin de traitement
automatique
del’information,
des textes et deslangues.
Destravaux
caractéristiques
de cettepériode :
VitoldBelevitch, Langages
des machines etlangage
humain
(1949) ;
J.Apostel,
B.Mandelbrot,
A.Morf, Logique, langue,
théorie del’information (Paris,
Presses Universitaires deFrance, 1957).
EnOccident,
on met l’accent surles relations entre
langage
et information(rappelons
que Claude Shannonpublie
en 1951"Prediction and entropy of
printed English",
BellSystem
TechnicalJournal, 30, 1951, p.50-60,
tandis que, en1957, paraît
lapremière
édition du livre de ColinCherry,
On HumanCommunication, Cambridge,
M.I.T.Press, Mass.,
où la relation dulangage
avec lesaspects techniques
etmathématiques
de l’information et de la communication estprésentée
d’unefaçon systématique
etdétaillée).
En mêmetemps,
lespremières expériences
de traductionautomatique
se déroulent avec enthousiasme à l’Ouest et à
l’Est,
mais la réactionthéorique
est différente. Unephotographie
fidèle de ce moment, en UnionSoviétique,
est l’article de RobertAbernathy ("Mathematics Linguistics",
dans Current Trends inLinguistics,
Th. A. Sebeoked., vol. 1,
LaHaye, Mouton, 1968,
p.113-131).
Plusieurs mathématicienssoviétiques
sepréocuppent,
à cemoment, de l’élaboration de modèles
mathématiques permettant
unereprésentation rigoureuse
del’information
linguistique :
A.N.Kolmogorov (la catégorie
ducas),
R.L.Dobrusin (la catégorie grammaticale élémentaire),
V.A.Uspenskii (la partie
dudiscours)
et surtout O.S.Kulagina, qui
dans un article programme
("Ob
odnomsposobe opredelenija grammaticeskih ponjatii na
bazeteorri
mnozestv", Problemy Kibernetiki, vol. 1, 1958,
p.203-214)
trace leslignes
de base de cequ’on
vaappeler
le modèle ensembliste de lalangue.
Les baseslinguistiques
de ce modèle setrouvent dans la
linguistique descriptive
américaine(la
notion de famille introduite parKulagina
est une formalisation des classes de distribution de Z.S.
Harris)
et dans le courant d’idées duCercle de
Prague,
en cequi
concerne les aspectsparadigmatiques.
Mais le modèle deKulagina
doit être aussi
rapporté
à la structure de lalangue
russe et, engénéral,
deslangues slaves,
caractérisées par une
morphologie riche,
en contraste avecl’anglais (et
même lefrançais),
oùl’intérêt est orienté vers la
syntaxe.
Même si les motivations immédiates de ces modèles tenaient de "lapréparation
deslangues
naturelles pour leur traitementautomatique",
on peut maintenantjuger
leurapport
engénéral.
IMPORTANCE DU MODELE DE KULAGINA
Il y a deux idées
profondes
dans le modèle deKulagina :
a)
leconcept
de dérivation d’unepartition
duvocabulaire, qui
se propose de formuler unehypothèse
en cequi
concerne le passage de lapartition
en classes flexionnelles à lapartition
enparties
du discours(il s’agit, naturellement,
d’uneapproximation,
cargénéralement
ni les classes flexionnelles ni lesparties
du discours ne forment despartitions) ;
b)
leconcept
deconfigurations syntaxiques
de diversordres, qui
se propose de décrire le mécanismelogique permettant
dedistinguer
desdépendances
de divers ordres(par exemple,
dans très beau
livre,
ladépendance
de beau parrapport
à livre devient manifeste seulementaprès
avoir tenucompte
de ladépendance
de très parrapport
àbeau,
enremplaçant
très beaupar la résultante
beau ;
on obtient ainsi lesyntagme
beaulivre,
dont la résultante estlivre).
Chacune de ces idées a
engendré
des recherches riches et intéressantes. Lespremiers
pas ont étéenregistrés
dans notremonographie
parue en 1967(Algebraic Linguistics ; Analytic Models,
New
York,
AcademicPress),
mais les recherches ultérieures n’ont pas encore étésynthétisées.
Les résultats
pourraient
être résumés de lafaçon
suivante : création du concept decatégorie morphologique (qui,
comme dénominateur commun descatégories morphologiques spéciales,
telles le genre, le
nombre,
le cas, etc. n’existe pas dans lelinguistique structurale) ;
découvertede mécanismes formels
expliquant
lephénomène d’homonymie
contextuelle et permettant de comparer deux formes dupoint
de vue de leurdegré d’homonymie ;
élaboration de modèlesalgébriques
de lapartie
dudiscours,
du cas et du genregrammatical, appliqués
auxlangues
slaves de l’Est par 0.
Karpikaja ("Metody tipologiceskogo opisanija
slavianskihrodovyh sistem", Lingvisticeskie issledovanija
poobscei
i slavianskoitipologii,
Izd.Nauka, 1966,
p.75-116)
et auTchèque
et auSlovaque
par J.Horecky (Uvod
dimatematickej jazykoved,
Univ.Komenského,
v.Bratislave, 1969) ;
élaboration d’untypologie linguistique
raffinant latypologie traditionnelle ;
un ouvragesignificatif
de cette orientation est celui de 1I. Revzin("Metod
modelirovania itipologya
slavianskihjazykov",
Izd.Nauka, Moskva, 1967).
Lathéorie des
configurations syntactiques
a étédéveloppée
par A.V.Gladkü,
MiroslavNovotny
etMaria
Semeniuk ;
mais leproblème
de connaître l’ordre maximal que peuvent avoir lesconfigurations syntactiques
dans leslangues
naturelles n’est pas encore résolu.v
LE MOMENT DOBRUSIN - SESTIER
La relation de domination
contextuelle,
introduite par R.L.Dobrusin
en1957,
s’est avérée richeen
conséquences.
On dit que laphrase
x domine laphrase
y par rapport aulangage
L sichaque
contextequi
accepte x dans L accepte aussi y dans L. Si x domine y, alorsl’homonymie
contextuelle de x n’est passupérieure
à celle de y.L’algèbre
de cette relation de domination s’est avérée unchapitre
intéressant de la théorie des monoïdeslibres,
en convergenceavec certaines notions et résultats étudiés
préalablement,
sans aucun rapport avec leslangues
naturelles.
Indépendamment
deDobrusin,
un auteurmystérieux,
A. Sestier("Contributions
àune théorie ensembliste des classifications
linguistiques",
PremierCongrès
de l’AssociationFrançaise
deCalcul, Grenoble, 1960, Paris, 1961,
p.293-305)
aproposé
un abord purement contextuel à l’aide de cequ’on appelle aujourd’hui
une fermeture de Sestier. En partant d’une collection A dephrases,
sic(A)
est ensemble de contextesqui
acceptentchaque phrase
deA,
alors la fermeture deSestier f(A)
est l’ensemble desphrases acceptées
parchaque
contexte dec(A).
Une étudeapprofondie
des fermetures de Sestier comme modèlealgébrique
descatégories grammaticales
a étédéveloppée
parJurgen Kunze,
dans une série decinq
articles sousle titre "Versuch eines
objectivierten
Grammatik Modells"(Zeitschrift für Phonetik, Sprachwissenschaft
undKommunikationsforschung,
vol.20,
1976 et lessuivants).
Lacatégorie grammaticale
deDobrusin
est la réunion d’un ensemble A de mots et de l’ensemble desmots dominés par tous les mots de A. Les fermetures de Sestier s’avèrent un modèle
plus
convenable des
catégories grammaticales
que celui deDobrusin.
Kunze montrequ’il
y a en allemand descatégories grammaticales qui
admettent le modèle deSestier,
mais pas celui deDobrusin.
L’ASPECT
ALGEBRIQUE
Les idées de
Kulagina, Dobrusin
et Sestier ont stimulé des recherches bien au-delà des intentions de ces auteurs. La fermeture de Sestier est unopérateur
defermeture,
cequi
aprovoqué
l’intérêtpour le rôle de tels
opérateurs
dans l’étude dulangage.
On sait maintenantquels
sont les types de domination contextuelleengendrés
par desopérateurs
de fermeture(voir,
parexemple,
DoraPana, "Opérateurs
de fermeture et relations de domination dans lalinguistique algébrique" (en roumain),
Studii~i
CercetâriMatematice,
vol.27, 1975, n04,
p.461-470).
La fermeture de Sestier a attiré aussi l’attention sur le rôle des connexions de Galois dans l’étude deslangages.
La connexion de Galois
qui
intervient entrephrases
et contextes est devenue lepoint
dedépart
d’une théorie
générale
où relations dedomination, opérateurs
de fermeture et connexions de Galois sonttoujours
en interaction. Le théoricien leplus profond
de cette orientation estMiroslaw
Novotny (voir,
parexemple,
son étude"Algebraic
Structures of MathematicalLinguistics",
Bull. Math. de la Société Math. de laR.S.R.,
vol.12, 1968, n03).
Lepoint
devue des relations binaires comme cadre
général
de lalinguistique algébrique analytique
a étédéveloppé
par J.A~reider ("Algebra binarnyh otnosenü",
annexe au volume de S.Marcus,
Teoretiko-mnozestvennye
modelijazykov, Moska,
Izd.Nauka, 1970,
p.300-330).
Ces troisorientations,
connexions deGalois,
fermetures et relationsbinaires,
ont bénéficié de l’articledéjà classique
deJacques Riguet ("Relations binaires, fermetures, correspondances
deGalois",
Bull. de la Soc. math. de
France).
Brian H.
Mayoh ("Simple
structures defined on a transitive and reflexivegraph",
RevueRoum. Math. Pures
appl.,
vol.11, 1966,
n°1,
p.43-51)
voit dans la théorie desgraphes
lemeilleur cadre des modèles de
catégories grammaticales,
maispeut-être
lechapitre mathématique
le mieux stimulé par les modèles
analytiques
delangage
est la théorie desdemi-groupes
libres.Certains aspects de ces modèles
apparaissent, indépendamment
et sans leur motivationlinguistique,
dans des recherches purementalgébriques ; voir,
parexemple,
B.M. Schein("Homomorphisms
and subdirectdecompositions
ofsemi-groups",
Pacific J. ofMathematics, vol.17,1966,
n°3,
p.529-547)
etJoseph Zapletal ("Distinguishing
subsets ofsemi-groups
andgroups", Spisy Prirodov,
Fak. Univ. J.E.Purkajne
vBone,
vol.4, 1968,
p.241-252).
Ladislav
Nebesky ("K ponijatiu Konteksta", Prague,
Studies in Math.Linguistics,
vol.2, 1967,
p.177-185 ;
"A theorem onpartitions
and twolinguistic applications", Prague,
Bull.of
Math.
Ling., 7, 1967,
p.52-57 ; "Language Systems",
Revue Roum. Math. puresappl.,
vol.12, 1967) prend
commepoint
dedépart
un véritable calcul des contextes. Un autrepoint
de vuepermettant
d’englober
la presque totalité desphénomènes analytiques
delangages
a étédéveloppé
par M. S.Burgin
et E.S.Burgina ("Poisk
informaticü imnogoznacnye razbienija
vjazykah", Kibernetika, Kiev, 1982, n’l,
p.30-43)
et repose sur le concept de"décomposition
multivaluée" d’un
alphabet
A(ou langage L),
définie comme une relation P sur A(ou
surL)
et un certain ensemble
F,
tels que P soit contenu dans leproduit
cartésien A x F(ou
dansL x
F) ;
F est l’ensemble des traits de P. L’abord deBurgin
etBurgina
couvre aussi lesphénomènes
concernant le traitementautomatique
de l’information. Un autreexemple
intéressantest la tentative de
Jerzy Pogonowski ("Tolerance Spaces
withapplications
toLinguistics", Universytet
Im. Adama Mikiewicza wPoznaniu,
seriaJezykoznawstwo Stosowane,
nr.3, Poznan, 1981,
103pp.)
d’unifier unegrande
variété de faits delangage
à l’aide des relations de tolérance(=
relations binaires réflexives etsymétriques)
introduites parZeeman,
dans son fameux article sur latopologie
du cerveau.L’algèbre
des relations de tolérance a étéapprofondie,
dansplusieurs articles,
par Bohdan Zelinka.L’intérêt de ces recherches va d’habitude au-delà des
problèmes linguistiques
etengendre parfois
desquestions
d’intérêtmathématique
incontestable. Les racines debeaucoup
de cesrecherches se trouvent, comme on l’a
déjà remarqué,
dans les idées et les méthodes de lalinguistique
distributionnelle américaine. Leparadoxe qui apparaît
ici mérite d’êtresignalé.
Endépit
des traditions de lalinguistique
distributionnelle et du fait queChomsky
a débuté commeétudiant et collaborateur de Harris
(en
l’aidant à achever la forme définitive de son livre StructuralLinguistics, Chicago
Univ.Press, 1961),
ledéveloppement
des modèles formels dans lalinguistique
américaine des années 1956-1986 a presqueignoré l’héritage descriptif- distributionnel,
se consacrant surtout à lalinguistique générative
et transformationnelle. Il estvrai que les
grammaires
de structure de laphrase
dontChomsky parlait
au commencement de sathéorie avaient comme une de leurs
motivations,
la formalisation del’analyse
en constituantsimmédiats,
siimportante
chez des distributionnalistes commeBloch,
Harris etWells ;
comme onsait,
cetépisode
a étérapidement dépassé,
la théoriegénérative
transformationnelle devenant trèspolémique
à l’adresse de lalinguistique descriptive.
Enrevanche,
certains paysd’Europe
dontles relations avec le structuralisme
linguistique
américain étaient assez faibles se sontmontrés,
àla fin des années
cinquante
et au commencement des annéessoixante, prêts
àcontinuer,
à unniveau