Traitement formel des langues naturelles. Première partie : mise en place des concepts à partir d'exemples

(1)

M ATHÉMATIQUES ET SCIENCES HUMAINES

A. C

ULIOLI

J. P. D

^ESCLÉS

Traitement formel des langues naturelles. Première partie : mise en place des concepts à partir d’exemples

Mathématiques et sciences humaines, tome 77 (1982), p. 93-125

<http://www.numdam.org/item?id=MSH_1982__77__93_0>

L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://

msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.

numdam.org/conditions). Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

TRAITEMENT FORMEL DES LANGUES NATURELLES Première partie :

Mise en place ^des concepts ^àpartir d’exemples .

A.

Culioli*,

^J.P.^Desclés**

AVERTISSEMENT

Le texte qui suit n’est pas ^unarticle mathématique, ^Ils’agit ^{de don-}

ner un exemple ^où^lesconcepts théoriques émergent ^dutraitement formel des données linguistiques empruntées ^àplusieurs langues. ^Souvent,^derrière^la

diversité parfois déroutante des observations, ^ilapparaît ^des^schémasorga- nisateurs identiques.~ ^Seule^uneanalyse abstraite autorise de tels rappro- chements et dégage petit ^àpetit quelclues opérations invariantes, ^la^diver- sité - dans le cas des exemples ^traités^{ici -}provient ^{alors de}différentes

"mises ^enordre linéaire" (permutation, déplacement de marqueurs morpho- prosodiques... ) alors que l’agencement fondamental des relations constitu-

tives est assuré _parun ensemble stable d’opérations êt^demacro-règles d’enchainement, âussi^cetagencement âbstraitreste-t-il invariant par rapport âuxmanisfestations qui ^se^modifientên^desorganisations par ^conca-

ténations différentes selon les langues, ^d’oùl’hétérogéneïté apparente.

L’analyse distributionnelle ou toute autre analyse analogue, y ^com-

pris ^laplupart ^desanalyses transformationnelles, ^estincapable ^{de sortir}

du magma des observations brutes des structurations invariantes ^etforcé-

ment abstraites. En effet, ^dans ^cesanalyses, ^lesprincipales manipula-

tions autorisées sont des opérations de substitution d’un élément plus complexe - ^une^chainecontiguë ^{ou non}^demorphèmes - ^à^un^élémentplus simple (par exemple ^dessyntagmes), ^lecritère étant _queles occurrences

des éléments substitués restent équivalentes lorsqu’elles ^sont^combinées

avec les autres termes de la phrase.

* Dpt. ^de^recher.Linguistiques. ^ERA^642.^Univ.^Paris^7.

** UER de Mathématiques. ^ERA^642.^Univ.^Paris^7.

(3)

On comprend ^trèsbien que les phénomènes d’imbrication (d’une relative dans un syntagme, par exemple) ^aientjoué ^un^rôle^decatalyseur théorique

dans la typologie ^desgrammaires syntagmatiques, ^par^essencetaxinomiques.

Même si les imbrications sont récursives - ^cequi ^resterait ^àprouver du

point ^de^vue^d’uneadéquation ^avec^lesobservations empiriques, sauf si l’on fait appel ^aucouple conceptuel chomskyen :

compétence

/ performance ^qui

réconcilliera toujours ^le^modèlethéorique ^avec^lesobservations effectives - les représentations métalinguistiques ^sonttoujours structurables en "arbres"

engendrés par des grammaires formelles d’un cettain type, ^en^{fait les}grammaires de tyloe ²(ou ^noncontextuelles) dans la hiérarchie de Chomsky.

Ce type d’organisation ^parsubstitution ^dechaines ^de

mQr p hèmes

concaténés n’a cependant âucune^chance^de^faire ^desînvariants structurels, Îlên^résulteûnevision classificatoire _propreâuxobserva- teurs. Cette visi’on ^sejustifie lorsque ûnelangue êst^décritepour elle- même mais la procédure classificatoire ^restefondamentalement inadéquate lorsque ^l’on^désire^dresser^destypologies syntaxiques. ^Pour^s’enconvaincre~

il suffit de se rappeler ^les^échecs^de^cesdernières années. C’étaient _pour la plupart ^desprojets typologi’ques êtcontrastifs. Signalons, êntreâutres, l’ouvrage ^éditépar Charl es N. Li : Subject ândTopic,

Academic.Press,

1975, pour ^serendre compte ^del’importance ^attachéeà la notion de "thème"

et des critiques ^adresséesà celle de sujet.

La plupart des contributions des auteurs au livre signalé ^ont^montré

que l’opposition sujet/prédicat ^n’avait^aucune^chance^d’êtreuniverselle, d’autant plus que le ^{terme de}"sujet" ^seprêtait ^à^demultiples interpréta-

tions et qualifications (sujet syntaxique, profond, logique, psychologique, thétique etc...). Aussi, ^lalittérature a-t-elle été

submergée

^{par des}

oppositions ^commetopiclcorment, thème/rhème... ^destinées^{à mieux}expliquer

la constitution progressive ^de^l’énoncé^alorsque l’analyse n’exprimait ^au

mieux _quela décomposition classificatoire des termes de la phrase ^toute constituée. Mais les définitions qui ^ont^étéproposées ("information nou-

velle opposas a l’information ancienne", "terme ajouté ^à^cequi ^estdéjà connu ", "terme pose à propos duquel ^{on en}^ditquelque chose ") ^neprésentent

pas cette simplicité qui les rendraient transparentes par ^tout^unchacun, elles ne débouchent _pasnon plus ^sur^desdéfinitions opérationnelles ^valida-

bles _pardes tra-Ltements informatiques finalisés. Pourtant, ^cetteclasse de phénomènes linguistiques êstpleinement représentative ^de^{l’activité} langagière ôbservée^dans^denombreuses langues ôrales^maisaussi écrites.

(4)

Les définitions proposées ^par^la^plupartdes auteurs ^{ne se}coulent pas dans des écritures métalinguistiques ^quireprésenteraient, ^par^les^notations employées, ^le^mécanisme^{de la}constitution ^del’énoncé effectuée ^enposant d’abord un terme (thème) pour ensuite lui attribuer ^despropriétés ^rhémati-

ques. Chaque ^actequi "pose ^unthème" est le résultat ^d’uneopération ^mettant

en jeu ^unénonciateur à un instant pris pour origine ^de^saprédication. ^En

effet, ^le^thème^estposé symboliquement ^par^rapport^àl’énonciateur, ^cequ’

attestent des expressions comme :soit, ^ily a, quant à, ^{en ce}qui concerne...

Il faut alors inventer des écritures formelles dans lesquelles ^onpuisse ^for-

muler des opérations ^dethématisation. Or, l’analyse ^desagencements ^par^thé-

matisation (à divers degrés, ^dureste)fait apparaître ^{des modes}d’organisa-

tion qui ^diffèrent^de^ceuxqui ^sontobtenus par simple concaténation (obser- vable directement ^au^niveaulinguistique), ^ou^paragencement- markovien ^(avec

les langages ^detype ³ôu"à nombre fini d’états") ôu par substitution (dans ûneanalyse classificatoire des termes constituants ^{de la}phrase).

Un mode plus complexe d’agencement ^estapparu,au fil ^desobservations

et des analyses, qualifié ^{de mode}par intrication. En effet, ^un^terme^étant

"posé" par l’acte énonci’atif, ^ce^terme^estensuite inséré dans d’autres relations où il est intriqué. Beaucoup ^deprocédés linguistiques, ^comme l’anaphore, l’utilisation de _pausesprosodiques ^etd’actualisateurs comme

il y

^{a en}^français,^variablesâvec^leslangues, sont ûtiliséspour maintenir les liens de cohésion entre les termes "posés" êtleur insertion dans des relations prédicatives ; ^ce^sont^{là les}^traces

repérabl es

^de^cetteopéra tion d’agencement par intrication.

Après un examen des différents types ^de^donnéeslinguistiques ^et^Ies

traitements qu’elles imposent, l’article vise à montrer comment se présen-

tent au mathématicien ,ïntéressé _parle traitement formel des langues, ^les concepts linguistiques lui faudra épurer ^sanspour autant les déna- turer. Ce mathématicien est ensuite confronté aux systèmes ^dereprésenta-

tions métalinguistiques qu’il ^doit"fabriquer" ^et^enrichir^sous^le^contrôle

du linguiste pour leur adéquation. ^Lessystèmes ^dereprésentation "classi-

ques ", ^enparticulier ^le"calcul des prédicats" ^sontinadéquats pour expri-

mer formellement les diverses thématisations. La nature de cette inadéqua-

tion se comprend ^désque l’on rappelle ^les^finalitésqui ^les^ontmotivé,

à savoir l’analyse des fondements de l’arithmétique essentiellement; ^ils

ne sont pas destinés à être des instruments d’analyse ^deslangues. ^Onpour- rait citer de nombreux auteurs aui, pour remédier à l’inadéquation ^du

(5)

Calcul des Prédicats "inventent" des’étiquettes, mais celle-ci ne sont pas constitutives d’un langage représentatif ^"bien^fait"^etadéquat ^{à la}descrip-

tion de phénomènes ^comme^lathématisation ou les relations casuelles. ~Que ^ce

soient G. Frege ^ouB. Russell, H. B. Curry et surtout A. Tarski, ^tous^ces logiciens établissent des barrières entre les langages formalisés logiques

et artificiels et les langues naturelles. La mise en place ^desystèmes métal inguistiques formels s’effectue _partâtortnements successifs. En effet,

un "bon" système ^dereprésentation ^doit xempli’r ^au^moinsquatre conditions :

1) xepré-senter ^lesphénomènes utilisés;

2) être manipulable par ^tout^unchacun et être txansparent;

3) ^entrecohérent ;

4) ^£tre

fécond et

^doué^d’unpouvoir heuristique.

Le

système

^dereprésentation présenté ^dans répond, ^du^mQins

dans ses intentions, âuxauatre contraintes, ^.lêst^destiné^à^noter^les^di- vers65 opérativns. ^dethématîsation. Sa transparence ^n’estpeut-être pas, dans la présentation ^retenueîci,

évidente..

^Le^systèmemétalinguistique présenté ici s’ inspi’re ^pourtantbeaucoup plus ^desnotati’ons frégéennes que des écritures russelliennes, ^{en ne}^retenant^pas^notammentl’usage ^{de la}

variable du Calcul des Prédicats présenté dans les ouvrages d e Church ^oude

Quine. ^La^nptation^devariable, ^libreôuliée/est ambiguë. ^Certespour traduire les énoncés arithmétiques ôupour écrire des équations êt^des expressions du calcul différentiel et intégral ôuexprimer ^lesîdentités remarquables, I ’ ambigui té êstgénéralement ^levéepar 1 e 1 ecteur sans pro- blème insurmontable mais pour fonder ûnsystème représentatif, ^{il faut}^non

seulement dominer mais aussi chasser et éviter ce genre d’ambiguité. ^Ce^fut

la tentative opérée par Schvnfinkel ^etdéveloppée pour le programme de la

Logique Combinatoire de H.B., Curry ^{et R.}Feys: construire un système ^for-

mel "sans" variables (encore faudrait-il s’entendre sur "sans variable" !)

La Logique Combinatoire et le À-calcul de A. Church, légérement ^dif- férent, ^sontutilisés maintenant pour ^unedescription sémantique ^deslanga-

ges de programmation, ^maiségalement pour représenter ^leslangues ^naturel-

les dans le Modèle Applicationnel ^de^{S. K.} Shaumyan par exemple (Logique Combinatoire) ^oudans la Grammaire Universelle de R. Montague ^{et B.}^Partee

(À-calcul). ^Lanon-transparence immédiate ^dessystèmes esquissés ^n’est^sou-

vent qu’un manque d’habitude, ^elle^ne^doitpas ^nonplus surprendre puisqu’il s’agit ^d’unsystème ^enconstruction et non d’un système figé présenté ^selon

les canons traditionnels des manuels logiques. ^Le^lecteurmathématicien reconnaîtra au fil de l’exposé ^la^trame^dusystème ^formelsous-jacent ^au

discours.

(6)

La recherche de la cohérence - non contradictoire mais aussi l’effec- tivité opératoire - appartient ^de^plein^droit^auxmathématiciens et logiciens

voire aux informaticiens. Traquer l’incohérence, ^lesparadoxes, ^lespseudo- définitions, ^lesêrreurs^decalcul, les imprécisions...mais ên^mêmetemps déduire les conséquences ^d’une^décisionpour mieux ênapprécier ^{la valeur}

ou l’incongruité, ^ce^sont^{là les}^tâchesquotidiennes ^dumathématicien con-

fronté à la modélisation ^desthéories linguistiques. Quant ^{à la}fécondité ,1 des systèmes ^dereprésentations métalinguistiques,, ^elle^estéprouvée par

l’usage, plus ^ou^moinsapproprié dans certains cas, qu’en ^{font les}linguis- tes, ^L’outilmis a leur disposition permet-il ^{de mieux}^décrire^leslangues

et de faire apparaître ^des^faitsjusque ^làignorés ^ou^{du moins}passablement sous-estimés ? Nous renvoyons ^sur^cepoint ^à

quelques

ûnedes thèses ^de linguistique êtâuxârticlespubliés ^quiûtilisent^ce^typed’écriture ^re-

présentative ^pourdécrire des faits linguistique, aussi bien dans le~

langues indo-européennes que dans le domaine sémiti~que, chinois,japonais,

ou pour les langues africaines.

rlous avons déjà ^dit^que^les^auteurs^avai’entpréféré ^montrer,^sur

un ou deux exemples, ^comments’opèrait ^laconceptualisation êt^{la mise}ên place progressive ^d’unsystème formel local car relatif à un problème précis plutôt que de représenter ^cesystème ^{sous une}^formequi ^serait coupée ^de^sesmotivations. Pour traiter ces exemples, ^{il leur}â^été^néces-

saire d’introduire un certain nombre de concepts - ^comme^ceux^derepérage-

et d’évoquer ^certainesquestions épi’neuses - ^comme^extension/intension ^-.

Il serait bien entendu souhaitable de mieux les cerner par ^undiscours plus

serré et mieux argumenté, ^Ceci^montre^en^tout^cas que l’analyse ^et^le^trai-

tement formel d’un seul énoncé linguistique impose ^en^{fait des}ingrédients conceptuels nombreux. Il en serait de même _pourtraiter d’exemples physiques

ou biologiques. ^Le^rapport^immédiat^que^nousentretenons avec notre langage

ne doit pas ^nouslaisser croire qu’une appréhension ^naive^{des faits}^est

suffisante _pouren découvrir les réglés de fonctionnement. L’objection ^sui-

vante a été émise _pardes esprits qui ^ne^croientqu’au simple immédiatement

compréhensible : "c’est bien difficile ce que ^vousreprésentez ! Pourquoi

faire si compliqué ? ^"sous-entendu "quand ^d’autrescollègues ^ont^{un .}

discours plus transparent". ^Ceci^estévidemment réfutable : "Pourquoi ^le

(7)

langage ^sur1 equel ^toutes^lesci vil i sa tions, ^à^toutes^lesépoques, ^se^sont interrogées, ^selaisserait-il décrire ^etenfermer dans un discours globali-

sant parsemé d’assertions qui ^semblentdépouillées ^de^toutmystère ^alors

que l’étude de la nature ou du vivant a conduit à des modélisations comple-

xes et locales qui imposent ^unelongue ^formationspécialisée préalable ^à^tou-

tes discussions sur la validité et la pertinence ^de^ces^{modèles ?}^fi

Le mode d’agencement par intrication conduit à des systèmes ^formels

dont la syntaxe n’engendre pas - ^nousl’avons déjà dit - des "arbres"

comme c’était le cas avec des systèmes agencés par substitution ^etconcaté- nation ( "arbres de dérivation" ou "arbres syntagmatiques" ^{dans le}^modèle génératif ^deChomsky). L’opération d’agencement par intrication engendre

des représentations qui, lorsqu’on ^veutmémoriser "l’histoire constitutive"

par ^unenotation appropriée,se ^laisse^décrire^par^unesous-classe de gra-

phes ^sanscircuits que l’un des ^auteursavait avec M.C. Barbault proposé d’appeler "treille" (cf. Transformations formelles et théories

linguisti-

ques 1972 ). Quelle êst^ladéfinition exacte de cette structure ? Comment est-elle engendrée ? Quelles ên^sont^lespropriétés ? ^Ces^questions^seront l’objet ^d’unprochain ârticle.

(8)

Dans le prochain numéro, ^il^sera^donné^une^liste^dequelques ^thèses(de

3 ème

cycle êtd’état) _portant^sur^desdescriptions ^delangues (anglais, chinois, français, japonais, malgache, mooré, portugais, tamoul...) êtqui ûtilisent

les systèmes ^dereprésentation ^etconcepts théoriques développés ^{dans le}

cadre de l’ERA 642.

La bibliographie qui ^concerne^cet^article^estidentique à celle de l’article

précédent.

Ce travail a pu être mené avec l’aide du C.N.R.S., ^{dans le}^{cadre de}^l’A.T.P.

"Informatique

^et^SciencesHumaines" *. Nous remercions cet organisme ^et^ses représentants.

J.P. Desclés

~. LES DONNEES EN LINGUISTIQUE

Les données auxquelles ^{on a}^affaire^enlinguistique peuvent ^être^clas- sées, par souci de commodité et de clarté, ^sous^diversesrubriques.

1.1. Etant donné un terme (dans ^le^cas^leplus simple, ^une^unitélexicale),

on étudie ses

propriétés distributionnelles,

c’est-à-dire ses latitudes de

co-occurrence. On dégage âinsides cadres de comptabilité contextuelle, êt l’on construit des classes d’équivalence ^àpartir ^de^certainespropriétés syntaxiques, ôu,pour être plus précis, ^decertaines contraintes ^surles ma-

nipulations êt^lesagencements. Îls’agit ^là^d’un^travailclassique ên^linguistique descriptive, auquel ^doit^seplier ^lechercheur,

qu’il

^soit^sur^le

terrain ou dans son bureau, ^et^{on a}trop ^souventtendance à sous-estimer

l’importance

^de^cette^activité^de^tri^et^declassification sans laquelle ^la

construction théorique risque ^de^n’être

qu’un

mirage. ^Mais^il^estégalement

patent que le linguiste êst^{amené à}fabriquer ûne^bonnepartie ^de^sesêxem- ples ^hors^contexte^(alorsqu’il faut travailler à contexte explicite), ^hors

situation (ainsi, ^on^netiendra pas compte ^des^valeursaspectuelles, ^modales

* A.T.P. n° 51 4220. (1979-1981)

(9)

ou du jeu ^despersonnes) ^et^horspro’sodie (comme ^si^l’oral^n’étaitqu’un

avatar de l’écrit). ^D’où^une^situationmétalinguistique qui, ^si^l’onn’y prend garde, transforme l’objet que l’on s’efforce de caractériser, ^d’autant

que le linguiste ^n’a^à^sadisposition que ^du^texte(écrit ^ouoral) ^etque,

quels que soient ses efforts théoriques pour rendre compte d’une activité à laquelle ^{il n’a}pas ûnaccès direct, îl^devra^se^fonderâudépart ^sur^des

suites textuelles, pour, inéluctablement, y ^retourner.

1.2. Ceci nous fournit un second ensemble de données (parfois produit ^de^fa-

çon délibérée, ^maissouvent, hélas, ^confondu^avec^du^textenaturel) ^etque

nous appellerons métatexte : phrases ^demanuels, ^textes^delogiciens ^ou^de spécialistes d’intelligence artificielle. Il n’y a, naturellement rien de

choquant ^àfabriquer êtmanipuler ^{de tels}métatextes. Après tout, l’activi- té de langage ^n’estpas la chasse gardée ^dulinguiste êtde telles études permettent ^dedégager ^certainespropriétés intéressantes, ^{mais il}êstdange-

reux de mettre sur le même plan ^des^donnéeshétéroclites, ^toutesdésignées

du même qualificatif ^de

linguistiques,

^alors^que,^dansle second _cas,par

exemple, ^{on a}supprimé ^un^certain^nombre^de^traitspropres ^auxénoncés pro- duits et interprétés, par des sujets énonciateurs (humains!), ^dans^des^si-

tuations spécifiques ^et^dans^unelangue ^naturelle^donnée.

1.3. Ce danger ^est^d’autantplus ^réelque, à première ^vue,^rien^ne^semble séparer ^cesmétatextes des gloses êpilinguistiques, qui ^forment^un^troisièine

groupe de données. Nous appelons ^ainsi^ces^textesqu’un sujet produit ^lors-

que, de façon spontanée ^{ou en}réponse ^àûnesollicitation, îl^commenteûn

texte précédent. ^Nousparlons ^deglose ^et^non^deparaphrase, ^{afin de}^réser-

ver ce dernier terme à une activité réglée, ^donc^contrôlée^parl’observateur (sur ^cepoint, ^voirplus bas), alors que la glose ^renvoie^à^lapratique ^lan- gagière ^dusujet énonciateur. Quant ^auqualificatif épilinguistique, ^{il dé-} signe l’activité métalinguistique non-consciente de tout sujet ^et^se^distin-

(10)

gue donc de l’activité métalinguistique délibérée. Nous nous voyons forcés de ne mentionner

qu’en

passant ^cettequestion capitale, que masque chez de nombreux chercheurs l’emploi ^du^mot

compétence.

^Or, ^les^glosesépilinguisti-

ques forment une bonne partie ^de^notre^discoursquotidien êtjouent ûn^rôle important ^dans^le^discoursexplicatif ^d’uninformateur qui ^veutfaire sai- sir le sens d’une phrase ^dansûnelangue étrangère ôu^lasignification ^d’un

énoncé mal interprété. ^Maisônnéglige presque toujours ^cesgloses épilin- guistique âlorsqu’elles ^sontûneprécieuse ^source^derenseignements ^linguistiques et, ^{à leur}manière, constituent un système ^dereprésentations

interne à la langue, c’est-à-dire une métalangue ^nontotalement contrôlable.

Ainsi, ^laphrase ^L’hommequi ^est^venu^hierportait ^bien^unimperméable beige

est peut-être glosé par "Eh bien, îly âquelqu’un qui êst^venuhier, êt

ce quelqu’un, ^c’est^un^faitqu’il portait effectivement un imper beige".

Lorsque ^lesujet énonciateur se fait (à ^samanière) linguiste, il produit des gloses. Lorsque ^lelinguiste ^se^faitsujet énonciateur, ^il^cons-

truit des familles paraphrastiques, c’est-à-dire, ^comme^en(1), des classes

d’équivalences:

^{on a}^affaireici, ^nonplus ^à^des^termessimples, mais à des

termes complexes ^ouénoncés, ^et^lespropriétés ^de^ces^familles^sont^fort^dif-

férentes de celles d’une classe distributionnelle. Très vite, ^on

s’aperçoit

que l’on a besoin d’un système métalinguistique qui ^ne^soitpas ^unjeu ^d’é- tiquettes, ^maisqui permette ^dereprésenter ^ladérivation paraphrastique.

Ainsi, ^si^l’onaccepte

l’équivalence

^{de :}

il faudra, grâce ^à^unsystème ^dereprésentations adéquat, marquer formelle-

ment l’équivalence, c’est-à-dire dégager ^lesrègles qui permettent de passer d’un agencement ^àl’autre et d’expliquer pourquoi ^cesagencements particu-

(11)

liers ont des valeurs référentielles (significations) équivalentes, ^{à la}

modulation près dont il faudra rendre compte.

On comprendra

l’importance

exceptionnelle ^de^cette^démarchelorsque

l’on

s’occupe

^deplus ^d’unelangue,

qu’il

s’agisse ^dedescription, ^de^tra- duction, ^detypologie ^oud’analyse ^ditecontrastive. En effet, ^{on ne}peut

jamais ^étudierûnelangue âutreên^soi(sauf ^si^l’on^traite^delangues ^de grande diffusion, ^comme^lefrançais ôul’anglais, ôù^l’onpeut âvoir^lapé-

rilleuse illusion de l’immédiateté de

l’analyse!):

^il^faudratoujours ^tra-

duire terme à terme, rendre ^le^sensglobal ^enlangue courante, mais ^surtout

en passer par ûncommentaire interprétatif qui ôscilleraêntre^laglose, ^la terminologie ^héritéeôunéologique, ^sanscompter l’astuce technique. Ainsi,

de la particule japonaise ^wa,ôn^ditqu’entre âutresemplois, êlle^sert^à

thématiser -mais la définition de la thématisation, ^comment^sefera-t-elle ?-

ou alors,

qu’elle

peut ^êtreglosée par les expressions françaises ^"àpropos

de",

"quant

à", "entre autres",..., ^comme^si^l’onpouvait ^utiliser^defaçon

neutre une seconde langue ^à^des^finsmétalinguistiques (c’est-à-dire pour décrire de façon univoque ^etstable les phénomènes ^d’unelangue différente).

De même, ^certains^croientque l’on _peutimpunément ré-introduire des termes comme "datif" dans (ou faut-il dire ’sans’?) ^une^théoriegénérale ^des^cas

(on dira, par exemple, que lui ^est"datif" dans i1 lui

parle),

^que^cela^ne

tire _{pas à}conséquence

puisqu’il

s’agit ^d’uneétiquette conventionnelle, ôu qu’en ûtilisant^desmajuscules (CAUSE, BE, DO) ôn^élèveâurang d’êtres ^mé-

talinguistiques ^des^termesempiriques. ^Enfait, ^onpeut ^montrer

qu’aucune

terminologie composite, ni, ^aureste, le ^recoursexpéditif ^{à des}symboles ^de logiciens (tels ^le"iota" de Russelle ou le "lambda" de Church) ^nepermet

d’appréhender

^lesphénomènes paraphrastiques ^defaçon ^contrôlée^et^fructueu-

se. Au mieux, ^elle^établira^descorrespondances étiquetées. Que ^l’on^consi- dère _parexemple ^lesphrases suivantes, ^tirées^d’unmanuel de japonais* :

* in Modern Japanse ^for

University

^StudentsI, Japanese Department, ^Interna- tional Christian University, ^RevisedEdition, pp. 117 sq.

(12)

Kazuko wa / ^mega ookii desu , ^où^Kazuko^est^{un nom}propre, ^mesignifie

"oeil, yeux", ôokii^veut^dire"grand(s)" êt^desuêstûnecopule (facultati- ve) ; quant ^à^waêtga, ^ce^sontdeux particules ^dontîlêst^ditque ^waintro- duit le "thème" êt_gaindique ^lesujet ^d’unephrase ^dans^certaines^circon-

stances. Les traductions proposées ^sont^"As^for^Kazuko,her eyes ^arelarge"

("Quant ^àKazuko, ^sesyeux ^sontgrands"); "Kazuko’s _eyes^arelarge" ("Les

yeux de Kazuko sont grands"); "Kazuko has large eyes" ("Kazuko â^degrands yeux"), êt^l’onpourrait ajouter, pour ^lefrançais, ^"Ily âKazuko, ^sesyeux sont grands / êlleâ^degrands yeux". ^Demême, ^{on aura}pour Tanakasan ^wa okusan ga byooki ^desu(terme ^à^terme:Tanaka Monsieur Wa femme GA malade

COPULE),

^"La^femme^de^monsieur^Tanaka^estmalade"; "Monsieur Tanaka a sa

femme (qui est) malade"; "(Il _ya) ^MonsieurTanaka, ^sa^femme^estmalade";

etc. Manifestement, ^leproblème posé êst^d’établirûne^relationêntre^la phrase japonaise êt^sestraductions anglaises êtfrançaises, qui marque

l’appartenance

^desdifférents membres à une même famille paraphrastique. ^Un

tel problème ^n’est^solubleque si l’on construit les systèmes ^dereprésen-

tations _{pour le}japonais, pour le français ^etpour

l’anglais,

^{à la}^fois^en

respectant ^laspécificité ^desphénomènes propres à chaque langue ^et^{en rame-}

nant ces phénomènes ^à^un^certain^nombre

d’opérations

élémentaires (prédica-

tives et énonciatives) qui ^auront^une^formegénérale; c’est-à-dire une for-

me que l’on généralisera, par ^unenchaînement argumenté, ^à^travers^les^con- figurations spécifiques ^dechaque langue. Ainsi, ^leproblème que ^sepose la

linguistique,

lorsqu’elle

^se^donnepour objectif ^l’étude^dulangage appré-

hendé à travers la diversité des langues naturelles, ^estde rechercher com-

ment construire une théorie de la forme générale ^desopérations prédicati-

ves et énonciatives dans les langues, qui respecte ^lesexigences habituelles de vérifiabilité. Une première condition, ^on^lecomprendra aisément, ^sera l’adéquation empirique, ^nonpoint ^au^sensvague où il doit être possible ^de

passer ^dusystème ^dereprésentations (SR) ^auxphénomènes ^et^desphénomènes

au SR, ^{mais de}façon plus précise ^enposant que le SR ^estle versant méta-