• Aucun résultat trouvé

Sommaire

1.1 Fondamentaux de la th´eorie g´en´erative . . . 15

1.2 Pour une histoire . . . 17

1.3 Le programme minimaliste . . . 24

1.4 Sur la libert´e . . . 30

Dans ce chapitre, nous pr´esentons sous un aspect historique l’´evolution de la gram-maire g´en´erative qui a ´et´e introduite par N. Chomsky, [Cho55]. D`es cette ´epoque, les mod´elisations syntaxiques ont ´et´e r´ealis´ees `a partir de la notion d’arbre, au sens tradi-tionnel de l’informatique moderne, [GS97]. L’´evolution de la th´eorie est tr`es proche de celle de l’homme. Nous noterons une premi`ere p´eriode de collaboration avec P. Sch¨ utzen-berger, [SC63] qui ouvre la partie de th´eorie des langages formels. Puis un retour `a la linguistique, avec notamment [Cho65] puis l’introduction de la notion de transformations, qui donnera l’autre nom de ces grammaires, les grammaires transformationnelles, [Cho73]. Les deux ´etapes majeures suivantes de la th´eorie sont la proposition de GB, [Cho81] et le minimalisme qui est `a la base de nos travaux, [Cho95].

1.1 Fondamentaux de la th´eorie g´en´erative

Chomsky1 s’est inscrit en rupture avec la pens´ee empirique d`es les ann´ees cinquante, pens´ee dominante depuis le XV IIIeme` si`ecle dans les sciences humaines. Il r´eintroduit le d´ebat entre “empirisme” et “rationalisme”. Les philosophes empiristes postulaient que l’ˆetre humain arrive au monde tel une surface vierge et que son exp´erience lui permet d’“´ecrire” sur cette surface. Ainsi, la connaissance qu’il acquiert au cours de sa vie serait la somme de ses exp´eriences, marqu´ees sur cette surface. Chomsky, dans le prolongement de Descartes, suppose lui qu’il est impossible que l’homme soit seulement r´eduit `a cette somme et pr´ef`ere expliquer le passage de l’exp´erience `a la connaissance par l’admission de structures inn´ees dans lesquelles s’inscrit l’exp´erience.

1Cette pr´esentation doit beaucoup `a l’article de C. Boeckx et N. Hornstein [BHar], ainsi qu’`a celui de T. Reinhart [Rei07], dont les traductions fran¸caises ont ´et´e rassembl´ees dans un num´ero sp´ecial des cahiers de l’Herne sur Noam Chomsky `a l’occasion des cinquante ans de “Syntactic Structures”, article fondateur de la th´eorie g´en´erative, [cdl07].

`

A partir de ces postulats se d´egagent deux visions de l’ˆetre humain. Les empiristes consid`erent que l’homme et l’animal viennent au monde avec la capacit´e d’apprendre de l’exp´erience, alors que les rationalistes diff´erencient l’homme de l’animal comme ´etant un organisme dot´e de facult´es particuli`eres. La pr´egnance de la th`ese empiriste peut s’expli-quer par le contexte socio-culturel qui englobe cette p´eriode, notamment par le fait que cette th`ese donne une impression tr`es scientifique et distingue la science de la notion de religion et, par extrapolation, du contrˆole de l’´eglise. Dans le mˆeme temps, l’empirisme ´etablit un parall`ele fort avec le dogme capitaliste qui s’est d´evelopp´e `a travers le monde `

a cette p´eriode. En effet, l’id´ee de “table rase” `a partir de laquelle l’homme se construit, laisse des possibilit´es d’´evolutions infinies `a un ˆetre dans la soci´et´e.

Dans les ann´ees cinquante, l’empirisme est repris par le comportementalisme (behavio-risme), port´e par Skinner [Ski74]. Selon lui, l’apprentissage de la langue est un processus obtenu uniquement `a partir d’exemples (positifs et n´egatifs) accompagn´es de stimuli. Ainsi, un enfant qui r´eussit une phrase complexe et re¸coit une r´ecompense, met cette structure langagi`ere dans la cat´egorie des structures utiles. La capacit´e langagi`ere est alors structur´ee par analogie avec les exemples positifs et n´egatifs.

Se poser la question de formaliser le processus langagier suppose l’existence de r`egles le r´egissant, et formuler des r`egles entraˆıne d´ej`a une abstraction sur la question du langage, induisant son caract`ere infini. Les concepts du comportementalisme, se basant sur une liste de possibilit´es et une r`egle de formation par analogie, excluent la possibilit´e de productions infinies (`a partir d’un ensemble fini d’´el´ements et de la r`egle d’analogie, l’ensemble des productions est fini).

Il est ais´e de prouver le contraire. Dans [Rei07], T. Reinhart propose la d´efinition du “fran¸cais optimiste” (h´ebreux dans la version originale) dans lequel il n’y a que les mots “tout, ira, bien, il, elle, pense, que”. `A partir de ce fragment du fran¸cais, on propose les premi`eres r´ealisations de phrase :

(1) Tout ira bien

(2) Il pense que tout ira bien.

(3) Elle pense qu’il pense que tout ira bien.

(4) Il pense qu’elle pense qu’il pense que tout ira bien.

On peut rapidement identifier la logique qui permet de passer de l’un des ´enonc´es au suivant et de fait, on est capable de produire une infinit´e d’´enonc´es. Il faut malgr´e tout admettre que l’utilisation d’un grand nombre de relatives produit des ´enonc´es difficilement compr´ehensibles, mais il est tout `a fait possible d’extraire une id´ee de telles phrases.

Pour d´ecrire le processus langagier, il est important, selon Chomsky, de diff´erencier comp´etence et performance. La comp´etence englobe la capacit´e langagi`ere alors que la performance d´ecrit ce que nous en faisons effectivement. Les probl`emes de compr´ehension dus au nombre de relatives dans les exemples pr´ec´edents proviennent de notre performance langagi`ere, mais le v´eritable sujet d’´etude du linguiste reste la comp´etence langagi`ere.

La pens´ee empiriste de Skinner, selon laquelle il n’y a pas de structure sous-jacente `a la langue, est ´ebranl´ee par l’argument pr´ec´edent. En r´ealit´e, il fait entrer la notion d’infini dans le concept d’analogie, mais il est par exemple difficile d’argumenter sur l’analogie entre la phrase 2 et la phrase 3 : elles n’ont pas le mˆeme nombre de mots, bien qu’elles aient une structure similaire. Cette approche est malgr´e tout utilis´ee en intelligence ar-tificielle pour la production de syst`emes ‘intelligents’ capables d’apprendre par analogie.

Actuellement, ces derniers ne sont pas en mesure de reconnaˆıtre les exemples 2 et 3. On peut ´egalement illustrer cette possibilit´e par un autre argument o`u les analogies sont ef-fectivement pr´esentes, `a partir des exemples suivants (extraits de [Rei07]) :

(5) L’investigateur a re¸cu deux livres d’Oxford (6) L’investigateur a perdu deux livres d’Oxford

La notion d’analogie est clairement mise en ´evidence avec ces deux phrases, en effet elles sont identiques sauf en ce qui concerne le verbe. Il est donc possible de produire l’exemple7 et par analogie, l’apprenant acceptera la phrase 8(les phrases pr´ec´ed´ees d’un ∗ ne sont pas consid´er´ees comme valides) :

(7) C’est d’Oxford que l’investigateur a re¸cu deux livres. (8) *C’est d’Oxford que l’investigateur a perdu deux livres.

Le cadre de la pens´ee empiriste ne r´esiste pas `a ce nouvel argument. En cons´equence, on peut difficilement justifier de suivre ce courant pour obtenir une mod´elisation pertinente de la langue naturelle. Selon Chomsky, il existe un mod`ele abstrait sous-jacent `a la langue, qui offre de meilleures perspectives et nous reviendrons ult´erieurement sur celles-ci.

De ces premiers commentaires, on retiendra le caract`ere infini de la langue, la structure sous-jacente, la distinction entre comp´etence et performance, le terme de g´en´erativisme qui provient de l’ad´equation du mod`ele avec la notion de comp´etence du locuteur (ce qui peut ˆetre g´en´er´e).

1.2 Pour une histoire

La linguistique g´en´erative est issue des travaux de Noam Chomsky. Elle date de plus de cinquante ans et a beaucoup ´evolu´e entre son introduction et sa version actuelle. Ces mo-difications sont en grande partie dues au sujet de l’´etude lui-mˆeme, qui est un ph´enom`ene naturel, donc la perception que l’on en a, est influenc´ee par le contexte socio-culturel. Dans sa courte histoire, la linguistique g´en´erative a connu trois grandes p´eriodes visant chacune ses objectifs propres. Actuellement, ces trois axes sont encore fortement pr´esents et inspirent des travaux nouveaux, certes voisins mais n´eanmoins diff´erents. L’identifica-tion de ces p´eriodes permet de comprendre comment, et en quoi, les enjeux ont ´evolu´e. Cette pr´esentation en trois grandes p´eriodes a ´et´e propos´ee par Boeckx et Hornstein dans [BHar]. Ils distinguent les phases combinatoire, cognitive et minimaliste. Pour chacune, les travaux ont ´et´e influenc´es par des parall`eles avec des sciences plus anciennes et plus d´evelopp´ees. Ainsi la phase combinatoire serait plus proche de l’ing´enierie, la cognitive de la biologie et la phase minimaliste de la physique.

`

A Chacune de ces p´eriodes est associ´ees un texte fondateur de Noam Chomsky qui propose les axes principaux de ses recherches. Le texte central de la phase combinatoire est Syntactic Structures, [Cho57]. La p´eriode cognitive peut ˆetre dissoci´ee en deux moments : le premier est ouvert par Aspects of the Theory of Syntax, [Cho65], et le second par Lectures on Government and Binding, [Cho81]. Cette p´eriode est la plus longue, ce qui explique la distinction en deux parties. Enfin, la derni`ere, est issue du Minimalist Programm, [Cho95]. Bien que le sujet d’´etude de tous ces textes soit le mˆeme, chacun se focalise sur un aspect particulier de la langue. Ils peuvent ˆetre vus comme des balises dans la courte histoire de

la linguistique g´en´erative. Nous allons revenir sur chacune de ces p´eriodes pour d´egager et expliciter les enjeux du minimalisme, sujet de ce manuscrit.

1.2.1 La phase combinatoire

Comme nous l’avons ´evoqu´e, la phase combinatoire s’ouvre avec Syntactic Structures. Ce texte d’une centaine de page annonce une nouvelle th´eorie linguistique. Le principe fondamental en est de d´evelopper un formalisme explicite (“g´en´eratif”) qui puisse rendre compte de ph´enom`enes linguistiques. Chomsky y pose le probl`eme de la fa¸con suivante :

“Le but fondamental de l’analyse linguistique d’une langue L est de s´eparer les s´equences grammaticales qui sont des phrases de L des s´equences non grammaticales qui ne sont pas des phrases de L. La grammaire de L sera donc un dispositif qui engendre toutes les phrases grammaticales de L, et aucune des phrases non grammaticales”

De ce point de vue, l’enjeu est donc de trouver une formalisation rendant compte pr´ecis´ement d’une langue naturelle, c’est-`a-dire de ses productions acceptables (les pro-ductions en langue naturelle ´etant infinies). L’analyse est alors vue de fa¸con combinatoire puisque toutes les productions sont envisageables. Le but est de caract´eriser l’ensemble des productions possibles par des r`egles (une grammaire) permettant de dissocier les deux ensembles infinis de productions possibles/impossibles. On remarquera aussi que le terme de g´en´erativiste provient de cette perspective de g´en´erer uniquement les phrases gramma-ticalement correctes.

Cette th´eorie pr´esente deux arguments importants, qui sont d´evelopp´es dans la com-paraison des avantages et inconv´enients des formalisations alternatives de la grammaire. D’abord, l’impossibilit´e pour des grammaires `a ´etats finis d’ˆetre un mod`ele correct. En effet, les processus d’´etats finis (dits markoviens) sont incapables de mod´eliser les langues ayant des d´ependances entre ´el´ements non-contigus : par exemple, une chaˆıne qui poss`ede n occurrences d’un a puis autant d’un b. Ce type de d´ependance est extrˆemement pr´esent dans les langues naturelles, comme le montre Chomsky :

Soient S1, S2, S3, . . . , des phrases d´eclaratives du fran¸cais. On peut avoir les phrases :

(9) Si S1, alors S2. (10) Soit S3, soit S4.

(11) La personne qui a dit S5, va arriver aujourd’hui

Dans (9) on ne peut pas avoir ou `a la place de alors ; dans (10) on ne peut pas avoir alors `a la place de soit et dans (11) on ne peut avoir vont `a la place de va. Dans chacune de ces trois phrases il y a une d´ependance entre des mots de part et d’autre de la virgule, mais pour chacune de ces d´ependances, on peut ins´erer une phrase d´eclarative (voire l’un des trois exemples).

Il est clair qu’en fran¸cais on peut construire une phrase a + S1 + b avec une d´ependance entre a et b, et l’on peut choisir pour S1 une phrase contenant une nouvelle d´ependance, par exemple c + S2+ d, puis choisir pour S2 une autre phrase de la mˆeme forme, etc. Un ensemble de telles phrases aura

toutes les propri´et´es qui les excluent de l’ensemble des langages `a ´etats finis.

Dans cet exemple on voit le caract`ere infini des productions langagi`eres r´ealisables et celui de l’utilisation de d´ependances non locales. Ces deux aspects ne peuvent ˆetre pris en compte par les grammaires d’´etats finis. On montre ais´ement la pr´esence de ce type de construction pour un grand nombre de langues naturelles, ce qui rend de telles grammaires inaptes `a rendre compte de la structure langagi`ere.

Chomsky aborde un autre type de grammaires : les grammaires `a structure de phrases. Elles ´echouent `a rendre compte de la langue naturelle mais pour un argument bien diff´erent. Elles peuvent tout `a fait produire une infinit´e d’´enonc´es, cependant, elles se contentent de “coller” `a la langue. Chomsky les qualifie alors “d’extrˆemement complexes, ad hoc, et peu transparentes”. L’id´ee sous-jacente est que, bien qu’il soit possible d’utiliser la description des ph´enom`enes pour les reconnaˆıtre, le grand nombre de r`egles n´ecessaires pour en rendre compte, ainsi que tous les cas particuliers, se rapproche de la tentative de d´ecrire une infinit´e de r`egles. L’argument selon lequel un grand nombre de vies finies ne suffisent pas `a d´ecrire une infinit´e d’´el´ements est suffisant pour remettre en cause ce type d’approche.

La probl´ematique est donc de trouver les g´en´eralisations significatives ´evidentes. Chom-sky exhibe l’exemple de la formation des phrases passives qui a ouvert une large discussion. Nous nous contenterons de pr´esenter l’exemple et de commenter bri`evement la comparai-son entre les grammaires `a structure de phrases et la perspective chomskyenne. Soient les deux ´enonc´es suivants en relation actif/passif :

(12) John ate a bagel [Jean mangea un beignet]

(13) A bagel was eaten by John [Un beignet a ´et´e mang´e par Jean]

Nous pouvons constater que les relations verbe/sujet et verbe/objet de (12) ne trouvent pas de restriction dans les mˆemes relations de (13). Les phrases suivantes sont des repr´esenta-tions abstraites de structures de phrases o`u N P d´esigne un groupe nominal et V un verbe. Donc si (14) est correct alors (15) l’est aussi. Et sinon, (15) est ´egalement faux.

(14) N P1 V N P2

(15) N P2 be V +en by N P1

Nous allons discuter la suite d’exemples qu’il propose : (16) 1. John drinks wine [Jean boit du vin]

2. Wine is drunk by John [Du vin est bu par Jean] 3. Sincerity frightens John [La sinc´erit´e effraie Jean]

4. John is frightened by sincerity [Jean est effray´e par la sinc´erit´e] (17) 1. *Wine drinks John [Du vin boit Jean]

2. *John is drunk by wine [Jean est bu par du vin] 3. *John frightens by sincerity [Jean effraie la sinc´erit´e]

Les restrictions pour les phrases `a l’actif semblent ˆetre en g´en´eral les mˆemes que pour celles au passif. Les grammaires `a structure de phrases doivent donc rendre compte de toutes les restrictions encod´ees pour les verbes transitifs `a l’actif dans leur version au passif. Chomsky soutient que ce type de grammaire ne peut rendre compte d’une g´en´eralisation pour ces ph´enom`enes, ce qui les rend impropres `a ˆetre un outil formel pour la reconnais-sance des langues naturelles.

Il propose alors une r`egle de la forme (Aux d´esigne la position de l’auxiliaire) : (18) Si S1 est une phrase grammaticale de la forme

N P1− Aux − V − N P2

Alors la chaˆıne correspondante de la forme N P2− Aux + be + en − V − by − N P1

est aussi une phrase grammaticale.

Ce type de r`egle ´evite certaines redondances in´el´egantes qui consistent en la description exhaustive des phrases acceptables.

La plupart des travaux de cette phase de la linguistique g´en´erative ont consist´e `a exa-miner diverses combinaisons de r`egles, de structures de phrase et d’op´erations transfor-mationnelles, dont l’objectif ´etait d’engendrer toutes les phrases, et seulement les phrases grammaticales d’un langage L donn´e, et, par l`a, de refl´eter les relations per¸cues par les locuteurs natifs. Les types de transformations pour rendre compte d’un ph´enom`ene pou-vaient soit produire des phrases agrammaticales, soit ´echouer pour d’autres cas, ce qui ´etait un probl`eme r´ecurrent. Ces transformations n’´etaient donc pas n´ecessairement la g´en´eralisation op´er´ee par un locuteur natif. Montrer l’ad´equation entre g´en´eralisation et perception d’un locuteur natif ´etait un probl`eme particuli`erement difficile.

L’identification des axiomes ´etait ´egalement la d´emarche choisie par d’autres disciplines comme l’informatique ou la philosophie. Cette perspective combinatoire a eu de grandes r´epercussions en informatique th´eorique, notamment dans la branche des langages formels, nous y reviendrons au cours du chapitre3.

1.2.2 La phase cognitive

Aspect d’une th´eorie de la syntaxe

Dans cette phase, le g´en´erativisme se place dans une perspective cognitive et biologique. C’est certainement la d´eclaration la plus claire de la th´eorie g´en´erative. Chomsky soutient que le probl`eme central de la linguistique est d’expliquer la capacit´e des enfants `a acqu´erir leur langue maternelle. Il expose deux normes d’´evaluation :

1. Une grammaire est descriptivement ad´equate dans la mesure o`u elle d´ecrit correcte-ment la comp´etence intrins`eque du locuteur natif id´ealis´e.

2. Une th´eorie de la grammaire est descriptivement ad´equate si elle fournit une gram-maire descriptivement ad´equate pour chaque langue naturelle.

La description des grammaires perd le caract`ere combinatoire de la possibilit´e de g´en´erer exactement une langue, mais tend vers une perspective cognitive plus abstraite qui peut se r´esumer par qu’est-ce que la connaissance poss´ed´ee par un locuteur natif. Les grammaires ne sont donc pas ´evalu´ees pour elles-mˆemes mais pour leur correspondance avec la th´eorie de l’ad´equation `a la langue.

La notion d’ad´equation devient plus perceptible si on la regarde par le prisme de la question de la proposition d’un mod`ele d’acquisition de la langue. Le probl`eme qui se pose `

a un enfant peut ˆetre r´esum´e ainsi :

“[Un] enfant qui a appris une langue a d´evelopp´e une repr´esentation interne d’un syst`eme de r`egles... Il l’a fait sur la base d’observations de ce que nous pouvons appeler des donn´ees linguistiquement primaires. `A partir de telles donn´ees, l’enfant construit une grammaire, c’est-`a-dire une th´eorie du langage dont les phrases bien form´ees des donn´ees linguistiques primaires constituent un petit ´echantillon.”

L’objet de l’acquisition est donc de formuler des hypoth`eses sur le mod`ele qui permet `a un locuteur d’apprendre la grammaire de sa langue naturelle. Ainsi, l’une des hypoth`eses fondatrices est que seules les hypoth`eses “valides” soient retenues, c’est-`a-dire que dans la phase d’apprentissage, l’ˆetre humain ne cherche pas le bon degr´e de granularit´e dans la formation des r`egles, mais de mani`ere inn´ee, poss`ede la connaissance de cette granularit´e. Ce postulat peut paraˆıtre singulier, mais est confirm´e par un grand nombre d’´etudes psycholinguistiques.

La non-remise en cause de ce niveau de formalisation interne r´epond au principe de pauvret´e du stimulus. Ce principe sugg`ere que tous les stimuli re¸cus par un enfant ne peuvent recouvrir l’ensemble des ´enonc´es corrects. Tout comme la formation des donn´ees primaires, le principe de pauvret´e du stimulus est la base d’un pan entier de la linguistique g´en´erativiste, dont le r´esultat principal est que la langue ne peut ˆetre apprise par une suite finie de stimuli chez l’enfant. Il est toujours possible de trouver des contre-exemples dans

Documents relatifs