• Aucun résultat trouvé

Les grammaires minimalistes

2.4 Grammaires minimalistes

Nous abordons `a pr´esent la d´efinition des GMs propos´ee par Ed Stabler, [Sta97]. Le syst`eme calculatoire est enti`erement bas´e sur la notion de traits. `A partir de ces derniers, des r`egles de composition sont d´efinies afin d’´etablir les structures grammaticales sur les arbres minimalistes. Les traits sont associ´es `a des items lexicaux (nous reviendrons sur la r´edaction et l’utilisation des lexiques ). Les diff´erents types de traits marquent l’utilisation linguistique qui est faite des items lexicaux dans ces grammaires.

2.4.1 D´efinition

Les ´etapes des d´erivations r´ealis´ees par les GMs sont d´eclench´ees par les traits des entr´ees lexicales. Ces grammaires sont enti`erement lexicalis´ees et de fait d´efinies par la donn´ee de leur lexique. Les r`egles de composition des expressions form´ees sont quant `a elles toujours les mˆemes.

Une grammaire minimaliste est d´efinie par un quintuplet hV, T raits, Lex, Φ, ci o`u : V = {P ∪ I} est l’ensemble fini des traits non-syntaxique o`u,

P est l’ensemble des formes phonologiques et I est l’ensemble des formes logiques

T raits = {B ∪ S ∪ La∪ Le} est l’ensemble fini des traits syntaxiques, Lex est l’ensemble des expressions construites `a partir de P et de T raits, Φ = {merge, move} est l’ensemble des fonctions g´en´eratrices,

c ∈ T raits est le trait acceptant.

Dans ces grammaires, chaque forme phonologique est utilis´ee comme entr´ee du lexique et comme forme associ´ee `a la liste de traits. Ces derni`eres constituent les “terminaux” de la grammaire. Une lecture gauche-droite des formes phonologiques sur les structures d´eriv´ees et accept´ees permet de reconnaˆıtre la s´equence de terminaux reconnue.

Le langage L(G) reconnu par G, une grammaire minimaliste, est la clˆoture du lexique par les fonctions g´en´eratrices φ. `A tout ´enonc´e accept´e par une GM correspondra un arbre minimaliste obtenu `a partir des r`egles de composition sur lesquelles nous reviendrons. Leur fonctionnement permet, pour une phrase d’une langue naturelle, d’obtenir l’arbre d’analyse g´en´erativiste traditionnel.

2.4.2 Les traits

Comme nous l’avons dit, une GM est d´efinie par son lexique qui stocke les ressources. Chaque entr´ee du lexique est d´ecrite par une liste de traits qui encode son comportement lors d’une d´erivation. Une GM contient des traits de deux sortes : les traits syntaxiques et les traits non-syntaxiques.

On note V l’ensemble des traits non syntaxiques compos´e :

– des traits phonologiques (forme phonologique FP) not´es entre barres obliques -/ -/.

– des traits s´emantiques (forme logique/s´emantique - FL) not´es entre parenth`eses - ( ).

L’ensemble des traits syntaxiques est construit `a partir de deux sous-ensembles : l’en-semble des cat´egories de base, not´e B et l’enl’en-semble des traits de d´eplacement, not´e D. En utilisant ces sous-ensembles, on d´efinit les diff´erents types de traits utilis´es dans les listes des items lexicaux de la grammaire :

– soit B = {v, dp, c, · · · } l’ensemble des cat´egories de base, – soit S = {=d | d ∈ B} l’ensemble des s´electeurs,

– soit La= {+k | k ∈ D} l’ensemble des assignateurs, – soit Le= {−k | k ∈ D} l’ensemble des assign´es.

Revenons sur le rˆole et la signification de chacun de ces ´el´ements.

Lorsque l’on mod´elise une langue naturelle, les ´el´ements de B d´enotent des concepts lin-guistiques standards, par exemple v pour un verbe, n pour un nom, p pour une pr´eposition, d pour un d´eterminant... Dans cet ensemble, on distingue un type particulier appel´e trait acceptant, qui sera le symbole acceptant de la grammaire. G´en´eralement on utilise le trait c qui repr´esente la position complementizer de la d´erivation, c’est-`a-dire l’´etat auquel on v´erifie la terminaison de la phrase. Dans ce cas, c est l’unique trait syntaxique pr´esent dans l’arbre d’analyse et il est sur la tˆete.

Les s´electeurs expriment une demande par rapport `a une autre expression poss´edant le trait de base ´equivalent. Si α est un trait de base, =α est un s´electeur. Il exprime la demande d’une expression poss´edant le mˆeme trait α.

Les assignateurs sont les traits qui assignent une propri´et´e `a une expression et qui sont dans une relation sp´ecifieur-tˆete par rapport `a celle qui les porte. `A nouveau, lors de la mod´elisation d’une langue naturelle, les assignateurs sont utilis´es pour apporter une propri´et´e `a une autre expression (c’est par exemple le cas pour les langues naturelles). Cette derni`ere vient occuper une nouvelle place en relation sp´ecifieur par rapport `a la tˆete.

Parall`element, l’expression recevant le trait assign´e doit ˆetre appropri´ee, autrement dit elle demande `a recevoir ce trait. On traduit cela par le fait qu’elle poss`ede le trait compl´ementaire de +f qui est not´e −f . Pour le traitement d’une langue naturelle, le correspondant du trait +cas sera −cas, poss´ed´e uniquement par les groupes nominaux qui doivent n´ecessairement recevoir un cas.

L’union de ces ensembles forme l’ensemble des traits syntaxiques de la grammaire utilis´es pour mod´eliser le comportement syntaxique des items lexicaux T raits = {B ∪ S ∪ Le∪ La}.

`

A partir de ces ensembles, on d´efinit la structure d’une entr´ee lexicale comme un ´el´ement de :

(S(S ∪ La))B(Le)/F P/(F L) ou bien B(Le)/F P/(F L)

Les FL n’´etant pas r´eellement prises en compte lors des d´erivations, pour pr´esenter les lexiques nous utiliserons la notation pour laquelle la liste de traits est s´epar´ee de la forme phonologique associ´ee par deux points :

FP : liste de traits

Ces listes peuvent ˆetre reconnues par un automate r´egulier donn´e en figure55, extension de la proposition de [Ver99]. Dans cette structure, on distingue deux parties, la premi`ere

contenant des s´electeurs et des assignateurs, traits d´eclenchant les r`egles comme nous allons le voir, puis un trait de base et des assign´es, traits attendant d’ˆetre compos´es dans la suite de la d´erivation.

De mani`ere analogue, on peut les d´efinir par une grammaire r´eguli`ere (nous utiliserons cette d´efinition dans un chapitre ult´erieur) : soit b quelconque appartenant `a B et d quelconque appartenant `a D, la liste de traits associ´ee `a un item lexical est reconnue par la grammaire :

L ::= =b S1 | B

S1 ::= =b S1 | +d S1 | B B ::= b S2| b

S2 ::= −d S2| −d

Pour la suite, nous adopterons les notations suivantes : e est un trait d’un type ar-bitraire et E une suite de traits ´eventuellement vide. Une entr´ee lexicale est compos´ee d’au moins une suite de traits et d’une forme phonologique associ´ee not´ee entre barres obliques : e1E/ζ1/. I II III b =b b -d =b +d

Fig. 11 – Structure de la liste de traits d’un item lexical.

2.4.3 Op´erations

Soit Φ l’ensemble des fonctions g´en´eratrices. Φ contient deux types d’op´eration sur les arbres minimalistes : la fusion (merge) et le d´eplacement (move), chacune de ces op´erations pouvant ˆetre raffin´ee. Les d´eclenchements de la fusion et du d´eplacement sont conditionn´es par le premier trait de la liste sur la tˆete de l’arbre.

La suite des op´erations qui interviennent dans une d´erivation permet de g´en´erer plu-sieurs types de repr´esentations : l’arbre d’analyse (arbre minimaliste obtenu apr`es ac-ceptation de l’´enonc´e) et l’ensemble des arbres d´eriv´es (arbres interm´ediaires vers l’arbre d’analyse). La suite des arbres d´eriv´es peut ˆetre recalcul´ee `a partir de l’arbre d’analyse et de la succession des r`egles utilis´ees pour l’obtenir. En g´en´eral, nous nous efforcerons de donner les diff´erentes ´etapes produites lors d’une analyse en se basant sur ces arbres interm´ediaires.

Pour A une grammaire minimaliste, on note TG = TM G(A). La fusion

La fusion (merge) est une op´eration qui unit deux arbres pour en former un troisi`eme. Cette op´eration est d´eclench´ee par la pr´esence d’un s´electeur et d’un trait de base corres-pondant. merge : TM G× TM G → TM G. Les traits utilis´es pour cette op´eration sont alors effac´es.

Soient t et t ∈ TM G(A) tels que t = Ht[l : =h E] et t = Ht[l : h E] avec h ∈ B :

merge(t, t) = 

< (l : E, Ht[l: E]) si t ∈ Lex, > (Ht[l : E], Ht[l : E]) sinon.

La repr´esentation graphique de cette r`egle est donn´ee par la figure 56. La fusion est l’op´eration qui met en relation les diff´erentes expressions construites au fur et `a mesure de la d´erivation. La tˆete du nouvel arbre pointe vers l’expression portant le s´electeur.

∀t, t ∈ TM G tels que t = Ht[l : =h E], t = Ht[l : h E] avec h ∈ B :

E E' > h E' t : =h E t' : merge(t,t') : E' E < h E' t : =h E t' : merge(t,t') : si t Lex sinon

Fig. 12 – Repr´esentation sous forme d’arbre de la fusion. Le d´eplacement

Comme nous l’avons pr´esent´e dans le chapitre pr´ec´edent, cette seconde op´eration est primordiale dans la d´efinition de la grammaire g´en´erative. Elle correspond au d´eplacement effectif d’un constituant en premi`ere position de la d´erivation, c’est-`a-dire en haut de l’arbre d´eriv´e. Elle r´ealise une restructuration d’un arbre minimaliste. La pr´esence simultan´ee d’un ´el´ement de La en premi`ere position de la liste de traits de la tˆete et d’un ´el´ement de Le ´equivalent en premi`ere position d’une liste de traits d’une des occurrences du mˆeme arbre la d´eclenche.

De mani`ere intuitive la proc´edure est la suivante : lorsque le premier trait de la tˆete d’une d´erivation est un assignateur (+), on cherche dans le reste de la d´erivation une feuille dont le premier trait est l’assign´e (−) ´equivalent. Si on en trouve un, on d´eclenche un d´eplacement en faisant passer en haut de l’arbre la projection maximale de la feuille portant l’assign´e. La tˆete de la nouvelle expression reste celle de l’expression avant d´eplacement. Il se peut qu’il y ait plusieurs feuilles dont le premier trait est l’assign´e (−) ´equivalent. Le choix d’une feuille particuli`ere rend l’op´eration de d´eplacement non-d´eterministe.

move : TM G→ TM G

pour tout arbre t = C[l : +g E, l: −g E], tel que t = Ht[l : +g E].

Il existe C1, C2 ∈ St tels que : C2 est la projection maximale de la feuille l et C1 est t priv´e de C2. On a alors t = C1[l : +g E, C2[l : −g E]].

– C2[l : −g E] = projmax(C[l: −g E]) – C1[l : +g E, x1] = projmax(C[l : +g E, x1])

move(t) = >(C2[l : E], C1[l : E, ǫ]) o`u ǫ est la feuille vide.

Si t est obtenu par d´eplacement `a partir de t, nous noterons que t ∈ move(t). Le sous-arbre est alors en relation sp´ecifieur-tˆete. Les deux traits ayant permis le d´eplacement sont alors supprim´es. La repr´esentation graphique des r`egles est pr´esent´ee dans la figure57. +g E -g E' C C2 E C1 E' > t move(t)

Fig. 13 – Repr´esentation sous forme d’arbre du d´eplacement.

Comme nous l’avons vu dans le chapitre pr´ec´edent, tous les d´eplacements ne sont pas envisageables. On ajoute (ou non) des conditions sur les d´eplacements possibles. Une condition majeure dans la d´efinition mˆeme du programme minimaliste est la condition d’´economie. Ainsi, en cas d’ambigu¨ıt´e, le d´eplacement doit avoir lieu sur l’´el´ement le plus proche de la tˆete. Cependant, les linguistes sont tr`es partag´es sur la d´efinition d’une notion de proximit´e entre constituants. Pour ne pas trancher, nous suivons [Sta97] et nous utilisons une condition forte sur le principe d’´economie, qui l’englobe, pour laquelle il ne doit pas y avoir d’ambigu¨ıt´e dans le d´eclenchement d’un d´eplacement - Shortest Move Condition (SMC). Sous cette condition, l’op´eration de d´eplacement devient d´eterministe. Cela se traduit par la propri´et´e si : t = C[l : +g E, l : −g E] alors pour tout C, t = C[l1 : E1, l2: E2] et E1= −h1 E1 et E2 = −h2 E2 et h26= h1.

Une condition de localit´e peut aussi ˆetre utilis´ee, la Specifier Island Condition - SPIC. Les “islands” d´efinissent les domaines qui interdisent des extractions. La SPIC impose que pour ˆetre d´eplac´e, un ´el´ement ne doit pas ˆetre en position de sp´ecifieur `a l’int´erieur d’un sous-arbre. Cette condition a ´et´e introduite par Ed Stabler dans [Sta99] en s’inspirant des travaux de [KS00] et [Kay98] qui proposent que les ´el´ements d´eplac´es soient uniquement en position de compl´ement.

Stabler propose ´egalement un raffinement du d´eplacement. On distingue les d´eplacements dits forts des d´eplacements dits faibles. C’est alors une gestion particuli`ere des formes phonologiques. Le d´eplacement fort d´eplacera toutes les composantes de l’´el´ement, alors que le d´eplacement faible laissera en position initiale la forme phonologique.

On note les traits de d´eplacement fort en majuscules et les traits de d´eplacement faible en minuscules et on utilise cette notation tant pour les assign´es que pour les assignateurs. Le d´eplacement fort est le d´eplacement pr´esent´e dans la section d´eplacement. Le d´eplacement faible est alors, dans les mˆemes conditions :

move(t) = >(C2[ǫ : E], C1[l : E, l])

Graphiquement, les d´eplacements sont les mˆemes, sauf pour la partie phonologique, comme le montre la figure 14o`u /l/ n’est pas d´eplac´e dans sa position d’origine.

+g E -g E' C C2 E C1 E' > t /l'/ move(t) /l'/ /l/ /l/

Fig. 14 – Repr´esentation graphique du d´eplacement faible.

C’est en faisant varier la valeur fort/faible sur certains traits que l’on obtient des va-riations dans l’ordre des mots. C’est notamment ce qui permet d’analyser, `a partir des mˆemes r`egles, des langues SOV - Objet-Verbe, comme le Japonais, ou SVO - Sujet-Verbe-Objet, comme le fran¸cais. On donne de cette mani`ere une r´ealisation de la notion de param`etres d’une langue naturelle, comme pr´esent´ee dans le chapitre pr´ec´edent.

On peut ´etendre les d´efinitions pr´ec´edentes pour obtenir un syst`eme plus performant dans la reconnaissance d’´enonc´es en langue naturelle, comme Stabler l’´etablit dans [Sta01]. En effet, plusieurs ´etudes linguistiques montrent que parfois seule la tˆete d’un consti-tuant doit changer de position. C’est ce qu’on appelle “Head Movement”. Ceci se pr´esente notamment dans le cas d’inversion du sujet et du verbe avec son inflexion dans les questions. Dans ce cas, on parle de transformation T-to-C (car le verbe quitte sa po-sition de “verbe ayant re¸cu son inflexion” T pour monter en fin de d´erivation C). Un exemple de question avec inversion du sujet sera donn´e comme illustration dans la section

2.5.

La partie phonologique d´eplac´ee peut avoir ´et´e construite par d’autres fusions de tˆete. De plus, son positionnement `a droite ou `a gauche de la nouvelle tˆete est d´etermin´e par un marqueur sp´ecifique sur le s´electeur.

Cette op´eration, contrairement `a ce que son nom pourrait laisser supposer, n’est pas un nouveau type de d´eplacement, mais une r´eelle fusion, comme le montre [Sta01]. L’iden-tification syst´ematique de la tˆete est alors n´ecessaire lors de l’analyse.

La fusion de tˆete est d´eclench´ee par un trait de s´election sp´ecial. On d´efinit les deux ensembles de traits suivants :

Soit Sg = {=>x | x ∈ B} l’ensemble des traits d´eclenchant une fusion de tˆete o`u la tˆete est adjointe `a gauche.

Soit Sd = {x<= | x ∈ B} l’ensemble des traits d´eclenchant une fusion de tˆete o`u la tˆete est adjointe `a droite.

On d´efinit la fusion de tˆete avec adjonction `a gauche, sous les mˆemes conditions que la fusion, par :

soient t et t ∈ TM G(A) tels que t = Ht[l : =>h E] et t = Ht[l : h E] avec h ∈ B :

merge(t, t) = 

< (Ht[ll : E], Ht[ǫ : E]) si t ∈ Lex, < (Ht[ǫ : E], (Ht[ll : E]) sinon.

o`u seules les positions des formes phonologiques sont diff´erentes. Et la fusion de tˆete avec adjonction `a droite, sous les mˆemes conditions que la fusion, par :

soient t et t ∈ TM G(A) tels que t = Ht[l : =>h E] et t = Ht[l : h E] avec h ∈ B :

merge(t, t) = 

< (Ht[ll : E], Ht[ǫ : E]) si t ∈ Lex, < (Ht[ǫ : E], (Ht[ll: E]) sinon.

On peut remarquer que quelle que soit la GM utilisant les fusions de tˆete, il existe une GM sans fusion de tˆete ´equivalente sur les chaˆınes. Cependant, l’ajout de cette op´eration nous permet de conserver des analyses ´equivalentes `a celles donn´ees classiquement en lin-guistique g´en´erative.

Revenons sur le cas de l’inflexion. Une ´etude de la position des adverbes en anglais montre que les ´enonc´es sont de la forme Sujet-adverbe-inflexion-verbe-objet, contraire-ment au fran¸cais o`u l’adverbe se positionne entre l’inflexion et le verbe. Les linguistes g´en´erativistes expliquent cette variation par une descente de l’inflexion vers le verbe prin-cipal, comme nous l’avons expos´e dans le chapitre pr´ec´edent. Cette op´eration est appel´ee Affix Hopping et est mod´elis´ee par extension de Head Movement.

On d´efinit les deux ensembles de traits suivants :

Soit Sahg = {x=> | x ∈ B} l’ensemble des traits d´eclenchant un Affix Hopping o`u la tˆete est adjointe `a gauche.

Soit Sahd = {<=x | x ∈ B} l’ensemble des traits d´eclenchant un Affix Hopping o`u la tˆete est adjointe `a droite.

On d´efinit l’Affix-Hopping avec adjonction de la forme phonologique `a gauche par : soient t et t ∈ TM G(A) tels que t = Ht[l : <=h E] et t = Ht[l : h E] avec h ∈ B :

merge(t, t) = 

< (Ht[ǫ : E], Ht[ll : E]) si t ∈ Lex, < (Ht[ll : E], (Ht[ǫ : E]) sinon.

et l’Affix-Hopping avec adjonction de la forme phonologique `a droite par :

merge(t, t) = 

< (Ht[ǫ : E], Ht[ll : E]) si t ∈ Lex, < (Ht[ll: E], (Ht[ǫ : E]) sinon.

L’op´eration d’Affix-Hopping est donc une op´eration inverse de la fusion de tˆete par rapport `a Head Movement, les deux ne diff´erant de la fusion standard que pour la gestion des formes phonologiques.

Une derni`ere op´eration est parfois ajout´ee dans l’utilisation des GMs. Nous ne ferons que l’´evoquer ici car elle ne sera pas utilis´ee dans la suite. Il s’agit de l’adjonction. Une proposition de formalisation dans le cadre des GMs a ´et´e donn´ee dans [MG03]. Elle se fait par introduction d’un nouveau marqueur ≈ d´efinissant un nouvel ensemble de traits. Cette op´eration est analogue `a la fusion mais sa particularit´e r´eside dans la non-consommation du trait de base avec lequel il y a combinaison.

Enfin, une autre d´efinition des GMs a ´et´e introduite `a partir non plus des structures d’arbres mais des chaˆınes [Sta99]. Cette seconde version pr´esente des avantages pour la partie calculatoire mais perd en qualit´e de repr´esentation. Nous pr´esentons `a titre indicatif cette d´efinition dans l’annexe A. Nous nous attacherons dans la suite de ce manuscrit `a conserver la version des GMs sur les arbres minimalistes.

2.5 Exemples d’utilisation des GMs

Nous allons pr´esenter les ´etapes d’analyses r´ealis´ees par une GM pour deux ´enonc´es du fran¸cais. Pour cela, nous pr´esenterons les diff´erents arbres d´eriv´es qui permettent d’aboutir `

a l’arbre d’analyse. Chaque grammaire utilise les r`egles d´efinies pr´ec´edemment. Afin de simplifier la pr´esentation, nous donnons uniquement le lexique n´ecessaire `a la r´ealisation de la d´erivation. Ainsi, nous supposons que les ensembles de traits sont induits par ces lexiques. Le trait acceptant est toujours le trait c.

Lors d’une analyse standard, on suppose que chaque groupe nominal attend une at-tribution de cas, ce qui se fera par une v´erification de la pr´esence simultan´ee dans une d´erivation, d’une demande de cas et d’une donation de cas, (i.e. par un d´eplacement).

De plus, nous faisons entrer dans l’analyse l’inflexion du verbe se basant sur l’obser-vation commune que seul un verbe conjugu´e peut prendre un sujet. Enfin, l’analyse se terminera par une v´erification du fait que la phrase n’est pas une relative enchˆass´ee ou une question, donc qu’en tant que telle, elle est une phrase simple.

2.5.1 Phrase standard

Les phrases standard en fran¸cais respectent un ordre donn´e o`u le sujet est le premier ´el´ement de la phrase, suivi du verbe, lui-mˆeme suivi de son objet. Par exemple :

(23) Pierre S prend V un train. O

Lexique 21.

P ierre : d -case inf l : <=v +case V

un : =n d -case comp : =V c

train : n

prendre : =d +case =d v

Nous revenons sur la composition de ce lexique. Dans ce lexique, nous introduisons un nom propre qui fonctionne alors comme un groupe nominal. Dans ce cas, il est de cat´egorie d - pour determinal phrase - et il attend une attribution de cas. De mani`ere analogue, on trouve un nom commun et un d´eterminant. C’est le d´eterminant qui construit le groupe nominal, d’o`u l’appellation determinal phrase. Le verbe attend deux groupes nominaux et peut attribuer un cas.

Les deux autres entr´ees correspondent `a deux ´etapes que nous introduisons syst´emati-quement dans les analyses : d’une part l’inflexion, et d’autre part la partie complementizer. L’inflexion porte sur le verbe et introduit le cas nominatif (position T dans la d´erivation). Ainsi seuls les verbes ayant re¸cu leur inflexion pourront recevoir pleinement leur sujet. La derni`ere entr´ee correspond `a la phase de complementizer v´erifiant la bonne terminaison

Documents relatifs