Grammaires minimalistes - Les grammaires minimalistes

Les grammaires minimalistes

2.4 Grammaires minimalistes

Nous abordons à présent la définition des GMs proposée par Ed Stabler, [Sta97]. Le système calculatoire est entièrement basé sur la notion de traits. À partir de ces derniers, des règles de composition sont définies afin d’établir les structures grammaticales sur les arbres minimalistes. Les traits sont associés à des items lexicaux (nous reviendrons sur la rédaction et l’utilisation des lexiques ). Les différents types de traits marquent l’utilisation linguistique qui est faite des items lexicaux dans ces grammaires.

2.4.1 D´efinition

Les étapes des dérivations réalisées par les GMs sont déclenchées par les traits des entrées lexicales. Ces grammaires sont entièrement lexicalisées et de fait définies par la donnée de leur lexique. Les règles de composition des expressions formées sont quant à elles toujours les mêmes.

Une grammaire minimaliste est définie par un quintuplet hV, T raits, Lex, Φ, ci où : V = {P ∪ I} est l’ensemble fini des traits non-syntaxique où,

P est l’ensemble des formes phonologiques et I est l’ensemble des formes logiques

T raits = {B ∪ S ∪ L_a∪ L_e} est l’ensemble fini des traits syntaxiques, Lex est l’ensemble des expressions construites à partir de P et de T raits^∗, Φ = {merge, move} est l’ensemble des fonctions génératrices,

c ∈ T raits est le trait acceptant.

Dans ces grammaires, chaque forme phonologique est utilisée comme entrée du lexique et comme forme associée à la liste de traits. Ces dernières constituent les “terminaux” de la grammaire. Une lecture gauche-droite des formes phonologiques sur les structures dérivées et acceptées permet de reconnaˆıtre la séquence de terminaux reconnue.

Le langage L(G) reconnu par G, une grammaire minimaliste, est la clôture du lexique par les fonctions génératrices φ. À tout énoncé accepté par une GM correspondra un arbre minimaliste obtenu à partir des règles de composition sur lesquelles nous reviendrons. Leur fonctionnement permet, pour une phrase d’une langue naturelle, d’obtenir l’arbre d’analyse générativiste traditionnel.

2.4.2 Les traits

Comme nous l’avons dit, une GM est définie par son lexique qui stocke les ressources. Chaque entrée du lexique est décrite par une liste de traits qui encode son comportement lors d’une dérivation. Une GM contient des traits de deux sortes : les traits syntaxiques et les traits non-syntaxiques.

On note V l’ensemble des traits non syntaxiques compos´e :

– des traits phonologiques (forme phonologique FP) not´es entre barres obliques -/ -/.

– des traits sémantiques (forme logique/sémantique - FL) notés entre parenthèses - ( ).

L’ensemble des traits syntaxiques est construit à partir de deux sous-ensembles : l’en-semble des catégories de base, noté B et l’enl’en-semble des traits de déplacement, noté D. En utilisant ces sous-ensembles, on définit les différents types de traits utilisés dans les listes des items lexicaux de la grammaire :

– soit B = {v, dp, c, · · · } l’ensemble des cat´egories de base, – soit S = {=d | d ∈ B} l’ensemble des s´electeurs,

– soit L_a= {+k | k ∈ D} l’ensemble des assignateurs, – soit L_e= {−k | k ∈ D} l’ensemble des assign´es.

Revenons sur le rôle et la signification de chacun de ces éléments.

Lorsque l’on modélise une langue naturelle, les éléments de B dénotent des concepts lin-guistiques standards, par exemple v pour un verbe, n pour un nom, p pour une préposition, d pour un déterminant... Dans cet ensemble, on distingue un type particulier appelé trait acceptant, qui sera le symbole acceptant de la grammaire. Généralement on utilise le trait c qui représente la position complementizer de la dérivation, c’est-à-dire l’état auquel on vérifie la terminaison de la phrase. Dans ce cas, c est l’unique trait syntaxique présent dans l’arbre d’analyse et il est sur la tête.

Les sélecteurs expriment une demande par rapport à une autre expression possédant le trait de base équivalent. Si α est un trait de base, =α est un sélecteur. Il exprime la demande d’une expression possédant le même trait α.

Les assignateurs sont les traits qui assignent une propriété à une expression et qui sont dans une relation spécifieur-tête par rapport à celle qui les porte. À nouveau, lors de la modélisation d’une langue naturelle, les assignateurs sont utilisés pour apporter une propriété à une autre expression (c’est par exemple le cas pour les langues naturelles). Cette dernière vient occuper une nouvelle place en relation spécifieur par rapport à la tête.

Parallèlement, l’expression recevant le trait assigné doit être appropriée, autrement dit elle demande à recevoir ce trait. On traduit cela par le fait qu’elle possède le trait complémentaire de +f qui est noté −f . Pour le traitement d’une langue naturelle, le correspondant du trait +cas sera −cas, possédé uniquement par les groupes nominaux qui doivent nécessairement recevoir un cas.

L’union de ces ensembles forme l’ensemble des traits syntaxiques de la grammaire utilis´es pour mod´eliser le comportement syntaxique des items lexicaux T raits = {B ∪ S ∪ L_e∪ L_a}.

A partir de ces ensembles, on définit la structure d’une entrée lexicale comme un élément de :

(S(S ∪ La)^∗)^∗B(Le)^∗/F P/(F L) ou bien B(L_e)^∗/F P/(F L)

Les FL n’étant pas réellement prises en compte lors des dérivations, pour présenter les lexiques nous utiliserons la notation pour laquelle la liste de traits est séparée de la forme phonologique associée par deux points :

FP : liste de traits

Ces listes peuvent être reconnues par un automate régulier donné en figure55, extension de la proposition de [Ver99]. Dans cette structure, on distingue deux parties, la première

contenant des sélecteurs et des assignateurs, traits déclenchant les règles comme nous allons le voir, puis un trait de base et des assignés, traits attendant d’être composés dans la suite de la dérivation.

De manière analogue, on peut les définir par une grammaire régulière (nous utiliserons cette définition dans un chapitre ultérieur) : soit b quelconque appartenant à B et d quelconque appartenant à D, la liste de traits associée à un item lexical est reconnue par la grammaire :

L ::= =b S1 | B

S₁ ::= =b S₁ | +d S1 | B B ::= b S₂| b

S2 ::= −d S2| −d

Pour la suite, nous adopterons les notations suivantes : e est un trait d’un type ar-bitraire et E une suite de traits éventuellement vide. Une entrée lexicale est composée d’au moins une suite de traits et d’une forme phonologique associée notée entre barres obliques : e₁E/ζ₁/. I II III b =b b ^-d =b +d

Fig. 11 – Structure de la liste de traits d’un item lexical.

2.4.3 Op´erations

Soit Φ l’ensemble des fonctions génératrices. Φ contient deux types d’opération sur les arbres minimalistes : la fusion (merge) et le déplacement (move), chacune de ces opérations pouvant être raffinée. Les déclenchements de la fusion et du déplacement sont conditionnés par le premier trait de la liste sur la tête de l’arbre.

La suite des opérations qui interviennent dans une dérivation permet de générer plu-sieurs types de représentations : l’arbre d’analyse (arbre minimaliste obtenu après ac-ceptation de l’énoncé) et l’ensemble des arbres dérivés (arbres intermédiaires vers l’arbre d’analyse). La suite des arbres dérivés peut être recalculée à partir de l’arbre d’analyse et de la succession des règles utilisées pour l’obtenir. En général, nous nous efforcerons de donner les différentes étapes produites lors d’une analyse en se basant sur ces arbres intermédiaires.

Pour A une grammaire minimaliste, on note T_G = T_{M G}(A). La fusion

La fusion (merge) est une opération qui unit deux arbres pour en former un troisième. Cette opération est déclenchée par la présence d’un sélecteur et d’un trait de base corres-pondant. merge : T_{M G}× T_{M G} → T_{M G}. Les traits utilisés pour cette opération sont alors effacés.

Soient t et t^′ ∈ TM G(A) tels que t = H_t[l : =h E] et t^′ = H_t′[l^′ : h E^′] avec h ∈ B :

merge(t, t^′) =

< (l : E, H_t′[l′: E′]) si t ∈ Lex, > (H_t′[l′ : E′], H_t[l : E]) sinon.

La représentation graphique de cette règle est donnée par la figure 56. La fusion est l’opération qui met en relation les différentes expressions construites au fur et à mesure de la dérivation. La tête du nouvel arbre pointe vers l’expression portant le sélecteur.

∀t, t′ ∈ TM G tels que t = Ht[l : =h E], t^′ = H_t′[l : h E^′] avec h ∈ B :

E E' > h E' t : =h E t' : merge(t,t') : E' E < h E' t : =h E t' : merge(t,t') : si t ∈_Lex sinon

Fig. 12 – Repr´esentation sous forme d’arbre de la fusion. Le d´eplacement

Comme nous l’avons présenté dans le chapitre précédent, cette seconde opération est primordiale dans la définition de la grammaire générative. Elle correspond au déplacement effectif d’un constituant en première position de la dérivation, c’est-à-dire en haut de l’arbre dérivé. Elle réalise une restructuration d’un arbre minimaliste. La présence simultanée d’un élément de L_a en première position de la liste de traits de la tête et d’un élément de L_e équivalent en première position d’une liste de traits d’une des occurrences du même arbre la déclenche.

De manière intuitive la procédure est la suivante : lorsque le premier trait de la tête d’une dérivation est un assignateur (+), on cherche dans le reste de la dérivation une feuille dont le premier trait est l’assigné (−) équivalent. Si on en trouve un, on déclenche un déplacement en faisant passer en haut de l’arbre la projection maximale de la feuille portant l’assigné. La tête de la nouvelle expression reste celle de l’expression avant déplacement. Il se peut qu’il y ait plusieurs feuilles dont le premier trait est l’assigné (−) équivalent. Le choix d’une feuille particulière rend l’opération de déplacement non-déterministe.

move : TM G→ TM G

pour tout arbre t = C[l : +g E, l^′: −g E^′], tel que t = H_t[l : +g E].

Il existe C₁, C₂ ∈ St tels que : C₂ est la projection maximale de la feuille l′ et C₁ est t priv´e de C2. On a alors t = C1[l : +g E, C2[l^′ : −g E^′]].

– C₂[l^′ : −g E^′] = proj_max(C[l^′: −g E]) – C₁[l : +g E, x₁] = proj_max(C[l : +g E, x₁])

move(t) = >(C₂[l^′ : E^′], C₁[l : E, ǫ]) o`u ǫ est la feuille vide.

Si t′ est obtenu par déplacement à partir de t, nous noterons que t′ ∈ move(t). Le sous-arbre est alors en relation spécifieur-tête. Les deux traits ayant permis le déplacement sont alors supprimés. La représentation graphique des règles est présentée dans la figure57. +g E -g E' C C2 E C1 E' > t move(t)

Fig. 13 – Repr´esentation sous forme d’arbre du d´eplacement.

Comme nous l’avons vu dans le chapitre précédent, tous les déplacements ne sont pas envisageables. On ajoute (ou non) des conditions sur les déplacements possibles. Une condition majeure dans la définition même du programme minimaliste est la condition d’économie. Ainsi, en cas d’ambigu¨ıté, le déplacement doit avoir lieu sur l’élément le plus proche de la tête. Cependant, les linguistes sont très partagés sur la définition d’une notion de proximité entre constituants. Pour ne pas trancher, nous suivons [Sta97] et nous utilisons une condition forte sur le principe d’économie, qui l’englobe, pour laquelle il ne doit pas y avoir d’ambigu¨ıté dans le déclenchement d’un déplacement - Shortest Move Condition (SMC). Sous cette condition, l’opération de déplacement devient déterministe. Cela se traduit par la propriété si : t = C[l : +g E, l′ : −g E′] alors pour tout C′, t = C^′[l1 : E1, l2: E2] et E1= −h1 E₁^′ et E2 = −h2 E₂^′ et h26= h1.

Une condition de localité peut aussi être utilisée, la Specifier Island Condition - SPIC. Les “islands” définissent les domaines qui interdisent des extractions. La SPIC impose que pour être déplacé, un élément ne doit pas être en position de spécifieur à l’intérieur d’un sous-arbre. Cette condition a été introduite par Ed Stabler dans [Sta99] en s’inspirant des travaux de [KS00] et [Kay98] qui proposent que les éléments déplacés soient uniquement en position de complément.

Stabler propose également un raffinement du déplacement. On distingue les déplacements dits forts des déplacements dits faibles. C’est alors une gestion particulière des formes phonologiques. Le déplacement fort déplacera toutes les composantes de l’élément, alors que le déplacement faible laissera en position initiale la forme phonologique.

On note les traits de déplacement fort en majuscules et les traits de déplacement faible en minuscules et on utilise cette notation tant pour les assignés que pour les assignateurs. Le déplacement fort est le déplacement présenté dans la section déplacement. Le déplacement faible est alors, dans les mêmes conditions :

move(t) = >(C₂[ǫ : E^′], C₁[l : E, l^′])

Graphiquement, les déplacements sont les mêmes, sauf pour la partie phonologique, comme le montre la figure 14où /l^′/ n’est pas déplacé dans sa position d’origine.

+g E -g E' C C2 E C1 E' > t ^/l'/ move(t) /l'/ /l/ /l/

Fig. 14 – Repr´esentation graphique du d´eplacement faible.

C’est en faisant varier la valeur fort/faible sur certains traits que l’on obtient des va-riations dans l’ordre des mots. C’est notamment ce qui permet d’analyser, à partir des mêmes règles, des langues SOV - Objet-Verbe, comme le Japonais, ou SVO - Sujet-Verbe-Objet, comme le fran¸cais. On donne de cette manière une réalisation de la notion de paramètres d’une langue naturelle, comme présentée dans le chapitre précédent.

On peut étendre les définitions précédentes pour obtenir un système plus performant dans la reconnaissance d’énoncés en langue naturelle, comme Stabler l’établit dans [Sta01]. En effet, plusieurs études linguistiques montrent que parfois seule la tête d’un consti-tuant doit changer de position. C’est ce qu’on appelle “Head Movement”. Ceci se présente notamment dans le cas d’inversion du sujet et du verbe avec son inflexion dans les questions. Dans ce cas, on parle de transformation T-to-C (car le verbe quitte sa po-sition de “verbe ayant re¸cu son inflexion” T pour monter en fin de dérivation C). Un exemple de question avec inversion du sujet sera donné comme illustration dans la section

2.5.

La partie phonologique déplacée peut avoir été construite par d’autres fusions de tête. De plus, son positionnement à droite ou à gauche de la nouvelle tête est déterminé par un marqueur spécifique sur le sélecteur.

Cette opération, contrairement à ce que son nom pourrait laisser supposer, n’est pas un nouveau type de déplacement, mais une réelle fusion, comme le montre [Sta01]. L’iden-tification systématique de la tête est alors nécessaire lors de l’analyse.

La fusion de tête est déclenchée par un trait de sélection spécial. On définit les deux ensembles de traits suivants :

Soit S_g = {=>x | x ∈ B} l’ensemble des traits déclenchant une fusion de tête où la tête est adjointe à gauche.

Soit S_d = {x<= | x ∈ B} l’ensemble des traits déclenchant une fusion de tête où la tête est adjointe à droite.

On définit la fusion de tête avec adjonction à gauche, sous les mêmes conditions que la fusion, par :

soient t et t^′ ∈ T_{M G}(A) tels que t = Ht[l : =>h E] et t^′ = H_t′[l^′ : h E^′] avec h ∈ B :

merge(t, t^′) =

< (H_t[l^′l : E], H_t′[ǫ : E^′]) si t ∈ Lex, < (H_t′[ǫ : E′], (H_t[l′l : E]) sinon.

où seules les positions des formes phonologiques sont différentes. Et la fusion de tête avec adjonction à droite, sous les mêmes conditions que la fusion, par :

soient t et t′ ∈ TM G(A) tels que t = H_t[l : =>h E] et t′ = H_t′[l′ : h E′] avec h ∈ B :

merge(t, t^′) =

< (Ht[ll^′ : E], H_t′[ǫ : E^′]) si t ∈ Lex, < (H_t′[ǫ : E^′], (H_t[ll^′: E]) sinon.

On peut remarquer que quelle que soit la GM utilisant les fusions de tête, il existe une GM sans fusion de tête équivalente sur les chaˆınes. Cependant, l’ajout de cette opération nous permet de conserver des analyses équivalentes à celles données classiquement en lin-guistique générative.

Revenons sur le cas de l’inflexion. Une étude de la position des adverbes en anglais montre que les énoncés sont de la forme Sujet-adverbe-inflexion-verbe-objet, contraire-ment au fran¸cais où l’adverbe se positionne entre l’inflexion et le verbe. Les linguistes générativistes expliquent cette variation par une descente de l’inflexion vers le verbe prin-cipal, comme nous l’avons exposé dans le chapitre précédent. Cette opération est appelée Affix Hopping et est modélisée par extension de Head Movement.

On d´efinit les deux ensembles de traits suivants :

Soit S_ahg = {x=> | x ∈ B} l’ensemble des traits déclenchant un Affix Hopping où la tête est adjointe à gauche.

Soit S_ahd = {<=x | x ∈ B} l’ensemble des traits déclenchant un Affix Hopping où la tête est adjointe à droite.

On d´efinit l’Affix-Hopping avec adjonction de la forme phonologique `a gauche par : soient t et t^′ ∈ T_{M G}(A) tels que t = H_t[l : <=h E] et t^′ = H_t′[l^′ : h E^′] avec h ∈ B :

merge(t, t^′) =

< (H_t[ǫ : E], H_t′[l^′l : E^′]) si t ∈ Lex, < (H_t′[l′l : E′], (H_t[ǫ : E]) sinon.

et l’Affix-Hopping avec adjonction de la forme phonologique `a droite par :

merge(t, t^′) =

< (H_t[ǫ : E], H_t′[ll^′ : E^′]) si t ∈ Lex, < (H_t′[ll′: E′], (H_t[ǫ : E]) sinon.

L’opération d’Affix-Hopping est donc une opération inverse de la fusion de tête par rapport à Head Movement, les deux ne différant de la fusion standard que pour la gestion des formes phonologiques.

Une dernière opération est parfois ajoutée dans l’utilisation des GMs. Nous ne ferons que l’évoquer ici car elle ne sera pas utilisée dans la suite. Il s’agit de l’adjonction. Une proposition de formalisation dans le cadre des GMs a été donnée dans [MG03]. Elle se fait par introduction d’un nouveau marqueur ≈ définissant un nouvel ensemble de traits. Cette opération est analogue à la fusion mais sa particularité réside dans la non-consommation du trait de base avec lequel il y a combinaison.

Enfin, une autre définition des GMs a été introduite à partir non plus des structures d’arbres mais des chaˆınes [Sta99]. Cette seconde version présente des avantages pour la partie calculatoire mais perd en qualité de représentation. Nous présentons à titre indicatif cette définition dans l’annexe A. Nous nous attacherons dans la suite de ce manuscrit à conserver la version des GMs sur les arbres minimalistes.

2.5 Exemples d’utilisation des GMs

Nous allons présenter les étapes d’analyses réalisées par une GM pour deux énoncés du fran¸cais. Pour cela, nous présenterons les différents arbres dérivés qui permettent d’aboutir `

a l’arbre d’analyse. Chaque grammaire utilise les règles définies précédemment. Afin de simplifier la présentation, nous donnons uniquement le lexique nécessaire à la réalisation de la dérivation. Ainsi, nous supposons que les ensembles de traits sont induits par ces lexiques. Le trait acceptant est toujours le trait c.

Lors d’une analyse standard, on suppose que chaque groupe nominal attend une at-tribution de cas, ce qui se fera par une vérification de la présence simultanée dans une dérivation, d’une demande de cas et d’une donation de cas, (i.e. par un déplacement).

De plus, nous faisons entrer dans l’analyse l’inflexion du verbe se basant sur l’obser-vation commune que seul un verbe conjugué peut prendre un sujet. Enfin, l’analyse se terminera par une vérification du fait que la phrase n’est pas une relative enchâssée ou une question, donc qu’en tant que telle, elle est une phrase simple.

2.5.1 Phrase standard

Les phrases standard en fran¸cais respectent un ordre donné où le sujet est le premier élément de la phrase, suivi du verbe, lui-même suivi de son objet. Par exemple :

(23) Pierre S prend V un train. O

Lexique 21.

P ierre : d -case inf l : <=v +case V

un : =n d -case comp : =V c

train : n

prendre : =d +case =d v

Nous revenons sur la composition de ce lexique. Dans ce lexique, nous introduisons un nom propre qui fonctionne alors comme un groupe nominal. Dans ce cas, il est de catégorie d - pour determinal phrase - et il attend une attribution de cas. De manière analogue, on trouve un nom commun et un déterminant. C’est le déterminant qui construit le groupe nominal, d’où l’appellation determinal phrase. Le verbe attend deux groupes nominaux et peut attribuer un cas.

Les deux autres entrées correspondent à deux étapes que nous introduisons systémati-quement dans les analyses : d’une part l’inflexion, et d’autre part la partie complementizer. L’inflexion porte sur le verbe et introduit le cas nominatif (position T dans la dérivation). Ainsi seuls les verbes ayant re¸cu leur inflexion pourront recevoir pleinement leur sujet. La dernière entrée correspond à la phase de complementizer vérifiant la bonne terminaison

Dans le document Calculs de représentations sémantiques et syntaxe générative : les grammaires <br />minimalistes catégorielles (Page 63-104)