• Aucun résultat trouvé

1 Structuration des informations intrinsèques

Dans nos constructions nous utilisons la structuration de base présentée en figure 22.

Selon cette structuration, l’information est divisée en plusieurs grandes parties. Nous détaillons dans ce qui suit les parties que l’on aura l’occasion d’utiliser dans la Partie 2, mais il est important de garder à l’esprit que les éléments de grammaire qui font l’objet du présent travail ne constituent qu’une partie de la ressource complète ; cela signifie que les traits que l’on présente dans les sections qui suivent ne constituent qu’une partie de la structure de traits complète, et que la liste sera à compléter à chaque nouvelle étape de complétion de la grammaire.

intr. 2 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 4 ancrage 2 6 6 4 index " début début fin fin # etc. 3 7 7 5 forme "

graph forme graphique

etc. # id 2 6 6 6 6 6 6 6 6 6 6 6 4

dom domaine d’appartenance

c.i. constituants immédiats

nature 2 6 6 6 6 6 4

type type de construction

cat catégorie

scat sous-catégorie

traits traits

accord informations d’accord

3 7 7 7 7 7 5 3 7 7 7 7 7 7 7 7 7 7 7 5 syn 2 6 6 6 6 6 6 6 6 4 dépendance1 "

recteur index vers recteur

dépendant index vers dépendant

#

dépendance2

"

recteur index vers recteur

dépendant index vers dépendant

# etc. 3 7 7 7 7 7 7 7 7 5 3 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5

Fig. 22 – Structuration des informations intrinsèques dans la grammaire.

1.1 Ancrage

Les premier ensemble de caractéristiques propres à une construction est son ancrage 61

. A ce titre plusieurs types de références et d’index peuvent être utilisés simultanément ou option- nellement pour localiser une même construction. Celle-ci pourra être référencée non seulement par sa position temporelle dans le signal, mais aussi par son index dans la chaîne lin- guistique correspondante (cf. [Bird & Liberman, 1999]). On peut également au besoin ajouter un attribut s’appuyant sur l’univers de discours (cf. [Kamp & Reyle, 1993]). Enfin, pour toutes les unités on pourra ajouter l’identification du (ou des) locuteur(s) qui les a (ont) produites62

.

Cette technique d’ancrage multiple, telle que proposée dans [Blache, 2003a] puis [Guénot & Bellengier, 2004], permet de localiser la construction non seulement dans la chaîne linguis- tique produite mais également dans toutes les autres dimensions jugées nécessaires à l’analyse (pragmatique, sémantique, etc.), et dont l’organisation n’est pas nécessairement aussi linéaire que la chaîne de production (comme le fait remarquer [Kracht, 2005b]).

61

En effet, on pourrait considérer que l’ancrage dans un énoncé dépend d’une occurrence précise de la construction et non pas de la construction elle-même, mais pourtant le fait qu’une construction ait un ancrage est bel et bien une information qui lui est propre (ce sont les valeurs d’ancrage qui sont variables, pas l’ancrage lui-même). C’est la raison pour laquelle on le fait figurer dans les informations intrinsèques de la construction.

62Sur la possibilité de considérer plusieurs locuteurs comme producteurs d’une même construction, cf. par

1.2 Forme

Cet attribut rassemble les informations concernant la forme de la construction. Elle peut recevoir des informations sur la forme orthographique ou phonique (auquel cas, phonologique et/ou phonétique).

Cet attribut ne sert que peu dans la grammaire, surtout au degré de généralité des éléments qui suivent. On n’est ici pas descendus dans la finesse de description assez profondément pour décrire des constructions dont la forme est contrainte (ce qui serait le cas de formes plus ou moins figées, comme par exemple il y a / il y avait / etc. ou y compris). Par contre on trouve ce trait à la fois dans les analyses (elles font référence aux formes des objets constituant les constructions), et évidemment dans les constructions lexicales (où à chaque construction est associée une forme).

1.3 Identité (id)

Cet attribut rassemble ce qui permet de définir réellement l’identité grammaticale de la construction. Elle contient les informations suivantes :

– Le domaine (dom) d’appartenance de la construction (morphologie, syntaxe, etc.). Les constructions étant par définition des objets pouvant appartenir à plusieurs domaines, les valeurs de cet attribut sont par conséquent non exclusives (un objet peut être de [domaine morphologie ∧ syntaxe] par exemple)

Concrètement, puisque les éléments de grammaire que l’on présente ci-après ne sont, comme on l’a dit, que des constructions syntaxiques, on ne précisera pas ce trait, qui sera sous-entendu, mais qui devrait figurer pour que la structure soit réellement complète.

– La liste des constituants immédiats (C.I.) de la construction, ces constituants immédiats étant des références à des constructions. Nous utilisons ici cette appellation sans la limiter à la notion de “constituants immédiats” en syntaxe, c’est-à-dire que toutes les constructions, quel que soit leur domaine d’appartenance, reçoivent une liste de constituants immédiats (une unité syntaxique minimale, par exemple, recevra des constructions morphématiques en guise de constituants immédiats, et rien n’interdit que cette liste soit constituée de constructions de domaines différents, dès lors qu’il s’agit bien de constructions).

1.3.1 Nature

Il reçoit également un ensemble de traits rassemblés sous l’appellation nature 63

, et qui sont les suivants :

– Le type de construction (type), dont la valeur est une partie du discours (pour les syntagmes) ou bien une étiquette correspondante (pour les entassements paradigmatiques).

63On parle de “nature” ici comme quand on l’emploie par opposition à “fonction” dans les grammaires

Ceci correspond à la “classe formelle” de [Bloomfield, 1961] (cf. discussion à ce propos plus bas).

– La catégorie syntagmatique (cat) de la construction, i.e. N, SN, etc. La catégorie, contrai- rement au type, correspond à une étiquette syntagmatique, ce qui signifie qu’elle ne peut pas être “entassement paradigmatique” (une telle construction, comme on le verra en détail au chapitre les décrivant, est de [type EP] et porte la (ou les) catégorie(s) correspondant à ses constituants, p.ex. [cat SN ] pour Pierre et Marie).

– Eventuellement, la sous-catégorie (scat) de la construction, i.e. propre ou commun pour un Nom, qualificatif ou relationnel pour un Adjectif, principal, auxiliaire ou modal pour un Verbe, etc. Il s’agit donc littéralement d’une sous-classe de la catégorie, et non pas de l’acception de “sous-catégorisation” que l’on trouve dans de nombreuses grammaires formelles (comme en HPSG par exemple).

– La liste des traits (traits) de la construction, i.e. les informations spécifiques qui lui sont intrinsèques, comme par exemple le genre pour les Noms.

– La liste des accords (acc) de la construction, i.e. les informations spécifiques qui lui sont extrinsèques, comme par exemple le genre pour les Adjectifs ou les Déterminants. Nous appelons ce trait “accord” parce que ces marques sont la manifestation d’un accord avec l’ob- jet dont ils dépendent (déterminant et adjectif s’accordent avec le nom dont ils dépendent, et à ce titre portent la marque du genre du nom).

Il est à noter que l’on effectue, dans la version de la grammaire qui suit, une utilisation abusive des traits traits et accord, puisque l’on y mentionne non seulement des informations qui sont réellement des traits (et des accords) à proprement parler (comme c’est le cas du genre), mais on y mentionne également des informations qui ne sont pas des traits de l’objet mais des morphèmes grammaticaux 64

, comme notamment le nombre, la personne, etc. Nous sommes consciente que ces deux informations devront être séparées, mais nous ne l’avons pas fait dans la version actuelle de la grammaire pour des raisons de compatibilité avec les analyseurs automatiques et avec les ressources existantes avec lesquelles nous avons mené nos recherches (notamment un lexique qui ne fait pas la différence entre traits et morphèmes grammaticaux, et qui considère que les unités syntaxiques minimales sont des mots et non des morphèmes, ce qui est tout à fait discutable). De fait, même si la distinction entre les deux est nécessaire et devra être faite, en ce qui concerne notre tâche présente, d’analyse syntaxique, la distinction formelle entre les deux ne s’est pas révélée indispensable (puisque dans l’état actuel on arrive à accéder à ces informations, sans avoir absolument besoin de les distinguer pour faire de la syntaxe 65

) ; elle le sera lorsqu’il s’agira de développer les constructions de taille inférieure aux constructions syntaxiques, afin de permettre une analyse morphologique notamment.

64

“Morphèmes grammaticaux ” selon l’appellation standard, que l’on trouve notamment chez [Touratier, 2002], qui correspondent aux diverses “modalités” (nominales, verbales, etc.) de [Martinet, 1979].

65Notons d’ailleurs qu’il n’est pas rare qu’elles ne soient pas distinguées dans les modèles formels que l’on

1.4 Syntaxe (syn)

Cet attribut rassemble les informations syntaxiques internes de la construction.

Dans les constructions syntagmatiques (cf. chapitre 5 §2.2), les constituants Majeurs sont référencés sous les attributs tête, et spécifieur le cas échéant ; les constituants Mineurs sont référencés comme recteur ou dépendant d’une relation binaire s’établissant avec la tête de la construction. Ces dépendances syntaxiques auront alors une forme ressemblant à :

syn 2 6 6 6 6 6 6 6 6 4 tête 1SV sujet " recteur 2SN dépendant 1.tête # obj-dir " recteur 1.tête dépendant 3SN # 3 7 7 7 7 7 7 7 7 5

On peut ajouter à ce cela les relations hypotactiques s’établissant entre deux constituants d’une construction macrosyntaxique, c’est-à-dire définir un noyau macrosyntaxique, qui en- tretiendrait des relations avec des préfixes, des postfixes et/ou des suffixes ; on n’a pour l’instant pas fait figurer ces relations dans nos descriptions, mais rien n’empêche de le faire. L’une des raisons pour lesquelles on n’a pas encore fait figurer ces informations est ce que la relation syntaxique entre un noyau et un suffixe est censée être paratactique, alors même que l’on définit cette relation en posant que le suffixe dépend (informativement) du noyau. pour une Proposition de la forme Pierre mange une pomme, ou bien pour un SN de la forme le petit chien on aura une structure syntaxique ressemblant à :

syn 2 6 6 6 6 4 tête 1N spécifieur 2Det épithète " recteur 1 dépendant 3Adj # 3 7 7 7 7 5

Dans les constructions paradigmatiques (cf. chapitre 5 §2.3), les constituants n’entretenant que des relations paratactiques, il n’existe pas de dépendance syntaxique entre eux. On ne spécifie donc rien à leur propos sous l’attribut syn 66

.

1.4.1 La notion de “tête”

Dans les syntagmes nous avons mentionné la présence d’un attribut tête. Il est utile de préciser que nous utilisons ici ce terme dans une acception légèrement différente de celle

66

Il serait néanmoins intéressant de réfléchir au type d’information que l’on pourrait indiquer sous cet attribut pour ces constructions. [Mithun, 2005], p.ex., postule que les relations paradigmatiques sont (essentiellement) pragmatiques ; [Deulofeu, 2005] y voit pour sa part des relations syntaxiques “primitives” qui, à la différence des relations syntagmatiques, ne sont pas basées sur les catégories.

utilisée par la syntaxe X-barre ([Harris, 1968]) et jusqu’à HPSG, et basée sur la notion d’endo- /exocentricité définie par [Bloomfield, 1961] :

Chaque construction syntaxique nous présente deux formes libres (et quelquefois plus) combinées en un syntagme, que l’on peut appeler syntagme résultant. Le syntagme résultant peut appartenir à une classe formelle autre que celle d’un constituant quelconque. Par exemple,John ran n’est pas

une expression nominale (comme John) ni une expression verbale conjuguée (comme ran). C’est

pourquoi nous disons que la construction anglaise acteur-action est exocentrique : le syntagme résultant appartient à la classe formelle de constituant non-immédiat. Par ailleurs le syntagme résultant peut appartenir à la même classe formelle que l’un (ou davantage) de ses constituants.

Par exemple, poor John est une expression de nom propre, de même que le constituant John ;

les formes John et poor John ont, dans l’ensemble, les mêmes fonctions. Par conséquent, nous

dirons que la construction anglaise qualité-substance (comme dans poor John, fresh milk, etc.) est une construction endocentrique.

Dans cette définition, l’auteur pose qu’un syntagme endocentrique est un objet qui est de la même “classe formelle” que l’un de ses constituants immédiats. Au sein des constituants immédiats, il définit ce qu’il appelle “centre” (le N milk dans le SN very fresh milk), c’est-à- dire la “tête”. Il décrit le SN comme un syntagme endocentrique, tout en précisant bien qu’il considère les SN anglais ; or pour notre part, nous ne considérons pas que l’endocentricité soit aussi évidente pour les SN français67

, mais nous souhaitons toutefois conserver cette notion de “tête”, que l’on pense pertinente aussi bien pour les syntagmes endocentriques que pour les syntagmes exocentriques. D’une certaine manière, on peut interpréter l’idée de similitude de “classe formelle” de Bloomfield comme étant traduite par le “type de construction” dans notre approche 68

, où un N construit tel que lait frais et un SN tel que du lait frais sont de [type N ]. Dans les deux cas, lait sera la tête de la construction ; mais le N construit lait frais, commutant69

avec sa tête, sera considéré comme un syntagme endocentrique, alors que le SN du lait frais, ne commutant pas avec sa tête, sera considéré comme un syntagme exocentrique. La différence entre les deux est signifiée par leurs catégories distinctes, N pour l’un, SN pour l’autre, et leur point commun est signifié par leur type identique, N dans les deux cas. On peut s’étonner que cette notion que l’on convient d’appeler “tête” pour les besoins du présent exercice et bien que cet emploi du terme ne corresponde pas à sa définition habituelle, ne figure pas dans la littérature linguistique. On peut rencontrer la notion de “noyau” (p.ex. [Riegel et al., 1999]), qui ne répond pas à nos besoins puisque il ne fait pas nécessairement référence à une unité minimale : ainsi le noyau de du lait frais serait lait frais et non simplement lait. Même chose pour le “nucleus” de [Tesnière, 1959] (dont le noyau est une transposition en grammaires syntagmatiques) qui est constitué de l’ensemble des objets régissant directement ou non un noeud donné. Dans les grammaires de dépendance on trouve aussi la notion de “recteur / gouverneur”, qui porte bien sur une unité minimale, mais dont la définition ne correspond pas à ce que l’on cherche puisqu’il s’agit d’une relation binaire s’établissant entre deux objets lexicaux, et qu’il est impossible d’extrapoler cette idée à une rection qui se ferait, dans une grammaire syntagmatique, entre une unité minimale et un syntagme dont elle est constituant. On peut également rencontrer la notion d’“ancre” dans les grammaires lexicalisées, qui diffère elle aussi de notre besoin puisqu’il s’agit ici certes d’un élément lexical, mais qui est associé à une structure élémentaire (p.ex. à un arbre élémentaire en TAG, cf. à

67Sur ce point nous rejoignons par exemple [Touratier, 2005]. 68Cf. Partie 2, Introduction.

ce propos [Joshi & Schabès, 1992]). La différence entre l’ancre des grammaires lexicalisées et notre tête est que cette dernière a une acception plus large : alors que l’ancre est toujours une forme lexicale précise (le nom commun masculin singulier cheval, le verbe au présent de l’indicatif 1erepersonne du singulier vais, etc.), notre tête peut être nettement moins spécifiée

que cela : lui affecter une forme lexicale aussi fine que l’ancre des grammaires lexicalisées représente le degré extrême de précision de la tête, qui le plus souvent, en fait, correspondra à une catégorie syntaxique. Toutefois, selon un certain point de vue leur “ancre” et notre “tête” ont en commun le fait qu’elles désignent un objet qui revêt cette même importance toute particulière au regard des constructions dont il est le constituant.

On peut ajouter deux dernières différences entre notre présente acception de “tête” et sa définition habituelle. La première est que notre grammaire n’est littéralement pas “guidée par les têtes” : certaines de nos constructions n’ont pas de tête ; c’est le cas des constructions Paradigmatiques (cf. chapitre 5 §2.3). La seconde différence est que nous considérons que les constructions à tête ne peuvent en porter qu’une seule.

1.5 Autres traits

Il est bien entendu possible d’ajouter à cet ensemble d’autres attributs, tels que morphologie, semantique, prosodie ou pragmatique, mais nous ne les introduisons pas ici puisque nous n’en faisons pas usage dans l’état actuel de la grammaire.