• Aucun résultat trouvé

Dépendants du nom, verbe, adjectif et adverbe

5.2 Jeu d’étiquettes syntaxiques et schéma d’annotation

5.2.7 Dépendants du nom, verbe, adjectif et adverbe

Un autre point de notre schéma d’annotation qui diverge de la syntaxe théorique du serbe (et d’autres langues comme le français) est celui regroupant les étiquettes sous-

spécifiées pour les dépendants des verbes, noms, adjectifs et adverbes commençant parDep. Au lieu d’entrer dans les distinctions fines entre les compléments et les ajouts, ces étiquettes sont basées sur le terme général de dépendant. Leur deuxième partie indique le type du gouverneur, qui peut êtreN,V,AdjouAdv; la troisième indique la forme morphosyntaxique du dépendant, qui peut être un nom fléchi (Cas), un groupe prépositionel (Prep), un adjectif (Adj) ou un adverbe (Adv).

Ces étiquettes ont été créées au moment où la liste des propriétés distinctives des relations syntaxiques présentée dans la section 5.2.1 s’est avérée insuffisante pour analyser l’ensemble des dépendants nominaux en serbe. Selon (Stanojčić & Popović, 2012), il existe trois types de dépendants nominaux : kongruentni atribut ‘attribut accordé’ (équivalent direct de la fonction d’épithète en français, ex. 12a), padežni atribut ‘attribut casuel’ (qui correspond grosso modo au complément du nom en français, ex. 12b), et atributiv ’attributif’, une fonction syntaxique à part exprimée par un groupe nominal juxtaposé à un autre nom (ex. 12c).

L’attribut accordé se réalise sous la forme d’un adjectif qui s’accorde pleinement avec le nom (en genre, nombre et cas). La fonction de l’attribut casuel désigne un GN à un cas oblique ou un GP. Les deux réalisations sont désignées par le terme casuel car la tradition grammaticale serbe considère souvent que les GP sont une manifestation spécifique d’un cas. La préposition est vue comme une sorte d’élément introductif exigé par la forme fléchie du nom et les constructions impliquant une préposition et un nom dans un cas oblique sont souvent appelées des constructions prépositionelles-casuelles (predloško-padežne konstruk- cije). L’attributif, quant à lui, désigne un dépendant nominal sous la forme d’un GN au même cas que son gouverneur.

(12) a.

Novi student nosi plavu torbu

nouveau.NOM.SG.M étudiant.NOM.SG porte bleu.ACC.SG.F sac.ACC.SG ‘Le nouvel étudiant porte un sac bleu.’

b.

ljubav majke i torta od jabuka

amour.NOM.SG mère.GEN.SG et gâteau.NOM.SG de pomme.GEN.PL ‘l’amour maternel et le gâteau aux pommes’

c.

Gospodin Petrović je u hotelu Slavija

monsieur.NOM.SG Petrovic.NOM.SG est dans hôtel.LOC.SG Slavija.NOM.SG Monsieur Petrovic est à l’hôtel Slavija.

Si l’on essaye de contraster les fonctions présentées, on se rend compte qu’il est difficile d’opérer une distinction fiable. L’attribut accordé est exclusivement un GA, l’attribut casuel peut être soit un GN, soit un GP, alors que l’attributif est exclusivement un GN. La distinction entre l’attribut casuel et l’attributif se joue dans le fait que le premier ne

s’accorde en principe pas avec le gouverneur, contrairement à l’attributif. Cependant, il est tout à fait possible que l’attribut casuel se trouve au même cas que son gouverneur à cause des exigences du contexte plus large (cf. od glave psa lit. ‘de tête.GEN chien.GEN’, ‘de la tête du chien’). Dans ce cas, la distinction se perd. Par ailleurs, si l’attributif exprime le nom de l’entité désignée par le gouverneur (cf. hotel Slavija ’hôtel Slavija’ dans l’exemple 12c), il peut garder la forme du nominatif quel que soit le cas du gouverneur. On peut essayer d’avoir recours à l’ordre des constituants pour clarifier ces distinctions. Cependant, même si l’attribut accordé préfère la position à gauche du gouverneur, et l’attribut casuel celle à sa droite, les deux sont capables de se déplacer (ceci est discuté en profondeur dans le chapitre 10). Pour ce qui est de l’attributif, certains sous-types se positionnent à droite du gouverneur, et d’autres à sa gauche (cf. exemple 12c).

Pour éviter de regrouper des phénomènes syntaxiques disparates sous la même éti- quettes, ce qui a été identifié comme défavorable pour le parsing par Mille et al. (2012), nous avons préféré entamer l’annotation manuelle du corpus avec des étiquettes génériques pour les dépendants du nom. Afin de faciliter l’analyse du comportement de différents types de dépendants nominaux une fois le corpus constitué, nous introduisons trois éti- quettes exprimant 3 formes morphosyntaxiques que peut avoir un dépendant nominal :

DepNAdj, DepNPrep et DepNCas. Une approche comparable est adoptée dans plusieurs corpus consultés : à l’exception de SynTagRus, qui met en place une classification très élaborée de différents types de dépendants nominaux, PDT, HOBS et SETimes couvrent ces fonctions avec une seule étiquette (Atr). FTBDep en distingue deux : l’épithète, qui s’applique aux adjectifs dépendants d’un nom, etdep, qui désigne tout dépendant nominal sous forme d’un GP.

À partir de cette analyse des dépendants nominaux, un traitement parallèle pour les dépendants des verbes, des adjectifs et des adverbes a été établi. Ces étiquettes sont sous- spécifiées : elles répercutent des informations déjà présentes au niveau de l’annotation morphosyntaxique, sans apporter davantage d’informations sur la nature du lien posé par la dépendance. On pourrait donc considérer qu’une seule étiquetteDepaurait suffi. Il nous a semblé néanmoins intéressant de garder cette distinction dans l’annotation manuelle afin d’observer de manière plus immédiate le comportement de ces différentes configurations. En effet, en serbe les groupes nominaux et prépositionnels peuvent être gouvernés aussi bien par un nom ou un verbe que par un adjectif ou un adverbe. Les cas de figure possibles avec les noms ont été montrés ci-dessus. En ce qui concerne les verbes, il peut s’agir de constructions comme ići kući ‘aller à la maison’ ou boriti se za napredak ‘lutter pour le progrès’. L’adjectif en serbe peut être modifié par des éléments adverbiaux, mais par ailleurs, certains adjectifs admettent un dépendant nominal ou prépositionnel sous une forme spécifique : sličan ‘semblable’ peut être complété par un nom au datif (sličan ocu lit. ‘semblable père.DAT’, ‘semblable à son père’), alors que zaljubljen ‘amoureux’ peut

avoir comme dépendant un groupe prépositionnel introduit par u ‘dans’ suivi d’un nom à l’accusatif (zaljubljen u Anu lit. ‘amoureux dans Ana.ACC’, ‘amoureux d’Ana’). Les adverbes de quantité admettent également des compléments au génitif, comme dans mnogo ljudi lit. ‘beaucoup gens.GEN’, ‘beaucoup de gens’. Ces éléments sont par ailleurs dotés de différents degrés de flexibilité quant à leur position par rapport à leur gouverneur.

Ces faits semblaient propices à provoquer un nombre d’erreurs important dans l’iden- tification du gouverneur des groupes nominaux et prépositionnels. En surdéfinissant ces relations, nous espérions attirer l’attention des annotateurs humains sur ces structures et pouvoir analyser plus facilement la distribution d’erreurs. Par ailleurs, cette méthode nous a permis de poser des contraintes précises dans l’interface d’annotation syntaxique, ce qui s’est montré particulièrement utile dans le cadre de l’annotation manuelle (voir la section 8.2.2). Nous avons également effectué une analyse approfondie du comportement des adjectifs dépendants d’un nom à l’aide de ces étiquettes. Elle est présentée dans le chapitre 10.