• Aucun résultat trouvé

INTÉGRATION DE LA DIMENSION SÉMANTIQUE DANS LA MÉTA-GRAMMAIRE

ÐA JK " composé d’un verbe et d’un

4.3. INTÉGRATION DE LA DIMENSION SÉMANTIQUE DANS LA MÉTA-GRAMMAIRE

lée par une hiérarchie de types et de contraintes que nous avons implémentée au sein de notre méta-grammaire. Quant aux rôles sémantiques, ils seront précisés au niveau du prédicat (qui est le verbe). Le cadre de la phrase est ensuite construit au fur et à mesure de l’analyse syntaxique en unifiant les cadres sémantiques élémentaires de ses composants syntaxiques par l’intermédiaire d’une interface syntaxe-sémantique.

Figure 4.24: Processus de génération semi-automatique d’ArabTAG V2.0 avec une di-mension sémantique

La figure 4.24, illustre les étapes que nous avons suivies pour réaliser notre approche : 1. Au niveau syntaxique des familles de classes décrites par la méta-grammaire (Sy-nArabTAG), nous avons défini les arguments du prédicat (verbe). Rappelons que chacune de ces familles regroupent les arbres ancrés par un verbe et un nœud (de substitution) pour chaque argument du prédicat.

2. Au niveau sémantique (SemArabTAG), nous avons défini les modèles des cadres sémantiques correspondants à chaque famille d’arbres définies dans le niveau syn-taxique. La dimension <frame> permet de décrire un cadre sémantique à l’aide de structures de traits typées.

3. Toujours au niveau de SemArabTAG, nous avons implémenté une hiérarchie des rôles sémantiques ainsi que les contraintes sur les types de cadres.

4. Le lien entre les éléments des cadres sémantiques et les constituants syntaxiques est établi à l’aide de l’interface syntaxe-sémantique en utilisant la dimension <iface>. 5. Le compilateur synframe de XMG2 génère la nouvelle version d’ArabTAG V2.0 (à

partir d’ArabTAG-XMG qui réunit les deux descriptions méta-grammaticales) avec un fichier correspondant à la hiérarchie de contraintes implémenté précédemment. Ce processus d’intégration de la dimension sémantique dans la méta-grammaire est détaillé dans la suite de ce chapitre. Mais, tout d’abord, nous commençons par la présentation de la hiérarchie de contraintes de types que nous avons implémentée dans SemArabTAG. En effet, afin d’alimenter notre grammaire avec les rôles sémantiques, nous avons étudié les ressources lexicales disponibles permettant de réaliser cette tâche. Grace à cette étude, nous avons établi une hiérarchie de contraintes de types qui permettra de considérer les restrictions éventuelles lors de l’unification des cadres durant la phase de l’analyse sémantique.

4.3. INTÉGRATION DE LA DIMENSION SÉMANTIQUE DANS LA MÉTA-GRAMMAIRE

4.3.1 Hiérarchie de contraintes de types implémentée dans

Se-mArabTAG

La sémantique des cadres a fait l’objet de plusieurs applications et projets acces-sibles en ligne dont le projet de l’Université de Berkeley, FrameNet [Baker et al., 1998]. Ce dernier a été fondé depuis une dizaine d’année, dans le but de constituer une ressource linguistique basée sur les cadres sémantiques de Fillmore pour l’anglais.

La base de données construite dans le cadre de ce projet met en relation les cadres (frames) avec leurs Frame Elements (FE) et leurs unités lexicales (Lexical Units, LU). Les FE sont les rôles sémantiques associés de manière unique à chaque cadre. Nous distinguons deux types de FE : les core FE qui sont les rôles obligatoires et les non core FE qui sont les rôles généralement descriptifs et non spécifiques au cadre. Quant aux unités lexicales, elles désignent un mot ou groupe de mots qui évoquent le(s) cadre(s). Chaque unité lexicale est illustrée par des exemples de textes annotés manuellement.

Par exemple, pour un verbe "poursuivre", son cadre sémantique peut avoir plusieurs unités lexicales telles que : "chasser", "conduire", "courir", etc. Ses rôles sémantiques obligatoires sont (AGENT, THEME) et il peut avoir les rôles descriptifs suivant (LOCA-TION, MODE, DURA(LOCA-TION, etc.).

La base de données lexicale de FrameNet (pour l’anglais) contient à ce jour 1224 cadres sémantiques et 13640 unités lexicales. Ce projet a servi de base à la construction de Frame-Net pour d’autres langues notamment le danois, le Portugais, le japonais, le coréen, l’alle-mand et le suédois. Cependant et malgré quelques initiatives, tels que [Ghneim et al., 2009], une telle ressource pour l’arabe n’est pas encore établie. Nous avons donc entrepris d’ex-ploiter une autre ressource qui propose un ensemble prédéfini de rôles et cadres séman-tiques. Notre choix s’est porté sur la ressource lexicale ArabicVerbNet [Mousser, 2010]. Nous avons parcouru toutes les classes verbales d’ArabicVerbNet et nous avons regroupé les informations concernant les cadres décrits et les rôles de leurs participants. Grâce à ces informations nous avons établi deux hiérarchies : la hiérarchie des rôles sémantiques et la hiérarchie de types des cadres.

4.3.1.1 Hiérarchie des rôles sémantiques

La hiérarchie des rôles sémantiques que nous avons implémentée est illustrée par la figure 4.25. Au fait, nous nous sommes basés sur l’organisation des rôles proposée au sein de la ressource lexicale ArabicVerbNet qui elle-même s’inspire de VerbNet pour l’anglais [Kipper et al., 2008].

Grâce à cette hiérarchie, il devient plus simple d’attribuer les rôles généralisables pour les participants de différents types d’événements (tel qu’un acteur qui est l’instigateur de l’évènement), les spécifier (tel que Agent et cause) ou les distinguer. Cette distinction permet aussi de différencier les différentes classes verbales.

4.3. INTÉGRATION DE LA DIMENSION SÉMANTIQUE DANS LA MÉTA-GRAMMAIRE

Figure 4.25: Hiérarchie des rôles sémantiques implémentée dans SemArabTAG Le tableau 4.3 présente la description de quelques rôles de cette hiérarchie (une des-cription de tous les rôles est fournie à l’Annexe B du manuscrit).

Rôle sémantique Description du rôle Actor L’instigateur de l’évènement

Agent C’est un acteur qui initie et réalise l’événement intentionnellement. Il existe indépendamment de l’événement.

Cause C’est un acteur qui initie l’événement mais sans aucune intentionnalité ou conscience et qui existe indépendamment de l’événement.

Stimulus Une cause dans un événement qui suscite une ré-ponse émotionnelle ou psychologique (exemple : événements de perception)

Table 4.3: Description d’un extrait de rôles sémantiques

Comme l’indique le tableau ci-dessus, les rôles "CAUSE" et "AGENT" sont deux ac-teurs qui initient un évènement mais le premier le fait sans intention contrairement au second. Tandis qu’un "STIMULUS" c’est un type d’acteur non intentionnel spécifique qu’aux verbes de perception.

Ces rôles attribués aux participants de l’événement, représentent les attribus (frame Elements) qui seront affectés aux cadres des prédicats définies au sein de notre méta-grammaire au moment de l’analyse sémantique. Cependant, dans certain cas, un rôle doit obéir à une ou plusieurs contraintes de type.

4.3. INTÉGRATION DE LA DIMENSION SÉMANTIQUE DANS LA MÉTA-GRAMMAIRE

4.3.1.2 Hiérarchie de types des cadres

Un verbe peut imposer un ensemble de restrictions à ses rôles d’argument. Par exemple, en exigeant qu’un rôle soit humain et /ou animé, etc.

Considérons les deux phrases suivantes avec leurs interprétations sémantiques : (1) "

éÒ£A

¯ ú

Ϋ I. m'

" / Ali aime Fatima : EXPERIENCER

Ϋ

/ Ali +THEME



éÒ£A¯

/ Fatima.

(2) "

éÒ£A ¯ H.AJºË@ I.m'

" / Le livre aime Fatima : EXPERIENCER

H.A JºË@

/ le livre + THEME

éÒ£A ¯

/ Fatima.

Le prédicat est le verbe "

I. k @

" (aimer). Bien que les deux phrases soient syntaxiquement correctes la deuxième est sémantiquement incorrecte. Le sujet, qui est l’"EXPERIENCER" "

H.A JºË@

" (livre), ne peut pas éprouver des sentiments envers un humain. Par conséquent, il est primordial de faire intervenir les contraintes spécifiées pour les rôles sémantiques afin de filtrer les phrases sémantiquement incorrectes. Après avoir examiné la classe verbale de "

I. k @

" (aimer), nous avons remarqué que les restrictions imposées par cette classe sur

l’"EXPERIENCER" c’est : animé et humain.

Nous avons exploité d’avantage les classes d’ArabicVerbNet et nous avons établi une deuxième hiérarchie (illustrée par la figure 4.26) qui concerne les types des cadres séman-tiques élémentaires. Ces types peuvent aussi servir à imposer des restrictions sur les rôles sémantiques.

Figure 4.26: Hiérarchie de types des cadres sémantiques élémentaires implémentée dans SemArabTAG