• Aucun résultat trouvé

Intégration des constructions à verbe support dans TimeML

N/A
N/A
Protected

Academic year: 2021

Partager "Intégration des constructions à verbe support dans TimeML"

Copied!
10
0
0

Texte intégral

(1)

HAL Id: inria-00522340

https://hal.inria.fr/inria-00522340

Submitted on 30 Sep 2010

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Intégration des constructions à verbe support dans

TimeML

André Bittar, Laurence Danlos

To cite this version:

André Bittar, Laurence Danlos. Intégration des constructions à verbe support dans TimeML. TALN 2009, Jun 2009, Senlis, France. �inria-00522340�

(2)

Intégration des constructions à verbe support dans TimeML

André Bittar et Laurence Danlos

ALPAGE, INRIA Rocquencourt, 78150 Le Chesnay

Université Paris Diderot, 75013 Paris

andre.bittar@linguist.jussieu.fr, laurence.danlos@linguist.jussieu.fr

Résumé.

Le langage TimeML a été conçu pour l’annotation des informations temporelles dans les textes, notamment les événements, les expressions de temps et les relations entre les deux. Des consignes d’annotation générales ont été élaborées afin de guider l’annotateur dans cette tâche, mais certains phénomènes linguistiques restent à traiter en détail. Un problème commun dans les tâches de TAL, que ce soit en traduction, en génération ou en compréhension, est celui de l’encodage des constructions à verbe support. Relativement peu d’attention a été portée, jusqu’à maintenant, sur ce problème dans le cadre du langage TimeML. Dans cet article, nous proposons des consignes d’annotation pour les constructions à verbe support.

Abstract.

TimeML is a markup language developed for the annotation of temporal infor-mation in texts, in particular events, temporal expressions and the relations which hold between the two. General annotation guidelines have been developed to guide the annotator in this task, but certain linguistic phenomena have yet to be dealt with in detail. A common problem in NLP tasks, whether in translation, generation or understanding, is that of the encoding of light verb constructions. Relatively little attention has been paid to this problem, until now, in the TimeML framework. In this article, we propose annotation guidelines for light verb constructions.

Mots-clés :

TimeML, verbes support, discours, sémantique.

(3)

André Bittar et Laurence Danlos

1

Introduction

TimeML1 est un langage d’annotation qui a pour objectif l’explicitation des informations

tem-porelles contenues dans des textes, en se focalisant sur l’annotation de critères de surface, c’est-à-dire ce qui est lexicalisé dans le texte. Ce langage permet d’annoter les unités linguistiques réalisant des événements, les expressions temporelles, les marqueurs de relation (typiquement des prépositions comme avant ou après) ainsi que les relations aspectuelles, temporelles ou de subordination qui peuvent exister entre événements et expressions temporelles. Sont considérés basiquement comme des événements introduisant une balise<EVENT>des verbes "ordinaires"

comme écrire ou commettre dans (1). (1)a. Luc a écrit ce livre.

b. Luc a commis ce film.

Sont aussi considérés basiquement comme des événements introduisant une balise <EVENT>

des noms comme destruction ou agression dans (2). Pour de telles phrases, TimeML codera à raison deux événements : l’événement décrit par le verbe "ordinaire" (décrire ou filmer) et l’événement décrit par l’objet de ces verbes (destruction ou agression).

(2)a. Luc a décrit la destruction de Rome (par Brutus). b. Max a filmé l’agression de Luc contre Marie.

Mais qu’en est-il pour les constructions à “verbe support” illustrées dans les exemples (3) ? (3)a. Luc a commis une agression contre Marie.

b. Marie a subi une agression de la part de Luc.

Pour (3a), un codage où le verbe commettre introduit une balise <EVENT>comme en (1b) et

où le nom agression introduit indépendamment une autre balise<EVENT>comme en (2b) n’est

pas, en soi, totalement correct : un seul événement est en jeu dans une construction à verbe support comme (3a), qui peut être paraphrasée par une phrase à verbe "ordinaire" Luc a agressé Mariequi ne met en jeu qu’un seul événement. De même pour (3b) qui peut être paraphrasé par Marie a été agressée par Luc.

Cet article se propose donc d’examiner le codage des constructions à verbe support en français dans TimeML, ce qui n’a pas été fait de façon détaillée pour les autres langues couvertes par TimeML (l’anglais, l’italien, le coréen et le chinois) à notre connaissance. La Section 2 présen-tera une introduction à TimeML, ses enjeux et sa méthodologie. La Section 3 présenprésen-tera les principales données linguistiques concernant les constructions à verbe support. La Section 4 proposera un codage linguistiquement justifié des constructions à verbe support dans TimeML. Enfin, la Section 5 portera sur des questions de faisabilité et de méthodologie.

2

Présentation de TimeML

TimeML (Pustejovsky et al., 2003) est un langage de spécification conçu pour l’annotation et la normalisation d’informations temporelles dans des textes. Il a principalement été élaboré

1La version de TimeML que l’on prend en compte ici est celle élaborée dans les consignes de l’ISO (Lee et al.,

(4)

dans le cadre de l’amélioration de systèmes questions-réponses en leur permettant de traiter des questions d’ordre temporel sur les entités et les événements. Le schéma d’annotation prévoit les fonctionnalités suivantes : l’annotation des événements, l’étiquetage des expressions tem-porelles et la normalisation de leur valeur2, ainsi que la mise en évidence des relations

as-pectuelles, temporelles ou de subordination qui peuvent exister entre ces deux types d’entités temporelles. Les marqueurs de relations peuvent également être annotés.

TimeML adopte une conception large des événements qui regroupe les événements et certains états, ce qui correspond plus à la notion d’éventualité (Bach, 1986). La balise<EVENT>permet

de classifier un événement annoté selon une ontologie prédéfinie. L’ontologie TimeML compte 7 classes d’événements différents :ASPECTUAL(commencer, continuer, terminer...),I_ACTION

(nier, permettre, empêcher...), I_STATE (vouloir, croire, aimer...), PERCEPTION (voir,

enten-dre, percevoir...),REPORTING(dire, citer, affirmer...),STATE(être + ADJ), etOCCURRENCE(les

événements qui ne rentrent pas dans l’une des autres classes). Nous orientons le lecteur vers (Saurí et al., 2005) pour une description de ces classes. La balise <EVENT> comporte des

at-tributs permettant de représenter les informations grammaticales comme la partie du discours, d’éventuels temps et modes verbaux, la présence d’une négation, ainsi que les propriétés as-pectuelles d’un événement donné. Les consignes d’annotation précisent que l’on marque de cette balise la tête lexicale du constituant qui dénote l’événement.

Les expressions temporelles sont marquées par la balise <TIMEX3>. Elles se divisent en

qua-tre classes : les dates (type DATE, le 15 janvier, 15.01.2008), les heures (type TIME, 15h20,

l’après-midi), les durées (typeDURATION, 5 jours, deux ans) et les ensembles (typeSET, tous

les jours, hebdomadaire, anuellement). TimeML permet aussi de raisonner avec des expressions temporelles sous-spécifiées, comme lundi prochain et l’année dernière, dont la valeur doit être déterminée par rapport à un point temporel de référence.

Les événements et les expressions temporelles sont mis en relation par trois sortes de liens (links) : liens temporels (TLINK), aspectuels (ALINK) et de subordination (SLINK). La première

sorte capture des relations temporelles entre deux entités (EVENT-EVENT,TIMEX3-TIMEX3, ou EVENT-TIMEX3), la deuxième capture les phases dans le déroulement d’un événement, enfin la

troisième est essentielle pour les raisonnements qui dépendent de la véracité ou la certitude des propositions qui dénotent des événements. Les mots fonctionnels qui signalent explicitement un de ces liens sont annotés avec la balise SIGNAL. Le plus souvent ce sont des prépositions

comme avant, après, pendant ou lors de.

3

Présentation des constructions à verbe support

La notion de verbe support est traditionnellement utilisée (Gross, 1981) pour un verbe (noté Vsup) qui a comme objet (direct ou indirect) un nom prédicatif (Npred) dénotant une éventual-ité, comme sujet un participant à cette éventualité – en gros, le participant qui est le sujet du verbe morphologiquement associé au Npreds’il existe – et comme objet oblique éventuel l’autre

participant s’il y en a un, voir (4a). Cette notion à été élargie pour couvrir les verbes support converses (Vconv) où, à l’instar des constructions passives, les rôles syntaxiques des participants

sont inversés, voir (4b) (Gross, 1982). Enfin, elle peut être élargie aux verbes supports inverses (Vinv) où le Npredse trouve en position sujet, voir (4c) (Danlos, 2009).

(5)

André Bittar et Laurence Danlos

(4)a. Ce politicien a mené une attaque contre le libéralisme [Vsup]

(Ce politicien a attaqué le libéralisme)

b. Le libéralisme a fait l’objet d’une attaque de la part de ce politicien [Vconv]

(Le libéralisme a été attaqué par ce politicien)

c. Un cri a échappé à Luc [Vinv]

(Luc a crié)

Dans les exemples (4), un seul événement est en jeu, comme en témoigne la (pseudo-)paraphrase avec une phrase à verbe ordinaire donnée entre parenthèses. Nous verrons à la Section 4.1 com-ment prendre en compte ce phénomène en TimeML.

Les verbes support de (4) ont un aspect neutre dans la mesure où aucune phase de l’éventualité dénotée par le Npredn’est mise en évidence. Ceci n’est pas le cas dans l’exemple (5) où lancer,

verbe support à aspect non neutre, indique qu’on s’intéresse au début de l’attaque.

(5) Ce politicien a lancé une attaque contre le libéralisme [Vasp]

Dans une construction à verbe support, le Npredest la tête d’un GN et en tant que tel il peut être

quantifié, (6a), la quantification portant le nombre d’occurrences de l’éventualité concernée, ou modifié, par exemple, par des adjectifs temporels, (6b), ou de fréquence, (6c).

(6)a. Ce politicien a lancé (quatre + plusieurs) attaques contre le libéralisme. b. Luc a fait un voyage nocturne.

c. Luc faisait une visite hebdomadaire à sa mère.

4

Intégration des verbes support dans TimeML

Nous présentons maintenant notre solution pour le traitement des constructions à verbe support dans le cadre de l’annotation TimeML.

4.1

Phénomènes de base

Avant de présenter notre solution, nous devons expliquer comment TimeML permet de capturer les relations aspectuelles. D’abord celles qui existent entre un verbe matrice aspectuel et son complément événementiel sous forme de verbe infinitif, voir (7a), ou de groupe nominal, voir (7b). Il s’agit ici de verbes tels que commencer, entamer, continuer, poursuivre, terminer ou ar-rêterqui indiquent la phase initiale, médiane ou terminale dans le déroulement d’un événement introduit comme complément. Pour l’exemple (7a), l’annotation est donnée ci-dessous.

(7)a. Luc a commencé à préparer une choucroute. b. Luc a commencé la préparation d’une choucroute.

Luc a <EVENT eid="e1" eiid="ei1" class="ASPECTUAL" pos="VERB" tense="PAST">commencé</EVENT> à <EVENT eid="e2" eiid="ei2"

class="OCCURRENCE" pos="VERB" vform="INFINITIVE">préparer</EVENT> une choucroute.

<ALINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="INITIATES"/>

(6)

Le verbe commencer est balisé<EVENT>. Il reçoit la classeASPECTUALet les valeursVERBet PAST pour ses traits grammaticaux de catégorie (pos pour part-of-speech) et de temps verbal

(attributtense) respectivement. Le verbe préparer est lui aussi marqué par la balise<EVENT>.

Il est de classe OCCURRENCE, et sa balise contient un attribut vform qui capture le fait qu’il

s’agit d’un infinitif. Les deux balises <EVENT>contiennent des attributseid eteiid, qui

ser-vent à identifier les événements et leurs instances. La dernière balise est un<ALINK>—

identi-fié par l’attributlid— qui désigne une relation aspectuelle. Ses attributseventInstanceID

et relatedToEventInstance sélectionnent les instances des événements concernés : ei1

pour le verbe commencer etei2pour le verbe préparer. L’attributrelTypeprécise le type de

relation aspectuelle en jeu, iciINITIATES, qui indique queei1se situe au début deei2.

Pour (7b), la seconde balise<EVENT>est placée autour du nom et seule la valeur de l’attribut poschange (cette balise ne contient pas l’attributvform).

Luc a <EVENT eid="e1" eiid="ei1" class="ASPECTUAL" pos="VERB" tense="PAST">commencé</EVENT> la <EVENT eid="e2" eiid="ei2" class="OCCURRENCE" pos="NOUN">préparation</EVENT> d’une choucroute.

<ALINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="INITIATES"/>

Considérons maintenant les phrases à verbe support données en (8), (8a) étant construite autour de lancer à valeur aspectuelle inchoative (de classe TimeMLASPECTUAL), (8b) autour de mener

à valeur aspectuelle neutre (de classe TimeMLOCCURRENCE).

(8)a. Une mère de famille a lancé une procédure contre une institutrice à Bourges. b. Une mère de famille a mené une procédure contre une institutrice à Bourges.

Étant donné leur similitude formelle et sémantique, (7b) et (8a) doivent recevoir des annota-tions similaires. En conséquence, l’annotation de (8a) doit comprendre deux balises <EVENT>

qui sont reliées par l’intermédiaire d’un <ALINK> indiquant une relation aspectuelle de type INITIATESentre le verbe support lancer, de classeASPECTUAL, et son complément nominal.

Maintenant, les annotations de (8a) et (8b) doivent être identiques sauf pour la relation aspectuo-temporelle entre le verbe support et son complément nominal et la classe du verbe. Pour un verbe support à valeur aspectuelle neutre, c’est-à-dire de classe OCCURRENCE, nous proposons

que cette relation aspectuelle soit de typeIDENTITY, comme cela a été fait dans (Pustejovsky

et al., 2005) pour l’anglais et dans (Caselli, 2008) pour l’italien — cependant, dans les deux cas sans argumentation poussée. Nous obtenons donc l’annotation suivante pour (8b).

Une mère de famille a <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="VERB" tense="PAST">mené</EVENT> une <EVENT eid="e2" eiid="ei2" pos="NOUN">procédure</EVENT> contre une institutrice à Bourges.

<TLINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="IDENTITY"/>

En conclusion, nous proposons que les phrases à verbe support reçoivent des annotations com-portant deux balises<EVENT>, l’une pour le Vsup, l’autre pour le Npred. Pour un verbe support à

valeur aspectuelle non neutre, ces deux balises sont reliées par un<ALINK>précisant le type de

relation aspectuelle entre le verbe support et son complément nominal. Pour un verbe support à valeur aspectuelle neutre, ces deux balises sont reliées par un <TLINK>de type IDENTITY.

(7)

André Bittar et Laurence Danlos

4.2

Quantification d’occurrences

Tout groupe nominal événementiel ordinaire porte une quantification et c’est bien le cas du GN construit autour du Npreddans les constructions à verbe support, cf Section 3. Dans les versions

antérieures de TimeML (Saurí et al., 2006), l’attributcardinalityservait à capturer la valeur

des quantifications adverbiales, comme dans (9a). Ces consignes ne prenaient pas en compte la quantification des occurrences d’événements nominaux (9b).

(9)a. Max a voyagé en Tanzanie deux fois.

b. Deux violents séismes ont fait des centaines de morts au Japon.

D’un point de vue temporel, il peut être pertinent d’annoter la quantification d’événements nom-inaux. C’est le cas dans les exemples de (10), qui précisent qu’un certain nombre d’accidents ont eu lieu sur une période donnée. Il est également important de capturer la quantification d’occurrences dans les constructions à verbe support, voir (12).

(10)a. 934 accidents ont endeuillé le pays au mois de mars. b. Plusieurs accidents ont endeuillé le pays au mois de mars. c. Aucun accident n’a endeuillé le pays au mois de mars.

L’emploi de l’attribut cardinality n’est pas très détaillé dans les consignes d’annotation

TimeML actuelles. Nous proposons d’employer cet attribut pour capturer la quantification d’oc-currences (différente d’une valeur de 1) sur tout nom événementiel marquable par une balise

<EVENT>. Les événements de cardinalité 1 n’auront pas cet attribut. Nous proposons que le

domaine des valeurs soit des chiffres pour des expressions numériques précises (934, aucun) comme dans (10a) et (10c) et des expressions à opérateur unaire pour les valeurs vagues, comme

>1pour plusieurs dans (10b).

L’annotation du nom événementiel dans (10a) serait alors :

934 <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="NOUN" cardinality="934">accidents</EVENT> ont endeuillé le pays au mois de mars.

Prenons maintenant les deux phrases à verbe ordinaire (11a) et (11b). (11a) comporte une quan-tification adverbiale d’occurrence et (11b) comporte une quanquan-tification adverbiale de fréquence d’occurrence.

(11)a. Max a voyagé en Tanzanie deux fois. b. Max a voyagé en Tanzanie deux fois par an.

Dans (11a), la quantification adverbiale deux fois porte sur l’événement décrit par le verbe voy-ager. La version actuelle de TimeML traite ce genre de phrase de la façon suivante. La quantifi-cation adverbiale est capturée dans une balise<TIMEX3>exprimant la fréquence (freq="2X"

pour deux fois). Un<TLINK>explicite la relation entre l’événement et l’expression temporelle. Max a <EVENT eid="e1" eid="ei1" class="OCCURRENCE" pos="VERB"

tense="PAST">voyagé</EVENT> en Tanzanie <TIMEX3 tid="t1" type="SET" freq="2X">deux fois</TIMEX3>.

<TLINK lid="l1" eventInstanceID="ei1" relatedToTime="t1" relType="IS_INCLUDED"/>

Selon TimeML l’annotation de (11b) sera la suivante. La quantification adverbiale de fréquence deux fois par an est capturée dans une seule balise <TIMEX3> de type SET qui désigne un

ensemble de valeurs. L’intervalle temporel est capturé dans l’attribut value de valeur P1Y

(8)

Max a <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="VERB" tense="PAST">voyagé</EVENT> en Tanzanie <TIMEX3 tid="t1" type="SET" value="P1Y" freq="2X">deux fois par an</TIMEX3>. <TLINK lid="l1"

eventInstanceID="ei1" relatedToTime="t1" relType="IS_INCLUDED"/>

Venons-en maintenant au cas des constructions à verbe support (12a-d). (12)a. Max a fait un voyage en Tanzanie.

b. Max a fait deux voyages en Tanzanie.

c. Max a fait un voyage en Tanzanie deux fois par an. d. Max a fait deux voyages en Tanzanie par an.

(12a) est annoté selon les consignes que nous avons présentées dans la Section 4.1 pour les verbes support à valeur aspectuelle neutre. Pour (12b), qui comporte une quantification sur le Npred, la balise<EVENT>du Npred a l’attributcardinalityde valeur2.

Max a <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="VERB" tense="PAST">fait</EVENT> deux <EVENT eid="e2" eiid="ei2" pos="NOUN" cardinality="2">voyages</EVENT> en Tanzanie.

<TLINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="IDENTITY"/>

L’annotation de (12c), avec une quantification adverbiale de fréquence d’occurrence, peut être obtenue de façon “compositionnelle” à partir de (11b) et (12a). L’annotation est analogue à l’annotation pour (11b) sauf qu’il s’agit d’une construction à verbe support. Le Npred est alors

annoté par une balise<EVENT>et un<TLINK>explicite la relation entre le Vsupet le Npred. Max a <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="VERB"

tense="PAST">fait</EVENT> un <EVENT eid="e2" eiid="ei2"

pos="NOUN">voyage</EVENT> en Tanzanie <TIMEX3 tid="t1" type="SET" value="P1Y" freq="2">deux fois par an</TIMEX3>.

<TLINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="IDENTITY"/>

<TLINK lid="l2" eventInstanceID="ei1" relatedToTime="t1" relType="IS_INCLUDED"/>

Enfin passons à l’annotation de (12d), où il y a une quantification sur le Npred ainsi qu’une

expression de fréquence par an rattachée au groupe nominal. Le verbe support est marqué par une balise <EVENT>. Le Npred comporte également une balise <EVENT>, avec un attribut

cardinalitypour la quantification d’occurrences. Maintenant une difficulté se présente lorsque

l’on doit annoter l’expression de fréquence. Les consignes TimeML (Lee et al., 2007) précisent que l’étendue de la balise<TIMEX3>doit correspondre soit à un groupe nominal (ex. deux fois

par an), soit un groupe adjectival (ex. annuel), soit un groupe adverbial (ex. annuellement), ce qui n’est pas le cas de l’expression de fréquence ici en forme d’un groupe prépositionnel. De plus, comme nous montre l’agrammaticalité dans (13a), l’expression de fréquence seule ne peut apparaître dans les constructions à verbe ordinaire à la place d’un adverbe comme annuellement. On ne saurait non plus l’annoter au même titre qu’un adjectif, comme annuel (13b) et (13c), qui représente à la fois la quantification et la fréquence d’occurrence (par synonymie avec une fois par an). Effectivement, le groupe prépositionnel qui exprime la fréquence ne peut être séparé du groupe nominal quantifié qu’il modifie.

(13)a. Max a voyagé annuellement / *par an. b. Le voyage annuel / *par an de Max. c. Le voyage de Max était annuel / *par an.

(9)

André Bittar et Laurence Danlos

Il est alors difficile de savoir comment arriver à une annotation adéquate dans le cadre du langage TimeML actuel. La solution qui nous semble la mieux adaptée à cette situation est celle d’étendre le langage TimeML pour capturer non seulement la quantification mais aussi la fréquence d’occurrence des événements nominaux dans la balise<EVENT>. Nous proposons

l’attribut periodicity (pour ne pas reprendre freq qui sert dans la balise <TIMEX3>), qui

prend la valeur normalisée de l’intervalle temporel en question. Ainsi, pour la phrase (12d) nous proposons une annotation similaire à celle pour (12b) mais cette fois avec l’attributperiodicity

de valeurP1Y(period - one year).

Max a <EVENT eid="e1" eiid="ei1" class="OCCURRENCE" pos="VERB" tense="PAST">fait</EVENT> deux <EVENT eid="e2" eiid="ei2" pos="NOUN" cardinality="2" periodicity="P1Y">voyages</EVENT> en Tanzanie par an.

<TLINK lid="l1" eventInstanceID="ei1" relatedToEventInstance="ei2" relType="IDENTITY"/>

L’introduction de l’attribut periodicity permet une annotation linguistiquement cohérente

des phrases à verbe support avec quantification et fréquence d’occurrences sur le Npred.

5

Faisabilité et méthodologie

Afin de pouvoir effectuer une annotation automatique des phénomènes présentés ici, un sys-tème doit disposer de certaines ressources lexicales, notamment pour déterminer quelle balise (<ALINK> ou <TLINK>) il faut utiliser pour expliciter la relation entre un Vsup et son Npred,

voir Section 4.1. Un lexique spécifiant les Vsup possibles pour un Npred donné, ainsi que la

variante aspectuelle (inchoatif ou neutre) de la construction, semble indispensable. Des travaux sur la reconnaissance des constructions à verbe support sont décrits dans (Laporte et al., 2008), mais à notre connaissance les lexiques résultants ne contient pas d’information sur la valeur aspectuelle du verbe dans ces constructions.

Une possibilité pour palier ce manque de ressources lexicales est de recourrir à des approx-imations, par exemple en choisissant la relation uniquement en fonction du verbe. Ainsi, les verbes ayant habituellement une valeur aspectuelle non neutre (commencer, lancer, terminer, ...) lorsqu’ils ont un objet direct événementiel, imposeraient l’utilisation de la balise<ALINK>.

Les autres verbes imposeraient l’utilisation d’une balise <TLINK> pour expliciter la relation

avec leur argument événementiel. La faiblesse de cette approximation réside dans le fait que les verbes de cette deuxième classe peuvent aussi avoir une valeur aspectuelle lorsqu’ils se combinent avec certains noms événementiels. Nous citons le cas de prendre, qui a une valeur aspectuelle inchoative dans (14a) et une valeur neutre dans (14b).

(14)a. L’économie a pris son essor. b. Luc a pris une revanche sur Marie.

Malgré cette faiblesse, l’implémentation de ces simples heuristiques permettrait de constituer automatiquement un lexique de pairs Vsup—Npred corrélées avec leur classe aspectuelle en

ef-fectuant une correction manuelle pour rendre compte des cas comme 14. Nous entreprenons actuellement une implémentation de cette approximation dans le cadre des modules que nous développons pour l’annotation TimeML automatique. Nous orientons le lecteur vers (Bittar, 2008) pour les détails sur ces modules. Nous nous servirons des résultats pour évaluer à la fois la fréquence du phénomène linguistique en question et la couverture des heuristiques proposées pour son traitement.

(10)

6

Conclusion

Une extension des consignes d’annotation du langage TimeML s’est avérée nécessaire pour l’annotation correcte des constructions à verbe support. Premièrement, pour rendre compte des variantes aspectuelles des Vsupet, deuxièmement, pour capturer la quantification et la fréquence

d’occurrenecs des Npred. De fait, nous avons élaboré des consignes linguistiquement motivées

pour la bonne annotation des phénomènes en question. Cependant, pour arriver à une implémen-tation exacte de ces consignes, le développement de ressources lexicales demeure une nécessité. Dans un premier temps, une implémentation approximative est envisagée. Une première évalu-ation de ce système permettra de jauger le potentiel apport des ressources lexicales proposées.

Références

BACH E. (1986). The Algebra of Events. Linguistics and Philosophy, 9(1), 5–16.

BITTAR A. (2008). Annotation des informations temporelles dans des textes en français. In Actes de RECITAL 2008, Avignon, France.

CASELLI T. (2008). It-TimeML : TimeML Annotation Guidelines for Italian, Version 1.0.

Rapport interne, Instituto di Linguistica Computazionale, C.N.R.

DANLOS L. (2009). Extension de la notion de verbe support. In Supports et prédicats non verbaux dans les langues du monde. Paris.

GROSS G. (1982). Un cas de constructions inverses : donner et recevoir. Langages, 136, 41–52.

GROSS M. (1981). Les bases empiriques de la notion de prédicat sémantique. Langages, 63, 7–52.

LAPORTEE., RANCHHODE. & YANNACOPOULOUA. (2008). Syntactic variation of support verb constructions. Lingvisticae Investigationes, 31(2).

LEE K., PUSTEJOVSKY J., BUNT H., BOGURAEV B. & IDE N. (2007). Lan-guage resource management - Semantic annotation framework (SemAF) - Part 1 : Time and events. International Organization for Standardization, Geneva, Switzerland. http ://lirics.loria.fr/doc_pub/SemAFCD24617-1Rev12.pdf.

PUSTEJOVSKY J., MEYERS A., PALMER M. & POESIO M. (2005). Merging PropBank,

NomBank, Timebank, Penn Discourse Treebank and Coreference. In ACL 2005 Workshop on Frontiers in Corpus Annotations II : Pie in the Sky, Ann Arbor, Michigan, USA.

PUSTEJOVSKY J., NOJ. C., INGRIAR., SAURÍR., GAIZAUSKASR., SETZERA. & KATZ G. (2003). TimeML : Robust Specification of Event and Temporal Expressions in Text. In Proceedings of IWCS-5, Fifth International Workshop on Computational Semantics.

SAURÍR., KNIPPENR., VERHAGENM. & PUSTEJOVSKYJ. (2005). Evita : A Robust Event Recognizer for QA Systems. In Proceedings of HLT/EMNLP 2005, p. 700–707.

SAURÍ R., LITTMAN J., KNIPPEN B., GAIZAUSKAS R., SETZER A. & PUSTEJOVSKY J. (2006). TimeML Annotation Guidelines Version 1.2.1.

Références

Documents relatifs

En matière de production laitière, la Tarentaise résiste mieux que la Holstein à des conditions de stress thermique extrême. La prochaine étape de cette étude est de quantifier

Et dans ce vaste réseau qui relie les villes, les pays, les voyageurs, les gens, les enfants, les hommes et les femmes, qui pour un moment traversent la gare, porteurs de

Que le système en question soit une infrastructure clé menacée par un attentat terroriste, un système de santé publique exposé à la résurgence de maladies infectieuses connues

Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, et al.. Anno- tation de la temporalité en corpus : contribution à l’amélioration de la norme TimeML..

Temporal@ODIL Project: Adapting ISO-TimeML to Syntactic Treebanks for the Temporal Annotation of Spoken Speech.. Jean-Yves Antoine 1 , Jakub Waszczuk 2 , Ana¨ıs Lefeuvre-Halftermeyer

Par opposition à la fois aux langages symboliques de la logique et aux langages strictement scientifiques, les langages d’expressions ordinaires contiennent

tener lugar tener lugar tener lugar hacer referencia hacer referencia hacer referencia dar cuenta dar cuenta dar cuenta dar lugar tener una superficie tener

Nous proposons de représenter les structures itératives via une entité S TRUCTURE dans laquelle nous intégrons un attribut obligatoire TYPE , permettant de distinguer une itération