Bilan du chapitre - : La localisation temporelle à l’œuvre dans les textes

Chapitre 2 : La localisation temporelle à l’œuvre dans les textes

2.6 Bilan du chapitre

Cette représentation formelle peut être paraphrasée de la façon suivante : la zone temporelle durant laquelle s’achève le procès localisé ( chevauche un repère temporel ( ) qui précède de trois jours ( ) l’acte d’énonciation ( ).

C’est dans la veine de cette approche que nos travaux s’inscrivent, en cherchant à représenter formellement les adverbiaux de localisation temporelle comme une succession d’opérations sémantiques agissant sur un repère temporel noyau (opération de régionalisation, de déplacement et de focalisation). L’analyse que l’on propose, décrite dans le chapitre 4, s’appuie sur la formalisation proposée par (Battistelli, 2009). On montrera qu’initialement limitée à l’analyse des adverbiaux calendaires (qui effectuent un repérage par rapport au calendrier), la modélisation peut être étendue à l’ensemble des types de repérage (déictique, anaphorique ou relatif à un procès).

2.6 Bilan du chapitre

On a vu que les adverbiaux temporels posaient des difficultés d’analyse aux linguistes à plusieurs niveaux : au niveau sémantique (quels critères définitoires permettent de circonscrire cette catégorie ?), au niveau de leur composition morphosyntaxique (les adverbiaux peuvent être constitués de différentes catégories morphosyntaxiques), et au niveau de l’analyse de leur portée, elle-même dépendante de critères dispositionnels. Les adverbiaux de localisation temporelle semblent néanmoins former une sous-classe relativement homogène de ces adverbiaux sur un plan sémantique, même s’ils sont susceptibles d’opérer une localisation à partir de repères de différentes natures (calendaires, déictiques, anaphoriques ou encore relatifs à un procès, éventuellement nominalisé).

On retrouve la trace de ces difficultés sur un plan terminologique, dans les différences de dénomination de l’objet d’analyse selon les disciplines. Ainsi, en ingénierie des langues, le terme d’« expressions temporelles » s’est progressivement imposé pour désigner les références temporelles présentes dans les textes. On a vu que cette approche tend à considérer les expressions temporelles comme des « entités nommées ». En linguistique, ce sont plus souvent des unités linguistiques prenant part à la structuration du discours qui sont considérées, articulant une notion

sémantique avec une fonction syntaxique : l’unité considérée est l’adverbial (avec toutes les difficultés liées à la définition précise de cette catégorie) et non la référence temporelle noyau - référence qu’il est difficile d’isoler en dehors de toute structure, à la fois sur un plan syntaxique et sémantique, parce qu’ainsi isolée, on perd la possibilité de poser le problème de la portée des adverbiaux, ou encore d’analyser de façon unifiée les différents types d’adverbiaux (adverbes de temps, subordonnées temporelles, syntagmes prépositionnels, par exemple, qui occupent manifestement une fonction syntaxique proche).

On a vu en outre, que les liens entre la désignation d’un événement et la détermination de ses coordonnées temporelles n’allaient pas de soi et ce d’abord parce qu’un événement n’est pas réductible à son ancrage temporel. Comme on va le voir dans le chapitre suivant, de nombreuses applications issues de travaux en ingénierie des langues et en Intelligence Artificielle cherchent à normaliser les expressions temporelles dans les textes, afin d’assigner une date ou un intervalle de dates au procès que ces expressions viennent déterminer. Or, très souvent, il n’est possible de représenter les événements et les adverbiaux de localisation temporelle sous la forme d’intervalles de temps qu’au prix d’une perte de sémantique ou d’une surdétermination de celle-ci. On verra que cette question devient centrale lorsqu’il s’agit de manipuler des représentations facilitant la mise en œuvre de raisonnements ou de calculs, puisqu’il devient alors important de pouvoir conserver différents niveaux de représentation selon les usages attendus (ou bien des intervalles ou bien des représentations formelles sous la forme d’une combinaison d’opérations sémantiques).

Chapitre 3 : Les adverbiaux de localisation temporelle : un objet pour

l’ingénierie des langues et l’ingénierie des connaissances

Au cœur des programmes d’annotation automatique, la caractérisation de l’« information temporelle » constitue un enjeu, tant sur le plan descriptif (quelles sont les unités de la langue qui expriment une information temporelle ?) que sur le plan analytique (quels sont les niveaux de représentation et les stratégies calculatoires à mettre en œuvre pour appréhender la catégorie sémantique du temps ?).

Dans le champ de l’ingénierie des connaissances et de la recherche d’information, par rapport auquel se situent souvent ces programmes d’annotation automatique, l’information temporelle est la plupart du temps rapportée à ce qui permettrait la résolution d’une tâche en particulier : celle du calcul de l’ancrage calendaire de situations - souvent appelées « événements » - décrites dans les textes. La nature de cet ancrage, c’est-à-dire la façon dont on associe l’objet localisé dans le temps et les valeurs calendaires, pose toutefois des difficultés.

Dans ces applications, les expressions linguistiques référant explicitement à un calendrier (le calendrier grégorien, par exemple) constitue un champ d’investigation exploré de longue date. C’est ainsi dans le cadre de recherches entreprises autour de systèmes de questions/réponses qu’a été organisée, pour la première fois, en 2004, une tâche d’évaluation dévolue uniquement à la problématique du repérage et de la normalisation de ce type d’expressions : Time Expression Recognition and Normalization (TERN).

Cette volonté d’ancrer les situations décrites dans les textes sur le calendrier est également à l’origine de la démarche visant à proposer une standardisation de l’annotation sémantique des « expressions temporelles » (cf. en particulier (Schilder et Habel, 2001 ; Pustejovsky et al., 2003 ; Ferro et al., 2003 ; Saquete et al., 2004)), dont ISO-TimeML est le résultat (Pustejovsky et al., 2010).

L’objectif qui anime cette démarche est d’améliorer la performance des systèmes de recherche d’information, en sortant du paradigme d’un accès aux textes reposant uniquement sur l’analyse des mots-clés : ce qui est visé, c’est le contenu des textes (access of information from texts through content rather than keywords (Pustejovsky et al., 2003)). En l’occurrence donc, le contenu temporel des textes, fait des événements et de leur ancrage temporel.

Cet effort s’est accompagné, au fil du temps, de l’élaboration de corpus annotés tels que ACE et TimeBank et, bien sûr aussi, d’un nombre croissant de systèmes automatiques pour annoter les « expressions temporelles » présentes dans les textes (cf. par exemple Mani et Wilson, 2000; Han et al., 2006; Ahn et al., 2007).

Pour autant, un constat s’impose : il y a aujourd’hui encore peu de réalisations opérationnelles du côté des systèmes de recherche d’information pour prendre en compte l’expression de critères temporels (Alonso et al., 2007). Ceux-ci n’exploitent encore que très peu et très difficilement les informations temporelles exprimées dans les textes. L’unique réalisation grand-public d’envergure, le service view:timeline de Google a d’ailleurs été abandonné en 2011.

Du côté des systèmes de gestion des connaissances, les propriétés calendaires décrivant la localisation temporelle d’objets très divers sont des propriétés très largement répandues, au sens où l’on trouve une grande quantité d’informations localisées temporellement dans les bases de données et de connaissances. Pour ce qui nous retient ici, du point de vue de l’ingénierie des connaissances, le problème s’articule à la fois avec l’ingénierie des langues (il relève alors de l’exploitation des connaissances portées par les textes), mais aussi de la modélisation des propriétés temporelles elles-mêmes.

Dans ce chapitre, nous nous attacherons à décrire la façon dont l’ingénierie des langues s’est emparée de cet objet d’analyse désigné sous les termes d’« expressions temporelles » (section 3.1), avant de s’intéresser à deux domaines d’application dans lequel les systèmes d’annotation qui visent à extraire et décrire ces expressions sont ou pourraient être exploitées : l’ingénierie des connaissances (section 3.2) et la recherche d’information (section 3.3).

Nous souhaitons par la suite montrer comment, à partir d’une analyse linguistique, il est possible de faire émerger d’autres représentations de la sémantique des « expressions temporelles » que celles qui prédominent actuellement – termes auxquels on préfère ceux, moins ambigus, d’« adverbiaux de localisation temporelle » - et comment, à partir de ces représentations, il est possible de répondre à certaines des difficultés que rencontrent aujourd’hui les systèmes dédiés à l’acquisition de connaissances et à la recherche d’information, lorsqu’ils doivent gérer des informations temporelles.

3.1 Traitement Automatique des Langues : quel(s) objet(s) d’analyse et

Dans le document Analyse sémantique automatique des adverbiaux de localisation temporelle : application à la recherche d'information et à l'acquisition de connaissances (Page 58-62)