• Aucun résultat trouvé

Pour Charolles [1997], le texte ne doit pas être analysé au niveau de la phrase, mais bien au niveau du discours. Certains marqueurs linguistiques, tels que des circonstanciels détachés en début de phrase, jouent un rôle particulier à cet égard. Il s’agit de la notion de cadres de discours, définie comme suit :

35

« tomber » peut être le résultat de « pousser ».

36

4.9 Les cadres de discours 139

« Les cadres de discours intègrent une ou plusieurs propositions en fonction de critères qui sont spécifiés par les expressions les introduisant. Ils contribuent à subdiviser et à répartir les informations apportées par le discours au fur et à mesure de son développe- ment. Les critères servant à la répartition des informations en blocs homogènes peuvent être très divers. » (Charolles [1997], p. 33).

Les cadres sont de longueurs variables, allant de la proposition à un ensemble de paragraphes. Ils correspondent en fait à des univers qui peuvent être de plusieurs types : spatiaux, de connaissances, de représentation, d’énonciation, et bien entendu temporels. C’est évidemment ce dernier type qui nous intéresse plus particulièrement car il souligne le caractère structurant ou organisateur des expressions temporelles au niveau du discours. Un exemple, tiré de Charolles et al. [2005], permet d’illustrer le découpage d’un texte en cadres temporels :

« En juin 1992, 747 500 candidats se sont présentés a l’examen, [...] ; près des trois quarts ont été reçus ; mais pour les candidats individuels le taux de réussite a été à peine de 50%. Pour la série collège [...], 76% des candidats des établissements scolaires ont obtenu le brevet [...]. En 1989, tant les collégiens du privé que ceux du public ont de meilleurs résultats dans les départements des académies de l’Ouest où les éleves du privé sont nombreux, [...]. Dans le Nord-Ouest, en Ile-de-France et dans l’Est, les taux de réussite des éleves des collèges publics sont généralement inférieurs à la moyenne nationale, [...]. À la session 1991, ce sont les académies de Rennes, Grenoble, Dijon, Nantes, Clermont-Ferrand qui obtiennent les meilleurs résultats [...], alors que celles du Midi méditerranéen n’atteignent pas 70%. » (p. 122)

Trois cadres de discours sont présents dans cet exemple. Le premier commence par « En juin 1992 » et se termine lorsque le deuxième commence (« En 1989 »). Enfin le troisième cadre suit, à partir de l’expression « À la session 1991 ». On peut le constater, ces expressions temporelles caractérisent et portent sur tout le cadre qu’elles définissent.

De nombreux travaux ont par ailleurs montré le rôle d’organisation du discours qu’ont les expressions temporelles. Par exemple, Costermans et Bestgen [1991] montrent que leur introduction en début de phrase permettent de marquer des ruptures importantes et d’ainsi signaler la structure hiérarchique du texte. Cette fonction de marqueur de segmentation a en partie été validée de manière expérimentale par Piérard et al. [2004].

La faisabilité et l’utilité de l’exploitation des cadres de discours ont déjà été démontrées. Par exemple, Battistelli et al. [2006] proposent une application de la gestion de la temporalité au travers des cadres de discours. Le système construit est une aide à la lecture de textes, biographiques en l’occurrence, qui permet de passer d’une lecture linéaire du texte à une lecture chronologique en naviguant d’un cadre de discours à un autre par le biais de leur caractérisation temporelle.

140 4 Expression du temps dans le langage naturel

4.10 Conclusion

Dans le langage naturel, et dans le cas présent, en français, de nombreux éléments interviennent pour l’expression de notions temporelles. Ce chapitre a permis d’aborder les principaux : les adverbes et connecteurs temporels, la notion de procès, le(s) temps et l’aspect, y compris les différents modèles linguistiques des temps verbaux, et finalement la structure de discours, et en particulier le mécanisme d’encadrement du discours.

Ces différents vecteurs de l’information temporelle sont tous importants, et devraient idéalement tous pouvoir être intégrés dans un processus de traitement automatique, permettant ainsi leur prise en compte conjointe. Malheureusement, certains sont moins enclins que d’autres à se soumettre à ce type d’analyse. Il est cependant possible de mener des tâches d’extraction d’informations temporelles en s’appuyant sur les éléments exploitables par une procédure automatique.

Les adverbes temporels sont à analyser en priorité, de par leur potentiel informationnel, ainsi qu’en raison des bonnes perspectives qu’offre leur traitement automatique. L’apport de l’analyse des temps des verbes est également incontestable, mais l’implémentation d’un modèle complet est une tâche complexe, surtout au vu de certains points théoriques qui restent ouverts. Le traitement du temps ne peut cependant se passer de l’information temporelle portée par le verbe. L’analyse à ce niveau doit donc tenter d’apporter autant d’informations que possible. Enfin, l’organisation du discours peut aussi apporter des informations intéressantes, mais nécessite des processus d’analyse plus larges, qui agissent au niveau du texte. Certains phénomènes, tel que l’encadrement du discours, n’impliquent pas un traitement trop complexe et sont susceptibles d’améliorer l’analyse temporelle. Une présenta- tion plus détaillée des caractéristiques et des choix réalisés pour l’extraction d’informations tempo- relles réalisée dans cette thèse, est proposée à la section 7.3.

C

HAPITRE

5

M

ODÉLISATION DU TEMPS

5.1 Introduction

Dans cette thèse, l’accent n’est pas mis de manière aussi importante sur les aspects de modélisation du temps que sur les aspects d’extraction. Par conséquent, les questions relatives à la manière de représenter le temps sont surtout abordées de façon à pouvoir définir clairement les concepts et idées qui sont exploités par la suite. Dans ce chapitre, l’ensemble des modélisations possibles pour un phénomène tel que le temps ne sont donc pas abordées. Plutôt que de fournir une étude qui se voudrait exhaustive, mais qui serait inévitablement incomplète, la présentation s’axe plutôt sur les points importants pour la poursuite de l’exposé. Le problème est abordé en deux temps : quelle modélisation peut on donner à l’espace du temps (Section 5.2) et comment est-il possible de faire référence à cet espace (Section 5.3) ?