• Aucun résultat trouvé

Discussion, perspectives

Dans le document Rapport technique du projet OGRE (Page 71-74)

Nous avons dans ce rapport introduit un modèle formel, de nature algébrique, et les principales opérations permettant de définir une sémantique formelle des CTI. Cette étude constitue la première étape du programme présenté en introduction. Voici pour conclure les suites maintenant planifiées.

6) Définition d’une grammaire sémantique des CTI

Il s’agit de définir une grammaire constituant une bonne couverture des CTI, dans la diversité de leur formes syntaxiques, en étudiant en particulier l’imbrication des différentes

permettre de calculer la sémantique associée, formulée en termes de série associée à une expression linguistique.

Cette grammaire sera implémentée, évaluée, et mise au point dans la cadre de la plate-forme LinguaStream22 (Bilhaut, Widlöcher, 2005) Rappelons que diverses grammaires spatiales et temporelles (périodes historiques non itérées) ont été élaborées dans ce cadre (notamment pour le projet GéoSem (Bilhaut et al. 2003) et que la plate-forme permet de manière particulièrement aisée une expérimentation sur corpus. De plus, dans le cadre du présent projet, le logiciel NLPT dévelopé par C. Person (Person, 2004), qui implémente la théorie SdT a été porté sous LinguaStream : ce qui permettra donc une intégration du calcul spécifique sur les CTI.

Une première esquisse (limité à l’analyse syntaxique) a déjà été réalisée, qui pourra être complétée à partir de la présente étude et de travaux linguistiques descriptifs, tels que (Condamines, 1992).

7) Calcul et raisonnement sur les représentations produites

L’étape suivant naturellement le calcul sémantique lui-même est constitué par l’élaboration de méthodes de raisonnement et de calcul sur les représentations produites. L’opération type consiste à programmer un test de compatibilité entre deux séries provenant de deux expressions distinctes.

Deux types de problèmes se posent. Le premier est la non-canonicité des représentations calculées : plusieurs expressions linguistiques et plusieurs expressions formelles peuvent dénoter la même série (ou le même ensemble de séries). Ceci rend a priori délicat un calcul direct sur les expressions sémantiques produites. Or nous savons par ailleurs que toute structure temporelle périodique (ou ultimement périodique, c’est-à-dire périodique à partir d’un certain moment) peut être codée dans l’arithmétique de Presburger23 (Egidi,Terenziani, 2004) Ceci garantit la possibilité « de principe » de transformation de nos représentations en formules arithmétiques canoniques. La comparaison de deux expressions linguistiques se ramène ainsi in fine à un test arithmétique décidable. Toutefois, une procédure effective, « adaptée » à nos représentations est évidemment souhaitable et devra donc être mise au point.

Le second problème est lié au caractère « flou » de certaines expressions de quantification : la plupart de, souvent, parfois… Des calculs peuvent être menés en principe : si je dis d’une part que la plupart des lundi d’été je vais voir ma grand-mère et de l’autre que, certaine année, je suis parti deux mois à Tombouctou (ville remarquable mais dans laquelle mon aïeule ne dispose d’aucune villégiature), il y a clairement une contradiction. Toutefois, il s’agit là d’un problème complexe, et les objectifs devraient être clairement précisés. Cet aspect est donc à traiter dans un second temps.

8) Intégration de cette sémantique dans une sémantique de la phrase et du texte

Finalement, les CTI n’ont véritablement d’intérêt24 que dans le cadre d’une analyse sémantique de la phrase et du texte. Voici quelques problèmes à traiter :

- le rôle de déclencheur d’itération des CTI, c’est-à-dire leur fonctionnement comme indice conduisant à interpréter comme itératif le procès qu’il situe temporellement ;

22

http://www.linguastream.org

23

Rappelons qu’il s’agit d’un fragment de l’arithmétique entière limité à l’addition et aux relations d’égalité et d’ordre. Rappelons également que ce fragment est décidable.

24

- la relation entre un CTI et son procès. Deux aspects principaux peuvent être retenus : d’une part la relation entre l’intervalle circonstanciel et les intervalles associés au procès itéré, comme esquissé en section 3 ; et de l’autre, dans la constitution même du procès itéré, la manière dont le procès modèle (au sens du texte de Yann Mathet) s’ancre temporellement dans cet intervalle circonstanciel pour créer le procès itéré25.

- les ambiguïtés d’interprétation itératif/non itératif ; par exemple dans les lundis de mars, mars peut renvoyer à la série des mois de mars (l’expression se lit alors : « les lundis de tous les mois de mars ») ou au mois de mars « de référence » (par exemple celui de l’années courante).

- l’ancrage référentiel des CTI sur une période donnée par la contexte d’énonciation ou, de manière anaphorique, le co-texte précédent l’expression : ce que nous avons appelé le « cadre de référence» en 3.2.1.

Ces différents points doivent faire l’objet d’études linguistiques, la formalisation ne semblant pas poser de problème par elle-même.

Bibliographie

Bilhaut F., Widlöcher A, « La plate-forme Linguastream », Journée d'étude ATALA « Articuler les traitements sur corpus », Paris, 5 février 2005.

Bilhaut F., Charnois T., Enjalbert P., Mathet Y., « Passage Extraction in Geographical Documents », Actes New Trends in Intelligent Information Processing and Web Mining (IIPWM), Zakopane, Pologne, 2-5 Juin 2003, p. 121-130.

Condamines, A., Expression de la répétition dans une phrase à subordonnée temporelle, In La quantité et ses modulations qualitatives, Benjamin S., Coll. Nouveaux Actes Sémiotiques, 1992).

Cukierman, D, Delgrande, J., Characterizing temporal repetition. In L. Chittaro, S. Goodwin, H. Hamilton, and A. Montanari, editors, International Workshop on Temporal Representation and Reasoning, TIME’96, pages 80–87, Key West, FL, USA,1996. IEEE Computer Society Press.

Egidi L., Terenziani, P., A mathematical framework for the semantics of symbolic languages representing periodic time. IEEE Proc. of TIME’04, pages 21–27, 2004.

Ligozat, G., On generalized interval calculi. In Proc. of the AAAI-91, pages 234–240, 1991.

Person, C, Traitement automatique de la temporalité du récit : implémentation du modèle linguistique SdT, Université de Caen, Décembre 2004,

25

Dans le document Rapport technique du projet OGRE (Page 71-74)