Liens avec les travaux sur la structuration du discours

Caractérisation des différents attributs

3.4 Liens avec les travaux sur la structuration du discours

De façon générale, les travaux sur la structuration du discours cherchent à rendre compte du fait que les propositions d’un texte ou d’un dialogue s’articulent les unes avec les autres afin de former un tout cohérent. Outre qu’ils se différencient sur le nombre et le type des relations qu’ils proposent pour rendre compte de cette cohérence, ces travaux se distinguent également par le degré de dépendance qu’ils accordent aux relations de cohérence par rapport aux conditions proprement externes aux textes. Si certains postulent l’existence d’une certaine autonomie de ces relations au niveau linguistique [Kamp 1981, Mann & Thompson 1987], d’autres les lient de façon très étroite aux connaissances sur le monde ou sur la situation considérée [Grosz & Sidner 1986, Schank 1986]. Entre ces deux pôles, on trouve tout un éventail de travaux, de [Hobbs 1979] et [Polanyi 1988] à [Asher 1993] et [Dahlgren 1993], mêlant ces deux visions en leur attribuant respectivement une part plus ou moins importante.

L’ensemble des travaux menés dans la lignée des réflexions de Schank constituent une forme extrême de la position faisant dépendre la cohérence textuelle de connaissances externes aux textes. Les représentations de texte dans ce cadre sont globalement assimilables à une instanciation de structures de connaissances possédées en mémoire, ou tout du moins à un assemblage de tels instanciations. Les relations mises en évidence entre les propositions se situent de fait uniquement sur le plan de la réalité évoquée (causalité, motivation, relations temporelles, ...) et aucunement sur le plan textuel (relations dites rhétoriques du type élaboration, contraste, ...).

La structure interne de nos UTs est assez directement inspirée de cette conception. Elles sont en effet assez proches de structures telles que les XPs [Schank 1986] que nous avons évoqués au chapitre 2 à propos de [Ram 1993]. On retrouve le même découpage en trois attributs selon le triptyque pré-conditions – actions – résultats et la possibilité d’avoir des relations binaires, notamment de nature causale et temporelle, entre les éléments de ces attributs.

Le modèle proposé par Grosz et Sidner prend davantage en compte le texte en tant que tel et sa structure. Il met clairement en évidence la notion de segment de discours et définit la façon dont les segments d’un texte ou d’un dialogue peuvent s’organiser. En revanche, il réfute la possibilité de définir un ensemble clos et autonome de relations entre segments et inféode complètement la structure du discours aux intentions véhiculées par ce discours ainsi qu’à la façon dont elles sont organisées. Reconnaître qu’un but est un sous-but d’un but plus large permet alors de déterminer qu’un segment est inclus dans un autre.

À l’échelon des épisodes, nos représentations de texte sont assez proches de ce que propose ce modèle. Les UTs correspondent à des segments de texte et les relations de suivi thématique, en particulier la relation de déviation, concrétisent les opérations de “push and pop” affectant la ou les piles de focalisation de l’attention1. La principale différence réside en fait dans ce que caractérise la notion de segment. Dans notre cas, un segment est défini par un critère thématique : il rassemble toutes les propositions du texte relatives à la même situation, alors que dans le modèle de Grosz et Sidner, un segment rassemble toutes les propositions du texte contribuant au même but. Il existe d’ailleurs une certaine ambiguïté sur la nature exacte de la notion de segment dans les travaux existants sur la structuration du discours, en particulier lorsqu’il s’agit de textes. Beaucoup y font référence mais il n’est pas toujours évident de cerner ce qu’elle recouvre exactement. Une

1 Comme nous l’avons dit précédemment, ces relations ont été reprises de [Grau 1983] où elles sont établies par une analyse thématique utilisant également un mécanisme à base de pile de focalisation de l’attention.

Chapitre 5 - Les représentations de texte 129 des raisons probables de cette ambiguïté vient de ce que la notion d’intention et celle de thème se recoupent assez fortement dans les textes, chose que l’on n’observe pas pour les dialogues¹.

Notre représentation des textes est plus éloignée des autres travaux mentionnés initialement. En particulier, elle ne cherche pas à rendre compte de tous les liens de cohérence existant entre les propositions d’un texte puisqu’elle met l’accent sur leur seule dimension thématique. La RST (Rhetorical Structure Theory) [Mann & Thompson 1987] est une des plus répandues parmi ces théories qui cherchent à rendre compte de la cohérence des textes par un ensemble défini a priori de relations. Elle se heurte cependant à deux difficultés. Bien que l’on puisse subdiviser les relations qu’elle propose entre celles qui se placent au niveau du contenu et celles, véritablement rhétoriques, qui se situent plus au niveau de la forme, en l’occurrence la façon dont le contenu est exposé, [Moore & Pollack 1992] font remarquer que la théorie ne permet pas de maintenir ce double plan de façon constante : chaque proposition n’est impliquée que dans une seule relation, qui est soit d’un type, soit de l’autre. Il serait ainsi difficile de maintenir un point de vue thématique sur l’ensemble du texte en y ayant recours.

Par ailleurs, la théorie ne définit pas les moyens de reconnaître les relations de cohérence à partir des textes. C’est sans doute ce qui explique que cet ensemble de relations ne soit pas très stable et ait fait l’objet de diverses extensions en fonction de besoins spécifiques.

C’est notamment dans le but de lever toute ambiguïté sur la nature de ce type de relations et sur la façon de les mettre en évidence que Asher, mais également Lascarides et Oberlander, ont défini la SDRT (Segmented Discourse Representation Theory) en prolongement de la DRT (Théorie des Représentations Discursives) de Kamp. Cette clarification a été réalisée au prix de l’introduction d’une base de connaissances sur le monde. La théorie décrit alors comment l’interprétation d’un énoncé se construit à partir de l’interaction de ces connaissances avec des connaissances proprement linguistiques.

Néanmoins, la SDRT constitue un cadre tout à fait spécifique dont le niveau d’élaboration va au-delà de ce que nous recherchons pour représenter le contenu thématique des textes. Compte tenu de notre contexte de travail, nous préférons en effet une analyse relativement grossière, mais robuste, à une analyse et une représentation des textes plus sophistiquées mais à l’application également plus limitée du fait de ses prérequis. En particulier, la dépendance de la SDRT vis-à-vis d’une base de connaissances sur le monde établie a priori rend son intégration difficile dans notre problématique. Enfin, et ce n’est pas le moindre des obstacles, la dimension thématique n’y est pas présente de façon explicite.

Pour achever cette comparaison rapide avec les types de représentations de texte existants, il faut également mentionner les propositions en provenance de la psychologie cognitive, notamment lorsqu’elles donnent lieu à des modèles informatisables. Les travaux de Schank que nous avons mentionnés précédemment s’inscrivent déjà dans ce cadre. Le modèle de Kintsch et van Dijk [Dijk & Kinstch 1983, Kintsch & Dijk 1978] est également l’une des grandes références dans ce domaine. Il propose de construire une représentation des textes à plusieurs niveaux. Le premier d’entre eux, appelé microstructure, est assimilable à notre niveau de base puisqu’il résulte d’une analyse propositionnelle des textes. Allant dans le sens de cette proximité, Guha expose dans [Guha 1995] une étude de la pratique de l’analyse propositionnelle en psychologie cognitive, soulignant le flou qui l’entoure souvent, et propose un certain nombre de critères afin de la rendre plus facilement reproductible et tendre ainsi vers une analyse automatique telle que celle produite par un analyseur syntaxique, en l’occurrence de type LFG.

Le deuxième niveau est celui de la macrostructure. Il est formé d’un ensemble de macro-propositions représentant chacune la condensation d’un ensemble de micro-propositions. Plusieurs niveaux de macro-propositions traduisant différents niveaux de généralité existent pour un même texte. Ces

1 Il faut rappeler que même si le modèle de Grosz et Sidner se veut un modèle général de structuration du discours, il est tout de même influencé par la problématique du dialogue.

130 Chapitre 5 - Les représentations de texte

macro-propositions forment un résumé du texte et en définissent la structure. Une macro-proposition s’assimile à ce titre assez directement à une UT, en particulier sur le caractère essentiellement thématique de leur nature. Certaines différences transparaissent néanmoins de cette comparaison. Une macro-proposition ne possède pas ainsi de structure interne puisqu’elle remplace les micro-propositions plus qu’elle ne les structure. En revanche, elle est dotée d’une appellation explicite alors que les UTs sont anonymes. Enfin, il n’existe pas de relations entre les macro-propositions comme il existe des relations de suivi thématique entre les UTs. Il faut préciser néanmoins que les relations de déviation thématique rendent compte d’une différence de niveau de généralité entre les UTs1 que l’on retrouve dans le modèle de Kintsch et van Dijk au travers des différents niveaux de macrostructure, sans d’ailleurs que les deux mécanismes soient équivalents.

Le passage de la microstructure à la macrostructure s’effectue grâce à l’application d’un petit nombre de macro-règles. De notre point de vue, ces règles présentent elles aussi l’inconvénient de s’appuyer assez largement sur une base préétablie de connaissances sur le monde.

Le dernier niveau du modèle est celui de la superstructure, sans équivalent véritable dans nos représentations de texte. Cette superstructure est destinée à caractériser l’organisation générale de la catégorie de textes auquel appartient le texte traité. Elle rejoint les travaux menés sur la structure du récit par Propp [Propp 1970] et les grammaires de textes de Rumelhart [Rumelhart 1977].

3.5 Implémentation

Comme dans le cas des schémas de la mémoire pragmatique, nous avons implémenté les représentations de texte en Smalltalk en nous fondant sur la plate-forme de graphes conceptuels présentée au §4.1. Une représentation de texte peut être créée soit en faisant appel à l’interface de programmation conçue à cet effet, soit par l’intermédiaire de sa forme linéaire textuelle, pour laquelle nous avons élaboré un compilateur et un générateur. On se reportera à l’annexe C pour la définition précise de cette forme linéaire dont la figure 5.5 donne un exemple assez complet.

L’interface de programmation est destinée à être utilisée par les processus, tels que l’analyse thématique de MLK, qui construisent des représentations de texte de façon automatique. La forme linéaire textuelle permet quant à elle de conserver le résultat de ces processus automatiques sous une forme humainement appréhendable tout en préservant les informations nécessaires à leur reconstruction à l’identique. Ce dernier point offre en particulier la possibilité de mener facilement des expériences sur la construction progressive de la mémoire épisodique. Le premier point permet quant à lui à un expérimentateur de définir des représentations de texte manuellement. Cette capacité est exploitée afin de tester la mémoire épisodique et d’amorcer le processus d’analyse thématique en l’absence de processus capable de construire des représentations de texte de bout en bout.

Les représentations de texte sont stockées dans une base de textes au sein de laquelle on cherche à maintenir le lien entre les représentations de différentes natures d’un même texte : texte initial, représentation syntaxique, sémantique et thématique. Ce lien entre les différentes dimensions d’un texte n’est pour le moment qu’embryonnaire mais se trouve concrétisé au travers d’un outil spécifique de visualisation et de gestion des bases de textes (cf. Annexe C).

1 Il s’agit d’une relation de généralité particulière. Elle est assimilable davantage à la relation partie_de qu’à la relation sorte_de. La relation entre micro-propositions et macro-propositions est à cet égard plus riche.

Chapitre 5 - Les représentations de texte 131

4. Contraintes pesant sur les représentations de texte

En préambule de ce chapitre, nous avons souligné le caractère central des représentations de texte dans MLK. Cette caractéristique tient tout autant à leur position au sein du système qu’à leur importance réelle dans son fonctionnement. C’est tout spécialement le cas en ce qui concerne la mémoire épisodique. Celle-ci est en effet tout entière le produit de l’agrégation de représentations de texte. Cette agrégation est elle-même dépendante de la mesure de similarité entre une représentation de texte et un agrégat de représentations de texte. Conformément à nos principes, cette mesure ne fait pas l’hypothèse de l’existence de connaissances a priori sur le domaine considéré. Elle est donc assez fortement tributaire de la forme même des représentations de texte. Par contrecoup, celle-ci a de ce fait une influence notable sur la forme de la mémoire épisodique. C’est pourquoi nous discutons de façon plus approfondie, dans les paragraphes qui suivent, d’un certain nombre de points touchant à la forme des représentations de texte.

Dans le document ANTHAPSI : un système d'analyse thématique et d'apprentissage de connaissances pragmatiques fondé sur l'amorçage (Page 135-138)