• Aucun résultat trouvé

Analyse automatique du discours

Dans le document Vers une algèbre des relations de discours (Page 102-107)

3.2 L’identification des relations de discours

3.2.3 Analyse automatique du discours

L’analyse automatique du discours (discourse parsing) est une tâche de TAL qui vise à attribuer automatiquement à un texte une structure discursive. Comme nous l’avons déjà mentionné, cette tâche trouve des applications dans le résumé et la génération automatique de textes. Mais elle trouve également des applications dans de nombreuses tâches reliées à la compréhension automatique de textes (Stede, 2011; Muller et al., 2012) : les systèmes de questions-réponses (Verberne et al., 2007), l’extraction d’information et l’extraction de connaissances (Gerber et al., 2010), l’évaluation de la cohérence d’un texte (Lin et al., 2011), la détection et l’analyse d’opinions (Somasundaran et al., 2009), ainsi que dans des tâches récemment définies, comme l’analyse de dialogues écrits provenant de blogs et de forum de discussions (Biran & Rambow, 2011).

L’analyse automatique du discours peut être subdivisée en trois sous-tâches : la segmenta- tion du texte en unités discursives ; l’attachement des unités discursives les unes aux autres ; l’identification des relations entre deux unités. Pour illustrer ces trois sous-tâches, considé- rons le discours en (160). La segmentation de ce discours en unités est présentée en (161) — les différentes unités sont entre parenthèses, et sont étiquetées (α), (β) et (γ). L’attachement des unités consiste à identifier les unités qui doivent être reliées. Dans notre exemple, deux liens doivent être repérés : un premier lien entre les unités (α) et (β), et un second entre les unités (α) et (γ) — voir (162). En revanche, les unités (β) et (γ) ne sont par directement reliées.

(160) Max est allé faire des courses, parce que son frigo était vide. Ensuite, il est allé au cinéma.

(161) Segmentation en unités :

(Max est allé faire des courses,)α

(parce que son frigo était vide.)β

(Ensuite, il est allé au cinéma.)γ

(162) Attachement des unités :

(Max est allé faire des courses,)α

(parce que son frigo était vide.)β

(Ensuite, il est allé au cinéma.)γ

(163) Identification des relations :

(Max est allé faire des courses,)α

(parce que son frigo était vide.)β

(Ensuite, il est allé au cinéma.)γ

Explanation Narration

La tâche de segmentation est généralement considérée comme la plus facile, alors que la l’attachement des unités d’un discours est la plus difficile à mettre en oeuvre, puisqu’elle consiste à déterminer la structure globale du discours, à identifier sa structure thématique. L’identification des relations établies entre les unités d’un discours, elle, constitue la tâche centrale d’une majorité de travaux en analyse automatique du discours. Nous discutons ici essentiellement de cette dernière étape.

Les travaux visant l’identification automatique de relations de discours ne présentent pas tous les mêmes objectifs. Ils peuvent se distinguer par la couverture qu’ils visent en termes représentation discursive : certains travaux se limitent à l’identification de relations intra- phrastiques (Soricut & Marcu, 2003; Wellner et al., 2006; Sagae, 2009), et d’autres visent à produire une représentation complète de la structure discursive d’un texte (Marcu, 2000a; Hernault et al., 2010; Subba & Di Eugenio, 2009). Il existe également des différences en ce qui concerne les catégories de relations identifiées. Certains travaux se limitent à l’identifica- tion des relations signalées par un connecteur de discours, aussi appelées relations explicites. C’est notamment le cas de Pitler et al. (2008), qui ont mené des expériences sur l’identifi- cation des relations explicites, qu’elles qualifient de « facilement identifiables » — la tâche d’identification de relations signalées par un connecteur obtient en effet de bien meilleurs résultats que l’identification de relations non signalées — d’autres sur l’identification des relations implicites (Pitler et al., 2009; Lin et al., 2009; Louis et al., 2010). L’identifica- tion des relations explicites peut-être considérée comme une sous-tâche à part entière dans l’identification automatique de structures discursives. Par exemple, (Pitler & Nenkova, 2009; Versley, 2010) se focalisent uniquement sur la désambiguisation des connecteurs.

Dans les systèmes statistiques développés pour l’analyse discursive, l’identification des rela- tions est souvent ramenée à une tâche de classification : chaque objet (une paires d’unités), appartient à une classe (la relation). Un des problèmes auxquels les chercheurs développant des systèmes statistiques pour l’identification automatique des relations sont confrontés est le manque de données. Sur ce point, les expériences de Marcu & Echihabi (2002) montrent qu’en utilisant de grandes quantités de données annotées artificiellement par la présence de connecteurs non ambigus — lexicalisant une seule relation de discours —, de bons ré- sultats peuvent être obtenus dans la classification. En revanche, dans les expériences de Sporleder & Lascarides (2008), qui ont voulu évaluer la possibilité d’utilisation de données artificiellement annotées pour entraîner des modèles d’apprentissage, les résultats obtenus en entraînant les modèles sur les données artificielles sont significativement moins bons que ceux obtenus avec des données manuellement annotées.

En ce qui concerne les traits utilisés pour entraîner les modèles de classification, on re- trouve un certain nombre des indices que nous avons présentés à la section 3.1. On trouve par exemple des traits de cohésion : occurrences des mêmes formes dans les deux unités reliées, informations morphologiques sur les pronoms, informations morphologiques sur les verbes (mode, temps, etc.). Des traits sémantiques peuvent également être utilisés, comme la présence de négations, ou des informations tirées de bases lexicales, comme la classe des verbes présents dans les unités ou la présence de relations lexicales (Subba & Di Eugenio, 2009). Certains traits structurels, comme le fait que la relation soit inter-phrastique ou intra- phrastique et la taille des unités reliées, sont souvent employés. Sont également généralement considérés des traits morpho-syntaxiques — comme les étiquettes morpho-syntaxiques des mots présents dans les unités —, des traits syntaxiques — comme des structures syntaxiques partielles, le fait que les unités correspondent à une proposition principale ou une subor- donnée, etc. D’autres traits, comme les différentes paires de lemmes (produit cartésien), ou des n-grammes sur les lemmes peuvent être utilisés. Notons que Lin et al. (2009) utilisent des informations du contexte discursif, à savoir les relations de discours qui précèdent et qui suivent la relation à identifier (si celles-ci sont des relations explicites). Néanmoins, les traits proprement discursifs sont généralement absents des traits employés, et c’est notamment sur ce point que le travail présenté ici peut apporter une contribution.

Vers une algèbre des relations de discours

Sommaire

4.1 La comparaison de structures . . . 106 4.1.1 Comparaison de structures discursives . . . 106 4.1.2 Comparaison « syntaxique » de structures . . . 108 4.1.3 Comparaison « sémantique » de structures . . . 109 4.1.3.1 La notion de fermeture temporelle . . . 110 4.1.3.2 Les notions de graphe minimal et de graphe noyau . . . . 113 4.1.3.3 Les algèbres temporelles . . . 113 4.1.4 Bilan . . . 116 4.2 Une algèbre des relations de discours . . . 116 4.2.1 L’ensemble des relations . . . 117 4.2.2 La nature des inférences . . . 118 4.2.3 La forme des règles . . . 121 4.3 Bilan . . . 125

Nous nous sommes concentrée dans cette thèse sur la question de la définition de règles d’in- férence dont les prémisses contiennent des relations de discours. Ces règles sont destinées à permettre, en partant d’une structure discursive, de calculer sa fermeture discursive. Les règles visent à être intégrées à une algèbre des relations de discours, c’est-à-dire un ensemble de règles d’inférences. Les notions de fermeture discursive et d’algèbre des relations de dis- cours seront discutées dans ce chapitre. Elles s’inspirent des notions de fermeture temporelle et d’algèbre temporelle (Allen, 1983), utilisées dans les travaux concernant la structure tem- porelle. Si la réflexion autour de la définition des règles d’inférence est partie de la question de la comparaison de structures discursives, elle soulève des questions théoriques sur l’en- semble des relations de discours, ainsi que la définition des relations elles-mêmes. En ce qui concerne les questions méthodologiques soulevées, elles seront abordées au chapitre 5. Dans ce chapitre, nous partons de la question initiale de comparaisons de structures dis- cursives, posée dans cadre applicatif (section 4.1), puis discutons des différentes questions

théoriques soulevées par la définition de règles d’inférence de relations de discours (sec- tion 4.2).

4.1

La comparaison de structures

Dans cette section, nous discutons des observations qui nous ont amenée à réfléchir à la construction d’une algèbre des relations de discours, et présentons des travaux qui ont ins- piré la réflexion menée. À la section 4.1.1, nous présentons quelques problèmes posés par la comparaison de structures discursives. Nous montrons pourquoi deux structures discur- sives peuvent différer tout en étant compatibles ou équivalentes. Puis, aux sections 4.1.2 et 4.1.3, nous discutons de la comparaison de structures proches des structures discursives. Nous confrontons deux approches : l’approche adoptée dans la comparaison de structures syntaxiques et celle adoptée dans l’évaluation de structures temporelles. Les techniques et les métriques utilisées pour la comparaison (ou l’évaluation) de ces deux types de structures diffèrent par le fait qu’elles cherchent, pour les premières, à identifier des structures syn- taxiquement identiques, c’est-à-dire des structures contenant les mêmes informations expli- cites, et pour les secondes, à identifier des structures sémantiquement identiques, c’est-à-dire des structures ne contenant pas nécessairement les mêmes informations explicites, mais les mêmes informations implicites. Nous verrons pourquoi ces dernières peuvent inspirer des solutions à certains problèmes posés par la comparaison de structures discursives.

Dans le document Vers une algèbre des relations de discours (Page 102-107)