• Aucun résultat trouvé

Pourquoi doit-on restreindre ?

Dans le document Vers une algèbre des relations de discours (Page 131-133)

5.1 Portée de l’étude

5.1.1 Pourquoi doit-on restreindre ?

L’ampleur du travail à effectuer pour construire une algèbre des relations de discours dépend directement de l’ensemble de relations de discours adopté. Or, comme nous en avons discuté à la section 2.2.2, l’ensemble des relations de discours n’est pas défini de façon homogène dans les travaux sur le discours. C’est pourquoi nous avons choisi de travailler sur des relations identifiées dans une majorité des travaux actuels sur le discours, sans pour autant adopter un ensemble de discours « figé ». Cet ensemble, que nous avons présenté à la section 2.2.3, compte un peu moins d’une vingtaine de relations. Supposons donc, à titre d’exemple, que l’ensemble des relations de discours adopté pour la construction d’une algèbre est fixé, et qu’il contient 20 relations de discours. En traitant uniquement des règles de la forme présentée à la Figure 5.1, l’algèbre contient 400 (soit 202) prémisses de règles. Si l’on veut

évaluer successivement la validité de toutes les combinaisons possibles aboutissant à des règles de la forme (Rx(α, β) ∧ Ry(β, γ)) → Rz(α, γ), on atteint un nombre de 8000 (soit 203)

règles à examiner. Si l’on tient compte des deux autres formes de règles impliquant trois unités discursives, on aboutit à 1200 prémisses dans l’algèbre, et 24000 règles possibles1

. L’ensemble des prémisses de règles contenues dans une algèbre des relations de discours complète est donc relativement conséquent.

Pour dégager des déductions à partir des prémisses, une première idée est d’exploiter les in- formations contenues dans les corpus annotés en discours. Suivant cette première idée, nous avons mené une exploration du corpus ANNODIS, présenté à la section 3.2.2.3 (page 99), qui utilise un ensemble de relations de discours proche de celui utilisé dans notre travail. À partir des occurrences de triplets d’unités discursives entre lesquelles trois relations étaient annotées dans le corpus, nous avons calculé des probabilités de déduction des différentes relations de discours pour chaque prémisse de règle (la méthode utilisée est décrite à l’An- nexe A). Mais l’utilisation d’une telle méthode pour la construction de règles de déduction de relations de discours présente certaines lacunes.

Premièrement, on peut critiquer cette méthode en soulignant que l’objectif de construction des règles de déduction étant de mettre en évidence des relations implicitement contenues dans des annotations de structures discursives, l’une des hypothèses sur lesquelles repose ce travail est justement que les relations pouvant être déduites à partir d’autres relations ont moins de chances d’être elle-mêmes explicitées par l’annotateur. Deuxièmement, cette méthode ne permet pas de distinguer, parmi les relations annotées pour un discours donné, celles qui peuvent être déduites à partir d’autres relations de celles qui pourraient appartenir au graphe discursif minimal de l’annotation — si toutefois une telle notion, qui est inspirée de la notion de graphe temporel minimal (voir section 4.1.3.2), se révèle adaptable au cas des structures discursives. En effet, pour trois relations Rx(α, β), Ry(β, γ) et Rz(α, γ) anno-

tées, comment déterminer, sans une étude linguistique, si Rz(α, γ) est une relation qui peut

être déduite à partir de Rx(α, β) et Ry(β, γ), ou bien si c’est une relation « essentielle » ?

Troisièmement, considérons un triplet (α, β, γ), pour lequel les relations suivantes sont an- notées : Rx1(α, β), Rx2(α, β), Ry(β, γ) et Rz(α, γ) — avec Rx1 6= Rx2. En admettant que

Rz(α, γ) soit une relation déductible à partir d’autres relations, comment savoir, sans étude

linguistique, si l’on peut dégager de l’occurrence de ce triplet la règle présentée en (180) ou la règle présentée en (181) ?

(180) (Rx1(α, β) ∧ Ry(β, γ)) → Rz(α, γ)

(181) (Rx2(α, β) ∧ Ry(β, γ)) → Rz(α, γ)

Par exemple, pour le discours en (182), on peut avoir une annotation contenant les relations suivantes : la relation Result(α, β) signalée par du coup, la relation Narration(α, β) (le coup de volant de Pierre succède immédiatement à l’apparition de la marmotte sur la route), la relation Explanation(β, γ) marquée par car, et la Result(α, γ) (Pierre a pris peur à cause de l’apparition de la marmotte). En suivant la méthode détaillée à l’Annexe ??, la présence d’un telle annotation dans le corpus viendra augmenter la probabilité des deux règles représentées à la Figure 5.2. Or, il est possible qu’une seule de ces deux règles ne soit pertinente2

. Seule

1. Nous rappelons que ces deux formes de règles sont (Rx(α, β) ∧ Rz(α, γ)) → Ry(β, γ) et (Ry(β, γ) ∧

Rz(α, γ)) → Rx(α, β).

2. Une première intuition concernant ces deux règles est que la déduction d’une relation de classe cau- sale est plus probablement faite à partir de deux relations de classe causale qu’à partir d’une prémisse

une analyse des contraintes sémantiques des prémisses de règles et de leurs réalisations linguistiques peut permettre de valider l’une ou l’autre de ces règles.

(182) a. Une marmotte a déboulé sur la route. (α)

b. Du coup, Pierre a donné un grand coup de volant, (β) c. car il a pris peur. (γ)

α β γ Result Explanation Result α β γ Narration Explanation Result

Figure 5.2 – Règles potentielles dégagées par l’annotation de (182)

Quatrièmement, même si l’on omet les remarques précédentes, cette méthodologie ne permet pas, dans les cas où il n’y a pas déduction d’une relation de discours, de dégager les liens sémantiques pouvant être établis entre les éventualités des unités non reliées. Or, comme nous l’avons vu au chapitre 4, identifier ces liens sémantiques peut permettre de définir des règles dont la déduction n’est pas une relation de discours, mais des liens sémantiques. Nous voyons donc que la construction des règles, si elle peut être aidée par l’exploration automatique des corpus annotés, nécessite néanmoins une étude, pour chaque prémisse, des contraintes sémantiques établies, et l’analyse de données linguistiques. Pour une pré- misse donnée, les réalisations possibles des relations de discours sont multiples, et plusieurs inférences sont généralement envisageables. De par la multiplicité des informations — tem- porelles, causales, etc. — intervenant dans l’interprétation d’un discours, les propriétés des relations de discours et des structures discursives, la tâche impliquée par la construction des règles d’inférence de relations de discours diffère considérablement de la tâche consistant à construire des règles d’inférence de relations temporelles comme celles de l’algèbre tem- porelle de Allen (voir chapitre précédent). L’objectif principal de l’étude des prémisses de règles est donc de restreindre les déductions possibles (en termes de relations de discours ou de liens sémantiques), et d’identifier certains facteurs influençant la déduction.

Dans le document Vers une algèbre des relations de discours (Page 131-133)