• Aucun résultat trouvé

La forme des règles

Dans le document Vers une algèbre des relations de discours (Page 122-130)

4.2 Une algèbre des relations de discours

4.2.3 La forme des règles

Dans cette section, nous présentons la forme que prennent les règles que nous cherchons à dé- finir. Tout d’abord, ces règles sont associées à une représentation par graphes non contraints des structures discursives, similaire aux représentations proposées par Wolf & Gibson (2005) et Danlos (2004). Cette représentation est donc indépendante de cadres théoriques comme ceux de la RST ou la SDRT. Nous avons fait ce choix dans le but de proposer des règles dont la formulation est indépendante d’un cadre théorique. En effet, comme nous l’avons dit à la section 2.1.2.3 (page 29), les contraintes définies dans les théories guident la re- présentation des structures discursives et par conséquent les analyses produites. De plus, certaines des structures discutées dans cette thèse ne sont ni représentables dans la RST, ni représentables dans la SDRT. Nous verrons néanmoins que certaines des règles peuvent être intégrées dans ces théories.

Trois formes de prémisses Nous nous sommes limitée à la définition de règles d’inférence impliquant trois unités élémentaires consécutives dans un discours. Jusqu’ici, nous n’avons mentionné qu’une seule forme de règle (chapitre 1, Figure 1.1). Néanmoins, si l’on considère des discours impliquant trois unités de discours dont deux ne sont pas reliées, deux autres schémas d’inférence sont à envisager. Les trois schémas d’inférence potentiels sont présentés à la Figure4.4. En (i), on retrouve le schéma déjà introduit. En (ii) et (iii), deux autres schémas sont présentés. Ces trois schémas correspondent respectivement aux formes de règles présentées en (172), (173) et (174). (i) α β γ Rx Ry Rz (ii) α β γ Rx Ry Rz (iii) α β γ Rx Ry Rz

Figure 4.4 – Schémas d’inférence de relations de discours pour des discours à trois unités élémentaires

(172) (Rx(α, β) ∧ Ry(β, γ)) → Rz(α, γ)

(173) (Rx(α, β) ∧ Rz(α, γ)) → Ry(β, γ)

Les trois schémas d’inférence sont respectivement illustrés par les discours en (175), (176) et (177). Dans ces discours, les relations signalées par un connecteur correspondent aux relations présentes dans les différents schémas d’inférence. En (175), deux relations sont signalées : Result(α, β) est signalée par du coup, et Explanation(β, γ) est signalée par parce que. En (176), le connecteur bien que signale la relation Concession(α, β) — le fait que l’eau soit froide aurait pu faire que Marie n’aille pas se baigner, mais elle est allée se baigner — et le connecteur du coup signale la relation Result(α, γ). En (177), ensuite signale la relation Narration(α, γ). Le connecteur comme signale une relation de classe causale entre (β) et (γ). En ce qui concerne le label de la relation, nous avons vu au chapitre 2 (section 2.2.1.4, page 42) que les relations signalées par des conjonctions de subordination avec subordonnée antéposée peuvent dans certaines théories poser des problèmes de représentation. Deux points de vue peuvent être envisagés : soit on note la relation Result(β, γ), soit on note la relation Explanation(γ, β)14

.

(175) a. Marie a mangé plein de chocolat. (α) b. Du coup elle n’a pas déjeuné,(β)

c. parce qu’ elle n’avait plus faim. (γ) (176) a. Marie est allée se baigner (α)

b. bien que l’eau soit très froide.(β) c. Du coup, Pierre l’a suivie. (γ) (177) a. Marie a fait un footing. (α)

b. Comme elle avait soif, (β)

c. elle est ensuite allée boire un café. (γ)

Soulignons que la définition de trois formes de règles est nécessaire, parce que les trois structures qui y sont associées ne peuvent être ramenées à une seule forme de règle. Nous avons vu qu’en ce qui concerne les relations temporelles, une règle comme before(x, y) ∧ after(x, z) → after(y, z) est équivalente à la règle after(x′

, y′ ) ∧ after(y′ , z′ ) → after(x′ , z′ ) — avec y = x′ , x = y′ et z = z′

. On peut donc ramener toutes les règles d’inférence temporelle à une seule forme, grâce au fait que pour toute relation temporelle r, on peut définir une relation inverse r−1

, telle que r(x, y) équivaut à r−1

(y, x). En ce qui concerne les relations de discours, ramener toutes les règles à une seule forme n’est pas possible. En effet, pour les relations de discours, il n’existe pas de définition de relations inverses. Si l’on peut déterminer, pour une relation R, une relation R−1

inverse en termes de conséquences sémantiques, il n’y a pas d’équivalence entre R(α, β) et R−1

(β, γ), comme nous l’avons dit à la section précédente.

Les structures des prémisses de règles peuvent poser des problèmes représentationnels dans la RST et dans la RST. La prémisse du schéma d’inférence (i) est représentable dans la SDRT. Elle peut également être représentée dans la RST, mais elle n’est pas représentable si une des deux relations est multinucléaire et que celle-ci est dominée par l’autre relation dans l’arbre RST (comme dans les arbres présentés à la Figure 4.5), du fait de l’application du principe de nucléarité — voir section 2.1.2.3, page 29.

14. La RST permet de représenter des relations subordonnantes à gauche (Danlos, 2008), c’est-à-dire des relations Nucleus-Satellite avec le Satellite à gauche. Pour le discours en (177) la relation est notée Cause(β, γ), (β) constituant le Satellite.

Rx Ry α β γ N ou S N ou S N N Rx Ry α β γ N ou S N ou S N N

Figure 4.5 – Problème représentationnel dans la RST pour la prémisse du schéma d’infé- rence (i)

Dans la RST, les prémisses des schémas d’inférences (ii) et (iii) sont également représen- tables, mais encore une fois la possibilité de représentation est dépendante des types de relations en jeu — multinucléaires ou Nucleus-Satellite — en raison de l’application du principe de nucléarité.

Au sein de la SDRT, la prémisse du schéma d’inférence (ii), c’est-à-dire Rx(α, β) ∧ Rz(α, γ),

n’est représentable que si la relation Rx est subordonnante, car dans le cas contraire, l’unité

(α) n’est pas disponible pour l’attachement de l’unité (γ), en raison de l’application de la contrainte de la frontière droite (RFC). Quant à la prémisse Ry(β, γ) ∧ Rz(α, γ), elle

recouvre une structure non traitée dans la SDRT, car du point de vue linguistique elle implique la présence de subordonnées antéposées non traitées par la SDRT, et du point de vue du processus de représentation incrémental adopté dans SDRT, après prise en compte de l’unité (β), celle-ci devrait nécessairement être attachée à une unité du contexte discur- sif.

Bien que les règles d’inférence des schémas (ii) et (iii) méritent également d’être étudiées, le travail présenté ici se limite à l’étude et la définition de règles entrant dans le schéma (i) : (Rx(α, β) ∧ Ry(β, γ)) → Rz(α, γ). En effet, la structure discursive correspondant à

la prémisse Rx(α, β) ∧ Ry(β, γ) est la plus commune, et comme nous venons de le voir,

c’est la prémisse qui pose le moins de problèmes représentationnels dans les théories du discours.

En se restreignant à la forme de règle (Rx(α, β) ∧ Ry(β, γ)) → Rz(α, γ), nous discutons

maintenant des possibilités de représentation des structures déduites par l’application des règles dans le cadre de la RST et de la SDRT. Si la relation déduite Rz est différente de

la relation Rx et différente de la relation Ry, la structure n’est pas représentable par les

arbres de la RST. Dans la SDRT, la structure est représentable si l’on fait abstraction des contraintes définies au sein de la théorie, comme la contrainte de la poursuite du schéma discursif (CDP) — voir section 2.1.2.3, page 29. En revanche, si l’on a Rz= Rxou Rz = Ry,

la représentation de la structure déduite est représentable à la fois dans la RST et dans la SDRT, avec certaines contraintes concernant le type des relations en jeu.

Dans le cas où Rz = Rx ou Rz = Ry, la structure déduite peut-être représentée en introdui-

sant une unité complexe. Dans le cas où Rz = Rx (la relation déduite entre (α) et (γ) est

la même que celle établie entre (α) et (β)), on peut considérer que cette relation lie l’unité (α) à l’unité complexe formée par (β) et (γ). Dans le cas où Rz = Ry (la relation déduite

entre (α) et (γ) est la même que celle établie entre (β) et (γ)), on peut considérer que cette relation lie une unité complexe formée par (α) et (β) à l’unité (γ).

Par exemple, dans la RST, on peut représenter la structure déduite par l’application d’une règle comme (Cause(α, β) ∧ List(β, γ)) → Cause(α, γ) par l’arbre à gauche dans Figure 4.6. Cette représentation est possible parce que la relation List est multinucléaire, et que par conséquent les unités (β) et (γ) sont toutes deux dans la portée de l’argument droit de la relation Cause. Observons que pour la règle considérée, la prémisse est représentable dans la RST par l’arbre à droite dans la Figure 4.6. On peut voir, dans ce cas, l’application de la règle d’inférence comme une révision de la portée de l’argument droit de la relation Cause. Dans les structures de la Figure 4.6, le Satellite de la relation Cause est à gauche. Si l’on considère le cas inverse, dans lequel le Satellite est à droite, et que l’on se pose la question de la possibilité de représentation de la règle (Cause(α, β) ∧ List(β, γ)) → Cause(α, γ), on conclut que seule la structure déduite est représentable par un arbre RST. La représentation de la prémisse est impossible à cause du principe de nucléarité.

Cause List α β γ S N N N Cause List α β γ N N S N

Figure 4.6 – Exemple de structure déduite et de prémisse associée représentables dans la RST

Dans la SDRT, on peut également représenter certaines structures déduites par l’application des règles, à condition d’introduire des unités complexes dans la représentation. Comme le soulignent Asher et al. (2011), la représentation par des unités complexes est parfois liée à la prise en compte de la contrainte de la frontière droite :

l’utilisation d’unités complexes est parfois nécessaire à exprimer un contenu qui ne peut être représenté dans les théories qui adoptent la contrainte de la frontière droite15

.

Dans d’autres cas, l’utilisation d’unités complexes n’est pas nécessitée par la RFC. Consi- dérons par exemple la structure déduite par l’application de la règle (Elaboration(α, β) ∧ Continuation(β, γ)) → Elaboration(α, γ) — qui reproduit d’ailleurs la règle formulée dans la SDRT par le principe du CDP. L’application de cette règle est généralement représentée dans la SDRT par la création d’une unité complexe couvrant (β) et (γ) et l’extension de la portée de l’argument droit de la relation Elaboration à cette unité complexe. Dans ce cas, la SDRT considère que la structure sans unité complexe Elaboration(α, β)∧Elaboration(α, γ)∧ Continuation(β, γ) et la structure avec unité complexe Elaboration(α, [β, γ]) ∧ Continuation sont équivalentes. Mais la représentation par des unités complexes dans la SDRT peut dans certains cas introduire des ambiguïtés (Asher et al., 2011). Considérons par exemple les

15. Voir (Busquets et al., 2001) : CDUs are needed sometimes to express a content that can’t be constructed in theories that have a "right frontier" constraint on attachment.

discours en (178) et (179). Dans la SDRT, la structure associée au discours en (178) est Explanation(α, [β, γ]) ∧ Continuation(β, γ). Cette structure a dans ce cas le même sens que la structure Explanation(α, β)∧Explanation(α, γ)∧Continuation(β, γ). En revanche, pour le discours en (179), la seule structure valide est Explanation(α, [β, γ]) ∧ Continuation(β, γ) : (β) et (γ) forment un bloc indissociable, notamment parce qu’on ne peut pas inférer : Paul est content parce qu’il a passé un examen tout à l’heure. Asher et al. (2011) tentent de formaliser la sémantique des unités complexes et définissent les notions de relations distributives à droite (right-distributivity) et de relations distributives à gauche (left- distributivity). En ce qui concerne les relations que nous venons de voir, Elaboration est dis- tributive à droite — les structures Elaboration(α, β)∧Elaboration(α, γ)∧Continuation(β, γ) et Elaboration(α, [β, γ]) ∧ Continuation sont équivalentes — mais Explanation ne l’est pas.

(178) a. Paul est content. (α) b. Il a réussi ses examens. (β)

c. De plus, il est en vacances pour deux mois. (γ) (179) a. Paul est soulagé. (α)

b. Il a passé un examen tout à l’heure (β)

c. et il a réussi à répondre à toutes les questions. (γ)

4.3

Bilan

Nous avons introduit dans ce chapitre les notions de fermeture discursive et d’algèbre des relations de discours. Ces notions sont inspirées des notions de fermeture temporelle et d’algèbre des relations temporelles. Pour nourrir la réflexion sur la définition de règles d’in- férences de relations de discours, nous avons effectué des comparaisons entre les propriétés des relations de discours et celles des relations temporelles, ainsi qu’entre les caractéris- tiques des structures discursives et celles des structures temporelles. Plusieurs constats nous amènent à préciser les modalités d’application et de définition de règles d’inférences dont les prémisses sont des relations de discours. Premièrement, le fait que plusieurs relations de discours puissent s’établir entre deux unités discursives nous amène à supposer que, dans certains cas, lors du calcul de la fermeture d’une structure discursive, plusieurs prémisses de règles pourront être présentes, ce qui soulève les questions suivantes : si plusieurs règles d’inférences peuvent s’appliquer sur les mêmes unités discursives, une des règles est-elle prioritaire sur l’autre ? si oui, pourquoi ? sinon, les deux règles s’appliquent-elles ? Deuxiè- mement, le fait que dans une structure discursive, toutes les unités ne sont pas directement liées par une relation de discours implique la définition d’une non-relation, appelée None. Mais s’il n’est pas possible de déduire la présence d’une relation de discours entre uni- tés, certains liens sémantiques entre les éventualités décrites peuvent être explicités. En ce qui concerne les notions de graphe minimal et de graphe noyau définis pour les structures temporelles, il est difficile de savoir si ces notions seront adaptables au cas des structures discursives. En effet, la notion de fermeture discursive restant à explorer, il est prématuré d’approfondir la notion de graphe discursif minimal. Les règles d’inférence que nous propo- sons de définir peuvent être utiles à différentes tâches de TAL. Tout d’abord, elles peuvent constituer une aide à l’annotation manuelle ou automatique des relations de discours. Dans le cadre de la prédiction automatique des relations, elles peuvent permettre de restreindre

l’ensemble des relations de discours pouvant s’établir entre deux unités, et également per- mettre de détecter des incohérences dans les structures construites. Ensuite, elles peuvent intervenir dans l’extraction d’informations, et dans ce cadre, elles peuvent être utiles même si les déductions auxquelles elles donnent lieu sont uniquement des liens sémantiques entre éventualités. Enfin, comme nous l’avons dit au début de ce chapitre, elle peuvent permettre d’améliorer la comparaison de structures discursives, notamment en aboutissant à l’iden- tification de structures équivalentes, dans le cadre de l’évaluation de systèmes d’analyse automatique ou la fusion d’annotations pour la construction de corpus.

Des règles de déduction de

relations de discours

Méthodologie

Sommaire

5.1 Portée de l’étude . . . 130

Dans le document Vers une algèbre des relations de discours (Page 122-130)