• Aucun résultat trouvé

4.2 Redondance du connecteur

4.2.2 Cohérence du discours

Dans certains cas par contre, le connecteur est nécessaire : sa suppression peut rendre le discours incohérent. Cet effet a été noté par ASHERet LASCARIDES(2003) dans le cas des contrastes de type

violation d’attente. Ainsi dans l’exemple donné par ces auteurs et repris en (43a) (nous traduisons)

2. Rappelons que les connecteurs ne sont pas annotés dans ce corpus. Nous avons donc projeté LexConn sur les données puis vérifié manuellement chaque exemple. Ainsi, le chiffre que nous donnerons plus loin sur le nombre de relations explicites de cette relation n’est pas 28, la correction manuelle ayant révélé qu’il y avait moins d’explicites.

3. Les trois premiers exemples correspondent à une relation Evidence dans le cadre de la RST, car le premier argument contient une déclaration plutôt que la description d’une situation. Nous n’avons pas pu conclure de manière définitive que le connecteur était plus facile à supprimer dans le cas de cette relation spécifique.

la suppression du connecteur mais conduit à un discours bizarre jugé incohérent. Par contre, dans les contrastes formels, où il n’y a pas de relation logique entre les conditions de vérité des arguments mais plutôt un contraste dû à une différence de contenu, le marqueur n’est pas nécessaire : dans l’exemple (43b) que nous traduisons également, la suppression du connecteur aboutit à une perte d’information, au sens où la mise en contraste des deux informations est perdue, mais le discours reste acceptable.

(43) a. John aime le sport. (Mais) il déteste le football. b. John a les yeux verts. (Mais) Mary a les yeux bleus.

SPORLEDERet LASCARIDES(2008) trouvent environ 30% d’exemples de Contrast rendus incohérents

par la suppression du connecteur. Les auteurs notent cependant que cet effet peut disparaître si le connecteur de contraste, ici but, est renforcé par un marqueur pouvant signaler Contrast comme then again dans l’exemple (44a). Bien sûr, si deux connecteurs sont utilisés, par exemple mais pourtant dans un exemple comme (43a), la suppression de l’un des deux laisse l’exemple cohérent. Nous verrons que l’heuristique que nous avons définie pour construire les données artificielles prend en compte ce cas : lorsque deux connecteurs sont identifiés, nous ne conservons pas l’exemple si ces deux connecteurs ont les mêmes arguments (ce qui serait le cas ici). Cette règle nous permet de nous assurer en partie que les exemples implicites artificiels ne contiennent vraiment pas de connecteur. Les cas non pris en compte sont ceux où le connecteur est suivi par une forme pouvant éventuellement marquer la relation mais qui n’appartient pas au lexique de connecteur utilisé, soit parce qu’il a été oublié, soit parce qu’il ne correspond pas aux critères définissant un connecteur. (44) a. Manually adding best-fit curves to data plots can be laborious and prone to error. ((But)

then again), Don Bradbury reviews TableCurve and still finds it has all the right lines. Notons que cet effet, c’est-à-dire le fait que la suppression du connecteur conduit à un discours incohérent, est présent dans l’exemple que nous avons donné au début de cette section, provenant de nos données artificielles françaises, et repris en (45a) : on a bien affaire ici à un contraste de type violation d’attente. C’est également le cas dans l’exemple (45b) issu du corpus ANNODISdans lequel ces deux types de contraste ne sont pas séparés. Nous avons donc dans nos données naturelles et artificielles des exemples pour lesquels le connecteur n’est pas supprimable, au sens de la cohérence du discours. Cependant, l’exemple naturel n’est pas inclus dans notre corpus d’évaluation puisque c’est un exemple explicite. La question est donc de savoir si le type d’information présent dans des exemples comme (43a), (45a) et (45b) est présent également dans des exemples implicites naturels, est-ce que, par exemple, on peut trouver la paire « drôle, drame » ou la paire « aime, déteste » dans un exemple de type contraste formel. Nous pensons que c’est possible au sens où le discours en (45c) semble acceptable dans un contexte spécifique similaire à celui qui rend acceptable l’exemple explicite (43b). Notons que, même si ce n’est pas le cas, ce genre de paires opposées a peu de chance d’indiquer une relation autre que Contrast donc il nous semble que l’inclusion de ces exemples ne devrait pas dégrader les performances du système. Il est cependant possible que le système établisse une corrélation entre un discours incohérent et la relation Contrast, alors que, bien sûr, il n’y a pas d’incohérence dans les exemples naturels.

(45) a. Elle était très comique, très drôle. (Cela dit), le drame n’était jamais loin. b. La hulotte est un rapace nocturne mais elle peut vivre le jour.

Nous ajoutons dans cette catégorie les cas d’agrammaticalité provoqués par la suppression du connecteur. S’ils n’ont bien sûr pas de lien avec la question de la cohérence, ils correspondent également à des discours qui seraient rejetés comme bizarres ou mal formés par des locuteurs. Ces cas peuvent correspondre à des problèmes liés au mode des verbes comme dans l’exemple (46a) de type contrastif. Ils peuvent aussi s’appliquer dans le cas de l’usage cataphorique d’un pronom comme dans l’exemple construit (46b) que l’on peut opposer à l’exemple (46c) où le connecteur parce que est au contraire parfaitement supprimable.

(46) a. [*(Bien que) celle-ci soit géographiquement située en Afrique,] [l’Art de l’Égypte antique, est l’une des principales sources de l’art en Europe.]

b. [*(Parce qu’) il de nature susceptible,] [Paul s’énerve facilement.] c. [(Parce que) Paul de nature susceptible,] [il s’énerve facilement.]

Nous avons également trouvé un exemple de cette catégorie mettant en jeu un autre problème dans nos données naturelles, nous le reproduisons en (47). Ici le connecteur utilisé, faute de indiquant un lien causal, n’est clairement pas supprimable sans effet sur la grammaticalité. Ce sera par ailleurs le cas pour tout connecteur de catégorie prépositionnelle. De plus, sa suppression entraîne la perte d’une information de type négation qui était contenue dans le connecteur. Ce sera également le cas pour les quelques connecteurs de polarité négative comme de peur que, de peur de ou sans. Même en transformant l’exemple pour le rendre grammatical, on ne pourrait pas récupérer cette information à moins de l’ajouter. Le fait d’avoir des exemples agrammaticaux dans nos données artificielles ne pose de problème qu’en regard de la modélisation des données adoptées. Il est clair que les informations syntaxiques vont ici conduire à une représentation très étrange de l’exemple. Il nous semble de toute façon que du fait même de la suppression du connecteur, nous ne pouvons nous appuyer sur une modélisation de type règles de production telle qu’utilisée dans les études précédentes. La perte de la négation pose plus de problèmes puisqu’ici, en restant sur une représentation de type paires de mots, on aurait un lien causal entre le fait de percevoir et celui de méconnaître alors que le lien s’établit entre le fait de ne pas percevoir et le fait de méconnaître. En tout, nous avons construit 730 exemples artificiels à partir de ce connecteur sur les 59 909 exemples de la relation Explanation4, l’effet devrait donc être négligeable.

(47) [*(Faute de) percevoir les liens possibles entre la démarche linguistique et la science du mouvement et de l’équilibre des corps,] [les contemporains de Guillaume ont en effet méconnu sa quête du mouvement sous-jacent à la construction des représentations par et dans la langue.]