• Aucun résultat trouvé

Le texte : Évaluation et Annotation des expressions d’opinion

CHAPITRE 2. SENTIMENTS, ÉMOTIONS, ET OPINIONS : DESCRIPTIONS LINGUISTIQUES

2.2. LES OPINIONS

2.2.3. Le texte : Évaluation et Annotation des expressions d’opinion

De nombreux éléments doivent être pris en compte pour faire une évaluation globale des opinions exprimées dans un texte, comme sa structure rhétorique ou le mode des verbes. Nous avons pu le vérifier en analysant des textes électroniques de genres différents, en français et en anglais.

2.2.3.1. Évaluation des opinions dans un texte

Une fois les structures de traits établies (cf. §3.3.1.), nous recherchons les relations de discours qui indiquent comment sont combinés les différents segments.

Dans certains cas, la relation Contraste modifie la force de l’opinion alors que Continuation renforce sa polarité.

Par exemple, dans la phrase T4 déjà vue : [[C’est bouleversant]d, [triste]e]g et [beau]f

a une polarité neutre, alors que le segment e appartient à la catégorie Tristesse de

Sentiment qui a une polarité négative. Un ensemble de règles dédiées est utilisé pour

combiner les structures de traits de plusieurs segments et permettent d’établir que la polarité du segment g est négative. Ces règles sont en cours d’élaboration et ne sont pas aisées à établir. En effet, est-il possible de déterminer si c’est la tristesse ou l’émotion qui prédomine quand on écrit « bouleversant, triste » ? De nombreux éléments entrent en compte, comme l’ordre des mots qui influe peut-être.

La relation Résultat indique la polarité ou l’opinion dans le second argument. Pour la relation Contraste, nous avons distingué deux cas : si les deux arguments sont des segments d’opinion, alors le Contraste affaiblit la polarité du premier argument : J’ai aimé

ce film mais il était un peu long ; si l’un des arguments est en relation rhétorique avec

l’autre argument, alors le Contraste renforce la polarité de l’opinion, comme dans [[Je

suis athée], mais [je soutiens ce curé totalement]]15.

Nous avons également pris en compte les impératifs, les conditionnels et les négations pour l’évaluation des opinions dans un texte. Les négations sont traitées en inversant la polarité de l’expression de l’opinion dans son périmètre (champ, portée). Les conditionnels sont complexes à interpréter. Dans certains cas, pour les opinions relevant du Conseil par exemple, ils peuvent inverser l’opinion. Ainsi la phrase Si vous voulez gaspiller votre

argent, achetez ce film ne sera pas interprétée comme recommandant l’achat de ce film,

mais au contraire comme recommandant de ne pas l’acheter. Mais les conditionnels peuvent également renforcer la recommandation comme dans Si vous voulez passer un bon

moment, Allez voir ce film.

Une représentation discursive du texte est faite à l’aide de graphes, que nous décrivons au §3.3.2.

2.2.3.2. Annotation des expressions d’opinion dans des textes

De façon à vérifier le bien-fondé de notre approche, nous avons étudié la distribution des expressions d’opinion dans des textes de genres différents, en anglais et en français, puis nous avons déterminé la structure rhétorique des segments composant ces textes. Nous avons annoté 3 types de corpus en ligne, chacun de style et d’audience différents : critique de films par des internautes, courrier des lecteurs et articles de presse. Nous avons sélectionné au hasard 40 articles de chaque catégorie et annoté près de 500 segments pour le français ; pour l’anglais 15 articles ont été étudiés et 170 segments annotés. Cette annotation a été faite manuellement, notre objectif est de la rendre automatique.

Pour chaque corpus, un segment a été annoté seulement s’il contient explicitement une expression d’opinion, c’est-à-dire un mot qui appartient à notre lexique, ou si ce segment contient une relation rhétorique qui le relie à un segment qui contient une expression

15 La Dépêche du Midi, 25 avril 2007

d’opinion. Quand un segment est identifié, l’annotateur définit sa représentation sémantique telle que nous l’avons décrite, puis relie les segments de discours en utilisant l’ensemble des relations rhétoriques que nous avons identifiées.

L’annotation de critiques de film a été très aisée. Le style d’écriture est simple et bref, généralement un paragraphe, et les expressions d’opinion sont principalement des noms et des adjectifs. L’exemple qui suit en est assez représentatif : « J'ai adoré ce film. Denzel

Washington en flic calme et zen est parfait, Owen en gangster des temps moderne, froid et impénétrable est formidable, quant à Jodie Foster, en mercenaire très classe, elle est fascinante. Ce film est très bien réalisé, il a de l'action et le rythme est dans l'ensemble soutenu (une ou deux longueurs cependant). Spike Lee joue parfaitement bien sur la psychologie de ses personnages, mystère et une touche d'humour sont au rendez vous! A voir absolument!!! »16. Nous avons trouvé en moyenne 5 segments par critique. Les

chroniqueurs résument leur opinion générale, puis donnent leur opinion sur chaque point particulier comme la mise en scène, le jeu des acteurs, etc. et concluent leur critique avec des expressions de recommandations (« allez voir ce film ») et quelquefois des expressions de suggestion (« ce film devrait gagner un oscar »). Les opinions exprimées sont essentiellement des sentiments et des appréciations, aussi bien en français qu’en anglais.

Le Courrier des lecteurs contient souvent un titre qui introduit la lettre puis un mélange de faits et d’opinion, sur plusieurs paragraphes, comme dans cet exemple : « NADAL, le

rouleau compresseur. Pour ma part, je pense que Rafaël Nadal est aujourd'hui invincible sur terre battue. Pour commencer, ce jeune espagnol a été impressionnant tout au long de l'année dernière sur terre battue, de par sa qualité physique et un mental d'acier.[...] Seule la pression pourrait mettre un terme à cette série ou un Federer des grands jours »17. Les

mots sont aussi bien des noms, des adjectifs que des verbes. Comme pour les critiques de films, les opinions sont principalement des appréciations et des sentiments. Par contre, les lettres en anglais contiennent plus d’expressions de jugement en fonction de normes sociales et moins d’expressions de sentiment qu’en français. La distribution des jugements, appréciation, espoirs et reportage est la même en français et en anglais.

Enfin, les opinions dans la presse contiennent essentiellement des discours rapportés. Les articles sont longs et composés de plusieurs paragraphes. Comme nous n’avons annoté que les segments contenant ou en relation, via les relations rhétoriques, avec des expressions d’opinion, notre annotation couvre une faible partie du document. Les articles de presse sont les plus difficiles à annoter car l’écriture est plus libre, et ils contiennent beaucoup de structures introduites par des verbes de Reportage, ainsi que de nombreuses négations. Il y a une grande similitude de distribution des catégories en français et en anglais : beaucoup d’expressions de jugement et peu de sentiments.

16 Allociné.fr, 4 mai 2006

La comparaison des différentes annotations faites pour un même corpus a montré qu’il y avait un large consensus pour la détermination des segments et la répartition des expressions d’opinion dans les catégories. Les principales sources de divergence entre annotateurs ont été dans le choix de certaines relations rhétoriques et dans la distinction entre les jugements relatifs aux normes sociales (classe Blâmer/Louer) et les jugements relatifs aux normes personnelles (classe Appréciation). Ces désaccords montrent la complexité de l’étude des opinions et la nécessité de prendre en compte d’autres phénomènes. Nous en étudions certains comme par exemple l’emploi de verbes modaux, du conditionnel ou du subjonctif ainsi que la présence d’adverbes qui peuvent modifier l’intensité ou la force de l’opinion émise comme dans « J'ai vraiment adoré ce film », « Je

vous le recommande vivement ». ou « Un film absolument génial ».

Nous poursuivons notre travail de recherche afin de produire une annotation automatique des expressions d’opinion, et fournir une évaluation de l’opinion globale d’un texte. Ces annotations permettront ainsi de se déplacer dans un texte, ou dans des textes, selon des critères choisis par exemple l’opinion elle-même, la personne qui l’émet, ou encore son sujet.

Cependant de nombreuses difficultés sont encore à résoudre. D’une part, la prise en compte d’autres éléments que les mots comme constituants signifiants dans un texte. De nombreux auteurs comme Edgar Poe, Gustave Flaubert ou André Breton ont utilisé les italiques ou les guillemets pour donner un sens particulier à un mot18. Dans le cas de l’expression des opinions, une modification de leur intensité et de la conviction de celui qui l’émet sont données par l’utilisation de la ponctuation, de la casse des caractères, ou la graphie d’une prosodie. On le voit dans les critiques de films avec l’emploi de majuscules ou de points d’exclamation qui renforce la recommandation dans « Je vous le recommande

VIVEMENT »19, « Excellent film [...] Surtout ne le ratez pas !!! »20, et dans la répétition de mots ou le découpage en syllabes avec des majuscules pour refléter une intonation dans « J'ai A-DO-RE ! Tout tout tout! Le scénario, la mise en scène, le montage, les acteurs, le

suspens! Excellent! »21.

D’autre part, les opinions ne sont pas toujours exprimées de façon littérale, le recours à l’humour et à l’ironie par exemple, est fréquent. Ainsi, interprétée dans son contexte, la phrase : « Ce projet est une vraie réussite » signifie que ce projet est, en fait, un vrai fiasco, et « On peut remercier le Conseil régional d’avoir voté ce texte » exprime une opinion très négative sur ce vote qui s’avère une grosse erreur.

18Le lecteur intéressé pourra se reporter à l’étude de Julien Gracq sur l’emploi des italiques dans l’œuvre d’André Breton [GRA 72]

19Allociné.fr, 4 mai 2006 20Allociné.fr, 29 mai 2006 21Allociné.fr, 1er novembre 2006

2.3. BILAN COMPARATIF DE NOS DESCRIPTIONS AVEC CELLES DU