La représentation des affects dans les tweets, entre instantanéité et

PARTIE I. SÉMANTIQUE LEXICALE

CHAPITRE 2. SÉMIOTISATION, INTERSUBJECTIVITÉ ET PERFORMATIVITÉ DES AFFECTS

2.5. Émotions en discours : entrées lexicales et enjeux discursifs

2.5.3. La représentation des affects dans les tweets, entre instantanéité et

Dans le domaine du traitement automatique des langues, la problématique de la détection des opinions en ligne a impulsé de nombreux travaux s’intéressant aux émotions. Les premiers travaux de détection des émotions en ligne/dans les grands corpus ont constamment limité l’expression des émotions à l’opposition entre polarité négative et polarité positive82 (cf. Asher et al. 2009), en identifiant les émotions aux opinions. Une autre difficulté est liée à l’identification des observables en corpus : au sujet des émotions, peut-être davantage que dans d’autres domaines, les sondages lexico-statistiques ont vite montré leurs limites, notamment pour ce qui est des émotions complexes ou de l’ironie, du sarcasme (Davidov et al. 2010b). Mon article (doc 47) visait à évaluer l’applicabilité des classifications lexicales à une approche dynamique des émotions en discours.

J’ai mené cette étude dans le cadre du projet PEPS HuMains AIDEM/ILEM (Apprentissage incrémental des émotions, dir. N. Grozavu). L’objectif était de contribuer au développement de méthodes informatiques permettant de déceler, grâce à l’apprentissage incrémental, des régularités, des relations « de cause à effet », en quelque sorte, dans la dynamique de l’expression des émotions dans les interactions écrites83.

Les données ayant fait l’objet de cette recherche sont issues d’un corpus de tweets portant sur l’élection présidentielle en France en 2012 qui a été recueilli par l’équipe de Montpellier dans le cadre du projet PoloP (Political Opinion Mining)84. Le corpus global contient 1 million tweets datant du 11, 12 et 26 avril et du 2 mai 2012, en marge des débats télévisés des candidats à la présidentielle. Compte tenu de la taille limitée des tweets, j’exploite dans cette recherche les deux premières catégories dénotatives d’A. Polguère (2013) citées ci-dessus : la dénotation du sentiment et la dénotation de l’évolution du sentiment (cette dernière catégorie visant surtout à saisir la dynamique de l’expression émotionnelle). En plus des formes lexicales, j’ai prêté attention aux émoticônes, interjections, insultes, ainsi qu’aux marqueurs axiologiques directement liés aux expressions de l’affect.

2.5.3.1. SPÉCIFICITÉS DES TWEETS

Twitter est un nouveau service de micro-blogging, datant de 2006, qui fait partie des modes d’interaction écrite instantanée en ligne (short instant online written interaction en anglais, ou SIOWI).

D’un point de vue linguistique, les tweets se définissent par les traits suivants :

 ce sont des productions écrites brèves, à volume contraint, dont la production répond par ailleurs à des contraintes de vitesse et de connectivité. Ces caractéristiques des tweets, et plus spécifiquement leur brièveté, demandent un travail interprétatif externalisé ; en effet, les tweets manquent le plus souvent d’arrière-plan narratif qui, dans les textes écrits, offre un cadre interprétatif permettant de comprendre, selon

82 Voir aussi le traitement de la polarité dans le chapitre 3 de la présente synthèse.

83La question de l’incrémentalité faisait par ailleurs écho aux travaux que j’avais commencé à mener dès 2011 sur les dynamiques du processus de textualisation dans les rapports éducatifs (je renvoie à l’ouvrage inédit doc 1 qui accompagne cette synthèse).

84http://wwirmm.fr/~bouillot/polop/polop.html (Université de Montpellier, France, and University of Ottawa, Canada). Je remercie Mathieu Roche qui nous a fourni ces données dans le cadre du projet AIDEM.

K. Oatley (2004 : 99), comment l’émotion peut dépendre des objectifs et des projets du sujet, comment elle peut évoluer, comment par exemple la colère peut émerger de la peur et le manque de confiance de la déception.

 ce sont des productions non linéaires (Paveau 2013), disposant d’une richesse hypertextuelle et interdiscursive, compte tenu de l’inclusion de liens, images, mots-dièse, etc., ainsi que de la possibilité de retweets.

 ils possèdent un potentiel interactif sous une forme non seulement dialogique mais aussi dialogale, pouvant évoluer d’une forme monologale vers un réseau polylogal. Le travail de R. Page (2012) suggère que la circulation et l’interactivité des tweets dépend largement des hiérarchies sociales et économiques, Twitter ne faisant que renforcer les hiérarchies off-line grâce aux possibilités d’autopromotion et de micro-célébrité. Le corpus de tweets permet ainsi d’observer les stratégies d’expression des affects face à des contraintes complexes imposant éventuellement le choix de stratégies linguistiques spécifiques : i) un format très rigide (140 caractères) ; ii) le caractère instantané de l’interaction en ligne ; iii) la liberté d’expression/formulation renforcée par la médiation de l’écran (Suller 2004).

2.5.3.2. L’EXPRESSIONS DES ÉMOTIONS DANS LES TWEETS

Deux questions se sont posées pour commencer : comment les affects sont-ils sémiotisés dans les tweets ? Quels sont les affects le plus souvent représentés ? Une question subsidiaire a émergé, compte tenu du caractère interactif : étant donné la possibilité de répondre à un message ou de le retweeter, peut-on parler de partage social des émotions dans ces conditions ? Ces questionnements ont eu pour toile de fond les travaux mettant l’accent sur le rôle joué par l’expression des affects dans la configuration des discours et plus particulièrement dans la construction de l’opinion publique (cf. Brader et al. 2011).

Le hashtag, ou mot-dièse (#) constitue une des spécificités des tweets. Destiné à catégoriser le contenu d’un tweet afin de faciliter la recherche des informations et la fouille des textes (“searchable talk”, dans les termes de M. Zappavigna 2011), le mot-dièse synthétise bien l’intention communicationnelle de l’énonciateur qui le produit ; c’est la raison pour laquelle des recherches portant sur l’expression d’émotions comme le sarcasme ont fait appel à des corpus de hashtags (voir Davidov et al. 2010a). J’ai eu recours au même marqueur, en utilisant des outils textométriques (Le Trameur, Lexico 3) pour identifier les occurrences de formes présélectionnées ; ainsi, les catégories linguistiques dénotant des émotions ou le déroulement des émotions présentées ci-dessus ont été utilisées pour identifier 330 mots-dièse avec les messages associés. J’ai observé par la suite les régularités et les fréquences, les collocations et leurs contextes, la fréquence des émotions marquées par un #, l’emploi d’expressions émotionnelles dans les messages tweets eux-mêmes. Les tableaux ci-dessous synthétisent les résultats ainsi obtenus :

TABLEAU 2.15. DOMAINES ÉMOTIONNELS REPRÉSENTÉS PAR DES MOTS-DIÈSES ET

RESSOURCES LINGUISTIQUES MOBILISÉES. Domaines émotionnels Constructions linguistiques saillantes

1. ironie, moquerie, sarcasme Interjections : #ahahahahah85; répétition de caractères : #ausseeeeeccooouuuuurrrsssss

2. mépris, dégoût Lexique des affects : #ironie ; insultes : #couille molle ; désignation d’une manifestation psychophysique de l’émotion : #lanausée

3. honte, blame, humiliation Lexique des affects : #honte

4. peur Lexique des affects : #peuuuuuuuur et constructions

phrastiques : #lepenfaitpeur

5. joie, sympathie, empathie Lexique, acronymes, interjections : #bravo, #coolcool

TABLEAU 2.16. DÉNOTATION DES MOTS-DIÈSE

Dénotation Mot-dièse

Stimulus Principalement des adjectifs : #absurde, #pathétique, #pitoyable, #coolcool

Effets

physiologiques ou psychologiques

Divers : #àvomir, #lanausée, #écoeurement, #dépit ; #sarcolahonte), #lepenfaitpeur, #sarkotumenerves ; #onvousaime

Insultes et

évaluations ^{#lafranceconne,}#hollandouille ^{#lafrancemolle,} ^#sarkonnard, ^{#umpitoyable,} ^#trouduc,

On constate cependant rapidement que le mot-dièse peut ne pas être une synthèse fidèle du tweet, du moins au niveau de l’expression des affects. Ainsi, dans les deux tweets ci-dessous, marqués tous les deux par le mot-dièse #shameonyou (honte à vous), les émotions représentées dans le corps du message correspondraient plutôt à la colère et au mépris respectivement :

(34)

a) dans votre monde du luxe peut-être, mais pas chez les gens normaux qui ont travaillé 41 ans. un peu de retenu ! #shameonyou

b) c’est sûr que la droite s’est elle libérée. votre porosité avec le fn est juste abjecte. #shameonyou

En revanche, en regroupant les expressions émotionnelles utilisées dans les tweets par familles lexico-sémantiques (le label “TRISTE+” regroupe triste, tristement, attrister, etc.), j’ai pu constater que trois champs étaient lexicalement représentés dans le corpus : la peur, la tristesse et, loin derrière, la colère. Il est intéressant de noter que la majorité des messages contenant des expressions d’affect contiennent des marqueurs interactifs, tels que des liens hypertexte, des pronoms à la 2ème personne et des marques verbales telles les injonctions.

On relève peu de tweets donnant lieu à des retweets dans le sous-corpus sélectionné pour l’analyse. La présence d’expressions émotionnelles dans les textes des messages n’indique pas de penchant particulier pour le partage social des émotions à large échelle, les internautes se contentant de la scène interactionnelle immédiate (Tableau 2.17.).

85 Suivi systématiquement dans ce corpus du coordonnant à valeur concessive mais ou par des adverbes modalisateurs, à l’instar de vraiment.

TABLEAU 2.17. RE-TWEETS ET PRINCIPAUX DOMAINES AFFECTIFS REPRÉSENTÉS.

Lexique Nombre

d’occurrences ^{Re-tweets (RT)} PEUR PEUR+ (notamment “fait peur”)

INQUIET+ (préférentiellement à la forme négative)

CRAIN+ (préférentiellement à la forme négative) 75 35 13 Total:123 peu fréquent

TRISTESSE TRISTE+ 106 fréquent

(3 tweets -> 162 occ.) COLÈRE COLERE ÉNERVE 18 5 4

Cette étude met en avant plusieurs phénomènes lexico-discursifs. D’une part, elle rappelle les difficultés propres aux sondages lexicaux en discours, à plus forte raison lorsqu’il s’agit de l’expression des affects. Qu’il s’agisse de mots-clés affichés sous forme de hashtags, ou de champs lexicaux dénotant telle ou telle émotion, les décalages sont toujours présents, et les lexicalisations du type pathétique (polarité négative, proche du mépris) ou, plus récemment, t’inquiète (proche de la menace) rendent la tâche encore plus complexe. Cependant, si des analyses qualitatives ont été nécessaires pour nuancer l’interprétation des données, la présence dominante de tels ou tels champs lexicaux (ou autres moyens expressifs) donne un aperçu des usages récurrents. D’autre part, ce travail montre la dépendance entre les domaines émotionnels représentés en discours et les thèmes ou événements discursifs. Même au niveau des retweets, qui peuvent prétendre jouer un rôle dans le partage social des émotions, ce sont davantage le contenu du tweet et l’intensité de l’émotion qui semblent déterminer le retweet. Enfin, et cela me semble être une observation qui ouvre des pistes pour l’étude de la complexité des émotions en discours, on constate un emboîtement de domaines émotionnels qui a pour seule cohérence sa trame évaluative. Le tweet le plus retweeté du corpus est une citation des paroles de J.-L. Mélenchon (leader de la France insoumise) :

(35)

Vous passez votre temps à recommander des sacrifices aux gens, je comprends que vous ayez toujours l’air triste M. Lenglet (73 retweets)

Il contient un lexème dénotant la tristesse, mais l’ensemble du tweet renvoie à une (fausse) empathie qui frise le sarcasme. On peut soupçonner d’ailleurs que le sentiment partagé par les re-twitteurs relève plutôt de l’ordre de la jubilation, ou de l’admiration envers Mélenchon. Le lien entre les émotions évoquées n’existe que grâce à des schémas évaluatifs sous-tendant toute mise en relation entre une émotion et une situation ou un objet de discours. L’expression / représentation d’une émotion devient un outil rhétorique apte à développer une force perlocutoire et à déclencher des émotions en cascade.

2.5.3.3. DISCUSSION

Les études exposées dans cette dernière section du chapitre mettent en évidence les dynamiques sémantiques de l’expression des émotions en discours.

La répartition des termes d’émotion utilisés en marge d’événements jugés comme négatifs dans les discours médiatiques et politiques d’une part et les commentaires des internautes d’autre part montre à quel point la divergence d’opinions peut se manifester dans le choix du lexique des affects. Par ailleurs, on constate que, du moins dans les termes utilisés, les internautes qui réagissent aux articles s’opposent tous en grande partie aux

discours politiques occupant du terrain. Ainsi, par exemple, le discours « de droite » s’attachant à construire un champ sémantique de la colère et de la honte autour des sifflements de La Marseillaise en 2008 reçoit en retour un discours de colère à son encontre. Le discours médiatique usant du thème du danger, qui devrait être à priori déclencheur d’un champ sémantique de la peur au sujet de risques alimentaires ou sanitaires, se solde par l’émergence du champ sémantique de la colère ou de l’ironie dans les commentaires d’internautes. On peut interroger à ce stade aussi bien le statut-même des commentaires et de leur origine énonciative (qui les produit ? pourquoi ? pour qui ?) que le pourquoi de la dominante du champ de la colère dans ces productions. S’agit-il alors de caractériser le genre discursif lui-même, comme défouloir ou outil de manipulation ou, au contraire, faut-il s’interroger quant aux dynamiques sémantiques contribuant à une continuité discursive régulière, s’inscrivant dans un schéma évaluatif (appraisal) ?

L’étude de la sémiotisation des émotions dans les tweets se proposait de tester l’hypothèse des dynamiques sémantiques. Or on n’a affaire ni aux mêmes stratégies discursives, compte tenu des contraintes génériques, ni tout à fait aux mêmes champs sémantiques. Reste en revanche ce qui semble être une constante dans les limites du corpus étudié : l’ironie, ou le sarcasme, constituent les manifestations les plus représentées au niveau de l’étiquetage des tweets par des mots-dièse, ainsi qu’au niveau des retweets.

Dans le document Dans le sens du texte. Dynamiques sémantiques des unités lexicales et des discours (Page 100-104)