• Aucun résultat trouvé

3. L’IRONIE ET LE SARCASME

3.7 Détection et gestion de l’ironie

Nous avons terminé la section précédente en nous interrogeant sur la problématique de l’ironie face aux systèmes d’analyse de sentiment. Actuellement, la détection du sarcasme et de l’ironie – dans le cadre de l’analyse de sentiment - est devenue un champ d’étude particulièrement apprécié par les chercheurs (Burgers et al., 2017). En effet, puisque ce champ cherche à établir la polarité d’une opinion (c’est-à-dire si elle est positive ou négative), le problème de l’ironie et le sarcasme semble évident. Comme nous l’avons défini précédemment, ceux-ci consistent justement à énoncer une polarité tout en souhaitant en exprimer une autre. Généralement, les modèles de détection de l’ironie ou du sarcasme fonctionnent soit grâce aux n-grammes, soit grâce aux polarités, soit grâce à l’ « émotionnalité », ou finalement par la détection des marqueurs explicites d’ironie que nous avons introduits plus tôt (Drover, 2015). La difficulté, pour ceux-ci, est donc de détecter l’implicite du message afin de l’interpréter. La tâche est ardue et l’est d’autant plus lorsque l’on sait que même l’être humain n’est pas capable de détecter l’ironie et le sarcasme parfaitement (Burgers et al., 2017).

De nombreux chercheurs ont toutefois tenté de trouver une solution à ce problème. Il nous paraît donc intéressant de mentionner plus en détail les différentes stratégies (Tableau 1) proposées afin de permettre sa détection. Dans la plupart des cas, le système tentera de trouver des marqueurs qui permettront l’identification d’un énoncé ironique. Carvalho (2009), par exemple, définit huit schémas linguistiques qui peuvent être utilisés pour déterminer si une locution générée par un utilisateur est ironique ou pas.

Il s’agit, par exemple, de l’utilisation de formes diminutives, des déterminants démonstratifs ou de l’utilisation de guillemets. Tsur et al (2010) ont également cherché à identifier les phrases sarcastiques

mais sur Twitter et sur Amazon. Pour cela ils ont utilisé les paramètres de détection suivants : la longueur des phrases, la ponctuation ou encore le nombre total de mots complètement écrits en majuscules.

Reyes et al (2013), eux, tentent également de trouver des marqueurs ironiques qui permettraient de détecter des Tweets ironiques. Ces marqueurs sont toutefois différents de ceux proposés par Carvalho.

Il s’agit par exemple des signatures (l’ironie est considérée comme construite par des marqueurs textuels spécifiques que les auteurs appellent des signatures), de l’inattendu qui s’exprime soit par un déséquilibre temporel (lorsque la phrase est construite avec d’abord du présent puis du passé) soit par un déséquilibre contextuel (lorsque les champs lexicaux des différents termes employés sont très différents les uns des autres). Reyes et al mentionnent aussi comme paramètres de détection le style et finalement les scénarios émotionnels. Tout ceci permet la mise en place d’un modèle qui – selon eux – capture efficacement les attributs les plus proéminents de l’ironie. Quant à Buschmeier et al (2014), ceux-ci ont décidé de regarder s’il existait une corrélation entre la polarité des mots présents dans un commentaire et le nombre d’étoiles que l’auteur lui avait donné. L’idée sous-jacente est que s’il y a un déséquilibre entre le nombre d’étoiles et la polarité du commentaire, le commentaire sera vraisemblablement sarcastique. L’un des autres marqueurs utilisés est la présence d’hyperboles : si l’on constate la présence d’au moins trois mots positifs ou de trois mots négatifs à la suite, il est vraisemblable que le commentaire soit ironique. Les auteurs soulignent aussi que la présence de guillemets peut être efficaces pour la détection, de même que la présence de plus de deux points d’exclamation, d’émoticons ou encore d’interjections.

Marqueurs d’Ironie Exemple

Formes diminutives Ce film était vrmt génial

Déterminant démonstratif Qu’est-ce que ce film était génial

Guillemets Ce film était « génial »

Longueur des phrases Ce film était génial. J’ai adoré. J’en redemande.

Ponctuation Ce film était génial !!!!!!!!!!!!

Mots en majuscule Ce FILM était GÉNIAL

L’inattendu - déséquilibre temporel + déséquilibre contextuel.

Ce film est génial. J’avais l’impression d’être en Enfer.

Hyperboles Ce film est le plus incroyablement génial de l’histoire.

Emoticônes Ce film était vraiment génial :-/

Tableau 1 : Récapitulatif des marqueurs possibles d’ironie

Nous nous sommes bornés à ne citer qu’un petit nombre d’études qui, cependant, font état de l’intérêt de la recherche pour la détection du sarcasme et de l’ironie. Les systèmes que nous avons utilisés pour notre travail ne sont pas constitués d’attributs de détection tels que présentés ci-dessus. Nous tenterons donc de découvrir si la traduction automatique rend l’analyse de sentiment automatique caduque, ou si celle-ci parvient tout de même à produire des résultats fiables. Nous commencerons par traiter les documents en langue source et tenterons d’analyser brièvement leurs scores en comparant notamment les annotations humaines à celle de la machine. Nous traiterons ensuite ces mêmes documents traduits automatiquement afin de mesurer si le score est différent et, si tel est le cas, dans quelle mesure.

3.8 Conclusion

La Traduction Automatique en ligne est donc intrinsèquement liée aux utilisateurs d’Internet. Comme le dit la revue presse de DeepL : « Que vous soyez un étudiant ayant besoin de traduire une thèse, un professionnel préparant une présentation dans une langue étrangère ou une entreprise fournissant des manuels d'utilisation à une clientèle internationale »8 l’on peut tous avoir besoin de recourir à la traduction automatique. Nous avons établi dans quelle mesure celle-ci était efficace ainsi que les différentes méthodes d’évaluations dans la première partie de notre mémoire, et avons introduit dans celle-ci l’élément principal de notre recherche : l’ironie. En effet, s’il est possible que les traductions proposées soient acceptables, le problème demeure quant à la perception et à la détection de l’ironie et du sarcasme. Incapables de prévoir une stratégie permettant de l’appréhender, les systèmes devront donc traduire (à priori) les commentaires ironiques de notre corpus comme s’il s’agissait de commentaires standards. Cette troisième partie est la dernière partie purement théorique de notre mémoire. La

quatrième partie sera également un pan important puisqu’il s’agira de présenter notre méthodologie en commençant par passer en revue les différents outils que nous avons mobilisés pour notre recherche : Notre corpus, Amazon et ses commentaires, les trois systèmes de traduction automatique que nous avons sélectionnés pour mener à bien notre travail, ainsi que les systèmes d’analyse de sentiment.