• Aucun résultat trouvé

Termes et modèles de référence de l’analyse de sentiments

1.3 Organisation du mémoire

2.1.1 Termes et modèles de référence de l’analyse de sentiments

2.1.3 Appraisal in English (Martin and White, 2005) . . . . 14 2.1.4 Bilan . . . 16 2.2 Méthodes en analyse de sentiments . . . 17

2.2.1 Aperçu des objectifs et méthodes en analyse de sentiments . . . 17 2.2.2 Compositionnalité et polarité . . . 18 2.2.3 Approches aspect-based : vers une meilleure analyse des cibles . . . 22 2.2.4 Bilan . . . 22 2.3 Positionnement : analyse de sentiments pour les interactions humain-agent

conversationnel animé . . . 23

2.3.1 Choix du modèle théorique . . . 23 2.3.2 Choix de la méthode . . . 24

CHAPITRE 2 – DÉTECTION D’OPINIONS ET ANALYSE AUTOMATIQUE DE SENTIMENTS

L

’ANALYSE de sentiments (ou sentiment analysis en anglais) a connu depuis le début

des années 2000 de nombreux développements et de nombreux succès tant dans le domaine de la recherche académique que dans celui de l’industrie. Ce succès est fa- vorisé par le développement massif de données issues du web et particulièrement des réseaux sociaux où l’utilisateur est amené à donner son avis sur divers objets. Ceci a entrainé la production de données affectives et axiologiques posant, de par leur variabilité, la question de leur analyse et de leur exploitation. Cette subjectivité évaluative prend diverses formes : elle peut s’exprimer textuellement, dans les forums, les commentaires, les tweets ; elle peut s’ancrer dans un contexte multimodal, dans des vidéos ou être accompagnée de photos. Cette variabilité conduit les chercheurs à développer et à évaluer différents modèles exploitant des technologies issues de l’extraction d’information ou de la fouille de données.

Notre champ d’application diffère de celui traditionnellement exploité en sentiment analysis. Néanmoins, une étude des différents modèles et méthodes utilisés dans ce domaine est une étape nécessaire pour définir nos propres choix et positionner notre approche. Notre objectif ici n’est pas de dresser une liste exhaustive des travaux réalisés en sentiment analysis, mais de mettre en lumière différentes tendances, afin de définir les outils théoriques et opérationnels pertinents sur lesquels se fonde le développement de notre modèle. Ce chapitre s’intéresse dans un premier temps aux modèles théoriques permettant de décrire la notion de sentiment ou d’opinion. Dans un second temps, nous présentons différents types de méthodes utilisées en sentiment analysis et mettons en relief leurs objectifs de développement (classification, extraction d’aspects, calcul de polarité). Après avoir mis l’accent sur les objectifs que se fixe aujourd’hui le sentiment analysis, nous présentons deux types d’approches qui se distinguent, selon nous, par leur manière d’envisager la complexité des expressions verbales de sentiments. Enfin, dans un troisième temps, après une rapide présentation de rares travaux intégrant un module de sentiment analysis dans une architecture de dialogue humain-machine, nous présentons notre positionnement.

2.1

Fondements théoriques de l’analyse automatique de sentiments

Dans le domaine du sentiment analysis (SA), différents termes sont utilisés pour référer aux phénomènes linguistiques ciblés : sentiments, opinions, jugements, affects, attitudes, appréciations, émotions. Leur définition varie d’une étude à une autre, de même que le type de d’expressions verbales qu’ils permettent de circonscrire. Ce chapitre a pour objet de faire le point sur les fon- dements théoriques exploités en SA. Dans un premier temps (Sous-section 2.1.1), nous passons en revue les termes et modèles relatifs à la question des sentiments, telle qu’elle est posée dans le domaine, et interrogeons la manière dont sont circonscrites les expressions candidates à la détection. Dans un deuxième et troisième temps (Sous-sections 2.1.2 et 2.1.3), nous interro- geons les domaines de la psychologie et de la linguistique pour nous intéresser à deux modèles fréquemment cités dans les travaux de sentiment analysis : le modèle OCC (Ortony et al., 1990) et le modèle de Martin and White (2005).

2.1.1 Termes et modèles de référence de l’analyse de sentiments

Définir le phénomène cible apparaît comme un pré-requis nécessaire au développement d’un système d’analyse de sentiments. Cette question émerge dans les premiers travaux produits dans le domaine par la référence à la notion de subjectivité. Dans (Wiebe, 2000), la subjectivité est envisagée comme la caractéristique discriminante des expressions d’opinion et de sentiment. Deux catégories sont envisagées : celle des expressions subjectives, qui portent la marque de ce que pense ou aime le locuteur, et celle des expressions objectives qui exposent un fait sans que ne se manifeste l’avis ou les goûts du locuteur. Les premiers travaux de classification se proposent ainsi de détecter automatiquement des adjectifs (Wiebe, 2000) et des phrases subjec-

2.1. FONDEMENTS THÉORIQUES DE L’ANALYSE AUTOMATIQUE DE SENTIMENTS

tives ((Riloff and Wiebe, 2003), (Wiebe and Riloff, 2005)). A cette notion, s’ajoute celle de la valence, utilisée pour distinguer les expressions subjectives ayant une polarité positive de celles ayant une polarité négative. Dans (Taboada et al., 2011), la polarité est définie relativement au modèle d’Osgood “It usually captures an evaluative factor (positive or negative) and potency or strength (degree to which the word, phrase, sentence or document in question is positive or negative) towards a subject topic, person or idea”. Néanmoins, force est de constater que peu d’études réfèrent à un modèle spécifique pour définir cette notion de valence ou de polarité.

Afin de dépasser ces oppositions subjectif vs. objectif et positif vs. négatif et de proposer une approche plus catégorielle, certains travaux se sont efforcés de référer à des modèles théo- riques offrant une description plus complexe de ces phénomènes. Dans la vaste classe des ex- pressions de sentiments, les sous-classes d’affect et d’émotion retiennent l’attention de quelques chercheurs. Le travail de Neviarouskaya et al. (2010a) exploite le modèle d’Izard (Izard, 1977) pour définir les neufs classes d’affects que le système est capable de détecter (colère, dégoût, peur, honte, intérêt, joie, tristesse, surprise, culpabilité). Une démarche similaire peut être obser- vée par Perikos and Hatzilygeroudis (2013), qui retiennent les six classes d’émotions basiques décrites par Ekman (1999). Toujours dans un objectif de catégorisation fine des phénomènes, Wiebe et al. (2005) développent un schéma d’annotation privates states tels que définis par Quirk (1985). Ce modèle implique plusieurs sous-catégories : les croyances, les opinions, les sentiments, les évaluations et les jugements. Enfin, les deux derniers modèles fréquemment ci- tés sont le modèle OCC (Ortony et al., 1990) et le modèle Appraisal in English de Martin and White (2005). Le premier est à l’origine de la catégorisation proposée dans WordNet-Affect (Va- litutti, 2004) et des règles formelles développées dans (Shaikh et al., 2009). Le second est utilisé dans les travaux de Neviarouskaya et al. (2010b), Bloom et al. (2007) et Whitelaw et al. (2005). Ces modèles, bien qu’issus de champs disciplinaires distincts, se définissent comme des théories de l’appraisal : ils mettent en valeur la notion d’acte évaluatif effectué par un agent envers une entité, un fait ou un événement. Cet intérêt porté au processus évaluatif offre l’avantage, pour une utilisation dans des travaux de SA, de rappeler qu’une expression de sentiment n’est pas définie uniquement par sa valence mais également par sa source et sa cible.