• Aucun résultat trouvé

1.3 Mod`eles de repr´esentation applicables aux syst`emes

infor-matis´es

Scherer propose dans [132] une description des diff´erents mod`eles de repr´esentation de l’´emotion. Nous d´ecrivons ici les trois types utilis´es en reconnaissance d’´emotions par infor-matique : les mod`eles discrets, les mod`eles dimensionnels continus, et les mod`eles `a compo-sants. Les deux premiers types de mod`eles sont ceux que l’on rencontre dans la quasi-totalit´e des syst`emes de reconnaissance affective par ordinateur. L’utilisation de mod`eles discrets est de loin majoritaire dans ces ´etudes ; certaines se basent sur des mod`eles dimensionnels. Le mod`ele `a composants (CPM) ne propose pas directement de repr´esentation de l’´emotion, ce qui freine son adoption en reconnaissance.

1.3.1 Mod`eles de repr´esentation discrets

Les mod`eles discrets repr´esentent un ensemble d’´emotions comme un ensemble discret, o`u chaque type d’´emotion est d´esign´ee par un label sp´ecifique (c’est-`a-dire un mot - par exemple “joie”, “peur”, etc.). Un exemple courant de ce type de mod`ele est l’ensemble des ´emotions basiques propos´ees par Ekman [49] (d´ecrit au paragraphe 1.2.2 page 17). Chaque ´emotion, en tant que r´eponse typique de l’organisme et de notre syst`eme nerveux central, est ici cat´egoris´ee par le terme qui lui correspond. Cette approche cat´egorielle propose un avantage certain en informatique. En effet, reconnaˆıtre une ´emotion d’un ensemble discret revient `a choisir une cat´egorie (i.e. une ´emotion) parmi celles propos´ees dans l’ensemble ; et la cat´egorisation de signaux est un probl`eme largement ´etudi´e en informatique, qui dispose d’outils ad´equats `a sa r´esolution (comme les r´eseaux de neurones).

Les mod`eles discrets comportent cependant des d´efauts. Premi`erement, la labellisation des ´emotions sous-entend qu’`a chaque label correspond un ´etat ´emotionnel d´efini. Or, nous avons vu en 1.2.2 qu’une ´emotion peut ˆetre vue comme un processus ´emotionnel dynamique plutˆot que comme un ´etat ´emotionnel statique. L’utilisation de labels ne permet pas de qualifier cer-taines subtilit´es de l’´emotion (par exemple son intensit´e) ni de relier entre elles les diff´erentes variantes d’une ´emotion (par exemple, la col`ere, la rage, l’agacement), d’o`u l’introduction de familles d’´emotions (voir page 17). Un recensement aboutit `a un grand nombre de labels, re-latifs `a un langage propre : Scherer d´enombre ainsi plus de 500 termes relatifs `a une ´emotion ou un ´etat affectif en anglais, et plus de 200 en allemand [129]. Enfin, cette labellisation est sujette `a un idiome particulier. La traduction peut parfois porter `a confusion et ne pas refl´eter le mˆeme ´etat interne. En effet de nombreuses ´emotions (hormis les ´emotions basiques) sont potentiellement sujettes `a la culture et aux diff´erences entre individus.

Comme nous l’avons dit pr´ec´edemment, les mod`eles discrets d’´emotions, de par leur nature, se prˆetent particuli`erement bien `a la reconnaissance d’´emotions par l’ordinateur. Ils sont donc largement utilis´es dans le domaine de la reconnaissance d’´emotions [132]. En 2009, cette assertion est toujours largement v´erifi´ee [152].

1.3.2 Mod`eles de repr´esentation continus

L’ensemble des ´emotions peut ˆetre consid´er´e comme un espace continu, comportant a priori un nombre ´elev´e de dimensions. Les efforts se tournent donc vers l’identification d’un sous-ensemble de dimensions, de fa¸con `a ce que les dimensions retenues permettent de d´efinir chaque ´emotion sans ambigu¨ıt´e, en minimisant la corr´elation entre ces diff´erentes dimensions. Les espaces obtenus les plus c´el`ebres sont bidimensionnels (plan) ou tridimensionnels (volume).

Le mod`ele bidimensionnel le plus connu est l’espace “plaisir-activation” propos´e par Russell dans [125] (valence-arousal space)(voir figure 5). Le premier axe est celui du plaisir. Plus on s’´eloigne `a droite de l’origine (valeurs “positives”), plus l’´emotion est plaisante. Les valeurs n´egatives transcrivent des ´emotions d´eplaisantes. Le deuxi`eme axe est celui de l’activation : il correspond `a une tendance `a l’action dans la r´eponse ´emotionnelle de l’individu. Les ´ emo-tions sont donc distribu´ees dans cet espace bidimensionnel dans lequel on peut distinguer les quatre quadrants : les ´emotions `a valence positive et forte activation (par exemple la joie), les ´emotions `a valence positive et faible activation (par exemple la relaxation), les ´emotions `

a valence n´egative et faible activation (par exemple l’ennui) et les ´emotions `a valence n´ ega-tive et forte activation (par exemple la peur). Dans cet espace, il s’av`ere que les ´emotions basiques sont distribu´ees selon un cercle de centre l’origine du rep`ere. Cet espace est donc qualifi´e de circomplexe. La distance `a l’origine qualifie l’intensit´e de l’´emotion. Une repr´ esen-tation discr`ete des ´emotions peut ainsi ˆetre plong´ee dans l’espace continu “plaisir-activation”. Ce mod`ele bidimensionnel a cependant ´et´e critiqu´e sur les ambigu¨ıt´es qu’il induit dans les positions de certaines ´emotions sur les axes. En particulier, la col`ere et la peur sont deux ´emotions `a valence fortement n´egative et `a forte activation : elles se retrouvent donc dans la mˆeme zone de l’espace.

Le mod`ele tridimensionnel a ´et´e propos´e pour rem´edier `a ce probl`eme. L’axe “dominance-soumission” v´ehicule la notion de contrˆole sur les ´ev`enements ext´erieurs. Ainsi, la col`ere est une ´emotion `a forte dominance, alors que la peur est caract´eris´ee par une forte soumission. Mehrabian introduit ainsi l’espace Plaisir- Activation- Dominance (Pleasure- Arousal-

Do-minance ou PAD) comme mod`ele tridimensionnel repr´esentant l’espace des ´emotions [96]. Cet espace tridimensionnel est d´ecoup´e en octants. Une liste de labels d’´emotions est propo-s´ee dans [126], avec leurs coordonn´ees dans l’espace PAD, permettant ainsi de plonger ces ´emotions dont les coordonn´ees sont identifi´ees dans l’espace continu `a trois dimensions PAD. L’espace PAD a ainsi ´et´e utilis´e dans diverses applications de test, comme pr´edire l’attraction physique, la d´esirabilit´e d’un nom ou des pr´ef´erences de produits. L’espace PAD est ´egalement propos´e comme espace de repr´esentation des temp´eraments [95].

1.3.3 Mod`ele de repr´esentation bas´e composants

Le mod`ele `a composants de Scherer offre une mod´elisation des processus internes d’une ex-p´erience ´emotionnelle. Cette mod´elisation plus complexe, issue du domaine de la psychologie, ne propose pas de repr´esentation d’une ´emotion directement applicable `a la reconnaissance d’´emotions en informatique. Cette complexit´e des ´evaluations d’un ´ev`enement, les param`etres `

a prendre en compte pour connaˆıtre les r´eactions d’un composant et cette absence de repr´ e-sentation directe constituent un frein `a une adoption plus large du mod`ele `a composants en

1.3. Mod`eles de repr´esentation 25

Fig. 5: L’espace plaisir-activation, un espace circomplexe des ´emotions. Figure tir´ee de [120].

informatique. L’objectif serait ici de pouvoir repr´esenter toute la s´equence de changements d’´etats dans les divers composants pour repr´esenter une ´emotion.

1.3.4 Int´erˆet de ces mod`eles de repr´esentation

Nous avons vu dans cette section trois fa¸cons de repr´esenter les ´emotions. Les mod`eles discrets se basent sur des labels pour repr´esenter chaque ´emotion et chaque variation. Le probl`eme majeur de ce type de mod`ele vient du nombre de labels utilis´es pour couvrir un maximum d’´etats ´emotionnels ; de plus, chaque label ´etant un mot d’un langage particulier, il est difficile d’assurer que la traduction d’un terme d’une langue `a une autre d´efinit bien la mˆeme ´emotion. Il peut ´egalement ˆetre difficile d’inf´erer des transitions entre les diff´erentes ´emotions. Les mod`eles continus `a deux ou trois dimensions permettent de lever cette limi-tation en proposant un espace dans lequel on peut se d´eplacer librement. L’effondrement de l’espace multidimensionnel des ´emotions en un espace bi- ou tridimensionnel suppose par contre une perte d’information et n’est pas adapt´e `a toutes les situations. En particulier, Scherer argumente l’inadaptation d’un tel mod`ele `a l’´evaluation d’´emotions esth´etiques [134]. Enfin, le mod`ele `a composants complexifie la repr´esentation d’une ´emotion.

Ces trois mod`eles de repr´esentation de l’´emotion sont utilis´es dans les travaux de recon-naissance automatique des ´emotions dans la litt´erature, travaux pr´esent´es au chapitre 2. Dans le cadre ce m´emoire, nous prenons en compte la pr´epond´erance de ces trois mod`eles en reconnaissance d’´emotions pour la conception de notre mod`ele d’architecture pr´esent´e au

chapitre 5.