• Aucun résultat trouvé

2.2.1 Définition

Les informations linguistiques sont nécessaires pour assurer une communi-cation face à face, cependant elles ne forment qu’une partie du message com-muniqué. Lors d’une conversation, les interlocuteurs sont très sensibles aux informations extralinguistiques (état du locuteur, identité du locuteur, etc.) et aux informations paralinguistiques (intention, prosodie, etc.). Ainsi dans une conversation, les émotions du locuteur et sa manière de parler peuvent être plus importantes que les informations linguistiques. De plus, les émo-tions jouent un rôle très important dans la vie quotidienne et exercent une influence non négligeable sur les comportements humains. Elles oeuvrent pour transmettre plus de sens aux échanges et renseignent sur les intentions et mo-tivations.

Cependant, il est difficile de définir une émotion, même si plusieurs tra-vaux ont tenté de caractériser des états émotionnels [Cowie et Schröder,2005] [Cowie et Cornelius, 2003]. En général, on distingue deux approches princi-pales pour la description des émotions. Une première approche catégorielle où les émotions sont représentées par un état (tristesse, colère, etc.) à un ins-tant donné. Les émotions sont alors considérées comme des caractéristiques

2.2. Signaux émotionnels 51 épisodiques basiques et universelles [Ekman, 1999c]. Une deuxième approche consiste à représenter l’état émotionnel par un point dans un espace multidi-mensionnel [Cowie et Cornelius,2003] [Schröder, 2004].

Wundt [1913] a proposé une description dimensionnelle des états émo-tionnels sur trois dimensions : envie-aversion (positif-négatif), excitation-apaisement (actif-passif) et tension-soulagement. La dimension positive-négative reste la plus utilisée. Dans cette dimension, les états émotionnels sont organisés selon un axe négatif-positif (dégoût, colère, peur, surprise, ex-citation, joie). Dans la littérature, on distingue plusieurs représentations des états émotionnels se basant sur ces échelles.Whissel [1989] a proposé une liste d’émotions, que l’on retrouve également dans la représentation de Plutchik (cône des émotions), voir la figure 2.1.Galati et Sini[1995] ont fait une étude empirique pour répertorier les termes utilisés dans le langage courant francais. Afin de faciliter la tâche de reconnaissance automatique des émotions, la majorité des études en informatique affective (affective computing) considère souvent l’approche catégorielle. Ils ne considèrent que les six émotions basiques proposées parEkman [1999c] : colère, peur, tristesse, joie, dégoût et surprise. Le problème de l’approche catégorielle réside dans l’hypothèse discrète de l’état émotionnel. Du point de vue psychologique l’émotion est une notion floue et les émotions peuvent se chevaucher dans les interactions réelles, de plus l’expression d’un état émotionnel peut changer d’un individu à un autre [Picard, 2003]. Du fait de la difficulté de catégorisation et d’annotation des signaux émotionnels, plusieurs études se limitent à l’étude d’un nombre réduit d’émotions non prototypiques. Lee et al. [2001] ont développé une technique qui permet de discriminer les signaux positives des émotions négatives. Ainsi ces travaux se sont limités à la discrimination des parole émotionnelles et des paroles neutres [Ringeval et al., 2010]. De plus, certains chercheurs ont étudié le problème de reconnaissance des émotions en tenant compte de leur application, comme les problèmes de la reconnaissance de la parole stressée vs. parole non stressée [Fernandez et Picard, 2003] [Narayanan, 2002], parole frustrée/contrariée vs. parole non frustrée [Ang et al., 2002], la peur [Clavel et al., 2008], l’empathie vs. neutre [Steidl et al., 2005], le motherese [ Mahd-haoui et al., 2008] [Mahdhaoui et Chetouani, 2010].

2.2.2 Emotions et contexte

De nombreuses études sur la catégorisation des émotions ont été menées. Cependant, il n’existe actuellement pas de consensus sur la catégorisation des émotions tant elles sont dépendantes du contexte. Par conséquent, il est impor-tant d’étudier les émotions dans leurs contextes : culturel, social, linguistique, etc. Concernant les applications en vidéo surveillance, Clavel et al.[2008] ont

Fig. 2.1 – Cône des émotions de Plutchik [Plutchik,1984]

étudié une émotion particulière : la peur vécue dans des situations anormales (événements imprévus constituant une menace pour la vie humaine). Il en résulte une définition expérimentale d’un ensemble d’états émotionnels re-groupant non seulement la peur mais également l’inquiétude ou la panique. Dans le contexte social d’un centre d’appel, l’état émotionnel du client est une information importante pour évaluer son degré de satisfaction, mais la définition de ce dernier s’avère complexe.

Dans le contexte d’interaction parent-enfant, les comportements vocaux des parents comportent indéniablement une dimension affective. Les parents, ou tout autre interlocuteur (caregiver), adoptent spontanément et inconsciem-ment un langage particulier, caractérisé par un discours simplifié et une

proso-2.2. Signaux émotionnels 53 die particulière. Ce registre de parole appelé mamanais ou motherese présente des caractéristiques linguistiques particulières : énoncés plus courts avec plus de répétitions et d’expansion, meilleure articulation et complexité structu-rale réduite, ainsi des caractéristiques paralinguistiques particulières : tona-lité globale plus haute, plus larges excursions tonales, des contours intonatifs plus distincts, un tempo ralenti et pauses plus longues. Ces caractéristiques se rapprochent de celles des émotions typiques et motivent l’approche suivie dans ce document consistant à exploiter des méthodologies de l’état de l’art en reconnaissance d’émotion [Schuller et al.,2007]. En complément à cette carac-térisation automatique, le contexte de production du motherese sera précisée par la modélisation des signaux d’interaction (cf. chapitre4).

2.2.3 Signaux émotionnels et interaction

Le rôle des émotions dans les interactions sociales n’est plus à démontrer cependant il est pertinent de préciser son intervention. Par exemple, le traite-ment du signal social distingue les émotions individuelles des émotions sociales [Pantic et al.,2009]. Les émotions individuelles correspondent le plus souvent aux émotions primaires comme la tristesse ou la joie. Elles sont considérées comme individuelles car elles ne sont pas dirigées vers autrui. Les émotions sociales, au contraire, sont produites dans l’intention de produire un effet chez l’autre comme l’admiration ou la compassion. Ces émotions sociales per-mettent également de réguler l’interaction et sont essentiellement formées par des émotions dites non-prototypiques.

Signalons cependant que la catégorisation prototypique / non-prototypique ne permet pas de discriminer entre les émotions individuelles et sociales. En effet, les émotions fournissent des informations sur la façon dont les inter-locuteurs agissent en établissant et validant leur identité dans l’interaction sociale [Mackinnon, 1994]. Aussi, dans une conversation, les interlocuteurs se partagent les sentiments et les émotions par rapport au contexte. Par exemple quand une personne parle avec une voix triste, la personne en face change sa voix et essaie aussi de parler avec une voix triste. Au contraire quand une personne est en colère ou agressive, son interlocuteur peut parler avec une voix neutre pour la calmer ou au contraire se met en colère, en fonction du contexte de l’interaction et de la culture des interlocuteurs.

Les études sur les échanges entre un parent et son enfant montrent l’exis-tence d’une adaptation mutuelle [Ruth et Arthur,2004]. Le registre de parole motherese produit par les parents a clairement une vocation sociale et nous cherchons dans notre étude à qualifier son impact dans l’interaction et notam-ment chez les enfants à devenir autistique.