Le paradigme du Magicien d’Oz

5. Méthodologie de recueil de données

5.3. Le paradigme du Magicien d’Oz « perturbé »

Le paradigme du Magicien dʹOz, dans le cadre des recherches en Communication Homme‐Machine, consiste à faire croire à un utilisateur quʹil utilise un système

« intelligent », alors quʹil se trouve face à une simulation contrôlée par un compère, désigné par le terme de magicien. Dans un autre cadre, il est possible de sʹappuyer sur ce

paradigme pour mettre en place des expériences dʹinduction. Il sʹagit alors de placer un utilisateur face à une tâche cognitive lourde, afin que celle‐ci accapare son attention, et dʹintroduire à son insu des perturbations dans cette tâche, afin de provoquer chez lui certaines émotions.

Ce paradigme tient son appellation du personnage du roman de L. Franck Baum dans lequel le magicien se fait passer pour une imposante statue, tandis quʹil ne sʹagit que dʹun petit homme dissimulé derrière un rideau pour contrôler cette statue. Ce paradigme a été baptisé ainsi par J.F. Kelley, qui l’a proposé pour la mise au point d’interfaces personne‐machine en langage naturel (Kelley, 1983). Le paradigme du Magicien d’Oz est parfois également désigné par l’acronyme PNAMBiC⁸ comme relevé par Fraser & Gilbert (1991).

5.3.2 Des magiciens d’Oz classiques …

Le paradigme du Magicien dʹOz, s’il est très largement utilisé à l’heure actuelle, a diverses applications. La plus répandue est l’évaluation d’interface, et les exemples d’une telle utilisation du paradigme du Magicien d’Oz sont légion. Citons en particulier le système Neimo qui consiste en une plate‐forme générique pour l’analyse d’interfaces multimodales, grâce à la présence de plusieurs magiciens, et propose un cadre méthodologique détaillé (Salber & Coutaz, 1993). Fraser & Gilbert (1991) ont quant à eux étudié en détail le cas d’applications dans lesquelles un système de reconnaissance vocale doit être simulé.

Le Magicien dʹOz a également été étendu à lʹétude de la multimodalité. Dans ce cas, ce sont les stratégies élaborées par le sujet pour exprimer un but communicatif lorsqu’il est placé dans des situations particulières qui sont étudiées. Cʹest le cas par exemple d’un corpus en langue suédoise (Lewin et al., 1999), portant sur des réservations de trains, hôtels, avions et taxis. Ce corpus a été enregistré afin d’évaluer le gain sémantique pouvant être apporté par des systèmes de reconnaissance incluant une analyse linguistique plus fine, au‐delà des langages de commandes. Ce corpus a été réalisé par des demandes de reformulation successives, ce qui d’après les auteurs a permis d’obtenir des requêtes « naturelles ».

5.3.3 … et perturbés

Le principe du Magicien dʹOz peut aussi être utilisé pour lʹinduction dʹémotions. En particulier, il est possible de provoquer l’irritation du sujet en simulant un mauvais fonctionnement du système, sous la forme de ralentissements ou de réponses inappropriées. Toutefois, lʹutilisation dʹun Magicien dʹOz à cette fin suppose de disposer de sujets suffisamment « naïfs » pour être persuadés quʹils se trouvent face à un véritable système, ou à l’inverse d’un système suffisamment réaliste pour que les sujets ne soupçonnent pas le caractère factice de la tâche proposée. De ce fait, il est nécessaire dʹélaborer un scénario qui constitue un bon compromis entre les contraintes imposées par les conditions dʹexpérience à respecter et un comportement réaliste de lʹapplication.

De plus, et bien que les techniques de Magicien dʹOz soient considérées comme comptant parmi les plus adaptées à lʹinduction dʹune large palette d’émotions spontanées, il peut être difficile dʹinduire chez le sujet des émotions telles que la colère.

En effet, le sujet pense être en présence dʹun véritable ordinateur, et lʹexpérience montre que les sujets sont plus coopératifs et, surtout, plus tolérants à des attentes répétées, dans ce type de situation que dans une situation de communication humain‐humain (Batliner, 2003a).

Dans ce domaine de lʹinduction dʹémotions, les exemples d’utilisation de protocoles de Magicien d’Oz sont moins nombreux et tous ne s’inscrivent pas strictement dans le cadre des simulations par ordinateur. L’expérience pionnière en ce domaine semble être celle menée par Hecker et al. (1968), qui ont mis en place un protocole afin de provoquer le stress chez des sujets enregistrés en chambre sourde, en leur donnant une tâche complexe de surveillance de voyants à effectuer, tout en jouant sur les délais de réponse accordés. Schröder (1998) a proposé à des locuteurs professionnels des tâches de lecture classiques pour eux. En les distrayant par des événements « amusants » inattendus, il a induit des expressions d’amusement spontané sur une tâche contrôlée de lecture. Les travaux de Fernandez & Picard (2000), qui ont mis en place un protocole permettant de collecter de la parole émotionnelle dans le cas du stress au volant, peuvent également être cités. Pour cette expérience, il était demandé aux sujets de résoudre par téléphone des questions de calcul mental tout en conduisant, la vitesse de conduite et la fréquence des questions étant fixées. De par le caractère extraordinaire de la situation dans laquelle le sujet est placé, il est néanmoins possible de s’interroger sur la mesure dans laquelle la parole collectée dans ce type de situation reflète les conditions normales de production (Campbell, 2000).

Klasmeyer et al. (2000) ont, quant à eux, utilisé des tests de logique dans lesquels l’état émotionnel du locuteur, à qui il était demandé de lire des phrases sémantiquement

neutres, était manipulé en simulant des dysfonctionnements ayant un impact négatif sur son score ou au contraire en le surévaluant. Une expérience de ce type a également été réalisée par Loyau (2003), afin d’étudier la parole émotionnelle chez les pilotes de chasse.

Pour cela, le simulateur de vol a été modifié afin de pouvoir perturber à distance les commandes du sujet et induire ainsi émotions et attitudes, tout en restant dans le cadre du langage de commandes dédié à la communication entre pilotes. Un Magicien d’Oz a également été utilisé par Kehrein (2002) pour induire et collecter des expressions émotionnelles authentiques. Dans cette expérience, plusieurs participants, qui devaient collaborer pour mener à bien un jeu de construction, ont été enregistrés au cours de leurs interactions. Egalement dans un contexte ludique, Johnstone et al. (2005) ont induit des expressions vocales d’affects au moyen d’un jeu vidéo.

Mishra et al. (2004) ont enregistré dans un simulateur de conduite 12 pilotes en interaction avec un soi‐disant système de reconnaissance de la langue naturelle leur permettant de contrôler l’appareillage électronique de l’habitacle, afin de recueillir des échantillons de parole expressive authentique en situation de stress. Batliner et al. (2004) ont enregistré les interactions d’enfants anglais et allemands avec un robot‐chien AIBO^®, en incluant une condition dans laquelle le robot suivait un scénario prédéfini plutôt que d’obéir aux ordres de l’enfant.

Plus récemment, Février et al. (2006) ont élaboré un protocole de Magicien d’Oz mettant en jeu des sujets placés en situation de vidéo‐conversation avec un vendeur complice de l’expérimentateur. Les scénarios suivis par les complices ont permis d’induire chez les sujets des réactions de satisfaction, d’amusement, d’embarras, d’incompréhension et de surprise.

5.3.4 Quelle tâche prétexte, quelles perturbations pour quelles émotions?

La forme générale que nous avons retenue pour le développement de scénarios d’induction de variations émotionnelles est un Magicien d’Oz imitant le fonctionnement d’une application à commandes vocales (Audibert et al., 2003, 2004). Toutefois l’usage que nous faisons de la technique du Magicien d’Oz s’écarte du rôle qui lui est classiquement dévolu : en effet notre objectif ici n’est pas de collecter des données directement liées à la tâche, mais relatives aux effets induits par la tâche proposée sur les locuteurs

D’autre part, le choix de la tâche proposée est primordial pour assurer le succès des scénarios d’induction. Cette tâche doit être en adéquation avec le profil psychologique

provienne de la nature de la tâche elle‐même, dans laquelle les sujets se sentent réellement impliqués. Cela exclut donc les scénarios dans lesquelles la motivation est suscitée par l’aspect ludique de la tâche, ou par une promesse de rémunération comme cela a été appliqué dans d’autres études telles que (Kaiser & Wehrle, 1994) ou (Kehrein, 2002). Un effort particulier doit en outre être consacré à la crédibilité de la tâche.

Cet objectif de motivation par la tâche est toutefois compliqué par les conditions expérimentales, susceptibles de perturber le sujet et par là même de le détourner de cette motivation. En effet, les mesures de données diverses au cours des enregistrements, quoique indispensables à toute analyse ultérieure, peuvent également s’avérer être un facteur perturbant (Campbell, 2000). Il convient donc de trouver un équilibre entre les contraintes imposées par l’ensemble des appareils de mesure et la naturalité de la tâche, c’est‐à‐dire sa crédibilité par rapport à l’écologie quotidienne du locuteur, afin d’éviter l’écueil de retirer de l’information (les variations émotionnelles du locuteur, qui sont le but recherché) en cherchant à en ajouter par des mesures plus complètes. Outre l’enregistrement acoustique, pour lequel l’utilisation d’un microphone se justifie aisément par le prétexte de l’utilisation d’une application à commandes vocales, et sauf à induire des émotions très intenses, le choix des mesures à effectuer doit en conséquence se limiter à des instrumentations peu invasives.

Dans le document Prosodie de la parole expressive : dimensionnalité d'énoncés méthodologiquement contrôlés authentiques et actés ~ Association Francophone de la Communication Parlée (Page 72-76)