É DITORIAL
Aujourd’hui, les personnages virtuels interactifs apparaissent de plus en plus comme des outils puissants pour le support et l’assistance à l’interaction entre les usagers du grand public et les applications de services, d’éducation, de loisir etc., ainsi que pour la recherche sur les architectures de nouveaux systèmes médiatisés comme les environnements de conception participative ou les communautés mixtes.
Dans ce contexte, un nouveau courant de recherche a vu le jour centré autour de la définition, la modélisation et l’évaluation des agents conversationnels animés (ACA correspondant au terme anglais ECA « Embodied Conversational Agents »).
Les trois termes du sigle ACA précisent la problématique :
– agent : composant autonome capable de raisonnement sur des représentations en situation,
– conversationnel : composant capable d’interactions multimodales avec l’usager,
– animé: composant doté d’une apparence effective face à l’usager.
En 2004, le groupe de travail GT ACA s’est constitué dans le collège SMA du GDR I3 (http://www.limsi.fr/aca/). En 2005, un premier workshop a réuni les chercheurs des thématiques scientifiques concernées par cette question, à savoir les systèmes multi-agents (SMA), le dialogue homme-machine (DHM) et les interfaces homme-machine (IHM), la psychologie des interactions langagières et la psychologie ergonomique. En 2006, un deuxième workshop a été organisé à Toulouse (http://www.irit.fr/WACA/). En 2008, un troisième workshop a été organisé à Paris (http://www.limsi.fr/aca/). Enfin, en 2010, c’est Lille qui va accueillir la quatrième édition du workshop (http://www2.lifl.fr/waca2010).
Les travaux récents et originaux de la communauté francophone décrits dans les quatre articles de ce numéro illustrent bien les recherches pluridisciplinaires des agents conversationnels animés.
Le premier article intitulé « Greta, une plateforme d’agent conversationnel expressif et interactif » présente une architecture générique, modulaire et interactive pour un agent conversationnel animé appelée Greta. Celle-ci est un agent capable de communiquer avec des utilisateurs de façon verbale et non verbale comme le regard, les mouvements de la tête et du torse, les expressions faciales et les gestes.
L’architecture respecte le standard SAIBA qui définit la modularité, les fonctionnalités
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com
750 RSTI - TSI – 29/2010. Agents conversationnels animés
et les protocoles de communication pour les ACAs. Les auteurs présentent l’architecture, les tests de performance ainsi que plusieurs applications interactives.
Le deuxième article, « Diva, une architecture pour le support des agents gestuels interactifs sur internet », présente une architecture orientée web pour le support de la déictique interactive ainsi que des agents virtuels s’exprimant en langue des signes.
L’architecture proposée est fondée sur des agents virtuels intimement intégrés à la structure document object model (DOM), inhérente aux pages Web. Dans cette étude, le logiciel est utilisé aussi bien dans le contexte des Signeurs Virtuels que celui de la langue vocale. Deux études de cas sont présentées : premièrement la question de la coarticulation dans la génération dynamique de phrases en langue des signes, deuxièmement les distinctions dans la manière dont les déictiques sont réalisés dans les deux contextes de la langue orale et de la langue des signes.
Le troisième article s’intitule « Prosodie expressive audio-visuelle de l’interaction personne-machine. Etats mentaux, attitudes, intentions et affects (Feeling of Thinking) en dehors du tour de parole ». Il décrit une méthodologie empirique d’éthogrammes pour étudier les informations données à propos des états mentaux et affectifs, appelés « Feeling of Thinking » (FoT). Des tests perceptifs de certaines « icônes gestuelles » sont ensuite décrits : d’une part les icônes gestuelles proprement dites, sous leur forme dynamique, mais aussi pour chacune l’extraction d’une image statique.
Le quatrième article, « Discrimination perceptive d’expressions émotionnelles actées vs. spontanées. Variabilité interindividuelle et influence de l’intensité de l’émotion », présente les résultats d’une expérience de discrimination de parole expressive multimodale actée vs. spontanée. Des énoncés ont été produits spontanément par 4 locuteurs francophones piégés dans une tâche de Magicien d’Oz ; ces locuteurs, par ailleurs acteurs, ont ensuite simulé l’expression des mêmes affects dans un protocole supposé optimal pour la comparaison de l’expressivité actée et spontanée.
JEAN-CLAUDE MARTIN
JEAN-PAUL SANSONNET
LIMSI-CNRS
Cet article des Editions Lavoisier est disponible en acces libre et gratuit sur tsi.revuesonline.com