• Aucun résultat trouvé

Chapitre 2. Les fonctions socio-affectives de l’interaction en phonostylistique

III. Prosodie

Fonagy [1983a] est un des pionniers dans l’observation de la voix émotive et l’émotivité dans ses œuvres s’exprime par le terme de vivacité de la voix. Le style vocal est donc la charge émotive que l’on donne à la voix en prononçant un message. Fonagy [1983a] décide de définir le style vocal de manière simple en rapportant le terme à une

manière à parler, façon de s’exprimer. Ainsi, deux messages entièrement identiques au

niveau de la forme et du contenu auront des styles différents selon la personne qui pro- nonce le message et la situation dans laquelle le message est prononcé. Il a été constaté que non seulement la charge émotive de l’énoncé existe, mais elle est dépendante du locuteur et de la situation d’énonciation. Fonagy [1983a] annonce également que « deux sons peu- vent être identiques dans la mesure où ils représentent le même phonème, et différents puisqu’ils comportent, en tant que gestes vocaux, deux messages divergeant : menace et caresse, tristesse et joie, etc. » Il revient à considérer que le message transmis n’est jamais neutre et indépendant de l’attitude qu’une personne a sur l’objet du message ou sur son interlocuteur. Campbell [2004] démontre que le style d’expression dépend de trois fac- teurs : le locuteur, l’interlocuteur et l’événement expressif. Ainsi, deux locuteurs exprime- ront différemment un même énoncé selon l’affect qu’ils approuvent par rapport à l’objet de l’énoncé, mais également un locuteur n’exprimera pas de la même manière un énoncé avec une charge affective selon l’interlocuteur qu’il a en face. Ainsi, l’expressivité dans le mes- sage dépend également du degré de familiarité que le locuteur a avec son interlocuteur. Quand le locuteur parle à un interlocuteur qui lui est familier, il peut montrer plus de sen- timents et donc peut s’exprimer en laissant apparaître dans sa voix plus d’affects sociaux. Mais où exactement dans la parole se crée le style vocal ? Comment le locuteur comprend qu’à part un message, son interlocuteur lui transmet une information secondaire d’ordre émotif ? Selon Fonagy [1983a] l’expression des attitudes de manière indirecte dans la pa- role n’est possible que par la voix et plus particulièrement par l’intonation de la voix qui est scientifiquement appelée la prosodie. Fonagy et al. [1983b] élaborent même onze cli- chés mélodiques qui représentent les analyses par rapport à la mélodicité de onze énoncés très utilisés dans le quotidien des gens pour des situations bien précises comme par exemple la salutation d’une vendeuse quand quelqu’un rentre dans un magasin, la moque- rie enfantine, etc.

La prosodie est un des principaux moyens de rendre le signal de parole plus affec- tif. Néanmoins, c’est un concept de la phonétique et de la phonologie qui est relativement peu étudié par rapport aux autres composantes du signal vocal. Selon Aubergé [2002a] la prosodie a de multiples fonctions qui sont observables au niveau de l’expression linguis- tique (intonation, focalisation, modalisation), de la pragmatique (intensions et attitudes) et des différences idiolectales (âge, genre, personnalité, émotion, etc.). La prosodie est donc une composante complexe qui fait partie des éléments suprasegmentaux qui se rajoutent au signal de parole et qui sont porteurs d’information attitudinale supplémentaire (et contras-

tive dans le cas de l’ironie) au message transmis. Aubergé [2002a] affirme que « la mor- phologie prosodique des attitudes est toujours calée sur des événements du discours, tandis que la prosodie des expressions est régie par les événements de l’écologie du locuteur qui introduisent chez lui des changements de ses états émotionnels. »

La prosodie est communément caractérisée par une variation dans la fréquence fondamentale, la durée et l’intensité du signal de parole. Néanmoins, ces trois paramètres prosodiques ne sont pas suffisants pour expliquer la vivacité de la voix, c’est-à-dire l’expressivité de la voix. Campbell et Mokhtari [2003] étudient ce qu’ils appellent la qua- trième dimension prosodique de la voix (« the 4th prosodic dimension »), à savoir la quali- té de voix (ou phonation glottale). Selon ces auteurs, la qualité de voix apporte des infor- mations paralinguistiques indépendamment des autres paramètres de la prosodie et elle est en corrélation forte avec l’interlocuteur, la manière de s’exprimer et avec l’acte de com- munication. Selon Giovanni [2011] la qualité de voix est une composante auditive produite par le timbre, le mode phonatoire et les caractéristiques phonatoires propres à chaque locu- teur et la qualité de voix peut fournir au locuteur des renseignements sur les caractéris- tiques diastratiques de son interlocuteur comme l’âge, le genre, la taille, le caractère, le statut et l’état d’esprit au moment de l’interaction. La qualité de voix définit donc le style expressif d’une personne. Par exemple, quand un locuteur entend une voix qui lui est fami- lière, il est capable de reconnaitre la personne derrière cette voix grâce à son style.

La prosodie expressive porte de l’information qui est souvent considérée comme secondaire, paralinguistique ou métalinguistique, mais Sasa et Aubergé [2014] supposent que la prosodie est constituée d’objets communicatifs et c’est justement ces objets primitifs qui créent ce qu’elles appellent la glu socio-affective, c’est-à-dire l’attachement émotionnel social.

Il a été démontré à travers les différentes études du domaine de la phonostylistique que l’expression vocale ne transmet pas seulement un message porteur de sens, mais elle évoque des informations qui vont au-delà de la simple information sémantique transmise. L’expression affective est donc due à l’émotion ou bien aux affects sociaux et elle est ren- due visible à travers la prosodie affective.

Conclusion sur « Bref survol de l’état de l’art »

La plus grande partie des études sur l’interaction homme-machine est focalisée sur l’interaction spontanée avec les humains à court terme concernant une tâche spécifique effectuée par le robot. Quoiqu’il en soit, l’interaction est une composante-clé pour les ro- bots sociaux. Bien que la plupart des théories concluent que pour pouvoir interagir avec l’humain, le robot doit avoir des caractéristiques humaines, nous nous orientons plus vers les conclusions des études qui soulignent que ce n’est pas la morphologie du robot qui est importante pour que le robot soit perçu comme un acteur social, mais sa capacité d’interagir. Nous pensons que l’interaction vocale est le paramètre qui permet de créer l’attachement au fur et à mesure de l’évolution temporelle de l’interaction. Dans l’approche empirique, les observations effectuées sur l’interaction entre un robot et la per- sonne se focalisent soit sur les performances de ce robot, soit sur la perception de l’humain par rapport au robot. Ce qui nous intéressera par la suite dans cette étude est la nature de l’interaction entre un robot et l’homme et plus précisément la dynamique de cette interac- tion. Nous allons observer le système interactionnel comme une granularité émergente, une entité systémique, des composants qui sont les deux systèmes expressifs qui sont les deux interactants. L’interaction est ainsi analogue à une molécule qui se construit par granulari- tés successives sur les particules. Tout comme la molécule, l’interaction sera observée par rapport à l'environnement et par rapport au temps de l'observation et prenant les hypothèses méthodologiques que l’observation modifie le système observé (paradigme de Labov), que le contexte est modifié en boucle par le système. Nous pensons que les paramètres langa- giers de l’interaction co-évoluent avec la nature et la biographie de la relation. Autrement dit, les deux locuteurs participent dans la création de l'interaction et cette interaction n'est pas la même à sa fin par rapport à son début. Cela veut dire que si l’on observe l'objet phy- sique qui pour nous est le langage dans une autre dimension espace-temps, nous retombe- rons peut-être sur d'autres données d'observation. La robotique sociale a un apport impor- tant sur l’observation du dialogue, parce que, comme cela a été démontré par les études citées précédemment, le robot social doit correspondre à un certain nombre de paramètres pour s’inscrire au mieux possible dans l’environnement écologique et social des humains, des paramètres qui ont des conséquences directes sur la forme de l’interaction socio- affective entre un humain et un robot. Le robot social, comme un système utilisant les mé- thodes de TAP (Traduction Automatique de la Parole), devient donc un outil permettant d’étudier l’interaction de manière contrôlée dans le but de pouvoir la modéliser.

Documents relatifs