LA VOIX DE SYNTHÈSE : DE LA COMMUNICATION DE MASSE À L’INTERACTION HOMME-MACHINE. DIALOGUE AVEC LE MONDE
Clotilde Chevet
NecPlus | « Communication & langages » 2017/3 N° 193 | pages 63 à 78
ISSN 0336-1500
DOI 10.3917/comla.193.0063
Article disponible en ligne à l'adresse :
--- https://www.cairn.info/revue-communication-et-langages1-2017-3-page-63.htm ---
Distribution électronique Cairn.info pour NecPlus.
© NecPlus. Tous droits réservés pour tous pays.
La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage dans une base de données est également interdit.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
des environnements sonores
CLOTILDE CHEVET
La voix de synthèse : de la communication de masse à l’interaction
homme-machine.
Dialogue avec le monde
Alors que le consortium Voice annonce notre entrée dans le monde de l’Hypervoice, dans lequel la voix serait intégrée aux médias comme le texte et les images le sont actuellement, cet article propose d’explorer les enjeux communicationnels liés à cet outil tantôt biologique, tantôt synthétique.
Il s’agit de revenir sur l’évolution progressive de la place de la voix dans notre environnement sonore et de comprendre son passage du domaine public au domaine privé grâce à l’intégration de technologies interactives personnalisées. Nous adoptons pour cela une approche sémiologique de la construction d’une voix de synthèse et explorons les différents imaginaires entourant celle que l’on présente déjà comme l’interface ultime.
Mots clés : voix, mobilité, de- sign sonore, interaction homme-machine, imaginaires
INTRODUCTION. DE LA VOIX HUMAINE À LA VOIX DE SYNTHÈSE:LA DÉFINITION À L’ÉPREUVE DE LA MÉDIATISATION
Si la voix humaine a été examinée sous tous les angles par les philosophes et psychologues, les sciences de l’information et de la communication peinent encore à porter un regard scientifique sur ce qui semble être l’un des médias les plus naturels et les plus anciens de notre histoire. D’où la difficulté d’aborder cet objet désormais infra-ordinarisé1, comme s’il n’y avait plus rien à en dire au XXIe siècle, après 150 000 ans d’usage et d’observation. Pourtant, une oreille attentive entendra que la voix, loin d’être immuable, est en réalité historicisable et que chaque nouvelle ère apporte avec elle de nouveaux questionnements. En effet, grâce aux progrès technologiques et à l’évolution de la synthèse vocale, nous assistons aujourd’hui à « la fabrique de sons dans un monde où la voix fait corps autrement, fait plus ou moins corps avec notre chair »2. Nous constatons au fil des années l’évolution de la définition même de la voix, cette dernière s’échappant peu à peu de la sphère biologique.
1. L’infra ordinaire est décrit par Emmanuël Souchier comme « un phénomène d’impensé du texte, et plus généralement d’impensé des médiations, qui caractérise les pratiques de communication ordinaires et repose sur la mémoire de l’oubli » dans l’article « La mémoire de l’oubli : éloge de l’aliénation. Pour une poétique de “l’infraordinaire” », Communication & langages, 172, 2012, p. 3–19.
2. Anne Karpf,La voix : un univers invisible, Paris, Éditions Autrement, 2008, p. 8.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
Tout d’abord, l’invention du téléphone en 1876 a rompu un axiome de communication fondamental, celui selon lequel l’œil peut repérer l’origine d’un bruit si l’oreille peut l’entendre. En effet, avant cette invention, entendre des voix en l’absence de leurs locuteurs relevait de la folie ou du mysticisme. Or, ce nouveau média a élargi la portée de la voix en la séparant de son origine physique, son rayon d’action a cessé de se limiter aux possibilités de mobilité du corps. La portée de l’oreille a considérablement augmenté, instaurant ainsi une véritable rupture paradigmatique dans la façon d’appréhender non seulement le corps, mais aussi la communication. C’est pourquoi dans les premiers temps, cette voix qui voyageait par le biais d’un « simple fil » était pour beaucoup aussi effrayante qu’un fantôme.
De fait, les superstitions mystiques liées à la voix se sont greffées à la technologie. Philippe Baudouin, journaliste pour France Culture, l’explique ainsi :
« les techniques modernes de communication – le téléphone, la radio, le cinéma, la télévision, l’informatique, etc. – n’ont pas fait disparaître les fantômes. Au contraire, elles les ont amplifiés. D’une certaine manière, les machines n’ont fait que démultiplier les occasions pour les spectres de venir hanter nos vies »3. C’est pourquoi à l’origine, les journaux exprimaient de mauvais pressentiments face à cette invention. On pouvait ainsi lire dans leProvidence Press: « Il est difficile de résister totalement à la notion que les puissances du mal se sont liguées avec cette machine »4. Dans leScientific American, un autre journaliste décrivait lui aussi son malaise face au téléphone: « Je suis raisonnablement sûr de ma propre expérience matérielle. Je peux imaginer mon ami à l’autre bout de la ligne. Mais il y a entre nous un nulle part aérien, uniquement habité par des voix – que j’appellerais le Allôland. Les habitants vocaux de cette étrange région ont une évanescence remarquable »5.
Face aux nombreuses appréhensions suscitées par l’apparition du téléphone, la voix de l’opératrice a servi dans un premier temps à apaiser les craintes. De la même façon on remarquera, au cours de cet article, que la plupart des voix de synthèse sont aujourd’hui féminines, comme si la voix en changeant de nature avait conservé les valeurs qui y étaient associées. Dans son ouvrage, Anne Karpf explique que
« le téléphone inquiétait parce qu’il donnait à des voix étrangères un accès direct à votre oreille ; utiliser des femmes comme intermédiaires entre les mondes privé et public paraissait une sorte d’antidote. Appelées pour domestiquer le téléphone, elles ont aidé à le faire passer dans l’esprit du grand public du statut d’intrus de la technologie à celui de moyen de maintenir le contact social par la parole »6.
Par la suite, l’invention du disque et celle du magnétophone permirent de con- server la voix et de la restituer de façon différée : elle devint à la fois une empreinte et une signature sonore. Mais c’est l’ère du numérique et les progrès de la synthèse vocale qui achevèrent d’en faire un véritable objet de communication, indépendant des contraintes « humaines » que peuvent être le vieillissement ou la maladie. Au- delà de la performance technique qu’elle constitue, la voix de synthèse est devenue
3. « La chasse aux fantômes est une science ». Interview de Philippe Baudouin,Tryangle.fr, publié le 20 juillet 2014.
4. Article cité par Anne Karpf,La voix : un univers invisible,op. cit.
5.Ibid.
6. Anne Karpf,La voix : un univers invisible,op. cit., p. 394-395.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
un objet marketing identitaire, travaillé pour toucher efficacement son public et pour s’intégrer le mieux possible sur les nouveaux supports médiatiques. Ainsi, il est bien loin le temps où entendre des voix était signe de dérangement mental7. À présent, les voix de synthèse nous accompagnent partout, elles habillent nos quo- tidiens sonores dans le domaine tant public que privé. Les objets parlants quant à eux foisonnent et annoncent une nouvelle ère pour l’interaction homme-machine.
C’est pourquoi nous souhaitons replacer la voix de synthèse au cœur des enjeux communicationnels stratégiques dont elle est porteuse. Il s’agit d’interroger sa place dans notre environnement sonore et de comprendre son passage de la communication urbaine de masse à l’intégration de technologies interactives personnalisées. Ce faisant, nous verrons que même si le mode de production de la voix a changé, passant du biologique au synthétique, les angoisses et superstitions présentes à l’apparition du téléphone perdurent à l’ère de l’interaction homme-machine, voire connaissent un renouveau.
La voix est peut-être toujours ce « phénomène inthéorisable », comme la décrivait Barthes, ce « lieu privilégié de la différence qu’aucune science n’épuise »8. Il nous faudra alors faire appel aux imaginaires pour comprendre les contradictions qui la composent, comprendre le lien si particulier qui nous unit à cet objet facteur de lien, générateur de présence ou lieu criant de l’absence lorsque la voix s’éteint.
Nous verrons donc dans cette étude comment la voix a investi le domaine public pour ensuite se glisser au cœur de nos foyers et faire parler notre environnement en donnant vie à l’inanimé. Nous verrons également comment ce passage du domaine public au domaine privé a contribué à faire évoluer l’usage de la voix d’une fonction utilitaire à une visée relationnelle.
LA VOIX DE SYNTHÈSE AU SERVICE DE LA COMMUNICATION URBAINE DE MASSE
La voix, un élément de design sonore au service de la mobilité
On ne saurait parler de la voix de synthèse sans évoquer tout d’abord la fameuse voix de la SNCF ou encore celles devenues presque familières de nos GPS. Or, il n’est pas anodin que ces voix soient les premières à nous venir à l’esprit. En effet, les voix de synthèse sont en premier lieu utilisées en situation de mobilité, et ce pour des raisons aussi pratiques que physiques.
Dans nos sociétés hypermobiles, l’audio, et donc la voix, sont les formats médiatiques les plus adaptés au mouvement. La lecture d’un texte est contraig- nante, elle mobilise le corps tout entier : les mains tiennent parfois le support, le regard est nécessairement tourné vers celui-ci, et l’individu doit se tenir à proximité afin que le texte soit lisible pour lui. Le corps est donc captif de l’activité de lecture. À l’inverse, l’audio est compatible avec la mobilité des usagers ; le premier média consulté en déplacement est aujourd’hui encore la radio. On peut d’ailleurs se rappeler l’époque des premiers transistors, que les jeunes transportaient déjà partout avec eux. Dans une interview, Xavier Nouaille,
7.Ibid., p. 393.
8. Roland Barthes, « La musique, la voix, la langue »,L’obvie et l’obtus. Essais critiques III[1972], Paris, Seuil, 1982, p. 247.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
directeur du Développement de la diffusion chez Radio France, explique que « La radio, c’est la mobilité de la réception, c’est le fait d’être libre, d’écouter ce qu’on veut là où on est, avec l’outil qu’on a »9. L’audio, c’est donc avant tout la liberté de mouvements, la possibilité de prendre connaissance d’informations tout en continuant nos déambulations quotidiennes.
Or, nous sommes en permanence plongés dans un univers sonore riche et complexe, dont le moindre son nous renseigne sur ce qui nous entoure, sur un écosystème, une société, une époque et ses pratiques. On le voit par exemple dans le remarquable travail de reconstitution de l’ambiance sonore du quartier du Grand Châtelet à Paris au XVIIIesiècle par la musicologue Mylène Pardoen10. Ses travaux nous montrent que la plupart des sons peuvent acquérir une valeur informationnelle. Lorsque qu’on se penche d’un peu plus près sur cet univers sonore dans lequel nous sommes plongés, on réalise que celui-ci n’est pas que chaotique et hasardeux mais bien structuré et ce depuis longtemps. Ivan Illich le montrait bien dans son article « Le haut-parleur sur le clocher et le minaret » avec sa description des cloches de l’église du village. Il évoquait alors le « manteau acoustique » dont les cloches dotaient chaque paroi, leurs pouvoirs curatifs, les légendes auxquelles elles étaient attachées mais également les repères qu’elles donnaient aux passants tout au long de la journée.
Sans surprise, les entreprises de transports ont été parmi les premières à se saisir des opportunités offertes par le son pour orchestrer les déplacements dans l’espace urbain. Bien avant de s’attaquer au chantier de la voix de synthèse, la RATP s’est tout d’abord attachée à élaborer les signaux qui devaient guider les usagers au cours de leurs trajets selon les principes du design sonore. Développé à partir des années 1980, ce concept a amené avec lui tout un ensemble de nouveaux outils :audio branding,conception d’ambiances, marketing audio. . .Dès les années 1990, la RATP a ainsi sollicité un compositeur, une psychosociologue ainsi qu’un technicien du son pour concevoir le signal sonore du passe Navigo. Bernard Delage, le responsable de l’opération, a travaillé sur trois signaux : « Le premier, qui accueille les détenteurs d’une carte valide, est bref, avec un peu de réverbération pour donner de la douceur. Il vous souhaite la bienvenue. Il est aigu car il dit oui.
Et dans oui, il y ai. Et leiest aigu. CQFD. Le troisième vous informe que votre carte est périmée : c’est un refus. Timbre irrité, rugueux, plus grave. Il y a du “on”
de non dans ce son. Et le deuxième ? Celui-là vous alerte ; votre carte doit bientôt être rechargée. C’est un son hésitant, qui vous dit : “Quelque chose cloche” »11.
Petit à petit, la voix de synthèse est ensuite venue se greffer sur ces sons préexistants, donnant un souffle nouveau au design sonore. Pour les entreprises de transport comme la SNCF, l’enjeu était de taille puisqu’il s’agissait de gérer la mobilité de millions de voyageurs empruntant chaque jour un réseau de transports en commun déployé sur 30 000 km de lignes. La voix de synthèse est venue
9. « La force de la radio, c’est le contenu et la mobilité – Entretien avec Xavier Nouaille, directeur du développement de la diffusion chez Radio France », https://www.ina-expert.com/, mis en ligne en janvier 2013.
10. Laure Cailloce, « Écoutez le Paris du XVIIIesiècle », https://lejournal.cnrs.fr/, publié le 16 juin 2015.
11. Nicolas Delesalle, « C’est quoi ce bruit? »,telerama.fr, publié le 5 mai 2007.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
répondre à ce défi en proposant des solutions pratiques que la voix humaine ne permettait pas. Comme le montre ce témoignage du responsable des voix à la SNCF : « il faut bien comprendre que lorsque nous avons utilisé la synthèse vocale, c’était uniquement pour des raisons pratiques pour le réseau bus. Par exemple, avec la législation sur l’accessibilité au début des années 2000, il fallait que tous les bus soient sonorisés, ce qui représentait des milliers de noms de point d’arrêts à enregistrer dans un délai très court. Opter pour la synthèse vocale nous permettait alors un gain de temps considérable »12.
Par ailleurs, pour optimiser la transmission des messages dans ces lieux particuliers, les voix ont été travaillées afin de les adapter à leur environnement.
Par exemple, dans les couloirs du métro parisien souvent bruyants et stressants, les critères principaux sont « des voix calmes et articulées ». Il s’agit avant tout d’« améliorer tout ce qui serait relatif aux émotions et à l’orientation », explique Damien Masson, chercheur du Centre de recherche sur l’espace sonore et l’environnement urbain en mission à la RATP13. On remarque aussi que les voix de femmes ont longtemps été privilégiées par rapport à celles des hommes, car perçues comme plus audibles. Néanmoins, la parité est aujourd’hui respectée puisque chaque ligne de métro est désormais animée par une voix féminine et une voix masculine. Song Phanekham, responsable de l’Identité sonore et visuelle de la RATP, explique que l’on prête également attention à la musicalité propre des messages diffusés, que ce soit dans leur écriture (peu de personnes savent ainsi que la formule « attention à la marche en descendant du train » est un alexandrin), ou dans le ton et le timbre des voix utilisées. Tout est ainsi fait pour retenir l’attention des usagers et leur permettre de retenir plus facilement les messages.
Toutefois, si cette stratégie semble idéale sur le plan pratique, elle se heurte à l’imperfection des voix de synthèse. Comme l’explique Song Phanekham, « le problème, au-delà des problèmes de prononciation particulièrement sensibles sur les noms propres, c’est le manque de chaleur de ce type de voix. Le besoin d’information est satisfait, mais il manque ce petit supplément d’âme qui fait le charme des voix humaines »14.
D’où la décision de la RATP d’organiser en 2014 un grand casting pour revenir à des voix humaines. Ce pari de proposer un panel de voix variées, peu d’agences de transport le font aujourd’hui. À Lyon par exemple, la voix humaine est cantonnée aux annonces « inopinées », en cas de problème. Pour les autres annonces, Keolis, l’entreprise gestionnaire des transports en commun lyonnais, utilise une voix de synthèse pour informer ses usagers. De même, de plus en plus d’entreprises font le choix de recourir à une voix unique, de créer unepersonavocale, facteur d’identité sonore propre aux entreprises et aux lieux. On s’est ainsi progressivement éloigné de l’optique d’instrumentation informationnelle de la voix pour l’inscrire dans une stratégie marketing.
12. « Annonces sonores, opération de renouvellement des voix », http://scope.ratp.fr/annonces- sonores-operation-de-renouvellement-des-voix/, publié le 8 décembre 2014.
13. « Le marketing sonore envahit les villes »,Le Monde diplomatique, 713, 2013 , p. 12.
14. Ibid.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
La voix de synthèse au service d’une stratégie marketing
La SNCF a depuis longtemps intégré la nécessité de disposer d’une identité vocale forte. Dès 1983, le groupe dépasse la question purement informationnelle et décide d’habiller toutes ses gares de la voix désormais bien connue de Simone Hérault. L’entreprise l’a choisie pour incarner son identité sonore et a depuis souhaité « numériser cette voix unique pour la rendre éternelle »15 afin de la fondre définitivement dans l’identité du groupe, et ce malgré le vieillissement de sa propriétaire. Cette dernière considère d’ailleurs que la voix de la SNCF est aujourd’hui une entité qui « vit sa vie », mais sans elle16. La voix n’est alors plus seulement utilisée pour son aspect pratique, mais également pour son caractère unique. Elle devient la signature de l’entreprise, elle lui apporte une identité permanente, un genre, un âge, une personnalité. La voix inscrit également celui qu’elle incarne dans un contexte culturel et géographique particulier.
Tout comme la SNCF, de nombreuses entreprises et institutions ont fait le choix d’une voix féminine. Au-delà de l’argument pratique selon lequel elle serait plus audible, elle permettrait aussi de séduire un plus large public. La voix féminine serait « plus plaisante » à l’oreille. Pour Clifford Nass (université de Stanford), spécialiste de l’interaction homme-machine, « il est beaucoup plus facile de trouver une voix féminine que tout le monde appréciera qu’une voix masculine »17. Cependant la raison n’en serait pas uniquement psychologique.
Elle serait également historique. En effet, durant la Seconde Guerre mondiale, les avions de combat étaient équipés d’appareils de navigation dotés de voix féminines, afin de permettre de les distinguer facilement des voix des copilotes.
Aujourd’hui encore, on utilise des voix féminines dans les cockpits, en particulier pour les alertes – les pilotes l’appellent d’ailleursBitching Betty. De plus, le fait que l’assistance technique des opérateurs téléphoniques ait souvent été confiée à des femmes aurait également « habitué les personnes à être aidées par une voix féminine désincarnée »18.
Toutefois, l’élaboration et le choix des voix reposent aussi sur des imaginaires plus profonds et des mythes anciens souvent exploités par les médias : laséduction, héritée de la légende des sirènes (un imaginaire exploité par le téléphone rose ou encore par les applications de rencontres basées sur la voix). L’autorité, présente dans de nombreux passages de la Bible dont le livre de Jérémie de l’Ancien Testament, « Écoutez et obéissez à ma voix, et je serai votre Dieu, et vous serez mon peuple » (Jérémie 7:23) ; on retrouve notamment cette dimension avec la voix de Golsdtein dans1984d’Orwell, ou, dans un autre style, avec la voix de Big Brother dans l’émission de téléréalitéLoft Story. Latransmission de savoir,incarnée par exemple par la voixoffdans les documentaires. Enfin, lecaractère humainde la
15. « SNCF, la voix des gares », https://www.voxygen.fr/content/sncf-la-voix-des-gares.
16. « Voix off : enquête sur un imaginaire sonore hyper codé », http://www.lesinrocks.com/
2010/04/08/medias/tele/voix-off-enquete-sur-un-imaginaire-sonore-hyper-code-1132171/, publié le 8 avril 2010.
17. « Pourquoi la plupart des ordinateurs ont une voix féminine », http://www.slate.fr/lien/
45401/ordinateur-voix-masculine-feminine-siri, publié le 24 octobre 2011.
18. Ibid.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
voix. Pour Jean Abitbol, ORL et phoniatre, auteurde L’Odyssée de la voix, « l’Homo sapienspourrait très bien s’appeler Homo vocalis car il est le seul être vivant à pouvoir véritablement parler »19. Ainsi dans la Bible, à une phase intermédiaire de sa formation, Adam n’est qu’un golem. Il ne devient un homme que lorsqu’il reçoit le souffle de Dieu et que ce dernier lui donne la parole. La voix telle que nous la connaissons serait donc un instrument propre à l’être humain, variant d’un individu à l’autre et lui donnant son caractère unique. C’est en cela qu’elle apporte une plus-value essentielle pour une entreprise : elle réduit le sentiment d’altérité et produit une sensation de proximité, elle donne du corps au lointain et à l’immatériel.
Cet imaginaire de l’humain est sans doute le plus puissant et le plus exploité.
On le retrouve fréquemment dans les discours d’accompagnement des dirigeants d’entreprises de synthèse vocale. Ainsi, pour Antoine Sapin, co-fondateur de l’agence Cadence : « il est bel et bien fini le temps des marques inaccessibles, sourdes et muettes. En un mot : elles s’humanisent »20. Il est cependant intéressant de constater un paradoxe : si les marques s’humanisent, elles n’utilisent pas pour autant des voix humaines, mais bien des voix de synthèse. Pour la première fois on ne recherche plus la personne qui nous représentera le mieux, mais on crée de toutes pièces une voix sur mesure : féminine, masculine, jeune, enjouée, sérieuse.
Acapela Group, autre entreprise spécialisée dans la synthèse vocale, propose quant à elle de « créer une voix de synthèse sur mesure, qui ne ressemble qu’à vous, porte vos couleurs et joue à plein-temps le rôle de porte-parole auprès de tous les points de contact audio ! »21.
Il devient alors intéressant pour les sémiologues que nous sommes d’entrer dans le détail de la construction d’une voix. En effet, il ne s’agit plus de sélectionner une voix externe préexistante, mais bien de créer un objet original grâce aux technologies de synthèse. La voix est alors décomposée en différents éléments qui ont chacun leur fonctionnalité sur le plan communicationnel. Pour Alain Delbe, psychologue, la voix peut être envisagée selon les méthodes propres à la linguistique. En effet, chaque composant de la voix peut être considéré comme un signifiant, puisque « la communication vocale utilise certains éléments comme la prosodie, le rythme, dont chaque combinaison va constituer un signe vocal pour signifier une émotion : colère, joie, chagrin. . .»22. Chacun de ces éléments sera choisi avec soin pour représenter une institution et faire vivre sa parole au quotidien.
C’est le choix qu’a fait la Ville de Paris en signant en février 2016 un contrat avec l’agence de synthèse vocale Voxygen. L’objectif est de doter la capitale d’une identité vocale spécifique, que l’on écouterait dans un premier temps sur les sites
19. « Voix, Parole et Langage », dossier 27, www.mutuelles-presence.fr.
20. « Le son, parent pauvre de la communication de marque. Pourquoi ? », http://www.marketing- professionnel.fr/tribune-libre/pourquoi-son-parent-pauvre-communication-marque-09-2010.html, publié le 7 septembre 2010.
21. Site officiel d’Acapela, onglet « Voix », http://www.acapela-group.fr/voices/custom-voice-creation/?
lang=fr.
22. Alain Delbe,La voix contre le langage, Paris, L’Harmattan, 2014, p. 19.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
officiels de la ville. L’agence se donne pour objectif de donner « de la couleur et du relief à vos contenus, en vous proposant des voix adaptées à votre contexte, à vos besoins, en cohérence avec votre stratégie de communication, jusqu’à la définition de votre propre identité vocale »23. La ville se pare alors de couleurs et de sonorités qui lui sont propres et offre un nouveau « visage » à ses visiteurs.
Voix de synthèse & urbanisme : pour une ingénierie de l’enchantement
Tel est bien l’objectif poursuivi par les entreprises qui utilisent la voix de synthèse dans l’espace urbain : proposer une nouvelle expérience, donner une identité, un « supplément d’âme » à ces lieux de passages souvent froids et impersonnels.
Dans l’immense labyrinthe d’espaces que constitue une ville, les voix donnent une personnalité et un peu d’humanité à chacun des lieux traversés par les individus qui y évoluent. Elles contribuent à créer un effet de présence là où les bornes automatiques deviennent parfois plus répandues que les êtres humains. En se greffant sur les sons préexistants de notre univers sonore, la voix de synthèse a donc proposé une façon différente de vivre la ville et a tenté de répondre au manque de présence humaine dans un espace urbain sémiotiquement surchargé.
Un passage deNuit d’ambre, de Sylvie Germain, illustre tout particulièrement bien ce sentiment. Le narrateur y décrit le ressenti du personnage principal face à son environnement : « C’était ainsi qu’il ressentait la ville : comme une innombrable lettre folle adressée à personne, à tous, à l’absence. Tous ces panneaux géants affichant avec force couleurs les publicités les plus criardes et racoleuses, et ces kiosques à journaux couverts de titres et d’images qui changeaient chaque jour, à qui s’adressaient-ils sinon à des passants pressés, distraits ? »24. Face à cet anonymat dans lequel plonge la communication textuelle massive en milieu urbain, le personnage de Sylvie Germain tente de résister, voire de survivre, en procédant ainsi : « Jasmin toujours lisait ces plaques lorsqu’il en croisait une ; il lisait ces noms à voix haute. Pour les arracher au mutisme des murs, à la surdité de la pierre et du marbre »25.
Peut-être est-ce dans un même élan de résistance à la froideur des villes que la voix de synthèse s’est progressivement intégrée dans notre environnement sonore quotidien, des passages pour piétons aux traditionnelles bornes automatiques. En s’élevant, la voix produit un effet de présence et donne vie à des paroles écrites dans un passé plus ou moins proche. En effet, si nous nous intéressons ici à la voix en action, nous n’oublions pas cependant que les messages diffusés par les voix de synthèse ont été écrits en amont par des auteurs absents au moment de la diffusion. C’est précisément le paradoxe de l’écriture décrit par Ricœur dans Du texte à l’action. Essais d’herméneutique II: « le lecteur est absent à l’écriture ; l’écrivain est absent à la lecture ». Mais l’auteur décrit également le phénomène inverse observé lors de l’utilisation de la voix, « cette relation de dialogue qui noue immédiatement la voix de l’un à l’ouïe de l’autre »26. D’où notre hypothèse selon
23. Voix sur mesure – site officiel de Voxygen, https://www.voxygen.fr/content/voix-sur-mesure 24. Sylvie Germain,Nuit d’ambre, Gallimard, 1987, p. 200.
25. Ibid., p. 201.
26. Paul Ricœur,Du texte à l’action. Essais d’herméneutique II, Seuil, coll. « Esprit », 1986, II, 1, « Qu’est- ce qu’un texte ? », p. 139.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
laquelle, lors de l’élaboration d’une voix de synthèse, on construit non seulement une personnalité, mais aussi un lien, voire une sorte de rencontre.
Cependant, cette présence artificielle peut se révéler décevante, incarnée par une voix qui est là un moment et qui disparaît l’instant d’après, s’efface, se perd dans le bruit ou à cause d’une mauvaise transmission, comme pour rappeler le fadingde la voix décrit par Roland Barthes dansLe discours amoureux.Comme l’écrit l’auteur « C’est la voix qui supporte toute la disparition, l’évanescence de l’être »27, cette voix distante qui peut s’éteindre d’un moment à l’autre et de semi-présence passer à un état d’absence absolue. Dans ce même texte, Barthes citeDu côté des Guermantes de Proust, qui peut-être décrit le mieux le sentiment que l’on peut ressentir face à cette semi-présence. Dans ce passage, Proust décrit un échange téléphonique en des termes qui pourraient aujourd’hui exprimer le sentiment produit par les voix de synthèse qui habillent la ville :
« Je sentais mieux tout ce qu’il y avait de décevant dans l’apparence du rapprochement. [. . .] Présence réelle que cette voix si proche – dans la séparation effective ! ».
Néanmoins, si l’on échoue à créer une présence humaine directe, les objets peuvent prendre le relais. Des promeneurs ont ainsi pu entendre des confessions amoureuses chuchotées dans diverses langues au parc Montsouris, grâce au travail de sonorisation d’une dizaine de bancs publics réalisée par l’artiste Christian Boltanski. Il suffisait au flâneur de s’asseoir, de fermer les yeux, et de s’imaginer plonger doucement au cœur duColloque sentimentalde Verlaine : « Dans le vieux parc solitaire et glacé, Deux spectres ont évoqué le passé. . .».
Cet événement illustre le concept développé par Yves Winkin dans son article
« Reconsidérer le piéton en ville : pour une ingénierie de l’enchantement ». Il s’agit de développer une stratégie pour ré-enchanter le cadre de vie urbain, pour réintroduire du plaisir, de la magie dans la pratique de la ville au quotidien. Un travail de mise en scène de la ville et de ses espaces s’accomplit et il se dessine alors une « cartographie sonore » des lieux. Les voix se mêlent ainsi au sein de la ville : voix institutionnelles, voix des entreprises mais également voix des visiteurs passés. En effet, avec l’apparition d’applications telles que Bobler, les individus peuvent avoir accès aux témoignages des voyageurs qui les ont précédés, comme un gigantesque livre d’or sonore. Pierre Brouder, fondateur de cette application, est persuadé que « l’avenir de l’information se situe dans la découverte de contenu au moment précis où il est le plus pertinent, c’est-à-dire lorsqu’il concerne l’endroit où l’on se trouve ». D’où l’idée de cet outil à la croisée des tendances médiatiques : un réseau social capitalisant à la fois sur la voix et sur la géolocalisation. Ainsi, chaque utilisateur de l’application peut enregistrer une « bulle de deux minutes » sur la place du Louvre pour raconter une anecdote que les visiteurs suivants pourront écouter lors de leur propre passage.
L’exemple de Bobler montre le rôle croissant d’un objet dans l’appréhension de notre environnement : le smartphone. Cet objet personnel semble être le pivot du passage de la communication de masse à l’interaction personnalisée. Il permet à
27. Roland Barthes,Le Discours amoureux.Séminaire à l’École pratique des hautes études, 1974-1976, Paris, Seuil, coll. « Traces écrites », 2007.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
la voix de synthèse des objets de rencontrer la voix humaine des utilisateurs et de glisser du domaine public au domaine privé.
LA VOIX DE SYNTHÈSE AU SERVICE DE L’INTERACTION HOMME-MACHINE
Le smartphone : porte d’entrée vers l’interaction
Le pari de Bobler sur la voix est en grande partie lié à l’explosion des ventes de smartphones ces dernières années. En France, l’évolution sur deux années a été spectaculaire : aujourd’hui, 65% des Français en possèdent un, pour 46% en 201428. Afin de répondre aux besoins d’utilisateurs en situations de mobilité et demultitasking, les commandes vocales se sont développées et ont offert un rôle inattendu à la voix dans la révolution numérique. Ainsi, la plupart des smartphones proposent la fonctionnalité « mains libres » grâce à laquelle l’individu écoute, parle et commande l’objet à distance. Cet élément,a priorianodin, ouvre en réalité la porte à l’interaction. Il nous met à distance de l’objet en supprimant le contact physique et nous incite à lui « parler ».
Certes, les interfaces vocales ne datent pas d’hier et une foule d’objets parlants ont envahi nos vies depuis un moment déjà, le téléphone en est d’ailleurs la figure de proue. D’objet de communication, il est passé au statut d’objet communiquant, réalisant ainsi le rêve à l’origine même de son invention, celui de faire un jour parler la machine. Le brevet d’invention du téléphone a été décerné en mars 1876 à Alexander Graham Bell. Or, les travaux de cet inventeur étaient encouragés depuis le début par son père, Alexander Melville Bell, lui-même passionné par les machines. Ce dernier était présent en 1845 lorsque Joseph Faber présenta Euphonia, sa machine parlante au public. Vingt ans plus tard, en 1863, il emmenait ses fils, dont Alexander, voir « l’homme mécanique », développé par Sir Charles Wheatstone, un automate très rudimentaire simulant une voix humaine. Durant l’été 1864, Alexander et son frère Melville construisirent à leur tour une machine parlante. On comprend donc que l’homme qui a conçu le téléphone comme une « machine à communiquer » était fasciné par l’idée de faire parler un jour la machine elle-même. Moins d’un siècle plus tard, la première horloge parlante était présentée au public, en 1936, par le service téléphonique anglais. En cette occasion, leNew York Timesavait résumé le sentiment général en un titre, une exclamation : « My God, it talks! ».
Depuis, ces objets sont partout, nous nous y sommes habitués et nous ne nous extasions plus devant les poupées bavardes ni devant les GPS. Mais la grande différence est certainement que depuis peu, la machine répond lorsqu’on lui parle.
En effet, parallèlement à la synthèse vocale s’est développée la reconnaissance vocale, pourtant considérée comme une utopie il y a à peine cinquante ans.
En 1969, John Pierce lui-même, à l’époque directeur exécutif des laboratoires Bell, disait de cette performance technique qu’elle était aussi improbable que de
« guérir le cancer ou d’aller sur la lune ». Aujourd’hui, l’homme a mis le pied sur la lune et la reconnaissance vocale a fini par intégrer la quasi-totalité des smartphones.
28. Rapport du Credoc « La diffusion des technologies de l’information et de la communication dans la société française », 2014.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
Ces progrès techniques ont permis l’apparition de nouveaux types de services sur les téléphones mobiles, dont les assistants personnels vocaux. Longtemps considérées comme des gadgets, ces applications sont la nouvelle coqueluche des grands groupes numériques. La plus célèbre est actuellementSiri, produite par Apple, mais il existe égalementGalaxy pour Samsung,Cortana pour Microsoft, Moneypenny pour Facebook ou encore Google now. . . D’après une étude de Gartner, une entreprise américaine de conseil et de recherche dans le domaine des techniques avancées, près de 40% des utilisateurs de mobiles aux États-Unis se servent actuellement d’un outil de reconnaissance vocale. Le cabinet prévoit que d’ici 2019, 20% des interactions des utilisateurs avec leurs smartphones s’effectueront par le biais d’un assistant numérique.
Cette innovation s’inscrit dans l’évolution globale des interfaces homme- machine. La reconnaissance vocale fait ainsi partie de ce que l’on appelle les NUI (Natural User Interface), qui désignent l’ensemble des technologies permettant à l’utilisateur d’interagir directement avec la machine. Le corps humain devient le seul et unique « contrôleur ». Ce type d’interface se rapproche petit à petit de l’interaction interpersonnelle en présence et fait appel non pas à notre connaissance technique du dispositif, mais à notre culture de la relation. En effet, les concepteurs de l’applicationSiridemandent à l’utilisateur de faire abstraction de la nature mécanique de leur interlocuteur et de parler à l’assistant comme il le ferait avec une personne: « Vous pouvez interagir avecSiricomme vous le feriez avec n’importe qui.Siricomprend non seulement ce que vous dites, mais aussi ce que vous voulez dire. Il va même jusqu’à vous répondre »29.
Il est important de comprendre que le développement de ce type d’applications crée un nouveau rapport à l’objet en introduisant en premier lieu un nouveau rapport à la voix. En effet, si nous sommes habitués à ce que les voix de synthèse incarnent les entreprises dans les lieux publics, elles restent malgré tout « distantes » car hors de contrôle. Or ce n’est plus le cas avec les assistants personnels, qui proposent désormais de s’approprier le service en choisissant la voix et en personnalisant l’interaction, afin de créer une relation. Ce changement de paradigme est majeur : on observe un tournant dans la conception de l’interaction homme-machine, facilité par la polysémie même du terme
« interaction », à la définition tantôt physique, tantôt sociologique. En passant du référentiel technique au référentiel social dans leurs conseils d’utilisation, les concepteurs ne proposent plus une interaction physique et utilitaire avec un objet, ils promettent une relation, basée sur la personnalisation et la personnification du dispositif.
Aux premiers jours de l’application, les voix étaient imposées et variaient selon les pays. La voix deSiriétait ainsi féminine aux États-Unis et masculine en France et au Royaume-Uni, ce qui n’avait pas manqué de soulever de nombreuses questions.
Mais depuis les dernières mises à jour, l’utilisateur peut choisir une voix d’homme ou de femme pour le « servir ». Plus encore, certains usagers ont développé un
29. Page « À propos de Siri – Assistance Apple – Apple Support » du site officiel d’Apple, consultée le 27 avril 2015.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
nouveautweak30afin de doterSiride différents accents. « Pour ajouter une touche exotique à la voix deSiri, il suffit d’installer le tweak et de choisir l’accent qui fera de votre Siri, une Canadienne, une Américaine, une Autrichienne ou encore une Italienne à l’accent napolitain! »31. En prenant le contrôle sur la voix de synthèse, l’utilisateur détermine la base de son échange avec l’assistant : ce dernier n’est plus un interlocuteur anonyme mais bien son assistantpersonnel. Un lien se crée également parce que l’utilisateur contribue à l’élaboration de sa machine. C’est ce que Shyam Sundar et Yuan Sun (université de Pennsylvanie) décrivent comme le
« syndrôme Ikea »: selon eux, le fait de participer à la construction de son propre robot humanoïde pousserait l’utilisateur à s’y attacher et à lui donner plus de valeur, et ce même si sa participation peut paraître dérisoire, comme le simple choix d’une voix.
Nous ne sommes plus dans la situation de la communication de masse où une voix de synthèse lointaine descend du ciel pour nous guider dans l’espace urbain. Au contraire, le rapport à notre environnement se fonde sur de nouveaux paradigmes, ceux de la liberté de choix, de la proximité, ainsi que sur la promesse faite par les concepteurs : celle de la conversation. Ce dernier principe suppose le partage d’une même temporalité entre deux acteurs et vient donc intensifier l’effet de présence déjà automatiquement engendré par l’usage de la voix. Comme l’explique Valérie Patrin-Leclère, « la conversation est la réactivation du modèle originel de l’échange interindividuel non médiatisé, c’est la promesse d’une communication “naturelle” qui se joue : la conversation est un retour aux sources de l’échange humain »32.
Nous avons ici affaire à un service à la croisée de progrès techniques et de pratiques sociales par ailleurs bien ancrées. Les assistants personnels numériques seraient le fruit de la rencontre entre la synthèse vocale, bien acceptée dans le milieu urbain, et les systèmes de chat et de messagerie instantanée désormais omniprésents sur nos smartphones. En effet, lors de l’échange, la voix de l’assistant s’élève de notre téléphone tandis que ses paroles sont retranscrites automatique- ment dans des bulles conversationnelles au design plus que proche des applications de messageries. Ce principe d’affordance favorise l’appropriation du dispositif et naturalise l’échange en lui donnant l’apparence graphique d’une conversation.
Vers un internet des objets hantés?
Nous apprenons donc progressivement à échanger à voix haute avec l’objet qui nous est le plus proche, considéré par certains comme une nouvelle prothèse33et
30. Letweak(tordre en anglais) est une application ou un petit logiciel qui permet de modifier iOS pour apporter aux appareils iPod, iPhone ou iPad des réglages supplémentaires, interdits ou oubliés par Apple, souvent dans le but de personnaliser ou l’optimisation du système.
31. « AnyVoice iPhone: Donner un des 40 Accents à la Voix de Siri », http://www.maxiapple.
com/2012/03/anyvoice-iphone-donne-40-accents-voix-siri-gratuit.html.
32. Valérie Patrin-Leclère, « La communication revisitée par la conversation »,Communication &
langages, 169, septembre 2011, p. 24.
33. Pierre Manière, « Le smartphone est devenu une “prothèse cérébrale” », http://www.latribune.
fr/technos-medias/le-smartphone-est-devenu-une-prothese-cerebrale-488713.html, publié le 5 juillet 2015.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
qui, pour les utilisateurs les plus connectés, ne quitte plus les sacs ni les poches, en ville comme à la maison. Enfin parvenue au seuil du domaine privé, la voix de synthèse continue sa progression et s’immisce en terre nouvelle, c’est-à-dire au sein même de nos foyers. C’est ainsi qu’Amazon et Google ont chacun lancé, en 2016, leur assistant vocal domotique pour commander les objets de la maison, des lampes au réfrigérateur en passant par la chaîne Hi-Fi.Alexa, l’assistant d’Amazon, possède plus de 500 fonctionnalités pour diriger notre intérieur ; elle veut se rendre « indispensable et omniprésente »34. Se concrétise alors la vision de David Rose, président fondateur d’Ambient Device, société qui intègre les technologies internet dans les objets du quotidien. Dans ses discours, il présente ses produits comme des objets enchantés, ou bien hantés si l’on en perd le contrôle, c’est selon. Ces objets parlants permettraient de « partager un sentiment de présence sans nécessiter d’actes de communication délibérés »35. Le simple fait qu’ils soient connectés avec le monde et aptes à nous parler suffirait à créer un effet de présence dans nos maisons, rôle que jouaient jusque-là la radio ou la télévision mises en sourdine pour tromper la solitude. Ces types de réflexions de la part de concepteurs sont fréquents et sont de bons exemples de ce que décrit le philosophe Hervé Fischer, dansLa pensée magique du Net(2014). Selon l’auteur, le digital raviverait nos croyances les plus archaïques. Il observe un retour généralisé de la pensée magique dans de nombreuses activités humaines – écologie, intelligence artificielle et robotique, astrophysique, biotechnologies, génétique, et tout particulièrement dans les technologies numériques de communication.
Ce phénomène est loin d’être nouveau : paradoxalement, le XIXe siècle,
« siècle du progrès », durant lequel ont été inventés le télégraphe puis le téléphone, a également été le siècle où la recherche parapsychologique a été la plus répandue. À cette époque, les médiums et les séances de spiritisme suscitaient l’intérêt des scientifiques, dont certains étaient persuadés que le télégraphe et le téléphone pourraient permettre de communiquer avec d’autres intelligences et même avec les morts. C’est par exemple le cas de Nikola Tesla et de ses tentatives de communication avec les Martiens ou encore celui de Thomas Edison qui voulait mettre au point une machine capable d’enregistrer la voix des morts, le
“nécrophone”36.
Selon les récits contemporains, les médiums n’hésitaient pas à utiliser des dispositifs techniques durant leurs séances. Le langage télégraphique de Samuel Morse aurait par exemple inspiré les « coups frappés » chez les Sœurs Fox. Dans sonHistoire du spiritisme, Arthur Conan Doyle raconte également comment les
« trompettes pour esprits » de l’appareil d’Edison étaient utilisées au cours des séances de spiritisme: « les cônes d’aluminium étaient utilisés lors des séances
34. « Comment Amazon a commencé à envahir nos foyers », http://www.slate.fr/story/116771/
comment-amazon-envahir-foyers, publié le 14 avril 2016.
35. Mélanie Rostagnat, « À part la radio et la télévision, je n’ai pas de contact », http://www.
lefigaro.fr/actualite-france/2014/08/18/01016-20140818ARTFIG00187–part-la-radio-et-la-television- je-n-ai-pas-de-contact.php, publié le 18 août 2014.
36. L’expression est de Philippe Baudouin, dans sa préface à: Thomas Edison,Le royaume de l’Au-delà, trad. de l’anglais, Éd. J. Millon, 2015.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
médiumniques pour amplifier la voix et aussi [. . .] pour former une petite chambre noire dans laquelle les véritables cordes vocales utilisées par l’esprit [pouvaient] se matérialiser »37. Le téléphone a donc été impliqué dans des recherches scientifiques à la croisée des sciences occultes et des télécommunications. Il s’agissait pour ces chercheurs passionnés d’étendre la capacité de cette nouvelle technologie capable de transmettre la voix à travers l’espace et le temps.
On retrouve aujourd’hui ce genre de quête au travers d’applications visant à échanger avec des personnes disparues ou des objets inanimés. La plateforme Eterni.me propose notamment aux internautes de fournir des données telles que des informations publiées sur les réseaux sociaux, des extraits de conversations ou le contenu d’emails personnels afin de créer un avatar qui les représentera après leur mort. Ce serait « comme avoir une discussion sur Skype avec le passé », peut-on lire sur leur site. Grâce à la synthèse vocale, on rend un souffle au défunt et l’on redonne vie aux mots du passé. On retrouve alors le pouvoir du son que décrivait Pascal Quignard dansLa leçon de musique: « Tout son ranime de la mort, restitue la merveille du souffle à des corps désertés par le souffle. Tout détourne du silence divin »38. Dans d’autres cas, la voix de synthèse vient animer les objets qui nous entourent, de notre frigo à notre smartphone, et nous poussent à leur prêter une intériorité. On comprend pourquoi David Rose parle de ses produits comme des objets enchantés, ou bien hantés.
En donnant une voix aux objets de notre environnement, les ingénieurs nous proposent de les considérer différemment, de faire l’expérience de parler à un Autre. Le fonctionnement technique de l’interaction homme-machine restant obscur pour la majorité les utilisateurs, il arrive que ceux-ci questionnent les assistants vocaux pour comprendre le monde comme si la machine était autre, comme si l’homme n’était pas à son origine.
DIALOGUE AVEC LE MONDE
Alors que l’homme est en train de donner la parole aux objets de son espace privé, on peut s’attendre à ce que la voix de synthèse effectue une ultime pirouette en réintégrant le domaine public, toujours en conservant ce mode conversationnel jusque-là réservé aux assistants personnels. En effet, des projets naissent peu à peu pour interagir avec le mobilier urbain par le biais du smartphone et ces derniers n’attendent plus que la voix de synthèse pour atteindre un certain accomplissement. Ainsi le projet Hello Lamp Post, créé en 2013 à Bristol et vainqueur de l’appel à projets Playable city. Déjà présent à Singapour, Tokyo et Austin, ce jeu « donne à prendre conscience de ce qui nous entoure », explique son concepteur Ben Barker du Pan Studio. Encore muet pour le moment, Hello Lamp Post permet d’échanger des SMS gratuits avec un lampadaire, une boîte aux lettres ou même un monument. Comme on peut le lire dans la description du projet,
« une discussion s’engage avec l’objet en question sur des thèmes aussi variés que l’avenir, les enjeux de société ou plus simplement sur l’environnement immédiat de l’objet. Les objets réveillés par Hello Lamp Post créent une conversation indirecte
37. Arthur Conan Doyle,Histoire du spiritisme, Paris, Dunod, 2013, p. 426.
38. Pascal Quignard,La leçon de musique, Paris, Gallimard, coll. « Folio », 1987, p. 73.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
entre ses différents interlocuteurs, en sachant rebondir sur des informations fournies par de précédents joueurs »39.
On peut alors assister à ce type de conversation avec un lampadaire :
- Bonjour, on ne s’est jamais rencontrés. Est-ce que je peux me permettre de te demander ce qui t’amène par ici ?
- Je suis simplement en train de rentrer chez moi. Il se trouve que tu habites sur le chemin !
- Ah d’accord ! La dernière personne à qui j’ai demandé cela m’a répondu « j’essaie de trouver la plus belle vue de Bordeaux ».
Ce jeu se donne la double ambition de changer le regard que les habitants ont sur leur environnement quotidien et d’en faire un espace interactif dans lequel évoluer en harmonie. On retrouve alors, viace biais technologique, une pensée ancestrale, d’apparence lointaine et opposée à notre culture, la pensée chamanique. En effet, quel but poursuivons-nous si ce n’est celui de communiquer avec le « Grand Tout », de faire parler le monde qui nous entoure, de le comprendre. Mais que comprenons-nous de ces objets auxquels nous prêtons des mots humains ? Finalement, peut-être n’avons-nous pas tant changé depuis ces temps anciens où les chamanes criaient dans les grottes afin que l’écho leur indique la présence d’esprits derrière les parois. Peut-être cherchons-nous toujours une présence dans ce qui n’est que le miroir de notre propre culture, dans une quête infinie de compréhension d’un monde qui demeure toujours aussi opaque malgré les progrès techniques. Ainsi, la description des cavernes du paléolithique par Pascal Quignard comme « des sanctuaires à images » mais aussi comme « des chambres à échos »40pourrait tout aussi bien décrire les objets parlants du XXIe siècle.
CONCLUSION
Ce panorama rapide des utilisations de la voix de synthèse dans notre environ- nement quotidien ouvre la porte à une réflexion teintée à la fois d’enthousiasme et d’inquiétude. On assiste en effet au développement de technologies qui viennent habiter voire parfois enchanter un environnement trop impersonnel. Comme le dit Anne-Christine Taylor-Descola, commissaire de l’expositionPersonaau musée du quai Branly : « Nous assistons au retour du non humain et paradoxalement notre monde est en train de se repeupler de présence »41.
En pénétrant le domaine privé, la voix de synthèse et les technologies interactives ont également fait naître de nouveaux questionnements éthiques.
Que nous proposent ces objets parlants ? Un nouveau mode d’action et d’accès à l’information ? En donnant le langage et la voix aux objets, la science nous propose en effet un dialogue avec le « Grand Tout », fait de données et d’informations, pas
39. Hello Lamp Post, https://semainedigitale.bordeaux-metropole.fr/hello-lamp-post.html 40. Pascal Quignard,La haine de la musique, Paris, Gallimard, coll. « Folio », 1996, p. 248.
41. « Persona, Étrangement humain – Bande-annonce de l’exposition », Publiée sur la plateforme YouTube le 25 février 2016.
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)
loin de l’hypothèse que formulait Umberto Eco : « Si Dieu existait, il serait une bibliothèque »42.
Mais si nous engageons le dialogue avec ces objets, est-ce vraiment pour répondre à une soif d’apprendre ou plutôt à un besoin viscéral de communiquer et d’exister ? En misant sur la fonction phatique du langage et sur l’oralité, les voix de synthèse touchent leurs auditeurs et les poussent à demander l’impossible à la machine. On est alors en droit de s’interroger sur notre rapport aux objets lorsque nous demandons le sens de la vie à un être inanimé et qu’il nous apporte une réponse, ou quand nous demandons un contact physique à un être virtuel et qu’il nous raconte la rencontre entre ces corps qui ne pourront jamais se toucher. À nous de ne pas ignorer le risque qu’énonçait le psychiatre Serge Tisseron, selon lequel
« les hommes finissent par préférer les illusions programmées avec des machines aux relations avec leurs semblables »43.
Bibliographie
Barthes Roland, « La musique, la voix, la langue »,L’obvie et l’obtus. Essais critiques III [1972], Paris, Seuil, 1982
Barthes Roland,Le Discours amoureux. Séminaire à l’École pratique des hautes études (1974- 1976), Paris, Seuil, coll. « Traces écrites », 2007
Conan Doyle Arthur,Histoire du spiritisme, Paris, Dunod, 2013
Fischer Hervé,La pensée magique du Net, Paris, Éditions François Bourin, 2014 Germain Sylvie,Nuit d’ambre, Paris, Gallimard, 1987
Karpf Anne,La voix : un univers invisible, Paris, Éditions Autrement, 2008
Patrin-Leclère Valérie, « La communication revisitée par la conversation »,Communication
& langages, 169, 2011
Quignard Pascal,La leçon de musique, Paris, Gallimard, coll. « Folio », 1987 Quignard Pascal,La haine de la musique, Paris, Gallimard, coll. « Folio », 1996
Ricœur Paul, « Qu’est-ce qu’un texte ? »,Du texte à l’action. Essais d’herméneutique II, Paris, Seuil, coll. « Esprit », 1986
Souchier Emmanuël, « La mémoire de l’oubli : éloge de l’aliénation. Pour une poétique de
“l’infraordinaire” »,Communication & langages, 172, 2012, p. 3-19
Tisseron Serge, Le jour où mon robot m’aimera. Vers l’empathie artificielle, Paris, Albin Michel, 2015
Winkin Yves,« Propositions pour une anthropologie de l’enchantement »,inNancy Midol, Paul Rasse et Fathi Triki (dir.),Unité-Diversité. Les identités culturelles dans le jeu de la mondialisation, Paris, L’Harmattan, 2001, p. 169-179
CLOTILDE CHEVET
42. Umberto Eco cité par Jean-Claude Zylberstein,L’événement du Jeudi, 9 avril 1998.
43. Serge Tisseron,Le jour où mon robot m’aimera. Vers l’empathie artificielle,Paris, Albin Michel, 2015.
◦
© NecPlus | Téléchargé le 05/09/2022 sur www.cairn.info (IP: 134.122.89.123)