• Aucun résultat trouvé

modalités tactiles et/ou auditives

C ONCLUSION SUR LES MAPPINGS SONORES

Précédemment, nous avons vu les limites des propriétés du son : intensité, fréquence, durée, différences interaurales de temps et d’intensité ; et les limites de la parole : champ auditif, dégénérescences liées à l’âge ou innées. Nous avons également vu les composantes et les dimensions composées d’un son : rythme, tempo, timbre, note, mélodie, azimut et élévation. Avec ces propriétés, il est possible de construire des « mappings sonores » afin de lier une information à un son. Toutefois, ces mappings nécessitent d’être appris par les utilisateurs avant toute utilisation. Enfin, ces mappings offrent de multiples façons pour encoder une information. En les combinant, notamment grâce à la sonification, les solutions sont encore multipliées.

Nous illustrons dans la suite, comment des interactions auditives permettent une transmission d’informations, et donc, sont des alternatives aux solutions déjà présentées.

2.2.4 Artéfacts technologiques pour produire des stimuli auditifs

Il existe des technologies capables de produire des stimuli nous faisant percevoir des sons :

 L’écouteur ou oreillette : dispositif contenant, dans la majorité des cas, un transducteur électrodynamique (en langage courant, une sorte de hautparleur miniature) que l'on place dans l'oreille ou que l'on accroche à celle-ci pour l'écoute de sons (voir Figure 2-13).

27

-56-

Figure 2-13 : oreillette monophonique Bluetooth (sans fil)(source : https://fr.wikipedia.org/wiki/écouteur)

 Le casque audio : composé de deux écouteurs, un pour chaque oreille. Les casques stéréo permettent de spatialiser les sons (voir Figure 2-14).

Figure 2-14 : Un casque audio des années 1970(source : https://fr.wikipedia.org/wiki/Casque_audio)

 Le hautparleur : transducteur électroacoustique destiné à produire des sons à partir d'un signal électrique. Il est en cela l'inverse du microphone (premier brevet en 1877 par Werner von Siemens). A la différence d’un casque stéréo, il est très difficile de spatialiser un son avec des hautparleurs, du fait qu’ils sont souvent loin de l’oreille, et aussi, que la position des utilisateurs, dans la pièce, change leur perception du son. Pour ce faire, il faut un système qui calcule la spatialisation du son, en fonction de la réflexivité de l’environnement, et de la position en temps réelle de l’utilisateur. Alors qu’avec un casque audio ces deux paramètres sont fixes (voir Figure 2-15).

Figure 2-15 à gauche : schéma de coupe d'un hautparleur ; à droite : un hautparleur. (source :

https://fr.wikipedia.org/wiki/Haut-parleur)

-57-

Dans cette section, nous synthétisons des mises en œuvre concrètes de l’auditif dans les situations interactives. Nous avons choisi de considérer trois catégories de situations interactives :

 Les IHM auditives cantonnées à une tâche d’estimation de valeur(s) de type stimulus- réponse.

 Les IHM d’assistance pour du guidage ou de la prévention.

 Les IHM auditives utilisant un mapping sonore pour des tâches de navigation, de sélection, de manipulation ou notification.

2.2.5.1 Interfaces auditives pour l’estimation de valeur

Les interfaces auditives, pour l’estimation, transmettent des informations selon les propriétés du son. L’efficacité des propriétés du son à transmettre des informations varient selon leur type et les caractéristiques physiques de l’environnement.

Dans le contexte spécifique d’estimation de distance, (Coleman 1963) a identifié cinq facteurs essentiels dans la perception d’une distance : l’intensité, la fréquence, la réverbération, les différences binaurales de temps et d’intensité. Puis, il s’ensuivit une longue discussion sur leur efficacité et l’environnement de contrôle. Par exemple, (Mershon and King 1975) étudièrent, en deux expériences, l’impact d’un environnement anéchoïque28 (ou non) sur l’estimation d’une distance, par les propriétés d’intensité et de réverbération. Il en est ressorti que l’intensité est une bonne propriété, pour l’estimation de distance. Cependant, dans le cas d’une estimation absolue, l’intensité initiale de la source sonore doit être connue par l’utilisateur, car sans ce repère, point de différence d’intensité et donc point d’estimation possible. De plus, ces études recommandent une différence de vingt décibels pour une perception optimale de la distance. (Mershon and King 1975) observèrent également que plus l’effet de réverbération est important, plus la perception de la distance sera grande. Cependant, l’utilisation de cette propriété nécessite un contrôle de l’acoustique du milieu, ce qui est rarement le cas en situation réelle (et ordinaire). Dans ce même contexte, (Talbot and Cowan 2009) ont réalisé une étude basée sur la fréquence, l’intensité et le rythme. Leurs conclusions sont les suivantes : la fréquence est la propriété la moins effective des trois ; la propriété « rythme » est plus effective que la propriété « fréquence » ; leur interaction « écologique » est la meilleure. Certes, mais quels sont ses paramètres ? (Talbot and Cowan 2009) ont décrit leur interaction écologique ainsi : plus l’intensité décroit plus la distance augmente, elle est bornée entre 60 et 80 dB et est

28

-58-

composée de sept niveaux ; de plus, la fréquence est modifiée selon la distance par un filtre passe bas, afin de simuler l’absorbation du son par l’air. Dans une deuxième expérience, ils combinèrent leurs deux meilleures techniques (rythme et écologique) et conclurent que cette combinaison était redondante et à peine meilleure que l’interaction écologique. Dans un autre ordre d’idée, les travaux de (Meijer 1992), décrivent la conception et l’évaluation d’un algorithme de rendu d’ « image sonore ». Ainsi, cet algorithme, baptisé « The vOICe » par (Auvray, Hanneton, and O’Regan 2007), est basé sur trois propriétés du son, liées à trois propriétés d’une image : fréquence, durée, intensité (resp. ligne de pixels, colonne de pixel, nuance de gris). Dans leur expérimentation, les utilisateurs devaient « estimer » une image avec du son. Dans les travaux de (Capelle et al. 1998), les auteurs proposent un prototype de rendu d’ « image sonore » basé notamment sur la fréquence de son, y figure également une comparaison entre leur prototype (bonne résolution du centre de l’image, i.e. un zoom) et celui de (Meijer 1992) (résolution totale satisfaisante de 64x64). Dans un contexte de transfert d’information, (Oh, Kane, and Findlater 2013) ont utilisé les modalités sonification et parole, afin de concevoir des techniques d’interaction permettant de dessiner à l’aveugle une figure géométrique (ovale ou rectangle). La forme était transmise par le son, plus précisément, par quatre propriétés d’un son : la fréquence avec une gamme de dix fréquences entre 246 Hz et 587 Hz) ; l’intensité composée de dix niveaux ; le timbre, ou plutôt la combinaison d’un signal pur en sinusoïde et d’un second en triangle dont le « mélange » variait selon si la cible était à gauche ou à droite ; le pan, qui est la balance des hautparleurs gauche et droit. Ainsi dans une première expérience, la fréquence était utilisée pour guider sur l’axe des ordonnées, tandis que l’axe des abscisses était assigné soit à l’intensité, soit au timbre, soit au pan. Les résultats de cette étude comparative montrèrent que la combinaison « fréquence + pan » était la meilleure. Cette combinaison fut comparée, dans une seconde expérience, à une interaction basée sur la parole. Au vu des résultats de cette étude complémentaire, les auteurs conclurent que les deux modalités (sonification et parole) étaient aussi bien l’une que l’autre, et offraient des avantages complémentaires, avec toutefois une meilleure appréciation de la part des sujets pour la sonification (« fréquence + pan »). D’autres travaux conduits par (Larsen et al. 2013), ont comparé, dans une tâche de localisation, trois interactions basées sur le pan (ou panning, balance des hautparleurs gauche et droit) et une interaction basée sur la fonction de

-59-

sonores par le corps d'un auditeur, qui permettent à l'être humain de localiser une source sonore, voir aussi https://fr.wikipedia.org/wiki/Hrtf). Les auteurs ont donc évalué des interactions reposant sur les différences interaurales de temps29 ou d’intensité (panning), et sur l’effet HRTF. Leur conclusion, basée sur des résultats significatifs, recommande l’utilisation de l’effet HRTF dans des techniques d’interaction destinées à des tâches de localisation de sources sonores. De plus, leur technique avec l’HRTF était plus précise et plus rapide pour une tâche de guidage en navigation.

En résumé, il est possible de transmettre des informations avec les différentes propriétés d’un son et même plusieurs informations en simultané avec un son. Ce dernier point est important, car nous utiliserons, nous aussi, les propriétés d’un son pour transmettre des séquences de couples d’information, où chaque couple est transmis en simultané (voir Deuxième étude : interactions non visuelles pour faciliter le rendu d’une séquence de couples direction-distance).

2.2.5.2 Technologies d’assistance auditives

Cette catégorie regroupe les techniques d’interaction basées sur des modalités auditives, et ayant au moins une fonctionnalité parmi les trois suivantes : alarme (signal avertissant d’un danger) ; alerte (signal invitant ceux qui le perçoivent à se tenir sur leurs gardes, à faire attention à quelque chose) ; assistance dans une tâche nécessitant la vue (recherche d’objet, navigation, etc.).