• Aucun résultat trouvé

Chapitre 4 : Premiers pas avec le dispositif TheVIBE

4.1 Saccades vers une cible à l'aide du dispositif TheVIBE

4.1.4 Discussion

Dans cette expérience, nous avons testé l'effet d'un échantillonnage spatialement variant dans le dispositif TheVIBE sur les performances de sujets dans une tâche de "saccade" vers des cibles lumineuses.

Nous avons pour cela comparé les performances des sujets pour lesquels l'échantillonnage de l'image dans le dispositif était uniforme aux performances des sujets pour lesquels l'échantillonnage était spatialement variant. Par ailleurs, nous avons testé, chez les sujets utilisant un échantillonnage spatialement variant, l'effet du taux de magnification de l'échantillonnage.

4.1.4.1 Une tâche de saccade?

Le lecteur s'interrogera peut-être sur l'équivalence de notre protocole de test avec un protocole d'oculométrie standard. Notre tâche peut paraître en particulier moins contrainte qu'une tâche de fixation visuelle traditionnelle, à l'aide d'un eye-tracker par exemple, puisque le centre de fixation est défini à postériori pour chaque sujet, en calculant la moyenne de ses réponses.

Il n'en est rien : en effet, dans une tâche de saccade visuelle, la position de l'oeil est préalablement calibrée en demandant au sujet de "fixer", justement, une cible au centre de l'écran. Toutes les positions de l'oeil sont ensuite rapportées à cette position initiale. Rien ne dit pour autant qu'au moment de la calibration la cible était véritablement en coïncidence avec le centre "objectif" de la rétine, qu'il serait d'ailleurs délicat de définir. La seule différence, dans notre cas, est que la calibration, au lieu d'être réalisée une fois sur une cible arbitraire au début de l'expérience, est réalisée en calculant a postériori le barycentre de la position de toutes les cibles fovéalisées.

4.1.4.2 Principaux résultats

Dans cette expérience, nous mettons effectivement en évidence un effet du mode d'échantillonnage sur le comportement des sujets.

Les performances des sujets utilisant un échantillonnage spatialement variant (groupes "Log2" et "Log4") sont significativement meilleures que celles des sujets utilisant un échantillonnage uniforme. Le temps de réponse est pratiquement réduit de moitié : 10.25 ± 0.6 sec dans les groupes "spatialement variants" contre 21.5 ± 3.55 sec dans le groupe "uniforme". La précision passe quant à elle de 45 ± 5 pixels (soit environ 11° de champ visuel) dans le groupe "uniforme" à 28 ± 4 pixels (soit environ 7° de champs visuel) dans les groupes "spatialement variants".

Par ailleurs, le temps mis pour réaliser l'exercice d'apprentissage est également significativement plus court dans le cas d'un échantillonnage spatialement variant que dans le cas d'un échantillonnage uniforme. Dans les groupes "spatialement variants", le temps mis pour réaliser l'exercice d'apprentissage est de 21 ± 1 minutes en moyenne, contre 36 ± 5 minutes dans le groupe "uniforme".

L'effet du taux de magnification de l'échantillonnage spatialement variant, qui différencie les groupes "Log2" et "log4", est lui beaucoup moins net. Nous n'observons son effet que sur les durées

de l'exercice d'apprentissage : les sujets du groupe "Log4" mettent en moyenne 19 ± 3 minutes , contre 23 ± 4 minutes dans le groupe "Log2".

L'implémentation d'un échantillonnage spatialement variant dans le dispositif a donc un effet très marqué sur les performances des sujets. Avec un temps d'apprentissage réduit presque de moitié, les sujets bénéficiant d'un échantillonnage spatialement variant sont deux fois plus rapides et plus précis qu'avec un échantillonnage uniforme.

4.1.4.3 Analyse des résultats par des hypothèses externes

Un premier élément d'explication de ces résultats est que dans les "rétines" spatialement variantes, la densité d'échantillonnage au centre est plus importante (d'un facteur 2 ou 4 selon le groupe) que la densité des rétines uniformes. Il n'est donc pas étonnant que les sujets soit plus précis dans le cas spatialement variant que dans le cas uniforme. Il est curieux néanmoins que dans ce cas on n'observe pas de différence significative de précision entre le groupe "Log2" et le groupe "Log4". Par ailleurs, cette hypothèse rend difficilement compte de la différence observée sur les temps de réponse. Nous ne voyons en effet aucun argument qui permettrait de faire l'hypothèse qu'un sujet bénéficiant d'une rétine uniforme de meilleure définition aille plus vite dans une tâche de pointé. Cette possibilité pourrait néanmoins être testée expérimentalement en utilisant des rétines uniformes de densités variables.

Une deuxième hypothèse concerne la question de la résolution de l'oreille, l'idée étant que puisque la densité des échantillons est plus forte au centre, l'oreille entend mieux les variations sonores produites par le dispositif. Cette deuxième hypothèse est fausse car la définition des sources sonores est faite avant la modification de la position des échantillons pour réaliser un échantillonnage spatialement variant. Les sources sonores sont donc aussi différentiables les unes des autres dans le groupe uniforme que dans les groupes spatialement variant. Ce qui est vrai en revanche, c'est que, vu l'effet de loupe associé à l'échantillonnage spatialement variant, deux points de l'image aux centre de la rétine seront plus facilement discriminés dans ce dernier cas. Cette remarque est néanmoins totalement équivalente au point précédent.

La troisième hypothèse que nous proposons est que l'aspect spatialement variant de l'échantillonnage vient enrichir les contingences sensori-motrices liées au dispositif. Dans le cas uniforme en effet, lorsque je bouge la caméra, seule la fréquence et le panoramique du son change. Dans le cas spatialement variant en revanche, le nombre de sources activées change également, ainsi que la vitesse de variation du son, qui est maximale au centre de l'image. Cet enrichissement des contingences sensorimotrices est en particulier à même de fournir des indices supplémentaires concernant le centre du champ perceptif.

Si tel est le cas toutefois, la position des centres subjectifs des sujets dans les groupes spatialement variants doivent mieux coïncider avec le centre de l'image que dans le cas uniforme. Nous avons donc tracé sur un graphe la position des centres subjectifs des sujets en fonction de leur groupe ainsi que le centre objectif de l'image (fig 4.9). On observe qu'effectivement, la dispersion des centre subjectifs diminue entre les groupes "Unif", "Log2" et "Log4", et que ces derniers se rapprochent du centre objectif de l'image.

4.1.4.4 Analyse des trajectoires de la cible

Afin de mieux cerner les différences de performances entre les sujets, nous nous sommes penchés sur la trajectoire de la cible entre son point de départ et son point d'arrivé. Afin de dégager d'éventuelles tendances, nous avons tracé l'ensemble des trajectoires de toutes les cibles pour chaque sujet. Dans l'idéal, ce graphe devrait ressembler à une étoile, centrée sur le centre subjectif du sujet.

Les graphes de tous les sujets sont fournis en annexe. Nous avons identifié dans ces graphes trois comportements typiques : le sujet "pressé", le sujet "prudent", et enfin le sujet "droit au but". La figure 4.10 présente deux exemples pour chaque comportement, mentionnant le sujet, son groupe, son temps de réponse, sa précision et le produit du temps de réponse par la précision, qui donne une estimation du compromis rapidité/précision.

La comportement des sujets "pressés" (fig. 4.10, sujets 4 et 10) consiste à vrai dire à répondre le plus vite possible sans se soucier de la question de la précision. Leur temps de réponse défie donc toute concurrence, mais leur précision est proche du hasard.

Le comportement des sujets "prudents" (fig 4.10 sujets 5 et 13) consiste, pour déterminer le centre du champ perceptif, à se baser systématiquement sur les bords du champ de vision. Le sujet prudent fait sortir la cible d'un côté puis de l'autre afin de bien déterminer le centre du champ de la caméra. Ses mouvements sont donc essentiellement des mouvements horizontaux et verticaux, et il fait souvent plusieurs allé-retour avant d'arrêter son choix. Les performances de ce type de sujet sont relativement variables : le sujet 5 est assez lent et ne gagne pas en précision, le sujet 13 est, lui, assez rapide et d'une bonne précision.

Le comportement des sujets "droit au but" (fig 4.10, sujets 6 et 8) produit des trajectoires qui se rapprochent de la trajectoire idéale en étoile. Ils vont directement placer la cible au centre de leur champ perceptif, et n'emploient pas nécessairement des chemins verticaux et horizontaux. Ce type de sujet est à la fois rapide et précis. Si l'on exclue les performances des sujets "pressés", qui finalement ne réussissent pas la tâche (leur précision correspond peu ou proue au hasard), ce sont ces sujets qui ont les meilleurs compromis rapidité/précision. Ils exploitent réellement le couplage sensori-moteur introduit par les variations de fréquence et de panoramique.

Figure 4.9 : Position du centre subjectif des sujets dans l'image, en fonction de leur groupe.

Bien sûr, nous nous sommes demandés si l'on pouvait dégager des tendances en fonction des groupes. En particulier, nous nous sommes demandés s'il n'y avait pas plus de sujets "prudent" dans le groupe "uniforme" que dans les groupes "spatialement variants". En effet, dans le cas du groupe "Unif", le centre du champ perceptif ouvert par le dispositif ne peut être défini qu'à partir de l'exploration des bords du champ, alors que dans le cas spatialement variant, d'autres indices y concourent. Il est néanmoins difficile de trancher sur cette question vu le faible nombre de sujets par groupe. Par ailleurs, les sujets ayant été prévenu de la méthode de codage, ils ont pu en déduire que le centre du champ perceptif correspondait à un son de fréquence donnée dont la position apparente est au centre de la tête, l'exploration dans ce cas n'est plus nécessaire, en tout cas au moins dans le sens horizontal (la notion de fréquence "centrale" n'a rien de naturel, contrairement à une source sonore d'azimut central).

- 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 - 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0

Sujet 4, Gr. "Unif", TR = 8, Pr = 54, TR*Pr = 432 Sujet 10, Gr. "Log2", TR = 7, Pr = 56, TR*Pr = 392

- 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 - 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0

Sujet 5, Gr. "Unif", TR = 21, Pr = 46, TR*Pr = 966 Sujet 13, Gr. "Log2", TR = 11, Pr = 10, TR*Pr = 110

- 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 - 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0 1 5 0 - 1 0 0 - 5 0 0 5 0 1 0 0

Sujet 6, Gr. "Unif", TR = 22, Pr = 32, TR*Pr = 704 Sujet 8, Gr. "Log2", TR = 13, Pr = 8, TR*Pr = 104

Figure 4.10 : position du centre subjectif des sujets dans l'image, en fonction de leur groupe. En haut, sujets "pressés", au milieu les sujets "prudents" et en bas les sujets "droit au but".

4.1.4.5 Les autres facteurs potentiels

Cette expérience est la première que nous avons réalisé avec le dispositif. De ce fait, le dispositif présentait certains défauts que nous avons corrigé par la suite. En particulier le fichier de "rétine" a été construit par la méthode des rectangles (voir chap. 3). Si cette méthode est meilleure que la technique d'origine consistant à choisir les centres des champs récepteurs aléatoirement dans l'image, certains défauts n'étaient pas totalement corrigés. En particulier, les rétines présentaient parfois des zones sous-échantillonnées où le sujet perdait momentanément la cible : le sujet 1 et le sujet 3 en ont fait la remarque à la fin de l'expérience.

Par ailleurs, l'application de la transformation logarithmique aux échantillons dans les groupes "Log2" et "Log4" produit des effets de bord qui ont tendance à rétrécir le champ de la caméra. Ce rétrécissement est de l'ordre de 10% pour les rétines "Log2" et de 20% pour les rétines "Log4". Il est évident que si le champ est plus petit, la tâche est plus facile. Néanmoins, cet élément peut difficilement rendre compte de la taille de l'effet observé : les performances varient de 50% entre le groupe uniforme et les groupes spatialement variant. Par ailleurs, on n'observe pas de différence significative de performance entre le groupe "Log2" et le groupe "Log4" alors qu'il y a la même différence en matière de rétrécissement du champ entre ces deux groupes qu'entre le groupe "Unif" et le groupe "Log2".

Enfin, nous n'avons pas songé pour cette première expérience à faire en sorte que l'opérateur ne sache pas dans quel groupe était le sujet. Le protocole est donc en simple aveugle. Toutefois, il est peu vraisemblable que l'opérateur ait influencé les résultats. Il ne pouvait en particulier en aucun cas influencer directement sur les résultats de l'expérience, puisque c'est le sujet qui déterminait le décours des essais.

Ces autres facteurs potentiels ne sont donc pas à même de rendre compte à eux seuls des résultats de l'expérience. Ils restent néanmoins à prendre en compte dans l'analyse.

4.1.5 Conclusion

Dans cette expérience, nous avons testé, chez des sujets voyants équipés du dispositif TheVIBE, l'effet d'un échantillonnage spatialement variant biomimétique sur l'une des premières capacité accessible lors du développement du système visuel humain : la capacité de réaliser des saccades vers une cible visuelle.

Pour cela, nous avons constitué trois groupes de sujets, dans lesquels l'échantillonnage était soit uniforme, soit spatialement variant avec un taux de magnification central de 2, soit spatialement variant avec un taux de magnification central de 4.

Nous avons placé les sujets devant un grand écran sur lequel nous affichons des cibles lumineuses sur un fond noir. Après une phase de prise en main d'environ 45 minutes, nous avons demandé aux sujets de "fixer la cible visuelle, c'est à dire de mettre la cible au centre du champ perceptif". Nous avons mesuré la durée mise par le sujet pour réaliser l'essai ainsi que la dispersion des positions de la cible à la fin de chaque essai.

Nous avons ainsi pu comparer les performances des sujets dans les trois groupes et constater que les sujets des groupes "spatialement variant" montrent des performances nettement supérieures à celles des sujets du groupe "uniforme". L'effet du taux de magnification dans les groupes "spatialement variant" est en revanche beaucoup plus discret.

pensons en particulier que l'existence d'un échantillonnage spatialement variant enrichit les contingences sensorimotrices du dispositif et que cela facilite la tâche de fixation. D'autres éléments sont toutefois à prendre en compte dans cette analyse et notamment l'effet de loupe associé à l'échantillonnage spatialement variant. Une analyse fine des trajectoires de la cible sur un plus grand nombre de sujets devrait permettre de mieux comprendre le phénomène observé.