• Aucun résultat trouvé

CHAPITRE 2 REVUE DE LITTÉRATURE

2.1 Principes de la vision humaine

2.1.2 Mouvements oculaires

Les fixations stabilisent la rétine sur un objet immobile. Elles sont caractérisées par des mouvements miniatures involontaires, les micro saccades, ayant une amplitude variant de 1’ à 2’ et permettant à l’image projetée sur la rétine de rester nette. Nous consacrons 90 % du temps de vision à fixer des éléments de notre environnement visuel (Duchowski, 2007).

Saccades

Les saccades sont des mouvements rapides, volontaires ou réflexes, que nous effectuons à raison de 3 à 5 fois par seconde (Lorenceau, 2012) afin de projeter de nouvelles zones de l’environnement visuel sur la fovéa. Le temps de déplacement de l’œil est d’environ 10 à 100 ms, temps pendant lequel la personne est « aveugle » (Shebilske and Fisher, 1983) en raison

du taux de rafraîchissement rétinien. Les saccades sont supposées balistiques, c’est-à-dire que la destination est préprogrammée, ce qui signifie qu’une fois que le mouvement a été calculé jusqu’à la prochaine zone de fixation, celui-ci ne peut pas être altéré (Duchowski, 2007).

Mouvements de poursuite douce

Les mouvements de poursuite douce interviennent lorsque nous suivons un objet qui se déplace, comme une voiture ou une personne qui marche. Dépendamment de la vitesse de la cible, les yeux sont capables de s’y adapter de manière à ce que l’image ne s’écarte pas de la fovéa (Duchowski, 2007), résultant en un mouvement continu et fluide, c’est-à-dire sans saccades.

Ces différents mouvements peuvent être interprétés en terme d’attention visuelle, comme expliqué en section 2.1.5.

2.1.3 Vision stéréoscopique

À partir des deux images 2D formées sur les rétines, illustrées en figure 2.2, le cerveau est capable d’évaluer la profondeur de notre environnement visuel : il s’agit de la vision stéréoscopique, ou binoculaire (DeAngelis, 2000). Pour cela, il s’appuie sur les disparités horizontales (et verticales dans une moindre mesure), c’est-à-dire les différences de position entre des points correspondants sur les images rétiniennes causées par l’espacement entre les deux yeux. Ces disparités suffisent à elles seules à percevoir la profondeur, néanmoins d’autres indices monoculaires ou binoculaires (parallaxe, occlusions, tailles et déplacements relatifs, perspective, ombres, etc.) peuvent les compléter (DeAngelis, 2000, Lipton, 1997). En réalité virtuelle, la disparité horizontale est l’angle entre l’œil gauche, l’objet virtuel et l’œil droit. Elle est liée à la distance sur l’écran entre un point de l’image gauche et son correspondant dans l’image droite, ainsi qu’à la position de l’observateur (Leroy et al., 2012).

Les disparités ne sont souvent appréhendées consciemment par l’individu que dans les cas extrêmes, lorsqu’il regarde au loin tout en plaçant son pouce très près de son visage par exemple. Les deux images du pouce observées correspondent à la projection de ce dernier sur l’une et l’autre des rétines (Blum et al., 2010). C’est en particulier dans cet espace proche que les disparités verticales interviennent. Elles sont dues au fait qu’un objet excentré par rapport au plan médian de la tête apparaît plus grand à l’œil dont il est le plus proche. Pouvant atteindre 12 % pour un objet à une distance frontale de 20 cm et 2 % à 140 cm, elles ne servent que d’indicateurs supplémentaires qui modifient la perception des formes, tailles et distances induites par les disparités horizontales (Garding et al., 1995, Perez-Bayas, 2001).

Œil gauche Œil droit

Figure 2.2 Vision binoculaire.

Distance interpupillaire

La distance interpupillaire réfère de manière ambigüe dans la littérature à l’écart entre les centres des deux pupilles lorsque les yeux fixent un objet à l’infini (Office québécois de la langue française, 2002a), ou à celui-ci en prenant en compte la convergence oculaire. Dans le reste de ce mémoire, c’est la première définition qui est employée, sauf précision contraire. Pour la vaste majorité des adultes, elle se situe entre 50 mm et 70 mm, avec une moyenne et une médiane d’approximativement 63 mm (Dodgson, 2004, Lambooij et al., 2007).

Convergence et accommodation

Les différentes catégories de mouvements oculaires détaillées en section 2.1.2 s’accom- pagnent toutes de mouvements de vergence et du phénomène d’accommodation. Un mouve- ment de vergence correspond à la rotation des deux yeux dans des directions opposées afin de localiser la région d’intérêt sur la fovéa. Il s’agit d’un procédé principalement actionné par la disparité (Takeda et al., 1999). Près de 70% de l’intervalle de vergence normale d’un individu est utilisé dans un rayon d’1 m. L’angle de vergence, soit l’angle existant entre les deux directions de vue, varie d’environ 14◦ lorsque le point de regard passe de l’infini à la distance de convergence confortable la plus proche située aux alentours de 25 cm, et de 36◦ quand il passe au point le plus proche sur lequel les yeux peuvent converger (Daugherty et al., 2010). La figure 2.3 illustre les variations de cet angle liées aux changements de profondeur du point de regard.

Le phénomène d’accommodation réfère quant à lui à l’étirement plus ou moins important du cristallin permettant au focus de s’effectuer à la bonne profondeur de champ, procédé

Vergence

Objet proche Objet plus lointain

Figure 2.3 Mouvements de vergence.

actionné par le flou (Takeda et al., 1999). En raison du diamètre de la pupille, les objets qui sont à une profondeur différente du point fixé (et en dehors de l’horoptère, voir la section 2.1.3) apparaîtront floutés. Pour reprendre l’exemple précédent où l’on place son pouce près du visage tout en regardant au loin, les deux images du pouce seront perçues floues (Blum et al., 2010). À ce flou de profondeur de champ s’additionne celui de vision périphérique, dû uniquement aux différences de densités des capteurs de la rétine vues en section 2.1.1.

Bien que l’interconnexion de ces deux phénomènes soit assez complexe3, dans des condi-

tions normales de vue l’accommodation et la vergence varient de manière synchrone et en fonction de la distance à l’objet d’attention (Wann et al., 1995). Elles sont intrinsèquement et réflexivement liées (Rushton and Riddell, 1999). A contrario, dans un environnement de réa- lité virtuelle, les yeux doivent maintenir l’accommodation au niveau du dispositif d’affichage, tandis que la présence d’indices de disparité nécessite des mouvements de vergence (Wann et al., 1995), ce qui conduit au conflit accommodation-convergence.

Horoptère et fusion stéréoscopique

L’horoptère, ou cercle de Vieth-Müller (DeAngelis, 2000), présenté en figure 2.4, désigne pour un degré de convergence donné la ligne qui connecte tous les points de l’espace se projetant identiquement sur les rétines gauche et droite(Perez-Bayas, 2001). Une disparité croisée (parallaxe négative) caractérise alors les objets situés devant cette ligne, une disparité décroisée (parallaxe positive) ceux situés derrière (Lambooij et al., 2007).

Zone de fusion de Panum La zone de fusion de Panum est une extension en profondeur de l’horoptère, où la petite quantité de disparité binoculaire rend encore possible la fusion

3. Une réaction d’accommodation en l’absence de convergence, par exemple lorsqu’un œil est occulté, peut induire une réponse de convergence concurrente, la convergence accommodative (AC en anglais). De même, une réponse de convergence va provoquer une réponse accommodative concurrente appelée accommodation de convergence (CA en anglais). Les ratios AC/A et CA/C sont des indices des degrés de convergence accommodative et d’accommodation de convergence (Fukushima et al., 2009).

Œil gauche Œil droit

Point de fixation Point de fixation

Horoptère

Zone de fusion de Panum Vision binoculaire

Figure 2.4 Horoptère et zone de fusion de Panum.

des deux images sans mouvements de vergence (mais au prix de quelques efforts qui peuvent susciter de la fatigue visuelle, Leroy et al., 2012). Au-delà des limites de cette zone, les deux images ne peuvent plus être fusionnées et sont perçues séparément : il s’agit du phénomène de diplopie (Perez-Bayas, 2001). Les angles maximums de disparité varient d’un individu à l’autre et peuvent être extrêmement petits au regard du champ visuel humain. Yeh and Silverstein (1990) ont mesuré, en fonction de conditions plus ou moins contraignantes, des angles de 27’ à 4,93◦ en croisé, et de 24’ à 1,57◦ en décroisé. Ils varient également en fonction de l’excentricité par rapport à la fovéa : Lambooij et al. (2009a) mentionnent 0,1◦ au niveau de celle-ci, 0,33◦ à une excentricité de 6◦ et 0,66◦ à une excentricité de 12◦.

Distance limite de fusion Il existe une limite de distance en dessous de laquelle, même situé sur l’horoptère, un objet ne pourra être fusionné. En rapprochant par exemple son pouce de son visage, un individu finira fatalement par expérimenter de la diplopie. En réalité virtuelle, ce cas correspond au moment où une parallaxe excessive conduit à une image qui apparaît floue et qu’il est impossible de fusionner, probablement en raison de la dissociation trop importante entre accommodation et convergence (Woods et al., 1993).

Jones et al. (2001) mentionnent une expérimentation menée afin de déterminer les limites de fusion, dans laquelle les participants étaient placés à 0,7 m d’un écran LCD autostéréo- scopique de 35,05 cm4. Pour la condition expérimentale la moins contraignante, les limites

au-delà de l’écran étaient généralement comprises entre 2 m et 20 m, celles devant l’écran entre 0,3 m et 0,5 m. L’expérimentation de Woods et al. (1993) consistait quant à elle à afficher un tore de 4 cm de diamètre selon deux protocoles :

– Parallaxe horizontale croissante : le tore est affiché au niveau de la surface de l’écran, puis la parallaxe est augmentée graduellement de manière croisée (derrière l’écran) ou décroisée (devant l’écran) jusqu’à la perte de fusion de l’observateur.

– Parallaxe horizontale décroissante : le tore est affiché avec une parallaxe croisée ou décroisée de la taille de la largeur de l’écran, progressivement réduite jusqu’à ce que l’observateur puisse fusionner les images.

Les participants, au nombre de 10, s’asseyaient approximativement à 0,8 m du moniteur de 40,64 cm5, chaque mesure étant réalisée au moins 3 fois. Les résultats révèlent une grande

variabilité inter participants, et suggèrent que l’intervalle de profondeur augmente avec une exposition plus importante aux dispositifs stéréoscopiques. Dans le but de présenter une scène stéréoscopique à un maximum d’individus, les auteurs suggèrent donc de minimiser l’intervalle de profondeur totale de celle-ci et de placer les objets d’intérêt proches de l’écran. Ils préconisent également de minimiser la parallaxe verticale afin d’augmenter le confort, leur expérimentation avec parallaxe verticale croissante ayant indiqué que celle-ci devait rester inférieure à 7 mm pour que la fusion soit toujours réalisable.