Caractéristiques de la vision en monde virtuel

PARTIE 2. ETAT DE L’ART

A. Caractéristiques de la vision en monde virtuel

Les dispositifs d’affichage visuel présentent l’information à l’utilisateur à travers le système visuel humain (processus de vision). La vision peut être définie comme l'ensemble des mécanismes physiologiques et psychologiques par lesquels la lumière émise ou réfléchie par l'environnement détermine des impressions sensorielles de natures variées, comme les formes, les couleurs, les textures, le mouvement, la distance et le relief. Ces mécanismes font intervenir l’œil, organe récepteur de la vue, ainsi que des processus cognitifs complexes mis en œuvre par des zones spécialisées du cerveau (Jacob 2005).

Le fonctionnement du système visuel ne se limite pas à une analyse statique des images qui sont projetées sur la rétine mais celui-ci construit dynamiquement un monde visuel. A la réception sur la rétine de la lumière, celle-ci est transformée en signaux chimiques puis électriques et ensuite des traitements spécialisés travaillent en parallèle et décomposent l’information. Les images formées sur les deux rétines sont décomposées selon des critères de profondeur, de forme, de couleur et de mouvement. Mais avant l’extraction des formes ou de la profondeur, des informations de bas niveau sont traitées et exploitées : des canaux fréquentiels travaillant en parallèle sont chargés d’établir des représentations de l’information visuelle à différentes échelles de l’espace observé (Fuchs, Hafez et al. 2003).

notions de profondeur. Cette interprétation se fait inconsciemment par traitement cognitif grâce à l’expérience apprise dès le plus jeune âge. Au stade précoce du traitement visuel, la décomposition et le traitement de l’information visuelle par différents canaux permettent d’utiliser une série variée d’indices pour la perception de l’espace tridimensionnel, donc de la profondeur. Ces indices se décomposent en deux grandes catégories :

- les indices proprioceptifs (dus aux actions des muscles orbitaux et ciliaires),

composés de l’accommodation et de la convergence : ces indices sont fiables à faible distance (quelques mètres) ;

- les indices visuels, composés des indices binoculaires et des indices monoculaires.

Les indices proprioceptifs, accommodation et convergence, sont ajustés par le système visuel. C’est par la valeur de commande des muscles orbitaux et ciliaires que le cerveau a une perception proprioceptive de la profondeur de l’objet observé.

En vision monoculaire, les indices monoculaires, appris inconsciemment, permettent d’appréhender la troisième dimension avec un œil, même si la perception de la profondeur est nettement mieux quantifiée avec la vision binoculaire. Les indices monoculaires peuvent être classés de la façon suivante (Fuchs, Moreau et al. 2006) :

- Ombres et les lumières : Les variations de lumière et les ombres sur les objets

permettent d’avoir une meilleure perception de la forme tridimensionnelle de ceux-ci;

- Interposition : deux objets identiques ayant la même taille, si l’un est plus petit que

l’autre, le cerveau comprendra qu’il est situé plus loin ;

- Gradient de la texture d’une surface : La texture d’une surface est perçue plus

nettement si la surface est positionnée à faible profondeur ;

- Variation de visibilité dans une scène extérieure : La visibilité d’une scène extérieure

est décroissante en fonction de l’épaisseur de la couche atmosphérique, donc de la profondeur ;

- Parallaxe due aux mouvements : Pendant le déplacement d’un sujet, les images

rétiniennes d’objets immobiles bouges en fonction de leurs distance par rapport à l’observateur ;

- Perspective : Elle permet de percevoir le monde en relief sur un écran monoscopique.

Il existe plusieurs types de perspectives (cavalière, géométrique, photographique, artistique).

La formation de l’image sur le fond de l’œil répond aux principes généraux de celles d’une image sur un film, à travers les lentilles d’une caméra. Mais à la différence d’un film, l’œil est tapissé d’une mince couche de cellules nerveuses, dite rétine. Sur le fond de ses rétines,

l’observateur recueille 2 images 2D à partir d’un objet 3D réel, son système visuel en extrait une perception 3D (Fuchs, Moreau et al. 2003).

La vision est caractérisée par un champ de regard et un champ de vision. Le champ de regard (FOR) correspond à l’espace physique entourant l’utilisateur dans lequel les images visuelles sont affichées. Par exemple si l’on construit un affichage cylindrique dans lequel l’utilisateur peut s’installer, l’affichage a un champ de regard horizontal de 360°(Bowman, Kruijff et al. 2004).

La partie du monde extérieur représentée sur la rétine, dépend de la direction dans laquelle les yeux sont dirigés. Cette partie de l’espace est appelée champ visuel physique (PFOV) (Robert 2003). Le champ visuel physique correspond au nombre maximal de degrés d’angles visuels qui peuvent être vus simultanément dans un affichage. Par exemple sur un écran de projection large, le champ de vision est entre 80° et 120° dépendant de la position de l’utilisateur par rapport à l’écran.

D’une manière générale, le FOV est plus petit ou égal au FOR. C'est-à-dire qu’à chaque instant, un utilisateur peut voir α degrés (PFOV) sur la totalité de β degrés (FOR) disponible pour lui (Bowman, Kruijff et al. 2004). Le champ visuel binoculaire correspond à l'espace perçu par les deux yeux immobiles fixant droit devant. Il s'étend sur 120 degrés, encadré de part et d'autre d'un croissant de perception monoculaire de 30°(Zanglonhi, Avital et al. 2000). La vision dans un environnement virtuel se caractérise aussi par le champ visuel logiciel (SFOV) qui correspond à la valeur de l’angle de la caméra dans le monde virtuel.

Foels et Jonqueres ont proposé une carte de pondération du champ visuel binoculaire afin de permettre l'évaluation quantitative d'une atteinte périmétrique sur la vie quotidienne d'un patient (Foels and Jonqueres 1989). Elle divise le champ visuel en 85 rectangles de surface inégale. Chaque rectangle non vu donne 1 % de taux médical d'incapacité.

La Figure 2 représente la carte de pondération binoculaire d’une patiente cérébrolésée, âgée de 25 ans, présentant une quadranopsie latérale homonyme supérieure droite. 33 rectangles roses testés en statique ne sont pas vus. Son taux médical d’incapacité en champ visuel est donc de 33% (Zanglonhi, Avital et al. 2000).

Figure 2. Carte de pondération du champ visuel binoculaire

D’une manière générale les objets perçus par l’œil son reconnus en fonction de leur emplacement dans le champ visuel. La figure suivante représente les champs de reconnaissance de différents objets par le système visuel (Panero and Zelnik 1992).

En regardant un objet à moins de 65 mètres environ, l’image réfléchie deviendrait floue sur la rétine si l’œil ne possédait le pouvoir d’accommoder automatiquement. Sous l’action des muscles ciliaires, la puissance du cristallin varie et permet de mettre au point sur la rétine pour voir des objets proches ou éloignés: c’est le phénomène d’accommodation. Il est important de signaler que l’accommodation et la convergence des yeux étant toutes deux liées à la profondeur de l’objet que l’on observe, il en découle une relation entre celles-ci. Cette correspondance n’est pas innée chez l’homme mais est apprise expérimentalement et inconsciemment par l’enfant. Cette relation naturelle peut être mise en défaut artificiellement lorsque l’on regarde des images stéréoscopiques sur un écran : un objet virtuel positionné en arrière de l’écran fait converger les axes optiques sur lui tandis que les yeux s’accommodent sur l’écran. Cette modification de la relation convergence-accommodation est susceptible de créer des difficultés visuelles et de la fatigue pour l’utilisateur (Fuchs, Moreau et al. 2003).

Dans le document Impact des caractéristiques de l'information délivrée par un système virtuel dans une tâche de recherche de cibles : perspectives en rééducation cognitive (Page 32-36)