• Aucun résultat trouvé

Chapitre 4 LA VISION, UN MODELE D’ETUDE

1. Vision et fréquences spatiales

1.1 Traitement et intégration des fréquences spatiales

1.1.1 Définition des fréquences spatiales

On connait plus généralement les fréquences temporelles, exprimées en Hertz (Hz) qui caractérisent le nombre de cycles répétés sur une unité de temps, en cycles par seconde pour les Hz par exemple. La mesure en fréquences spatiales permet, quant à elle de décrire le nombre de répétitions, de cycles sur une unité de longueur.

Un cycle est alors défini comme l'alternance de deux raies de luminance différente, une blanche et une noire. Ainsi, dans le domaine visuel, en faisant référence à la mesure d'angle visuel, on peut caractériser une fréquence spatiale en termes de cycles par degré d'angle visuel (c/d). Un réseau (« grating ») sinusoïdal est caractérisé par sa fréquence

spatiale, son contraste, sa phase, et son orientation. Le contraste du réseau (voir Figure 2) peut aussi être compris en termes d’amplitude ou de différence de luminance entre les éléments les plus sombres et les plus clairs du réseau. La phase présente la position de l'onde sinusoïde à un point de référence donné. L'orientation quant à elle peut être verticale, horizontale ou même oblique (voir Figure 3).

Figure 2. Réseaux sinusoïdaux à contraste variable, pour une fréquence spatiale constante. Adapté de http://apps.usd.edu/coglab/schieber/psyc301/CSF2d.html , consulté le 19/02/2016

Figure 3. Réseau sinusoïdaux à orientation variable, pour fréquence spatiale constante.

Adapté de http://apps.usd.edu/coglab/schieber/psyc707/psyc707-syllabus.html, consulté le 19/02/2016

Plus un réseau présente la répétition d'un grand nombre de cycles sur la même unité de longueur spatiale, plus l'information sera fine. On dit qu'il s'agit d'un réseau de haute fréquence spatiale (HFS) (voir Figure 4). A l'inverse, un réseau présentant moins de répétitions de cycle apportera une information plus grossière, floue et sera décrit comme apportant des informations de basse fréquence spatiale (BFS) (voir Figure 4).

Figure 4. Réseaux sinusoïdaux de fréquences spatiales de basses à hautes. Un degré d’angle visuel est indiqué. Adapté de : http://www.gatinel.com/recherche-formation/acuite-visuelle-definition/frequence-spatiale/,

consulté le 19/02/2016

Lors d'une expérience de traitement visuel, l'unité de l'image présentée à l'écran peut être donnée en terme de cycles par degré (d'angle visuel), cycles par image (c/img) ou de cycles par visage (c/v) pour ce stimulus particulier; l'unité de longueur étant ici rapportée à l'image traitée.

1.1.2 Modèle de traitement des objets selon leur contenu en fréquences spatiales

Le domaine théorique dans lequel il est utile de replacer ce concept psychophysique de fréquence spatiale est celui de l'analyse de Fourier. Tout objet visuel contiendrait les gammes d’informations décrites précédemment. Il est donc décomposable en une somme de

composantes sinusïdales.

Selon la formule mathématique de la Transformée de Fourier, les ondes sinusoïdales, constituantes élémentaires de l'image, peuvent être situées dans un plan spatial ou espace de Fourier à deux dimensions (pour une image complexe) à coordonnées permettant de coder l'amplitude, l'orientation, la phase et la fréquence spatiale des ondes. Cette somme d'ondes

formerait alors le spectre fréquentiel de l'image, incluant le spectre d'amplitude et le spectre de phase de chaque onde à une fréquence spatiale et une orientation particulières.

Ainsi, des stimuli complexes visuellement comme une scène ou un visage peuvent être représentés dans le plan spatial. Cette formule de la Transformée de Fourier trouve sa validité dans le fait qu'elle soit réversible et permette, grâce à la Transformée inverse de Fourier de retrouver l'image originelle à partir de la somme des ondes sinusoïdales extraites de l'image. La Transformée inverse de Fourier permet de retransposer l'image inscrite dans le domaine spatial (« spatial domain ») vers le domaine fréquentiel (« frequency domain ») (voir Figure 5).

Figure 5. A gauche : image originale transposée dans le domaine spatial par Transformée de Fourier. En haut : Une partie du spectre des fréquences spatiales masqué: les basses fréquences spatiales.

Après transformée inverse, on obtient une image de HFS (détaillée)

En bas : spectre de l’image originale, duquel on conserve uniquement les BFS. On obtient un visage de BFS (floue). Adapté de http://imagejdocu.tudor.lu/doku.php?id=gui:process:fft, consulté le 19/02/2016

Ce principe est déjà utilisé dans les systèmes de reconnaissance de la voix par exemple. En effet, la voix peut être décomposée en plusieurs ondes d'amplitudes, de

fréquences temporelles particulières et arrangées spécialement pour une personne, ce qui créé comme une signature auditive de cette personne. Les images naturelles suivent ce même principe, pouvant être décomposées et ajoutées pour reconstituer l'image de départ.

Cette possibilité d'inverser la décomposition d'une image est utilisée notamment pour le filtrage, l'extraction de certaines gammes de fréquences spatiales choisies. On peut aussi brouiller la phase de ces ondes pour altérer le traitement subséquent de l'image. Lorsque l'on parle de filtrage en fréquences spatiales d'une image, cette image a été placée dans le domaine spatial grâce à la Transformée de Fourier, puis une sélection de certaines gammes de

fréquences spatiales a eu lieu, et enfin, l'image a été retransposée dans le domaine fréquentiel par la Transformée inverse de Fourier. Lors d'un filtrage des HFS, où elles ont été

supprimées, on perçoit par exemple une diminution de la teneur de l'image en détails (voir Figure 5).

Les fréquences spatiales des ondes sinusoïdales sont peu, voire pas altérées par les réfractions rencontrées lors du trajet quasi-linéaire de la lumière dans les milieux transparents de l'œil. Cette approche du monde visuel en terme de composantes spectrales de différentes fréquences spatiales permet d'appréhender le traitement des images naturelles avec des

informations élémentaires qui ne seront pas altérées entre l'entrée dans le système visuel par la rétine et son arrivée en cortex visuel primaire. L'amplitude peut varier mais la fréquence spatiale et la phase sont maintenues.

Cette analyse de décomposition fréquentielle pourrait être réalisée par le système visuel lui-même. C'est ce qu'ont proposé R. De Valois et K. De Valois (1990) dans leur ouvrage Spatial Vision où ils présentent une théorie de traitement de l'image passant par l'extraction et le traitement des fréquences spatiales de l'image. Les fréquences spatiales de l'image seraient traitées par certains canaux psychophysiques préposés à ne traiter que

certaines gammes de fréquences spatiales. Pour mieux comprendre, Palmer (1999) proposa de comparer ces canaux aux chaines de la télévision. Les stations d'émission d'ondes

éléctromagnétiques émettent toutes les gammes mais à des fréquences temporelles d'émission différentes. C'est ainsi que l'on a des chaînes Hertziennes, dépendant de la fréquence

temporelle d'émission de ces ondes. Lorsque l'on sélectionne une chaîne sur la télévision, on lui indique, on l'oriente à n'utiliser qu'une certaine gamme de longueur d'ondes à laquelle notre émission est diffusée.

Le modèle à canaux multiples de Campbell et Robson (1968) suggère que de nombreux canaux traitent le stimulus visuel en même temps et que chacun de ces canaux

répondent, indépendamment à une certaine gamme de fréquence spatiale. En 1968, Campbell et Robson ont montré que le système visuel pouvait s'habituer à certains réseaux sinusoïdaux de fréquences spatiales différentes et de manière sélective. La mesure qui était alors effectuée était une mesure de fonction de sensibilité au contraste. Cette mesure permet de déterminer le seuil nécessaire pour percevoir l'alternance de raies sombres et claires à différentes fréquences spatiales. Après présentation pendant un temps suffisament long d'une grille de fréquence spatiale choisie, le système visuel y devenait moins sensible et présentait une valeur de sensbilité au contraste plus faible qu'évaluée avant adaptation. Cette expérience a donc souligné l'existence de canaux psychophysiques pouvant être orientés de manière

préférentielle, accordés sur certaines fréquences spatiales. En anglais, on parle de « tuning » des canaux pour certaines gammes. Blakemore et Campbell (1969) ont affiné ce modèle en montrant que l'adaptation pouvait être sélective et que l'habituation à une certaine fréquence spatiale ne valait pas pour une fréquence spatiale voisine de même contraste. De plus, Graham et Nachmias (1971) ont retrouvé cette adaptation sélective même lorsque l'habituation mettait en jeu des grilles complexes, constituées de deux fréquences spatiales différentes. L’existence de canaux fréquentiels et indépendants fut ainsi démontrée avec des stimuli complexes à deux gammes de fréquences spatiales.