• Aucun résultat trouvé

O` u se cr´ee la carte d’attention visuelle ?

La question o`u dans le cortex se cr´ee la carte d’attention visuelle n’a pas de

r´eponse unanime. Dans les mod`eles de Koch et Ullman [Koch and Ullman, 1985]

ou d’Itti [Itti et al., 1998], la carte de saillance est construite `a partir des cartes de

caract´eristique sans toutefois pr´eciser o`u ce processus a lieu. Quant aux recherches

de Zhaoping [Zhaoping, 2002, 2005], toujours sur le mod`ele ascendant, la carte de

saillance est suppos´ee cr´e´ee au niveau du cortex visuel primaire (V1) o`u les

ca-ract´eristiques visuelles ´el´ementaires sont analys´ees. De plus, d’autres ´etudes avancent

aussi le traitement des informations visuelles dans d’autres parties du cortex comme

V2 et leurs “feedback” vers V1 pour moduler des r´eponses des neurones dans V1

[Hansen et al., 2001; Stettler et al., 2002]. N´eanmoins, dans [Stettler et al., 2002],

les auteurs ont montr´e que le renforcement du contour est plus li´e aux connexions

dans V1 que le “feedback” de V2 vers V1.

Quand les facteurs de bas niveau et les facteurs de haut niveau sont `a la fois

pris en compte dans la cr´eation de la carte d’attention visuelle, cette combinaison

est cens´ee ˆetre effectu´ee dans les aires de plus “haut niveau” que V1. Dans [Mazer

and Gallant, 2003], ils ont propos´e une convergence des voies ascendante et

des-cendante dans V4 qui guiderait la programmation oculomotrice lors d’une recherche

visuelle. La mˆeme conclusion s’est av´er´ee dans [Ogawa and Komatsu, 2004]. De plus,

d’autres aires du cortex sont suppos´ees comme ´etant le lieu de la construction d’une

carte d’attention visuelle : l’aire intrapari´etale lat´erale [Gottlieb et al., 1998] ou le

colliculus sup´erieur [Findlay and Walker, 1999].

4 R´esum´e

Dans un premier temps, nous avons regard´e les mouvements oculaires lors de

l’exploration de sc`enes visuelles. En ´etudiant ces mouvements enregistr´es `a partir

des exp´eriences psychophysiques, on a r´ev´el´e certaines propri´et´es des mouvements

oculaires et les facteurs les influen¸cant.

Les sujets ont une tendance `a regarder plus au centre qu’`a la p´eriph´erie d’une

image quelque soit la tˆache. De plus, la distribution des amplitudes de saccades n’est

pas uniforme mais contient majoritairement des petites saccades. Il y a ´egalement

plus de saccades dans les directions verticale ou horizontale que dans une direction

oblique. Plusieurs ´etudes ont confirm´e deux modes d’exploration : “ambiant” et

“fo-cal”. Le mode “ambiant” correspond `a une exploration rapide dans un champ visuel

large, caract´eris´ee par des saccades longues et des fixations courtes. En revanche,

le mode “focal” correspond `a une exploration dans une petite zone en d´etails. Ce

mode est souvent observ´e avec des saccades courtes et des fixations longues.

Les exp´eriences psychophysiques permettent de diviser en deux groupes les

teurs influen¸cant les mouvements oculaires. Le premier groupe concerne des

fac-teurs de bas niveau dans une sc`ene comme la luminance, la couleur, l’orientation

et le contraste. Ces facteurs arrivent tˆot dans le traitement du syst`eme visuel. Le

deuxi`eme groupe comporte les facteurs de haut niveau comme la s´emantique, la

m´emoire ou la tˆache. Contrairement au premier groupe, ces facteurs arrivent tard

dans le traitement du syst`eme visuel. En g´en´eral, ces deux facteurs coexistent et

in-fluencent la perception visuelle. N´eanmoins, la contribution de chacun des facteurs

d´epend bien de l’exp´erience, sans tˆache ou avec tˆache, et de la dur´ee d’exploration.

Les mouvements oculaires dans une sc`ene statique se font grˆace `a des saccades.

Comment se programment ces saccades ? Des ´etudes ont suppos´e la

programma-tion de saccades en parall`ele dans des exp´eriences de recherche visuelle pour des

stimuli simples. Cependant, pour des sc`enes naturelles o`u des stimuli sont beaucoup

plus complexes, la question de programmation de saccade reste encore ouverte. La

strat´egie de programmation d’une seule saccade ne devrait pas ˆetre ´ecart´ee dans ce

cas-l`a.

Pour ´etudier les mouvements oculaires et la programmation de saccade par

m´ethode computationnelle, un mod`ele d’attention visuelle est indispensable car il

permet d’estimer les saccades ou fixations. Selon les deux groupes de facteurs qui

peuvent influencer les mouvements oculaires, il y a ´egalement deux types de mod`ele

d’attention visuelle : ascendant et descendant. Le mod`ele ascendant s’appuie sur

les caract´eristiques de bas niveau dans une image. Dans la litt´erature, les mod`eles

de ce type suivent souvent l’architecture propos´ee par Koch et Ullman [Koch and

Ullman, 1985] o`u la carte de saillance est la combinaison des caract´eristiques de

bas niveau. Quant au mod`ele descendant, l’influence de la tˆache ou du contexte

est int´egr´ee pour moduler la carte de saillance. Des r´esultats de la litt´erature ont

montr´e une bonne performance des mod`eles descendants pour la recherche visuelle.

Pourtant, dans une exploration libre de sc`enes naturelles, lorsqu’il n’y a pas de tˆache

sp´ecifique, les facteurs de bas niveau peuvent jouer un rˆole plus important, d’autant

plus si on consid`ere uniquement la pr´ediction des premi`eres fixations. Dans ce cas,

le mod`ele ascendant peut ˆetre suffisant pour mod´eliser l’attention visuelle.

Mod`ele d’attention visuelle

propos´e

1 Introduction

Lors de l’exploration d’une sc`ene visuelle, les mouvements oculaires d’un sujet

ne sont pas al´eatoires mais d´ependent, entre autres, des caract´eristiques visuelles

des stimuli, de la consigne donn´ee au sujet avant l’exploration, du sujet qui explore

la sc`ene, etc. Pour pr´edire ces mouvements oculaires, diff´erents groupes de recherche

proposent des mod`eles dits d’attention visuelle : des mod`eles dits “ascendants” ou

“Bottom-Up” et des mod`eles dits “descendants” ou “Top-Down”.

Dans cette th`ese, nous nous int´eressons uniquement aux mod`eles ascendants, et

nous proposons un mod`ele d’attention visuelle dans cette lign´ee. Ce mod`ele permet

de pr´edire les zones saillantes (qui attirent le regard) dans des sc`enes naturelles.

Ces zones pr´edites seront compar´ees aux r´egions fix´ees par un ensemble de sujets

lors d’une exp´erience d’exploration libre de sc`enes utilisant l’oculom´etrie.

L’explo-ration des sc`enes se fait sans consigne pr´ecise, pour ne pas contraindre les sujets

et donc pour se rapprocher des mod`eles ascendants. De plus, le mod`ele que nous

proposons a pour objectif de pr´edire uniquement les premi`eres fixations : pr´ediction

des mouvements oculaires pendant 1 `a 2 s successivement `a la pr´esentation d’une

sc`ene. Des travaux [Tatler et al., 2005; Henderson et al., 1999] ont montr´e que les

premi`eres fixations sont majoritairement command´ees par les caract´eristiques des

stimuli visuels de bas niveau et cela ind´ependamment de la tˆache.

Comme nous l’avons d´ecrit au chapitre 1, les mod`eles d’attention visuelle

ascen-dants se basent sur le fonctionnement du syst`eme visuel humain pour pr´edire les

zones d’attention (ou les zones saillantes) d’une sc`ene visuelle [Koch and Ullman,

1985; Itti et al., 1998; Le Meur et al., 2006]. Dans ces mod`eles, la simulation du

fonctionnement des cellules r´etiniennes reste peu, voire pas abord´ee, alors qu’il a ´et´e

montr´e que de nombreux traitements sont r´ealis´es d`es la r´etine [H´erault, 2001] ; il

peut donc ˆetre int´eressant d’inclure, dans un mod`ele d’attention, la mod´elisation de

ces traitements r´etiniens.

Fig. 2.1 – Sch´ema du mod`ele d’attention visuelle propos´e. Ce mod`ele se d´ecompose

en deux ´etages principaux : le mod`ele de la r´etine et le mod`ele du cortex visuel

primaire. Ce mod`ele permet d’obtenir pour une image sa carte de saillance qui met

en exergue les zones saillantes.

plausible qui imite en le simplifiant, le fonctionnement du syst`eme visuel depuis la

r´etine jusqu’au cortex visuel. Ce mod`ele est inspir´e de l’architecture initialement

propos´ee par Koch et Ullman [Koch and Ullman, 1985] et se distingue des autres

mod`eles propos´es dans la litt´erature par plusieurs aspects : l’importance accord´ee au

traitement r´etinien, la mod´elisation des filtres corticaux et des interactions entre ces

filtres. Ce mod`ele sch´ematis´e `a la figure 2.1 se d´ecompose en deux grandes parties

de traitement de l’information visuelle : une premi`ere qui concerne la mod´elisation

du traitement r´ealis´e par les cellules de la r´etine et une deuxi`eme celle du traitement

r´ealis´e par les cellules du cortex visuel primaire.

– Le mod`ele de la r´etine permet tout d’abord de s´eparer l’information de

lumi-nance et l’information de chromilumi-nance (par opposition de couleurs). Ce mod`ele

permet ´egalement un ´echantillonnage spatialement variant de l’information

vi-suelle (haute r´esolution `a l’endroit o`u l’œil se porte au niveau du point de

fixa-tion et r´esolufixa-tion de plus en plus faible avec l’´eloignement dans le champ visuel

par rapport `a ce point de fixation) ainsi qu’un r´ehaussement des contrastes en

luminance et un blanchiment spectral.

– Le mod`ele cortical d´ecompose l’information visuelle issue de la r´etine en

diff´e-rents attributs ´el´ementaires (ici orientations, fr´equences spatiales) et par

l’in-term´ediaire des interactions entre les filtres corticaux fait ressortir des zones

de l’image diff´erentes de leurs contextes (au sens des attributs).

Dans les paragraphes suivants, nous d´ecrivons en d´etails les diff´erents ´etages de

ce mod`ele.

2 R´etine