• Aucun résultat trouvé

Conclusion : performances et flot d’information dans le système visuel

Dans le document en fr (Page 39-43)

2 DU TRAITEMENT VISUEL RAPIDE

2.5 Conclusion : performances et flot d’information dans le système visuel

L’expérience de Kirchner & Thorpe (2005) montre que les sujets peuvent détecter de manière fiable un animal dans une scène naturelle (90,1% de précision), et produire une saccade appropriée rapidement (temps de réaction saccadique médian de 228 ms). Mais au regard de la question adressée dans cette section (« combien de temps faut-il au système visuel pour traiter une image naturelle complexe ? ») le résultat le plus important est que les humains sont aussi capables de détecter la présence d’un animal dans une scène naturelle et de produire une saccade appropriée dés 120 ms après la présentation du stimulus.

Figure 5. Diagramme des connexions anatomiques entre la voie visuelle ventrale, impliquée dans la reconnaissance d’objets, et les champs impliqués dans le contrôle des mouvements oculaires (tiré de Kirchner & Thorpe, 2005). Les latences montrées ici en regard de chaque zone sont basées sur des données du singe ; les valeurs correspondantes chez l’homme sont très probablement plus longues. A chaque étape de traitement, le premier nombre correspond à peu prés à la latence des réponses neuronales les plus précoces observées suite à un stimulus flashé ; le second nombre à une latence moyenne (Nowak & Bullier, 1997 ; Thorpe & Fabre-Thorpe, 2001). Les connexions à partir des cortex inférotemporaux antérieur (AIT) et postérieur (PIT) sont en pointillés car ces connexions sont ou insignifiantes ou absentes (Bullier, Schall & Morel, 1996 ; Schall, Morel, King & Bullier, 1995).

Maintenant se pose la question du trajet suivi par l’information pour produire des réponses aussi rapides et précises. Une première possibilité est celle d’une voie uniquement sub-corticale, via le colliculus supérieur, mais la complexité des scènes naturelles utilisées rend cette hypothèse improbable. Une deuxième solution suggère l’utilisation d’une autre voie sub-corticale vers l’amygdale, dont on sait qu’elle répond aux stimulations visuelles à caractère effrayant, comme celles impliquant des araignées ou des serpents (Adolphs, Gosselin, Buchanan, Tranel, Schyns & Damasio, 2005 ; Morris, Ohman & Dolan, 1999). Mais ici aussi, l’étendue des cibles animales qui ont provoqué des réponses très courtes, sans pour autant représenter de menaces particulières, gêne considérablement cette explication. L’explication la plus simple passe par une route corticale impliquant la voie ventrale du système visuel, dont on sait qu’elle est impliquée dans la

reconnaissance d’objets (Chelazzi, 1995 ; Girard, Lomber & Bullier, 2002 ; Grill-Spector, 2003 ; Ishai, Ungerleider, Martin, Schouten & Haxby, 1999 : Logothetis, 1998 ; Perrett, Hietanen, Oram & Benson, 1992 ; Rainer, Lee & Logothetis, 2004 ; Rolls, 2000 ; Sheinberg & Logothetis, 2001 ; Sugase, Yamane, Ueno & Kawano, 1999 ; Tanaka, 1993) : les champs oculaires frontaux (FEF), ainsi que les sillons intrapariétaux latéraux (LIP) accumuleraient l’information en faveur de la présence d’un animal dans leur champ visuel contralatéraux, information reçue des aires de la voie ventrale et traitée indépendamment dans les hémisphères droite et gauche (Kirchner & Thorpe, 2005 ; Figure 5).

Figure 6. Trajet présumé des activations dans le cortex du singe, dans une expérience de catégorisation animale (tiré de Thorpe & Fabre-Thorpe, 2001). Les singes catégorisent des stimuli visuels complexes très rapidement, avec des temps de réaction de 250 à 260 ms en moyenne mais qui peuvent être aussi bas que 180 ms. Cette figure montre le trajet présumé de l’information entre la rétine et les muscles de la main. L’information envoyée par la rétine (« retina ») est relayée par le corps genouillé latéral du thalamus (LGN) avant d’atteindre V1, le cortex visuel primaire. De là, le traitement continue dans les aires V2 et V4 de la voie visuelle ventrale avant d’atteindre les aires visuelles dans le cortex inférotemporal postérieur (PIT) puis antérieur (AIT), qui contiennent des neurones répond sélectivement à certains objets. Le cortex inférotemporal projette des connections vers nombre d’aires, dont le cortex préfrontal (PFC), qui contient des neurones répondant aux stimulations visuelles, qui catégorise les objets (Freedman, Riesenhuber, Poggio & Miller, 2001). Pour atteindre les muscles de la main, le signal doit probablement passé par le cortex prémoteur (PMC) ainsi que le cortex moteur primaire (MC) avant d’accéder au motoneurones de la moelle épinière (« spinal cord »). A chaque étape de traitement, les deux nombres indiquent, en millisecondes : pour le premier une estimation de la latence des réponses neuronales les plus précoces suite à un stimulus flashé ; pour le second, une latence moyenne plus typique.

Le travail mené par Kirchner & Thorpe (2005) revisite les performances du système visuel rapide à l’aune d’un nouveau paradigme expérimental, basé sur l’enregistrement des mouvements oculaires de type saccades. En cela, il diffère sensiblement des protocoles à base de réponses manuelles utilisés jusqu’ici pour mettre à jour le caractère rapide et précis du traitement de l’information visuelle (pour exemples Thorpe, Fize & Marlot, 1996 ; VanRullen & Thorpe, 2001a ; Rousselet, Fabre-Thorpe & Thorpe, 2002). Il n’y est en effet pas question de catégorisation rapide, au sens où le sujet doit répondre à la question : « l’image contient-elle un animal ? ». Il s’agit ici de détection rapide, où le sujet doit répondre à la question : « de quel côté se situe l’animal ? ». Il n’en reste pas moins valide du point de vue de l’étude du traitement visuel rapide puisque (i) des images naturelles sont utilisées qui sont présentées très brièvement à des sujets humains ; (ii) ceux-ci doivent répondre aussi rapidement que possible et enfin (iii) la réponse doit nécessiter de la part des sujets une forme de décision à propos du stimulus.

Cette étude fait donc désormais partie d’un corpus de travaux mettant en lumière le caractère rapide et précis du traitement de l’information dans la voie ventrale, tant en psychophysique et en électroencéphalographie chez l’humain (Thorpe, Fize & Marlot, 1996 ; VanRullen & Thorpe, 2001ab ; Fabre-Thorpe, Delorme, Marlot & Thorpe, 2001 ; Rousselet, Fabre-Thorpe & Thorpe, 2002 ; Bacon-Mace, Mace, Fabre-Thorpe & Thorpe, 2005 ; Mace, Thorpe & Fabre-Thorpe, 2005) et chez le singe (Fabre-Thorpe, Richard & Thorpe, 1998 ; Mace, Richard, Delorme et Fabre-Thorpe, 2005), qu’en électrophysiologie chez ce dernier animal (Wallis & Rolls, 1997 ; Keysers, Xiao, Foldiak & Perrett, 2001). Pour illustration, dans différentes parties du cerveau, des réponses sélectives à des stimuli visuels complexes, tels que des visages, de la nourriture ou encore des objets familiers, apparaissaient 100 à 150 ms après la présentation du stimulus (Perret, Rolls & Caan, 1982 ; Rolls, Sanghera & Roper-Hall, 1979 ; Rolls, Perret, Caan & Wilson, 1982). En particulier, quand le macaque est exposé à des séquences continues d’images naturelles diverses, présentées à des taux particulièrement élevés (72 images par seconde), la majorité des neurones enregistrés dans le cortex temporal du macaque conservent leur sélectivité aux visages : ces neurones peuvent discriminer correctement les visages dés le début de leur réponse, soit dés 118 ms, alors même que chaque image n’est présentée que pendant 14 ms (Foldiak, Xiao, Keysers, Edwards & Perrett, 2004). Et de fait, des réponses sélectives apparaissent dans chaque aire de la voie ventrale à des latences croissantes mais remarquablement courtes (revue dans Thorpe & Fabre-Thorpe, 2001 ; Figure 6). Comment expliquer cette vitesse en termes de

traitement neuronal de l’information ? Quel type de codage neuronal peut-il permettre la production de réponses si précises en si peu de temps ? Ces questions seront considérées dans la partie suivante, dédiée au codage neuronal utilisé pour expliquer le traitement visuel rapide.

Dans le document en fr (Page 39-43)