Disponible à / Available at permalink :

(1)

- - -

Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository

Thèse de doctorat/ PhD Thesis Citation APA:

Kolinsky, R. (1988). La séparabilité des propriétés dans la perception des formes (Unpublished doctoral dissertation). Université libre de Bruxelles, Faculté des Sciences psychologiques et de l'éducation, Bruxelles.

Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/213299/3/fb218d55-1ce4-41ce-9305-71667730b516.txt

(English version below)

Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université ([email protected]).

Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.

DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :

Le nom des auteurs, le titre et la référence bibliographique complète soient cités;

L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;

Le contenu ne soit pas modifié.

L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.

--- English Version ---

This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University ([email protected]).

If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.

DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.

Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:

The authors, title and full bibliographic details are credited in any copy;

The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;

The content is not changed in any way.

It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.

(2)

UNIVERSITE LIBRE D E BRUXELLES

• Faculté des Sciences Psychologiques et Pédagogiques Laboratoire de Psychologie Expérimentale Directeur : Monsieur le professeur P. BERTELSON

LA SÉPARABILITÉ DES PROPRIÉTÉS D A N S LA PERCEPTION DES FORMES

Volume I

EXAMEN DE LA LITTÉRATURE

D I S S E R T A T I O N

préparée sous la direction de Monsieur le professeur P. BERTELSON et présentée pour l'obtention du grade scientifique

de Docteur en Sciences Psychologiques

par

RÉGINE KOLINSKY

. (/- X

J A N V I E R 1988

(3)

1.1. LA THEORIE DU TRAITEMENT DE L'INFORMATION 1

1.1.1. Caractère inférentiel de la perception 1 1.1.2. Représentations et processus 6

1.1.3. Les transducteurs 9

1.1.4. Le type d'information utilisée dans les inférences perceptives 12

1.2. INTRODUCTION AUX NOTIONS DE STADES, NIVEAUX ET MODES DE TRAITEMENT 20

1.2.1. Stades et niveaux de traitement 20

1.2.1.1. Notions présentes dans la littérature 20 1.2.1.2. Proposition terminologique 30

1.2.2. La notion de mode de traitement 35

CHAPITRE II : LES THEORIES DE LA RECONNAISSANCE DES OBJETS 47

II.A. LES APPROCHES TRADITIONNELLES DE LA RECONNAISSANCE DES OBJETS 49

II.A.1. L'APPARIEMENT DE GABARITS 49

II.A.2. LE SYSTEME VISUEL EN TANT QUE MECANISME D'ANALYSE 54 II.A.2.1. L'extraction de traits : présentation des

modèles 55

II.A.2.2. Les modèles d'extraction de traits et la neurophysioiogie 64

II.B. APPROCHES PLUS RECENTES DE LA RECONNAISSANCE DES OBJETS 71

II.B.l. ALTERNATIVES AUX MODELES D'EXTRACTION DE TRAITS 71 II.B.1.1. L'analyse en fréquences spatiales 71

II.B.1.2. Le calcul de "l'esquisse primale brute"

dans la théorie de Marr 75

II.B.2. LES CONCEPTIONS RECENTES SUR LA RELATION ENTRE

LES DONNEES DE LA NEUROPHYSIOLOGIE ET LES

MECANISMES D'EXTRACTION DE TRAITS 79

(4)

II.B.3. LES DESCRIPTIONS STRUCTURALES 81

U . C . LA DISTINCTION ENTRE PERCEPTION ET RECONNAISSANCE 87

ÇHAPilBI iil 1 LA PERCEPTION DES FORMES 93

III. 1. LE GROUPEMENT ET LA SEGREGATION DE TEXTURES 94

III. 1.A. DEFINITION DU GROUPEMENT 94

III.l.B. AUTRES CONSEQUENCES DU GROUPEMENT 101

III.l.C. CARACTERISTIQUES DU SYSTEME PREATTENTIF 107 III.l.C.l. Facteurs de groupement et de formation

de textures : données initiales 109 III.l.C.2. Facteurs alternatifs de la formation de

textures : la théorie de Julesz 118 III.l.C.3. Le rôle des propriétés simples et des

conjonctions de propriétés dans la

ségrégation de textures et le camouflage:

généralisation 121

III.l.C.4. Le statut des propriétés émergentes 126

III.2. LA THEORIE D'INTEGRATION DES PROPRIETES DE TREISMAN 134

111.2.1. LA DISTINCTION ENTRE LA RECHERCHE EN PARALLELE DE CIBLES DISJONCTIVES ET LA RECHERCHE SERIELLE DE CONJONCTIONS DE PROPRIETES 138

II1.2.1.A. Données empiriques en faveur de l'hypothèse de Treisman 138

III.2.1.B. Données empiriques contre le traitement en parallèle de propriétés simples 144 III.2.l.C. Données empiriques contre le traitement

sériel des conjonctions de propriétés 148 111.2.2. LA LOCALISATION DES PROPRIETES DANS LE MODELE DE

TREISMAN 155

111.2.3. LE TRAITEMENT EN MEMOIRE DES CONJONCTIONS DE PROPRIETES 164

111.2.4. LE PHENOMENE DES CONJONCTIONS ILLUSOIRES 166

REFERENCES

(5)

Humpty Dumpty d'un ton de voix mécontent, en lui tendant un seul de ses doigts à serrer; vous ressemblez tellement à tout le monde."

"C'est par le visage que l'on se

distingue les uns des autres, en général", fit remarquer, d'un ton pensif, Alice.

"Cela n'est malheureusement pas vrai en ce qui vous concerne, répliqua Humpty Dumpty. Votre visage ne se distingue en rien de celui d'une quelconque personne...

un oeil à droite, un oeil à gauche... (il les situa dans l'espace à l'aide de son pouce), le nez au milieu de la figure... la bouche au-dessous du nez. C'est toujours pareil. Si vous aviez les deux yeux du même côté du nez, par exemple... ou la bouche à la place du front... cela m'aiderait un peu."

"Cela ne serait pas joli, joli", objecta Alice. Mais Humpty Dumpty ne fit rien que fermer les yeux et dire : "Attendez d'avoir essayé."

Lewis CarroU, De ilautre côté du miroir.

(6)

Le travail que je présente a été réalisé dans le cadre d'un mandat d'aspirant du Fonds National de la Recherche Scientifique.

Il n'aurait pu être mené à bien sans l'appui de nombreuses personnes.

Quatre personnes ont essentiellement guidé mes choix. Je tiens

particulièrement à remercier Monsieur le Professeur Paul Bertelson, qui a suivi ce travail et m'a souvent poussé à clarifier certaines idées, et dont l'appui moral et intellectuel a été indispensable lors des étapes finales de la réalisation de ce travail. Paul Bertelson a aussi été celui qui, par son cours de candidature, a éveillé en moi l'intérêt pour une approche

expérimentale de la psychologie cognitive. Par la suite, dans les cours de licence, il a jeté les fondements du présent travail, en exposant notamment les idées de chercheurs tels que Garner et Treisman. Je tiens aussi à

remercier particulièrement José Morais, qui m'a communiqué son enthousiasme pour la recherche, et m'a guidé et conseillé au cours de ces années, Alain Content, qui a contribué â ma formation en me fournissant l'occasion de

participer à ses recherches et qui par la suite m'a souvent donné des conseils utiles à propos des miennes, et Anne Treisman, qui m'a accordé à Berkeley plusieurs heures de discussion sur mes expériences, et qui a contribué de manière importante à en améliorer l'analyse des résultats. Je remercie aussi Robert Baes et Edgar Fonck sans la disponibilité et l'aide technique desquels de nombreuses expériences n'auraient pas pu être réalisées, et Monique

Declercq qui m'a aidé tant par sa gentillesse que par ses compétences. J'ai aussi bénéficié de nombreuses interactions avec tous les autres membres du Laboratoire de Psychologie Expérimentale, Jésus, Monique, Daniel, Eliane, Philippe, Jacqueline, Graziella et Ronald, dont le dynamisme et l'amitié est le meilleur des stimulants. Je devrais aussi y inclure Isabelle Peretz, qui malgré son exil à Montréal est toujours présente et m'a fait d'intéressantes suggestions, et Béatrice de Gelder, qui a apporté une réflexion philosophique vivifiante. Je tiens aussi à exprimer toute ma gratitude à des collaborateurs étrangers. Ariette Verhaeghe, Carlos Brito Mendes et Luz Cary, de

l'Université de Lisbonne, et Loni Grimm-Cabral et Fernando Cabrai, de

l'Université Fédérale de Santa Catarina, ainsi qu'à Catty Vandeskelde,

Nathalie Vercruysse, Claire Genevrois, Patricia Duchâtelet, Aniès Dewiere,

Anouk Flausch et Christian Cruyplandts pour m'avoir aidé à réaliser certaines

(7)

Les expériences n'auraient pas pu être menées à bien sans l'accueil des Directions et du personnel enseignant des écoles communales de Boitsfort et d'Ixelles, et l'autorisation des administrations des ces communes, ainsi que sans l'aide des Directeurs et Secrétaires du service d'Education Permanente de l'Université Libre de Bruxelles, et de nombreux amis tels que Madame Waldia Alegria-Iscoa et Madame Sulamite Peretz, qui m'ont aidé â trouver des

volontaires pour certaines expériences.

Je tiens aussi à remercier Anouk, Catherine, Claude, Hjalmar, Philippe,

Waldia et mes parents pour leur soutien lors de moments difficiles.

(8)

L'objet du présent travail est l'étude de traitements perceptifs et cognitifs particuliers du donné visuel en référence à la notion de stades de traitement.

L'exposé de la littérature pertinente à ce sujet fait l'objet du Volume I. Le Chapitre I est consacré aux fondements sur lesquels repose

l'étude du traitement visuel en termes de stades de traitement, et inclut un aperçu d'une notion complémentaire, celle de modes de traitement. Le

Chapitre II reprend les grands types de théories de la reconnaissance des objets. Une critique de ces théories est présentée, et des propositions plus récentes sont examinées. Une partie des critiques mène à 1Mdée qu'il est préférable d'étudier la perception des formes indépendamment des problèmes de la reconnaissance. Les approches expérimentales plus récentes qui se basent sur cette idée sont développées au Chapitre III.

Les recherches expérimentales faites dans le cadre du présent travail poursuivent ce dernier type d'études, à la fois chez le sujet habituel

d'expérimentation, l'étudiant universitaire, et dans d'autres types de

populations, à savoir chez les jeunes enfants et chez des adultes non

scolarisés. Ces recherches et leurs implications sont présentées dans le

Volume II.

(9)

CHAPITRE I: CADRE THEORIQUE GENERAL

I.l. LA THEORIE DU TRAITEMENT DE L'INFORMATION

La présente série de recherches a été menée dans le cadre théorique général des modèles de traitement de l'information. De tels modèles font tous l'hypothèse qu'une série de transformations du patron de projection de la lumière sur la rétine créé par la présence d'un stimulus sont nécessaires avant d'aboutir à l'expérience visuelle, ou percept, de ce stimulus. Ces modèles supposent dès lors l'existence de reerésentations internes

intermédiaires entre le stimulus et le percept, et de processus permettant de transformer une représentation en une autre.

I.1.1. Caractère infèrentiel de la 2§I£§2tion

L'information, comme le rappelle Neisser (1967), est essentiellement définie par le "choix", la limitation des alternatives (Shannon, 1948). Les premières approches scientifiques de la perception, datées de la seconde moitié du siècle passé, insistaient sur le caractère ambigu et incomplet, fragmentaire, de l'information fournie par la rétine (le stimulus "proximal"), et donc sur le fait que cette information sous-détermine l'expérience

visuelle à laquelle elle donne lieu. Des mécanismes additionnels étaient donc

postulés pour rendre compte de l'expérience visuelle. Ainsi, la perception

était considérée comme un processus indirect dans lequel l'information

sensorielle est utilisée comme un ensemble d'indices à partir desquels le

système engendre des interprétations. Ces mécanismes d'interprétation sont

appelés "inférençes" et, selon Helmholtz (1866/1925 pour la traduction

anglaise), sont supposées rester inconscientes {"unbewusster Schluss"). Ces

(10)

2 inférences dérivent de l'ensemble des connaissances, souvent implicites, sur les situations les plus courantes de l'environnement. En d'autres termes, Helmholtz (1866) a proposé que l'organisme infère la nature de l'objet en jugeant inconsciemment quel objet physique devrait être présent dans des conditions de vision normales, habituelles, pour produire le même patron de stimulation rétinien que l'actuel. Une prédiction qui découle de l'hypothèse du caractère inférentiel de la perception est qu'un tel système devrait

parfois engendrer des erreurs ou paradoxes. L'étude de ces erreurs fournirait des indications sur la nature des mécanismes d'inférence utilisés par le système. Au cours de ce siècle, un certain nombre de chercheurs, parmi

lesquels Richard Gregory {1966; 1970; 1974) a joué un rôle important, ont utilisé en ce sens de manière intensive le phénomène des illusions visuelles.

Un exemple classique de ces illusions est l'illusion de perpective de Ponzo (cf. Tausch, 1954). La plus haute de deux lignes horizontales placées entre deux lignes convergentes est perçue comme la plus longue, en dépit du fait qu'en réalité les deux horizontales ont la même longueur. Cette illusion serait due à une utilisation automatique, mais ici inappropriée, du mécanisme de constance de taille, par lequel un même objet vu à différentes distances est perçu comme étant de la même taille malgré le fait que la taille des

images rétiniennes varie avec la distance. Dans le cas de l'illusion de Ponzo, la présence d'indices de profondeur dans une scène qui en réalité n'a pas de profondeur amorce de manière inappropriée le mécanisme de constance de taille.

Cependant, toutes les théories de la perception n'admettent pas l'idée que la perception est un processus inférentiel. La théorie de la perception directe de J.J. Gibson (1966; 1979) semble réfuter toute notion de

construction de représentations intermédiaires. Gibson a en effet adopté une démarche "écologique" dans l'étude de la perception visuelle, et a insisté non sur les lacunes mais sur la richesse de l'information présente dans l'image rétinienne. Au lieu de concevoir celle-ci comme une image bi-dimensionnelle ambiguë et incomplète, Gibson la conçoit comme un patron dynamique complexe ("optic array", "optic flow") structuré de manière précise par les surfaces par lesquelles la lumière a été réfléchie, et par les changements provoqués par les mouvements de l'organisme par rapport à ces surfaces. Ce patron rétinien serait snffisant pour fournir â l'organisme des informations

invariantes sur la disposition des objets dans l'environnement. Il n'y aurait donc pas de nécessité ni de processus de transformation du stimulus proximal en représentations intermédiaires ni d'un apport de connaissances internes de

l'organisme. Même l'occurrence d'illusions ne permettrait pas de postuler

(11)

l'existence de mécanismes inférentiels, dans la mesure où, selon Gibson, la plupart des illusions arrivent dans des conditions d'appauvrissement de

l'information qui ne reflètent pas la richesse usuelle des indices fournis par 1'environnement.

Il n'est pas possible dans le cadre restreint de cette Introduction de décrire un débat aussi large que celui qui oppose les tenants de la perception directe à ceux de la perception inférentielle. On peut toutefois essayer de résumer la situation en disant que, si la théorie de Gibson a eu le mérite de souligner l'importance d'aspects de l'information précédemment négligés ou sous-estimés {les gradients de texture, le mouvement), elle reste peu apte à rendre compte d'un certain nombre de phénomènes. En particulier, elle ne permet pas d'expliquer comment le système visuel peut subir des illusions même en présence de nombreux indices environnementaux, comme par exemple dans le cas de l'illusion consécutive de mouvement. Un autre domaine dans lequel la théorie de la perception directe semble inadéquate est la reconnaissance

d'exemplaires particuliers de catégories d'objets. Même si on admet qu'il y a perception directe d'une table, on comprend nettement moins comment il peut y avoir perception directe lors de la reconnaissance, par exemple, d'une table de style Louis XV semblable à celle que l'oncle Henri avait près de sa fenêtre

il y a dix ans.

De manière plus fondamentale, on peut se demander si la notion de perception directe peut réellement fonder une théorie de la perception. Deux discussions de ce problème ont été présentées récemment. La première est due à Jerry Fodor et Zenon Pylyshyn, la deuxième à David Marr. La critique de Fodor et Pylyshyn (1981) réunit les deux points que j'ai esquissés ci-dessus, celui de la reconnaissance, c'est-à-dire de la mise en relation avec une catégorie sémantique ou fonctionnelle, et celui de la perception au sens restreint du terme, c'est-â-dire de la détermination des propriétés visuelle des objets.

Prenant un exemple caricatural, Fodor et Pylyshyn disent qu'une théorie de la perception directe ne pourrait répondre à la question "comment perçoit-on que quelque chose est une chaussure?" qu'en postulant qu'il y une certaine

propriété invariante que toutes les chaussures et seules les chaussures ont, à savoir la propriété d'être une chaussure, et que la perception de quelque chose comme étant une chaussure consiste en l'appréhension de cette propriété.

Or, de telles propriétés ne sont pas présentes dans le donné visuel. Le monde

extérieur ne fournit â l'organisme, à travers les organes de la vision, qu'un

ensemble restreint de propriétés de la lumière ambiante. Ceci implique que

toute la perception visuelle doit se baser sur les propriétés de la lumière

(12)

4 qui sont détectées directement par des transducteurs, c'est-à-dire par des mécanismes qui modifient la forme de l'information reçue mais peu leur contenu, et en tout cas qui n'utilisent pas des processus d'inférence

(Loewenstein, 1960). Notons que, en ce sens, même les théories de

l'information admettent qu'il y a une étape de perception directe, à moins de considérer, comme le font Fodor et Pylyshyn, que les transducteurs ne font pas partie de la perception. Quoiqu'il en soit de la terminologie accordée à l'étape de la transduction, Gibson brûle une autre étape, ultérieure, quand il dit que la lumière "contient de l'information sur" les surfaces, au lieu de dire que l'organisme prélève de l'information sur la lumière, et que celle-ci spécifie des propriétés des surfaces. Même si les deux informations sont

corrélées, puisque chacune renseigne sur les propriétés de l'autre, il y a une spécification strictement unilatérale, dont le sens est déterminé par la

nature des transducteurs. Tous les organismes utilisent les propriétés de la lumière pour spécifier la structure des surfaces, mais l'inverse n'est pas vrai. Le fait que nous possédons des transducteurs pour la lumière et non pour les surfaces est facile à démontrer par l'utilisation de situations où un seul des deux facteurs est présent. La seule présence de lumière nous permet de percevoir des surfaces en l'absence de celles-ci, comme le montre l'exemple de l'hologramme. Mais la seule présence de surfaces en l'absence de lumière ne nous permet de rien percevoir. La détection de la lumière est donc causalement nécessaire et suffisante pour la perception des surfaces, alors que l'inverse n'est pas vrai. Gibson lui-même semble avoir distingué la "capture" de la lumière ("pick-up") de la "perception directe" des surfaces (cf. Fodor et Pylyshyn, 1981, p.165). Donc, même pour lui la perception directe passe par un médium, et rien d'intrinsèque à sa théorie ne permet de se passer de la notion de 2I2Ç§§sus de transition entre l'information sur la lumière et l'information sur les surfaces. De plus, pour Fodor et Pylyshyn, la simple existence d'une corrélation n'implique pas que l'organisme la connaît ou

l'utilise comme étant susceptible d'être informative. La propriété directement perçue dans le médium (la lumière) est non-informative en elle-même, et ne l'est que par sa corrélation avec les propriétés des surfaces. Donc, la corrélation ne peut avoir de conséquences qu'à condition d'être mentalement représentée (voir aussi la présentation par Morais, 1937, de Fodor et

Pylyshyn, 1981).

Enfin, Fodor et Pylyshyn reprennent la notion classique suivant

laquelle il y a peu de correspondance parfaite entre les propriétés du médium

et celles des surfaces : l'information fournie par les transducteurs sous-

détermine l'expérience perceptive. Ils répliquent à l'argument selon lequel il

(13)

suffit de fournir un milieu plus riche en information pour détruire certaines illusions (comme par exemple celle de la chambre de Ames) en disant qu'une théorie de la perception visuelle doit rendre compte de toutes les

stimulations effectives, même lorsque 1 'appariement de l'expérience visuelle au stimulus proxiraal est sous-déterminé.

Bien que partant de données différentes, David Marr (1982) a lui aussi relevé le fait qu'affirmer que les invariants sont spécifiés et traités directement ne permet pas d'expliquer le mécanisme exact de la détection, à moins d'en sous-estimer la difficulté inhérente. Pour Marr, l'une des erreurs

les plus fréquentes concernant la perception visuelle est justement

l'hypothèse implicite qu'il s'agit de mécanismes simples qu'il ne faut donc pas spécifier. L'un des apports majeurs de l'intelligence artificielle a sans doute été de révéler que ce que nous concevons comme facile (percevoir une forme, ou même seulement des lignes ou des angles) est en réalité extrêmement difficile à réaliser lorsque la nécessité de construire des systèmes de

vision par machine pousse à spécifier en détail les procédures nécessaires.

C'est ce type d'investigation qui a mené Marr (1982, pp. 29-30) à synthétiser l'approche de Gibson de la manière suivante:

"L'importante contribution de Gibson a été de sortir le débat des considérations philosophiques (...) et de plutôt souligner que

l'aspect important des sens réside dans le fait que ce sont des canaux de perception du monde réel extérieur, ou, dans le cas de la vision, des surfaces visibles. Pour cela, il a posé la question la plus cruciale. Comment obtient-on des perceptions constantes dans la vie quotidienne sur la base de sensations continuellement changeantes?

C'est exactement la bonne question, qui montre que Gibson envisageait correctement le problème de la perception comme celui de retrouver à partir de l'information sensorielle des propriétés 'valides' du monde extérieur. (...) Bien qu'on puisse critiquer certaines imperfections dans la qualité de l'analyse de Gibson, son défaut majeur, et, selon moi, fatal, se situe à un niveau plus profond, et résulte du fait qu'il ne s'est pas rendu compte de deux choses. D'abord, la détection des invariants physiques, comme l'image de surfaces, est exactement et précisément, pour employer la terminologie moderne, un problême de traitement de l'information. Et deuxièmement, il a sous-estimé la difficulté d'une telle détection".

Dans la terminologie de Marr, on peut donc conclure que Gibson a été

(14)

6 celui qui, par son approche écologique, a accordé le plus d'importance au Diyeau çomeutationnei, c'est-â-dire à la spécification de la fonction de la perception visuelle, mais que par contre il n'a pas perçu l'importance du Oiï§aU a1S2li£i55iaU§. c'est-à-dire de décrire comment la théorie

computationnelle est implantée dans le système, quelle est la représentation à l'entrée et à la sortie du système, et quel est l'algorithme (le processus) qui opère la transformation des représentations.

1.1.2. Représentations et processus

Dans les théories actuelles du traitement de l'information, une représentation est un système formel qui rend explicites certains types d'information, avec une spécification de la manière dont cela est fait (Marr et Nishihara, 1978; Marr, 1982, p. 20). Une représentation est aussi une

^ÊSçri£tion symbolique d'information, ou plus exactement un ensemble de symboles et de règles pour les apparier. Les caractères symbolique et formel s'appliquent également aux processus mentaux (Fodor, 1980; 1981). D'une part, ceux-ci sont symboliques parce qu'ils s'appliquent à des symboles qui

entretiennent des relations de représentation avec le monde. D'autre part, l'adjectif "formel", bien que peu précisé, se réfère au fait que les processus n'ont pas accès aux propriétés sémantiques des représentations. Pour

effectuer, par exemple, une multiplication du type 3 x 20 = 60, un système qui possède les règles adéquates de multiplication n'a pas besoin pour manipuler correctement ces règles de savoir que des suites de chiffres comme "60"

représentent un nombre, ni que "3" est un symbole qui représente quelque chose qui a du sens dans le monde extérieur. En d'autres termes, les processus n'ont pas accès aux propriétés et relations sémantiques dont l'application dépend de la référence au monde extérieur, et donc n'ont pas accès à la valeur de vérité des symboles. Ceci a mené notamment Fodor (1980) â préconiser une forme de solipsisme méthodologique : il serait possible d'étudier les représentations mentales sans faire attention à la réalité extérieure qu'elles représentent.

Cette position admet bien entendu qu'il existe autre chose au-delà de

l'esprit, donc que la thèse du solipsisme est fausse, mais suppose que, pour étudier le système cognitif, il est utile de faire "comme si" elle était vraie. De nombreux auteurs ont critiqué ce point de vue (voir par exemple les commentaires de l'article de Fodor, 1980; Pylyshyn, 1980; Stillings,

Feinstein, Garfield, Rissland, Rosenbaum, Weissler et Baker-Ward, 1987),

principalement parce qu'il permet difficilement de rendre compte des aspects

(15)

dits élevés de la connaissance, tels que les attitudes propositionnelles et les "qualia" (le caractère "senti", "vécu" des états mentaux). Mais cette approche peut être utile en tout cas au niveau de l'étude des mécanismes perceptifs, et la plupart des théories actuelles s'accordent à distinguer entre, d'une part, les opérations formelles effectuées à l'aveugle sur des symboles qui n'ont pour elles pas de signification, et d'autre part les relations des symboles avec ce qu'ils représentent.

Marr (1982) souligne que dans une théorie du traitement de

l'information, il faut, au delà de la théorie computationnelle, poser la question du "comment": à savoir, il faut choisir un type de représentation pour le stimulus d'entrée et un autre pour la sortie des processus de transformation, et trouver un algorithme par lequel la transformation est accomplie. En réalité, il y a souvent un choix très large dans la manière de représenter une information, et les théories de la perception diffèrent sur ce point. Or, le choix d'un type particulier de représentation a un impact

important sur ilexpliçitation de certains types d'informations aux dépens d'autres, et donc sur la facilité ou difficulté subséquente des opérations qui peuvent être faites sur base de ces représentations. Ainsi, les systèmes

numériques arabe, romain et binaire sont tous des systèmes formels de

représentation des nombres. La représentation arabe consiste en des séries de symboles tirés de l'ensemble (0,1,2,3,4,5,6,7,8,9), et la règle pour

construire la description d'un nombre entier est de décomposer ce nombre en une somme de multiples d'exposants de 10 et de réunir ces multiples en une série dans laquelle les exposants les plus larges sont à gauche et les plus petits à droite (par exemple, 3x10 exposant 1 + 7x10 exposant 0 devient 37).

Donc, ce que cette description rend explicite c'est la décomposition d'un nombre en exposants de 10. Il n'en n'est pas de même pour le système binaire, dans lequel la description rend explicite la décomposition du nombre en

exposants de 2 (37 y devient 100101), ni pour le système romain (37 y devient XXXVII). Il s'ensuit qu'il n'est pas également aisé dans tous ces systèmes de représentation de décider si un nombre est un multiple de 2 ou de 10: ce qui est facile dans un système est difficile dans un autre. Ceci a des

implications majeures sur, par exemple, la facilité avec laquelle on peut faire des opérations arithmétiques; en particulier, la multiplication est extrêmement difficile à réaliser dans le système romain, et la culture romaine n'a d'ailleurs pas développé les mathématiques autant que les cultures arabes (cf. Marr, 1982, pp. 20-21).

La plupart des théories qui portent sur la nature des représentations

(16)

8 font simultanément une série d'hypothèses sur le traitement de ces

représentations. Il est important cependant de noter que ces deux aspects sont logiquement indépendants. Même si le type particulier de représentation

introduit des contraintes sur le choix des algorithmes de transformation, il y a souvent ElysiÊMIs algorithmes possibles (par exemple, dans le système numérique arabe, on peut définir des règles de multiplication mais on peut aussi multiplier en effectuant des additions répétées), et le choix de l'un ou de l'autre dépend de leurs avantages respectifs et aussi du type de

"hardware", c'est-à-dire des contraintes structurales du système.

Palmer (1978) relève pourtant un sens dans lequel représentations et processus sont indissociables: la seule information contenue dans une

représentation est celle pour laquelle des opérations sont définies pour l'obtenir. Ainsi, il souligne le fait que la représentation elle-même est dépendante des processus. D'une part, il n'est pas important qu'une

information soit présente dans une représentation si on n'a pas de méthode pour l'en extraire. Palmer cite comme exemple le travail de Shepard (1952 a;b) sur les matrices raultidimensionnelles. De telles matrices peuvent être

utilisées, par exemple, pour représenter les distances ordinales entre des villes. Jusqu'au moment où Shepard a établi un algorithme adéquat, il n'était pas évident que ces matrices puissent contenir de l'information précise sur les distances relatives et même sur la direction. Avoir trouvé un algorithme suffisant pour extraire une telle information prouve que cette information était présente. Mais, tant qu'il n'y a pas d'algorithme, l'information reste

implicite, et bien entendu inutilisable; en ce sens, on peut dire qu'elle

n'était pas là. Pour reprendre l'exemple de Marr (1982), un nombre décimal ne

peut représenter explicitement le fait qu'il est divisible par 10 que dans un

système capable de vérifier que le chiffre final est zéro. Le fait qu'une

information soit explicite ou implicite ne dépend donc pas seulement des

représentations, mais aussi des processus qu'on possède. D'autre part, il est

important de considérer quelle information est véritablement présente dans la

représentation si on veut arriver à distinguer entre les différentes théories

cognitives. Pour illustrer ce point a contrario, Palmer montre qu'une même

théorie sur la nature de l'information représentée, par exemple celle des

gabarits standards dans laquelle l'information est du type "noir à l'endroit

x" (voir Chapitre II.A.l.), peut prendre la forme d'un damier noir et blanc,

mais aussi d'une matrice digitale, d'une table de traits binaires, ou d'une

liste propositionnelle, etc. Ces différences superficielles dans la manière

concrète dont l'information est représentée n'ont pas beaucoup d'importance,

dans la mesure où tous ces modèles sont informationnellement équivalents et

(17)

font donc partie de la même théorie cognitive.

1.1.3. Les transducteurs

L'approche de la théorie du traitement de l'information suppose que la perception dépend en partie de processus d'inférence. Mais nous avons vu que même dans le cadre d'une telle théorie il faut admettre que certaines

propriétés sont captées directement, sans passer par des mécanismes

d'inférence. En effet, les processus d'inférence doivent nécessairement se baser sur des prémisses qui ne sont pas elles-mêmes le résultat d'une inférence (Fodor et Pylyshyn, 1981). La plupart des théories récentes du traitement de l'information identifient ces propriétés avec celles pour lesquelles l'organisme dispose de mécanismes périphériques de transducti^on.

Les caractéristiques des produits des transducteurs dépendent des caractéristiques de l'énergie qui excite les transducteurs, et de rien

d'autre. Les transducteurs sont donc des mécanismes non-inférentiels, dont la fonction est d'effectuer une traduction de l'information (Fodor, 1983/1986 pour la traduction française): ils ne modifient pas le contenu informationnel de départ, mais seulement la forme sous laquelle se présente l'information et, en ce sens, leur fonctionnement interne est non-symbolique (Pylyshyn, 1984).

Les différents types de récepteurs convertissent la forme d'énergie

particulière pour laquelle ils sont spécialisés en énergie neuro-électrique (Loewenstein, 1960). Alors que les transducteurs spécifient l'arrangement des stimuli à la surface de l'organisme, c'est-à-dire représentent les stimuli proximaux, les systèmes perceptifs (ou "périphériques", cf. Fodor, 1983) produisent eux des représentations qui spécifient l'arrangement des choses dans le monde extérieur, c'est-à-dire l'arrangement distal des stimuli. Pour ce faire, les systèmes périphériques prennent comme prémisses les

représentations des stimuli proximaux fournies par les transducteurs. Puisque les caractéristiques de l'énergie qui excite les transducteurs suivent de manière régulière, conformément à certaines lois, les caractéristiques de

l'arrangement distal, les systèmes périphériques peuvent inférer (déduire) les propriétés des stimuli distaux à partir des propriétés qui leur correspondent dans le produit des transducteurs.

Les propriétés extraites par les transducteurs seraient les

"primitives" (Fodor et Pylyshyn, 1981) de la perception, qui définissent, par

leur nature et leurs relations entre elles, le format des représentations

(18)

10 précoces, c'est à dire à la sortie des transducteurs. Toutes les théories du traitement de l'information ne sont toutefois pas d'accord sur la nature de ces unités primitives, et donc sur le format des représentations précoces.

Dans la mesure où les propriétés primitives dépendent de mécanismes de transduction qui traduisent la forme physique de l'information de telle manière que l'information de sortie ne dépend que de l'information d'entrée, on peut se demander d'où provient le désaccord. Comme le font remarquer Fodor et Pylyshyn (1981), le problème réside dans le fait qu'il n'est pas simple de décider ce qui constitue un transducteur. Par rapport à cette question, une position réductionniste qui consisterait à se baser sur la structure

neurophysiologique n'est pas satisfaisante. Elle permet tout au plus d'éliminer certaines propriétés, si celles-ci ne correspondent pas à un

mécanisme cohérent avec cette structure. En général, pratiquement toute forme d'énergie ambiante a un certain effet neuronal. Mais beaucoup de mécanismes qui convertissent la stimulation ambiante en énergie neuro-électrique n'ont aucune fonction significative pour une théorie de la perception: ils ne produisent pas de signaux fonctionnellement pertinents {Uttal, 1967). Or, ce sont des considérations fonctionnelles qui doivent décider ceux qui, parmi ces effets neuronaux, peuvent-être considérés comme des transductions.

L'établissement d'un inventaire correct des propriétés détectées directement est donc une question empirique, qu'il faut résoudre par

l'établissement de leur rôle fonctionnel dans les processus perceptifs.

Gibson s'était attaqué à la vue pointilliste de la perception selon laquelle les seules propriétés détectées directement par l'organisme sont des points instantanés d'intensité de la lumière sur la surface rétinienne. Rien ne permet d'exclure qu'il y ait une détection de propriétés de la lumière sur une échelle spatio-temporelle beaucoup plus large. En d'autres termes, le système perceptif pourrait utiliser des mécanismes "intelligents" ("smart perceptual mechanisms", Runeson, 1977) plutôt que faire des constructions et

inférences à partir d'informations ponctuelles. Par exemple, il est incorrect

de postuler que la seule façon de détecter un changement est la détection et

comparaison de deux états instantanés, dont au moins un des deux est retenu en

mémoire. Le travail de Johansson (1973; 1975) sur la perception du mouvement

va en ce sens: un mouvement et la forme qui le produit sont parfaitement

reconnaissables lorsqu'on présente des films à haut contraste de figures

humaines en mouvement dans lesquels la seule information disponible est

constituée par les changements des patrons d'illumination produits par des

lumières attachées à leurs articulations. Des mécanismes hautement spécialisés

dans la détection de la vitesse, de l'accélération ou de la fréquence

(19)

pourraient remplir les mêmes fonctions que des mécanismes "bêtes", non

spécialisés ("rote mechanisms", Runeson, 1977), calculant ces paramètres sur base d'informations temporelles, spatiales, etc. En ce sens, les premiers pourraient aussi être des transducteurs. Il faut cependant noter que la terminologie attribuée par Runeson (1977) â ces deux types de mécanismes est trompeuse. Pomerantz et Kubovy (1981) font remarquer que la distinction entre mécanisme "bête" et "intelligent" est indépendante du degré de spécialisation du mécanisme pour l'exécution d'une tâche particulière. Ces auteurs suggèrent que la différence essentielle entre les deux types de mécanismes n'est pas que les uns sont plus intelligents que les autres, mais que les mécanismes

spécialisés ne peuvent pas varier dans leur degré d'"intelligence", alors que les mécanismes non-spécialisés sont des "outils qui peuvent être utilisés soit

'intelligemment' soit 'bêtement'" (p. 454). En d'autres termes, il est parfaitement possible d'implanter des solutions intelligentes dans un mécanisme qui pourrait aussi résoudre le problème de manière bête. La distinction pertinente pour la présente discussion est donc celle entre mécanisme spécialisé ou non.

Fodor et Pylyshyn (1981) avancent trois types de considérations empiriques qui pourraient nous permettre de décider quelles propriétés sont soumises ou non à la transduction, et sont donc susceptibles d'être ou non des propriétés primitives du système. Ils proposent, premièrement, que la plupart des propriétés qu'ils appelent "productives" ne peuvent pas être détectées directement. Une propriété productive est une propriété qui détermine une classe infinie d'équivalence de stimuli (réels ou possibles) discriminables, de telle façon que l'organisme est, au moins en principe, capable d'identifier des stimuli nouveaux et arbitraires qui appartiennent à la même classe. La raison pour laquelle beaucoup de propriétés de ce type ne sont pas détectées directement est que la reconnaissance d'exemplaires appartenant à cette classe dépend en général d'une analyse préalable de la structure interne du stimulus et donc en ce sens est inférentielle. Deuxièmement, pour Fodor et Pylyshyn, s'il y a une telle analyse, il faut pouvoir montrer que le gradient de

généralisation du stimulus est prédictible â partir des relations d'identité et de similitude entre ses parties. Il faut qu'il y ait une hiérarchie

d'identification, dans le sens que l'identification du stimulus ou de

certaines de ses parties dépend de la détection et combinaison de propriétés

plus primitives. En d'autres termes, il est nécessaire d'étudier â la fois la

détection des propriétés et les relations d'ordre et d'inclusion entre ces

propriétés et le stimulus si l'on veut arriver à spécifier l'ensemble des

propriétés qui peuvent être considérées comme primitives. Enfin,

(20)

12 troisièmement, un mécanisme caractérisé par la "pénétrabilité cognitive", c'est-à-dire par la possibilité d'être influencé par des facteurs tels que les croyances et les attentes de l'organisme, les buts à atteindre, l'utilité

(Pylyshyn, 1980), n'est pas un transducteur, puisque sa réponse ne dépend pas uniquement de l'information fournie à l'entrée.

1.1.4. Le tY2§ d^inforraation uti1isée dans les inférençes eerçe2tives

Les théories de la perception diffèrent par le sens dans lequel elles supposent que la perception est élaborée. Certains modèles, dits "ascendants"

("bottom-up") supposent que l'expérience perceptive est élaborée uniquement sur base des données sensorielles. D'autres modèles, dits "descendants"

("top-down") supposent que les connaissances internes de l'organisme peuvent guider la prise en compte des données sensorielles. Il faut souligner que, dans la mesure où nous parlons dans les deux cas de modèles de type

inférentiel, c'est-à-dire, qui soulignent la sous-détermination du percept par le patron de stimulation rétinien, on pourrait dire qu'aucun modèle de la théorie du traitement de l'information ne peut être basé uniquement sur le donné sensoriel. Cependant, la distinction entre les modèles basés sur les connaissances internes et ceux basés sur le donné sensoriel reste valide si on considère le type de connaissance utilisé et le niveau exact dans la séquence de traitement auquel cette connaissance intervient. La manière dont s'effectue

le processus d'inférence et le type d'information utilisé par les mécanismes inférentiels n'ont pas toujours été considérés de la même façon par tous, et encore aujourd'hui il existe des divergences théoriques à ce propos.

Selon Helmholtz (1866), la règle de "causation", par laquelle nous inférons la cause externe des stimulations à partir de leurs effets, ne dépendrait pas de l'expérience. Nous ne pourrions jamais bénéficier

d'expériences d'aucune sorte si nous n'attribuions pas dès le départ une cause externe aux stimulations. Mais les règles auxquelles répondent les inférences seraient quant à elles apprises par des observations répétées de l'association entre deux situations. Ces observations sont soit passives, soit dérivées de l'expérimentation volontaire par les mouvements, c'est-à-dire par la variation volontaire de la relation entre nos organes des sens et les objets. Ces

associations sont conservées en mémoire, et interviendraient par la suite dans

toute situation analogue à celle de départ. Ces processus sont inconscients :

Helmholtz distingue ainsi les inférences perceptives des conclusions

(21)

auxquelles nous arrivons consciemment, et illustre cette distinction par l'exemple du travail de l'astronome calculant la distance et la position des étoiles dans l'espace â partir des différentes images qu'il a obtenues à

différents moments et à différents endrôits : "Ses conclusions sont basées sur une connaissance consciente des lois de l'optique. Dans l'acte normal de

vision, cette connaissance de l'optique est manquante" (p. 4). Helmholtz insiste sur le fait que le caractère inconscient des inférences les rend involontaires et inévitables, et appuie cette idée en soulignant la persistance de nombreuses illusions visuelles, dépendantes de ce type d'inférences, en dépit de la connaissance de la situation réelle.

Plus récemment, l'école transactionnaiiste (ou du "Fonctionnalisme probabiliste et transactionnel"), dont les représentants principaux sont

Ittelson et Ames (cf. Ittelson, 1952), s''est appliquée à démontrer l'existence des mécanismes d'inférence et le caractère probabiliste de la perception en mettant en évidence de nombreux phénomènes d'équivalence perceptive, et donc

la sous-détermination de l'expérience perceptive par la stimulation proximale.

Cette école insistait, tout comme Helmholtz, sur l'importance de l'expérience antérieure. Par exemple, dans l'illusion dite de la chambre de Ames, on

perçoit en vision monoculaire une chambre de type conventionnel, mais les personnages dans la chambre paraissent de tailles extrêmement différentes. En réalité, les deux personnages sont de la même taille, et c'est la chambre qui n'est pas rectangulaire, un des coins du fond étant beaucoup plus éloigné que

l'autre, mais sa forme est telle que l'image rétinienne monoculaire correspond à une chambre rectangulaire. Tant qu'aucun objet n'est introduit dans une chambre de ce type, le fait que nous la percevions comme rectangulaire n'a rien d'étonnant. Helmholtz (1866) avait déjà conçu l'idée qu'un ensemble infini de formes tri-dimensionnelles peut donner lieu à la même image bi- dimensionnelle, ou, en d'autres termes, que la correspondance entre une projection plane et une configuration tridimensionnelle est sous-déterminée.

Mais l'introduction de personnages dans la pièce change les données du problème, puisque dans ce cas soit on perçoit la taille des personnes comme déformée, soit c'est la pièce qui parait inhabituelle (c'est-à-dire reprend en fait sa forme réelle). Ames et de nombreux autres chercheurs ont attribué la distorsion de la taille des personnages dans une chambre qui continue à avoir l'air rectangulaire à la connaissance que nous avons des chambres comme étant généralement rectangulaires.

Des recherches ont été menées pour vérifier si des illusions du type de

la chambre de Ames sont présentes ou non chez des individus n'ayant pas ou

(22)

14 peu d'expérience visuelle d'objets rectangulaires, comme les aveugles congénitaux recouvrant la vue à l'âge adulte après une opération, ou des peuplades vivant dans des huttes rondes. Par exemple, Segall, Campbell et Herskovits (1963) ont utilisé des illusions optico-géométriques faisant

intervenir des indices de perspective (lignes parallèles) et des angles droits (illusions de Mûller-Lyer, 1889, parallélogramme de Sanders, et deux versions de l'illusion selon laquelle une ligne verticale est jugée plus longue qu'une horizontale de même longueur, cf. Oppel, 1854-1855). Ils ont testé des

Zoulous, qui vivent dans un environnement décrit comme présentant peu de perspective, parce qu'essentiellement circulaire, et des Américains, qui vivent dans un environnement rectangulaire (bâtiments, etc.) et riche en indices de perspective (routes droites, rails de trains, etc.). Les auteurs ont interprété les différences observées entre les deux peuples (les Zoulous sont moins susceptibles aux illusions de MQller-Lyer et de Sanders, mais le sont plus à l'illusion horizontale-verticale) comme une manifestation de

"différences inter-culturelles dans les systèmes d'inférence visuelle appris en réponses à différents facteurs écologiques et culturels de l'environnement visuel" (p. 771). D'autre part, Gregory (1974) s'étonne qu'un aveugle qu'il a pu tester peu de temps après son opération à l'âge adulte présente l'effet habituel de l'illusion de la chambre de Ames, et insiste surtout sur l'absence d'effet que présente ce patient dans des illusions optico-géométriques faisant

intervenir la profondeur apparente dans des dessins en perspective, telles que le cube de Necker ou des illusions similaires à l'illusion de Ponzo.

Comme il a été relevé par la suite (voir par exemple Rock, 1975), une difficulté majeure dans ces expériences est que les différences observées, par exemple entre deux cultures, peuvent simplement provenir d'une différence de familiarité avec le matériel (photos ou dessins). Par ailleurs, en ce qui concerne spécifiquement l'illusion de la chambre de Ames, Gregory (1970) relève un phénomène qu'il a appelé "la chambre de Ames sans chambre". La

différence de taille perçue entre deux personnes qui ont été photographiées de manière à supprimer les indices de perspective n'est pas attribuée seulement à

la distance: la plus petite des deux personnes est jugée non seulement comme un peu plus lointaine mais aussi comme beaucoup plus petite. Ainsi, dit Gregory (1970, p. 29), "on a peut-être attribué trop d'importance à ce qu'on peut appeler l'addition de Ames à la situation de Helmholtz". D'autres

auteurs, comme Rock (1975), insistent sur le fait que l'interprétation de la chambre comme étant rectangulaire ne doit pas nécessairement résulter de

l'expérience des chambres. L'essentiel de l'illusion provient du fait que nous

percevons le mur arrière comme étant rectangulaire et dans le plan frontal.

(23)

plutôt que comme étant trapézoïdal et déviant par rapport à nous. Mais, lorsqu'on regarde la chambre avec un oeil dans la position particulière choisie pour l'illusion, le mur arrière de la chambre projette une image rectangulaire, et il est possible que sans autre information nous supposions inconsciemment que les objets sont dans le plan frontal par rapport à nous. Ce principe serait un cas particulier de celui avancé par Gogel (1956) selon lequel des objets adjacents sont perçus comme équidistants en l'absence d'autre information sur leurs distances. Ainsi, l'image rectangulaire du mur de fond est interprétée comme un mur rectangulaire dans notre plan frontal, ce qui mène à d'autres illusions, comme celle de la taille des personnes dans la chambre.

Par ailleurs, le dispositif de la chambre de Ames a été utilisé par le courant le plus extrême des modèles de type descendant. Ceux-ci ont connu leur apogée dans le courant des années 1950, lors de la présentation de la théotie dite "New Look" de la perception. Pour cette théorie, l'information fournie par les transducteurs ne joue qu'un rôle mineur, l'essentiel de la perception étant guidé par la motivation, l'humeur, la personnalité de l'observateur.

Ainsi, par exemple, Wittreich (1959) a rapporté et étendu une observation faite par Cantril selon laquelle une jeune mariée regardant une chambre de Ames dans laquelle se déplacent deux personnes, son époux et un étranger, voit ce dernier croître ou rapetisser lors de ses déplacements, mais continue à voir son mari avec une taille constante. Cet effet, appelé "phénomène Honi"

d'après le surnom de la jeune femme, était interprété comme montrant que les facteurs émotionnels peuvent influencer la perception (voir aussi d'autres exemples d'interprétations "New Look" dans Bruner, 1957; Bruner et Goodman, 1947; Bruner et Postman, 1949; Siipola, 1935).

Alors que le Transactionnaiisme et le New Look considèrent que les processus d'inférence utilisent des connaissances très étendues et générales

(par exemple, le fait que les chambres sont rectangulaires) ou même des facteurs affectifs qui distordent la perception, la plupart des modèles actuels de la perception restreignent fortement la notion d'inférence. Ces modèles soulignent le fait qu'un bon nombre de mécanismes sont "cognitivement

impénétrables" (Pylyshyn, 1980) ou "informationnellement cloisonnés" (Fodor, 1983), c'est-à-dire insensibles à des aspects dits centraux de l'organisme, tels que ses attentes, buts, ou croyances, tout en n'étant pas des

transducteurs, puisqu'ils dépendent de processus d'inférence dans le sens

qu'ils doivent construire, calculer, transformer un type d'information en un

autre. Ces systèmes périphériques ou "modules" (Fodor, 1983; voir aussi la

(24)

16 notion de "détecteurs compilés", Fodor et Pylyshyn, 1981, et des notions similaires dans Marr, 1976, et UUman, 1980) sont des mécanismes inférentiels parce qu'ils disposent d'informations qui ne sont pas données dans la

stimulation proximale, et, en ce sens, ce sont des mécanismes "malins". Mais Fodor (1985) souligne qu'il est aussi un sens dans lequel ces mécanismes sont

"bétes": la seule chose que ces systèmes périphériques "savent" c'est comment inférer le stimulus distal à partir de ses effets proximaux, par exemple, dans le système visuel, comment inférer la forme distale à partir des déplacements proximaux, et rien d'autre. Ceci revient à dire que ces systèmes n'ont pas à leur disposition toute l'information qu'a l'organisme entier, mais seulement une "base de données" spécifique (Fodor, 1985), limitée à certaines opérations particulières dans un domaine particulier. En conséquence, ces systèmes sont

insensibles aux effets de rétroaction que des connaissances plus larges

pourraient introduire, et fonctionnent de manière essentiellement ascendante.

Un exemple clair de ce type de fonctionnement est donné par une illusion de mouvement bien connue: si on presse doucement le doigt contre le globe occulaire, on perçoit un mouvement apparent du monde extérieur. En règle générale, le déplacement de l'image rétinienne produit par un mouvement de la tête ou des yeux peut aussi être dû à un déplacement du monde extérieur, si la tête et les yeux étaient immobiles. La raison pour laquelle nous n'avons pas une sensation de mouvement lorsqu'on bouge les yeux est sans doute que les centres nerveux qui commandent les mouvements de la tête et des yeux

transmettent des informations au système périphérique qui interprètent les stimulations visuelles (Helmholtz, 1866; von Holst, 1954). Si ce dernier

"sait" ce que fait le premier, il peut ignorer les déplacements de l'image rétinienne qui sont dûs aux mouvements des yeux et de la tête. L'illusion serait due au fait que dans le cas présent il n'y a pas d'information

efférente. Or, comme le souligne Fodor (1983), dans cette situation on sait sans l'ombre d'un doute que c'est notre oeil qui bouge et non le monde. Il faut donc en conclure que cette information explicite est inaccessible au système qui s'occupe de l'intégration des stimulations rétiniennes. De

nombreuses autres illusions résistent à notre connaissance du fait que ce sont des illusions. Par exemple, on a beau mesurer les lignes horizontales

présentes dans l'illusion de Ponzo, et savoir qu'elles sont de même longueur, on voit quand même toujours la plus haute comme étant la plus longue.

Dans le type de modèle présenté par Fodor (1983), c'est donc seulement

â partir de sa base de données spécifique que chaque système peut engendrer

des hypothèses et faire des inférences. Ce cloisonnement informationnel permet

(25)

aux systèmes périphériques d'être rapides. Il faut remarquer ici que l'idée d'inférence inconsciente telle qu'elle a été présentée par Helmholtz (1866) avait justement été critiquée parce que l'inférence était supposée être un mécanisme lent, ce qui ne s'accorde pas avec" les observations selon lesquelles

les perceptions sont obtenues très rapidement. Comme le signale Allport (1955), ce type d'argument ne tient déjà plus si on considère la vitesse des processus neurophysiologiques. A un niveau plus psychologique, et au-delà des observations sur la vitesse de traitement, il est raisonnable de penser qu'il vaut mieux être rapide lorsqu'il s'agit, en suivant un exemple présenté par Fodor, de l'identification des panthères. S'il n'y avait pas de cloisonnement informationnel, cette rapidité serait fortement compromise, car l'accès à toutes les informations sur les panthères (par exemple, que grand-mère déteste les panthères, que le chat ressemble à une panthère, que les panthères sont ses cousins lointains, etc.) poserait le problème de décider quelles sont les

informations pertinentes dans la confirmation de l'hypothèse que la tache noire observée en ce moment dans le champ visuel est une panthère. La propriété de cloisonnement informationnel des systèmes périphériques joue, surtout, un rôle fonctionnel inestimable. Dire que les systèmes périphériques sont informationnellement cloisonnés implique qu'ils fonctionnent

obligatoirement indépendamment de nos croyances, attentes, désirs ou

préférences. Or il vaut mieux en effet voir la panthère, pour incroyable que sa présence soit par exemple dans notre maison, que d'être mangé par notre propre "chat". La propriété de cloisonnement informationnel est donc

importante pour la véri.diçité de la perception, et beaucoup d'auteurs contemporains insistent sur ce point: la perception doit nous permettre de voir le monde tel qu'il est et non tel que nous souhaitons le voir (Fodor,

1983; 1985; Marr, 1982; Pylyshyn, 1980).

Les modèles de type modulaire s'insurgent ainsi contre les excès auxquels le New Look a mené, c'est-à-dire contre l'idée que toutes les

connaissances de l'organisme, y compris ses désirs, états émotionnels, etc., peuvent guider la perception. Fodor (1983; 1985) souligne que les théories New Look, dans leur tentative de s'opposer à la vue selon laquelle la

perception serait simplement un réflexe, ont confondu la notion de complexité inférentielle avec celle de pénétrabi1 lté cognitive. Les réflexes ne

possèdent ni l'une ni l'autre de ces propriétés. Il sont directement

conditionnés par le stimulus, et sont informationnellement cloisonnés par

excellence : par exemple, on cligne de l'oeil obligatoirement, même si on sait

que le doigt qui se dirige vers nous appartient à notre meilleur ami qui en

aucun cas.ne nous fourrerait le doigt dans l'oeil. Les théories New Look ont

(26)

18 supposé que la différence entre les processus perceptifs et les réflexes est que seuls les premiers peuvent exploiter des informations générales. Selon Fodor, les deux notions sont indépendantes, à condition de distinguer entre l'information spécifique nécessaire à l'inférence perceptive et l'ensemble des connaissances de l'organisme. En d'autres termes, s'il est vrai que la

complexité inférentielle d'un mécanisme présuppose que les prémisses de l'inférence ne contiennent pas seulement des spécifications sensorielles sur le stimulus proximal mais aussi ce que Fodor appelle une "connaissance

d'arrière-plan" déterminée de manière innée ou par l'expérience, il n'est pas vrai selon Fodor que la complexité inférentielle implique qu'il y ait

continuité entre la perception et la "cognition", dans le sens que n'importe quel type d'information soit disponible en tant que prémisse de l'inférence perceptive.

La notion d'inférence présentée par les modèles modulaires de la perception diffère aussi de celle qui avait été présentée par Helmholtz

(1866). Comme Helmholtz, ces modèles insistent sur le caractère dit

"computationnel" (par exemple, Pylyshyn, 1980) de la perception, sur la

nature inconsciente et involontaire des inférences, et sur l'impossibilité de contrer les inférences inconscientes par des connaissances conscientes.

Mais, comme le fait remarquer Boring (1929), bien que Helmholtz insiste sur le caractère inévitable des inférences, une grande partie de son travail tend à montrer que ce caractère est plutôt une question de degré. Ceci provient du fait que Helmholtz conçoit les inférences comme des associations établies par l'expérience. Dès lors, seules les associations fortes, bien établies,

seraient inévitables. D'autre part, puisque les associations sont acquises par l'expérience, d'autres expériences pourraient les défaire, et les inférences peuvent donc être désapprises. Dans cette conception, rien n'empêche non plus qu'à tout moment de notre existence nous puissions acquérir de nouveaux types d'inférence, par la voie de nouvelles expériences, et Helmholtz leur attribue

le même statut qu'aux inférences déjà présentes. Par exemple, il dit (p. 5) que "des personnes peuvent apprendre dans une certaine mesure à utiliser des détails de leur sensation qui autrement ne seraient pas notés et ne

contribueraient pas à l'idée de l'objet. D'autre part, cette nouvelle habitude peut acquérir une telle force que quand l'individu en question est remis dans son état ancien original, il peut être soumis à des illusions des sens". De plus, les types d'inférence possibles sont quasi illimités: "Il y a de

nombreuses illustrations d'associations d'idées fixes et inévitables dues à la

répétition fréquente, et même quand elles n'ont pas de connexions naturelles,

mais dépendent simplement d'un arrangement conventionnel, comme, par exemple.

(27)

la connexion entre les lettres écrites dans un mot et son son et sa

signification" {p.5). Comme le rappelle Gregory (1966, p. 203), Helmholtz pensait ainsi qu'il n'y aurait aucune importance à changer, par exemple par inversion haut-bas, l'image que nous avons du monde extérieur, du moment que l'image soit reliée systématiquement au monde. Cette idée suivant laquelle la perception est un apprentissage de correspondances entre le monde extérieur et les images visuelles, quel que soit le type de correspondance, et quel que soit le moment de l'apprentissage, est aussi présente dans le travail sur l'adaptation à des changements perceptifs introduits par des verres déformants (Ewert, 1930; I. Kohler, 1964; Stratton, 1896). Le fait que toutes les

correspondances soient acquises par expérience implique aussi que toutes les inférences doivent reposer sur des phénomènes observables (sur des

spécifications des sensations en termes de leurs conditions d'occurrence), et c'est sans doute en ce sens qu'il faut interpréter l'affirmation de Boring (1929, p. 302) selon laquelle pour Helmholtz "les inférences (...) sont d'abord conscientes".

Bien que Fodor (1983) soit peu explicite à ce sujet, il est peu

vraisemblable que ce point de vue s'accorde au sien. Afin de pouvoir rendre compte de certains phénomènes, Fodor est obligé d'admettre que l'expérience du monde peut modifier l'action des systèmes modulaires. Afin de préserver la notion de cloisonnement informationnel, il suppose que cette influence joue au travers d'une modification de la structure interne des systèmes modulaires, par exemple en introduisant des connexions (associations) nouvelles entre des éléments lexicaux, ces associations provenant du fait que les noms de choses souvent reliées dans l'expérience deviennent eux-mêmes reliés dans le lexique.

Mais, d'autre part, Fodor pense que l'ontogenèse des systèmes modulaires suit un rythme et une séquence d'étapes caractéristiques. En effet, ces systèmes correspondraient à des systèmes neuronaux complexes spécifiques et localisés

(ce sont des systèmes "câblés" -"hardwired"-), qui se développeraient en suivant un ordre spécifique, déterminé de manière endogène, et déclenché par

l'environnement. A la fois cette conception innéiste des systèmes périphériques et l'idée selon laquelle ils sont informationnellement

cloisonnés impliquent que la notion d'inférence dans les modèles modulaires de

la perception est beaucoup plus restreinte et rigide que celle avancée par

Helmholtz.

(28)

20 1.2. INTRODUCTION AUX NOTIONS DE STADES, NIVEAUX ET MODES

DE TRAITEMENT DE L'INFORMATION

1.2.1. Stades et niveaux de traitement.

1.2.1.1. Notions présentes dans la littérature

Une implication du fait que la perception nécessite un traitement inférentiel de l'information sensorielle est qu'un certain laps de temps intervient entre l'arrivée du stimulus sur les récepteurs et l'apparition de l'expérience visuelle correspondante; il y a dès lors aussi corrélation étroite entre les processus perceptifs et la mémoire. De plus, l'idée que le stimulus d'entrée déclenche des processus de transformation menant à des représentations permet de concevoir le traitement de l'information comme un courant de transformations successives comportant des représentations

intermédiaires,^ Ces idées, déjà avancées au siècle passé par Donders (1868), forment la base des modèles de stades et de niveaux du traitement de

1'information.

Un modèle de stades ou de niveaux est une description d'une séquence temporelle de transformations et de représentations menant du stimulus d'entrée à la réponse de l'organisme. Certains auteurs (par exemple Rock, 1983) ont souligné que l'approche dite du traitement de l'information ne constitue en fait pas tant une théorie précise de la perception (je dirais qu'elle en rassemble beaucoup de différentes) qu'un programme d'analyse de ces stades de traitement supposés se dérouler entre la stimulation et l'étape finale de prise de connaissance ou de décision. Cependant, il faut noter que les termes de "stades" et de "niveaux" de traitement recouvrent plusieurs notions qui, à mon sens, ne sont pas équivalentes. J'essaierai, dans la suite de l'exposé, de distinguer entre ces notions.

Tout un pan de la recherche des années 1970 utilise le terme de stade

pour exprimer l'idée que chacun des traitements d'une séquence a un rôl.e

f.oOÇÊioon§i particulier. Cette littérature se réfère souvent à la méthode des

facteurs additifs (Sternberg, 1969). Les stades y sont définis comme des