R EVUE DE STATISTIQUE APPLIQUÉE
J.-P. B ENZECRI
Sur l’analyse des matrices de confusion
Revue de statistique appliquée, tome 18, n
o3 (1970), p. 5-63
<http://www.numdam.org/item?id=RSA_1970__18_3_5_0>
© Société française de statistique, 1970, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
SUR L’ANALYSE DES MATRICES DE CONFUSION
J.-P. BENZECRI
Professeur
deStatistique
à laFaculté des
Sciencesde
ParisD’un
objet
matérielsimple,
onpeut
donner unedescription
mathéma-tique complète,
etprécise
comme uneépure ;
onpeut
encore user du lan- gage commun. Cesdescriptions
ne mettent pastoujours
à leurjuste place
les traits
qui,reçus
par les sens, ont leplus d’importance
pour lesujet qui
considèrel’objet.
Aplus
forte raison est-il difficile de découvrir par la seuleréflexion,
sansexpérimentation,
les caractères parlesquels
nousdistinguons
les
objets complexes.
Ces caractèresdéfinissent,
enquelque
sorte un espace, où nous situons les choses : la relation devoisinage,
latopologie,
voire lamétrique (les distances),
propres à cet espace, ne donneraient-elles pasune
expression géométrique précise
à la notion confuse de similitude ? Cher- cher dans le concret et aussi dansl’abstrait,
les dimensions del’esprit,
c’est une des
premières
tâches de lapsychologie.
Dans cetterecherche, l’analyse statistique qui
d’un tableau de nombres vise à extraire un ordrespatial,
a certes saplace :
et nous proposons iciquelques exemples
d’ana-lyses
de ces tableauxparticuliers
que sont les matrices de confusion.Selon une
conception simpliste
l’actepsychologique
élém.entaire est dé- crit par uncouple (s - r),
où r est laréponse
fournie par lesujet
au sti-mulus s. Il est difficile de fonder sur ce schéma une
analyse
féconde de l’activité naturelle d’un homme ou même d’un animalaccomplissant
une tâchequi
l’intéresse. Mais encontraignant
lessujets
d’uneexpérience
àrépondre
à des
signaux,
lepsychologue
n’enremplit
pas moins des tableaux depaires (s - r),
dontl’analyse
révèlequelque
chose de l’âme... Deux stimuli s ets’
qui
sont pour lesujet, semblables,
recevront de celui-ci desréponses
dont les distributions
statistiques
seront voisines(e.
g. si lesujet
aappris
à
répondre r à s,
ilrépondra
aussi r à s’ voisin des). Et,
demême,
deux
réponses
semblables résulteront d’un même stimulus avec desfréquences
conditionnelles peu différentes. Ici l’on
parle
communément degénéralisation
de la
réponse,
là degénéralisation
du stimulus.(Sans
doute vaudrait-il mieux diregénéralisation
sur ; car ce n’est pas le stimulus lui-même ou laréponse qui reçoit généralisation,
mais l’attitude dusujet quant
à l’un oul’autre). Quoiqu’il
en. soit duprotocole expérimental
conçu avecplus
ou moinsd’ingéniosité
pour maintenir lessujets
en éveil et fairejouer
sélectivement telles de leursfacultés,
on aboutit engénéral
à un tableau decorrespondance ksR :
S étant l’ensemble des stimuliutilisés,
R celui desréponses permises, k(s, r)
est le nombre de fois que, dans uneexpérience
avec un ouplusieurs sujets,
le stimulus s a reçu laréponse
r.L’analyse
du tableau de corres-pondance kSR
fournit pour les ensembles S et R unereprésentation géomé-
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
6
trique (par exemple plane,
si l’on extrait deuxfacteurs), expression
concise des similitudes entre lesprofils
deslignes
et des colonnes de ce tableau.Le
jeu
simultané de deux ensembles distincts S et R donne àl’expé-
rience
plus
de confusion que de richesse : souvent faute de savoir cequi provient
de la structure dechaque ensemble,
on nepeut conclure ;
ou encorele lien artificiel mis par
l’expérimentateur
entre S et R afin de contraindre lesujet
àrépondre,
brouille si bien les structures naturelles de ces ensemblesqu’aucune interprétation
ne sesuggère
pour les résultats del’analyse.
C’estpourquoi
on s’intéresse surtout aux tableaux carrés S x S(que
ces tableauxsatisfassent ou non à la condition de
symétrie : k(s, s’) = k(s’, s).
Ces ta-bleaux carrés sont
appelés
communément : matrices deconfusion,
comme sik(s, s’)
était le nombre de fois que s a étépris
pour s’ : cequi
n’est pour- tant pas engénéral
le cas, lespaires (s - s’)
dénombrées dans lesexpé-
riences étant
produites
par desjeux complexes
dont on verra ci-dessous desexemples.
Onpeut
encore étudier les similitudes entre éléments d’un ensemble S par desexpériences qui
ne conduisent pas audénombrement,
direct ouindirect de
paires (s, s’) :
parexemple,
on demandera à dessujets d’expri-
mer directement par un nombre la similitude entre s et s’. Nous
parlerons
peu ici
(cf.
toutefois 1 -3)
de cesexpériences
que nous entendons traiteravec
l’analyse statistique
desproximités.
Ailleurs,
nous avons considérél’analyse statistique (distributionnelle)
d’un tableau
général
S x R(cf.
Benzécri1966). Ici,
nous voulons rassem-bler la
quasi-totalité
desanalyses
decorrespondances faites, (à
notre con-naissance),
sur des tableaux decouples
de stimuli ou deréponses ;
enfait,
il
s’agira toujours (sauf
au n°8)
de tableauxcarrés,
tableaux que noussommes convenus
d’appeler
matrices de confusion. Auxexemples
effective-ment
traités,
nous avonsjoint quelques projets : espérant
que des cher- cheurss’ingénieront
àremplir
les tableaux que nous voudrions voiranaly-
ser...
Les
expériences
sontprésentées
en ordre decomplexité
croissante.Les
premiers exemples
sont surtout l’occasiond’exposer
les difficultés propres aux recherchespsychologiques.
Comme la structure de l’ensembledes stimuli y est très
simple
et que les tableaux sont depetite taille,
l’ana-lyse
factorielle nepeut
que faire la preuve de sa propreefficacité,
en con-firmant des résultats attendus. Mais dans les
exemples
lesplus complexes qu’on
aittraités, l’analyse
donnedéjà
desreprésentations
intéressantesqui
n’étaient pas totalementprévisibles ; et,
cequi
estmieux,
ellesuggère d’explorer
des voies nouvelles de recherche.Nous nous sommes
partout appliqués
à fairecomprendre
leproblème psychologique
avec concision mais sansambiguité.
D’unepart,
eneffet,
sans ces
explications
l’examen desgraphiques
eut vite été fastidieux. D’autrepart
lestatisticien, qui analyse
desexpériences
trèsdiverses,
nepeut
faire honneur aux méthodesqu’il
utilise que s’il est averti desproblèmes
métho-dologiques
de toutes les sciences.1 - UN ENSEMBLE DE HUIT STIMULI COLORES
La matrice de confusion dont nous
rapportons
icil’analyse, provient
d’une
expérience d’apprentissage (cf.
Benzécri &Richard, 1964)
que nousdécrirons d’abord brièvement.
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
7
1.1 - On
présente
à dessujets
huitcouleurs, projetées grâce
à desfiltres
quasi monochromatiques
sur un écranblanc ;
lessujets
doivent ap-prendre
à associer aux couleurs les boutons d’unclavier,
disons les entiers de 1 à8,
pour omettre les détailsmécaniques.
Onprocède
àvingt
essais :à
chaque
essai(ou,
dans une varianteexpérimentale,
une fois surquatre) ,
le
sujet
se voitindiquer
le chiffrequ’il
aurait dûrépondre.
Ainsi onpeut remplir
pourchaque sujet
un tableau S x R :k(s, r)
étant le nombre de foisqu’à
la couleur s lesujet
arépondu
enappuyant
sur le bouton r. En début desérie,
les erreurs sontnombreuses ;
elles se raréfientensuite,
de sorte que finalement la
diagonale
dutableau,
où sontcomptées
les ré-ponses
exactes,
contient les nombres lesplus
élevés. S’iln’y
avait pas du toutd’erreur, l’analyse
factorielle nepourrait
rien extraire du tableauk(s, r) :
lesprofils
deslignes,
comme ceux descolonnes,
seraientétrangers
entreeux
(chacun
necomprenant qu’un
seul chiffre nonnul) ;
on nepourrait
par leursproximités
mutuelles établir une structure.Si,
au contraire les su-jets ignoraient
leurtâche,
tous lesk(s, r)
seraient aux fluctuations aléa- toiresprès, égaux
entre eux : lesprofils
seraient alors touségalement plats , et,
ici encore, leurcomparaison
ne révélerait rien. Onpeut
donc s’attendre à ce quel’analyse
soit laplus
fructueuselorsque
le taux d’erreurs est mo- déré.Or,
comme nous lesignalons
enintroduction,
ces erreurs,(à
suppo- ser, seul cas intéressant pour nous,qu’elles
reflètent ladisposition
del’expé- rience,
et nonquelque
cause extérieureignorée
denous), peuvent
être duessoit aux similitudes entre
stimuli,
soit aux similitudes entreréponses :
uneréponse
faussepeut
être soit un bouton voisin de laréponse exacte,
soit laréponse qu’il
faut donner à une couleur voisine de celleprésentée.
D’oùinterférence de deux structures : d’une
part
l’ordre des couleurs sur lespectre (puisque
on apris garde
d’utiliser des couleurs pures, et non des teintes rabattues de noir ou lavées deblanc,
etqu’on
aapproximativement égalisé
leséclairements,
il ne reste aux stimuli que la seule dimensionspectrale ;
cf. e. g. notre cours sur la vision descouleurs, 1967) ;
d’autrepart
ladisposition géométrique
des boutons sur le clavier. Nousreporterons
ailleurs desanalyses
mettant en évidence laconfiguration
d’un clavier Lepsychologue
s’intéressait ici à lagénéralisation
sur les couleurs. Afin d’isoler cephénomène,
il donna àchaque sujet
un code différent de cor-respondance
entre couleurs etboutons ; (pour
choisir cescodes,
à dé- faut depouvoir prendre
toutes les 8 ! 1permutations possibles
de huit ob-jets,
on recourrut auxrègles
combinatoires de ce que les statisticiensanglo-saxons appellent "randomisation").
Ainsi pour l’ensemble dessujets,
il est
possible
de construire un tableau de confusionkss d’où
les effets de clavier sont en moyenne éliminés : on posek(s, s’) égal
au nombre de fois que(dans
l’ensemble d’essais réalisés avec diverssujets ayant
chacun leurcode)
la couleur sreçût
pourréponse
le boutonqui
eût été laréponse
exacteà la couleur s’. Comme nous l’avons
annoncé,
il nes’agit
donc pas de con- fusions directes entre s ets’ ;
mais d’erreurs reliants à s’,
et dont laseule cause
jouant systématiquement
dans le même sens pour tous lessujets
est la
proximité
de s et s’ sur lespectre.
Il eùt étépossible
d’utiliser les mêmes données pour construire un tableau4p. : k(r, r’)
étant le nombre de fois que le bouton r’ fût donné pourréponse,
alors que laréponse
correcteétait r.
L’analyse
de ce tableau eût sans doute révélé ladisposition
du cla-vier : mais ne
disposant plus
des résultats détaillés desexpériences,
nousn’avons pu faire cette
analyse.
Revue de Statistique Appliquée. 1970 - vol. XVIII ? 3
8
Les données
analysées ici,
forment finalement deux tableauxks s :
l’uncomptabilise
les confusions faites en débutd’apprentissage,
l’autre concernela fin
(qui
estdéfinie,
pourchaque sujet indépendamment,
comme laphase qui
commence aupremier
essai où il a donné au moinsquatre réponses
exactes sur
huit).
La somme¿: {k(s, s’) s’
ES} = k(s), devrait, quelle
que soit la couleur s, êtreégale (pour chaque tableau)
au nombre des essais considérés : il n’en est pas tout à faitainsi,
parce quel’expérience pré-
sente
quelques irrégularités...
1.2 - Avant de décrire les résultats de
l’analyse factorielle,
nous invi-tons le lecteur à considérer le tableau de données. Dans les situations uni-
dimensionnelles,
pour des ensembles de cardinal peu élevé(10
ou20 ;
ici8 )
lesmanipulations
delignes
et de colonnessuffisent, on
lesait, à l’analyse.
Le seul
avantage
du calculautomatique
est alors de fournir des résultats necomportant
aucune décisionarbitraire,
et donccomparables
d’uneexpérience
à une autre. Dans les situations
multidimensionnelles, (stimuli
ouréponses dépendant
deplusieurs paramètres sensibles),
avec degrands
tableaux le calculautomatique
est la seule méthodepraticable.
Sur le tableau de find’expérience,
ladiagonale
sedistingue
nettement : ceci prouve que même si l’ensemble deslignes
et celui des colonnes avaient été soumis à deux permu- tationsdistinctes,
l’on reconnaitrait immédiatementquelle
colonnerépond
àquelle ligne.
Deplus,
comme il estnaturel,
à des couleurs voisines cor-respondent
desprofils
voisins delignes
et de colonnes :mais,
surtout au milieu duspectre,
on serait embarrassé pour retrouver l’ordre naturel des couleurs.Sur le tableau de début
d’expérience,
enrevanche,
on ne voit rien de très net.Dans
l’analyse
factorielle de ce tableau1.1,
la suite des valeurs propres extraites est0, 156 ; 0, 043 ; 0, 027 ; 0, 020 ; 0,01l...
Les facteurs d’ordre2,
3 etc.. ne nousparaissent
pas le moins du mondeinterprétable.
Lefacteur
1, qui
contient 60%
de l’inertie totale dutableau,
alors que le facteur 2 n’en contient que 16%,
fournit des données unereprésentation
assez satisfaisante. Sur la
figure 1.1,
on voit quepoints figuratifs
des sti-muli et des
réponses
secorrespondent
à peuprès.
Deplus,
l’on retrouve par- tiellement l’ordre des couleurs dans lespectre : après
les deux groupes{Violet, Bleu, Bleu-Vert}
et(Vert, Jaune-Vert,
Jaune à l’intérieurdesquels
l’ordre est
détruit,
viennentl’Orangé puis
leRouge.
Nous ne croyons pasqu’aucune
méthoded’analyse
trouvebeaucoup plus
dans le tableau1.1 ;
car,en début
d’apprentissage (cf. supra),
lessujets
commettent unemajorité
d’erreurs dues non à la
généralisation
sur le stimulus ou laréponse,
maisà
l’ignorance quasi
totale de lacorrespondance
entre stimuli(couleurs)
etréponse (touches
declavier,
lettresetc..).
En fin
d’expérience,
aucontraire,
les confusions deviennentplus
rares , mais lagénéralisation
yjoue
un rôleprépondérant.
Nous avonsremarqué
que la
diagonale
du tableau 1.2 se détachenettement ;
comme ce tableauest,
deplus
à peuprès symétrique,
stimuli etréponses
de même nom nese
peuvent distinguer
à l’échelle àlaquelle
sont tracés nosgraphiques.
Sur lepremier
axe, l’ordre duspectre
seretrouve,
à la seule inversionprès
du Jaune et du Jaune-Vert
(dont
leslongueurs
d’ordre sont trèsvoisines,
cf .fig.1.1) ;
mais au centre et à l’extrémité violette duspectre,
les couleurs sontplus
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
9 Tableau 1.1
Les matrices de confusion : les huit couleurs sont
désignées approximativement
par les initiales des noms :
Rouge, Orange, Jaune, Jaune-Vert, Vert, Bleu-Vert, Bleu,
Violet. Le tableausupérieur
serapport
au début del’expérience,
le tableau inférieur à la fin.
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
10 t :
réponses
o : stimuli
Figure 1.1 - Analyse des tableaux de confusion entre huit couleurs. On a donné aux axes la longueur unité.
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
11
étroitement resserrées
qu’à
l’extrémité rouge. Dans leplan
desdeuxpremiers facteurs,
l’extrémité violette duspectre reçoit
un étalementplus grand :
lespectre
forme deux tranchesquasi-rectilignes qui
serejoignent
au niveau duJaune et du Jaune-Vert en formant un
angle.
Cette
figure
est très bien connue enpsychophysique
de la vision des couleurs. Sansreprendre
en détail une théorie.classique (que
nous avonsexposée
ailleurs : cf.Benzécri, 1967) rappelons
que les stimuli lumineuxagissent approximativement
sur lessujets
humains normaux(i.
e. non dalto-niens
etc..)
comme des vecteurs d’un cône convexe situé dans un espace à trois dimensions : la frontière de ce cônecomprend
une nappecourbe,
ounappe
spectrale,
et une facetteplane (la
facette despourpres)
reliant lesgé-
nératrices
extrêmes, (rouge
etviolette)
de la nappe ; au centre ducône,
passe la demi-droite des stimuli blancs. L’intensité lumineuse est une forme linéaire
qui
s’annule sur unplan (dit alychne)
évidemment extérieur au cône maisauquel
la nappespectrale
tend à se raccordertangentiellement
sui-vant la
génératrice
violette.L’usage
est dereprésenter
une sectionplane
du cône des stimuli colorés : la courbe
spectrale,
intersection de la nappespectrale
avec leplan
s’inscrit dans untriangle
isocèle etrectangle ;
lecôté y = 0 est sur
l’alychne ;
le côté x = 0 esttangent
à la branche bleue duspectre ;
le troisième côté esttangent
à la branche rouge ; enfin le blanc est au centre degravité.
C’est lediagramme
de la Commission Internationale del’Eclairage (C.I.E.) (cf. fig. 1.2).
Il est
frappant
que nonseulement,
sur leplan
des deuxpremiers
axes , les huit couleurs dessinent la courbespectrale
mais encore la direction même des axes soit celle choisie par la C.I. E.(premier
axeparallèle
àl’alychne ;
deuxième axe faisant un
angle
faible avec la branche bleue duspectre).
Cette rencontre n’est pas
unique,
comme nous le verronsplus
bas(n° 1.3)
en
analysant
d’autres donnéesplus complètes
relatives aux similitudes entre stimulispectraux.
On sait que dans une situation
unidimensionnelle,
les facteurs succes-sifs sont en
général
tous fonctions dupremier :
le deuxième facteur étantune fonction
parabolique
le3ème,
unecubique
en S... : c’est cequ’on peut appeler
l’effet Guttman.Ici,
pour autant que 8points
suffisent à définir unecourbe en
S,
il semble que l’on soit dans ce cas. Mais ni la suite lentement décroissante des valeurs propres(~1
=0,758 ; À2 = 0,624 ; Bg
=0,527 ; À4
=0, 507... ),
ni lesgraphiques (e. g.
celui dans leplan 1. 3)
nepermettent
d’affirmer absolument l’unidimensionalité observée dans leplan
1.2 : c’esttrop
peurépétons-le qu’un
tableau 8 x 8.Quant
au critère duX2
il donneplus
decinq
facteursstatistiquement significatifs ;
cequi,
on le voitbien,
ne
signifie
pas que ces facteurs(nés
des conditionsparticulières
del’expé- rience)
soientinterprétables d’après
la structure de l’ensemble des stimuli colorés.1.3 -
Après l’analyse
des matrices de confusion issues del’expérience
de
Richard,
considérons un tableauplus ample publié
par G. Eckman1954).
L’expérience
d’Eckman concernequatorze
stimuli colorésquasi-monochroma- tiques ;
ceux-ci sontprésentés
à l’aide d’unprojecteur
éclairant au traversd’un filtre une fenêtre de verre
dépoli.
Plusexactement,
il y a deux pro-jecteurs
et deuxfenêtres,
cequi permet
de proposer successivement auxsujets
de comparer entre eux toutes lespaires
de stimuli distincts.(Mais
Eckman ne dit pas s’il a
prix
soind’égaliser
les brillancesphotométriques
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
12
Figure 1.2 : Diagramme chromatique de la C. I.E. ; les longueurs d’onde sont me-
surées en millimicrons
Figure 1. 3 - Analyse des proximités entre 14 stimuli colorés
(d’après
R. N. Shepard,1954 c)
Revue de Statistique Appliquée. 1970 - vol. XVI II N° 3
13
de tous ses
stimuli... ) Chaque sujet
évalue ledegré
de similitude par un nombre entiercompris
entre zéro etquatre.
Desréponses
dessujets,
Eckman
déduit,
par calcul de moyenne, un indice de similitudepouvant
va-rier de 0 à 1. Nous traiterons ailleurs de
l’analyse
de similitude. Ici nous nous bornons à donner les résultats obtenus en soumettant le tableau d’Eckman àl’analyse
descorrespondances,
comme s’ils’agissait
d’une matrice de confusion. L’article d’Eckman ne nous dit rien sur ledegré
de similitude d’une couleur avec elle-même : et il n’est pas surqu’avec
laprocédure expérimentale qu’il
utilise on trouve pour deux stimuliidentiques
un indiceégal
à 1. A titred’expérience
nous avonsanalysé
deux fois la matrice d’Eckman : en lacomplétant
par unediagonale
de1,
et aussi par une dia-gonale
de zéro. On voit sur lesfigures
1. 4 et 1. 5 que les résultats obte-nus dans les deux cas diffèrent peu. Comme dans la
figure 1.1,
les axesfactoriels
correspondent
aux axes(x = 0)
et(y = 0)
dudiagramme
de laC.I.E. Les
points (désignés
sur nosfigures
par deslongueurs
d’onde me-surées en
millimicrons)
serangent
sur une courbeanalogue
à la courbespectrale
de la C.I. E. : la seule différence notable est que la branche rouge duspectre (fortes longueurs d’ondes)
se termine non en droite(comme
surla courbe
spectrale)
mais en crochet. Avec unediagonale unité,
la suite desvaleurs propres est :
0, 65 ; 0, 39 ; 0,09 ; 0, 08 ; 0, 03... ;
avecdiagonale
zéro on a :
0, 55 ; 0,23 ; 0,11 ; 0,10 ; 0,09...
Il est doncpleinement jus-
tifié de s’arrêter à une
représentation plane ;
d’autantplus
que, avec dia-gonale unité,
les facteurs3, 4,
5 sont(cf. supra)
des fonctionsrégulières
dela
longueur
dondeprésentant
une suite alternée de maxima et deminima ;
tan- disqu’avec
unediagonale
zéro les facteurs3, 4,
et 5 sont des facteurs inverses. Le tableau Eckman a étéanalysé
par R. N.Shepard (1964 c)
sui-vant sa méthode
d’analyse
desproximités :
lareprésentation qu’il
obtient(fig. 1. 3)
estsatisfaisante ;
mais leparallélisme
avec lediagramme
de laC.I.E. est moins net que dans
l’analyse
decorrespondance.
Il est intéres-sant de noter que, de par le
principe
même del’algorithme
deShepard, l’analyse
desproximités
tend à diminuer les distances lesplus grandes,
donc à effacer les
angles aigus
de lapériphérie
desfigures :
celapeut-
être unavantage
dans certains cas(cf.
infra n"8, représentation
du codeMorse) ;
mais icil’aspect anguleux (quasi-triangulaire)
semble dans la na-ture des
choses,
et onperd
à l’atténuer.2 - SIX STIMULI SONORES SINUSOIDAUX
L’expérience
dont nous abordons maintenantl’analyse
diffère peu de celle décrite aun" 1.1 :
aussi pourrons-nous êtreplus
brefs. Lepsychologue (Mrr Le Ny)
utilise six stimuli sonores. Afin que n’intervienne que la seule dimension dehauteur,
les sons n’ont pas de timbre : ils sontproduits
par desgénérateurs
sinusoidaux. Deplus
afin d’éviter que le cercle de la gammene brouille la suite linéaire des
hauteurs,
les sons ont desfréquences
enprogression géométrique
de raison 2 : c’est donctoujours
la mêmenote,
mais on s’élève d’octave en octave.
(On sait,
cf.Shepard
1964b,
que la suite des sons sinusoidaux purs de hauteur croissante est un espace de stimulihélicoïdal,
nonrectiligne : entre,
parexemple
leD03
et leDo 4
la distance pourra être moindrequ’entre
leD03
et leFA3 : chaque
son sinusoidal pura donc d’une
part
une coordonnée dehauteur,
une coteZ ;
d’autrepart
unecoordonnée circulaire
cp ,
variant e. g. de 0 à 360"quand
on va duDO 3
auD04. Quant
aux sonscomplexes présentant
unelongue
suited’harmoniques ,
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
14
15
de très belles
expériences
de R. N.Shepard
ont montréqu’ils
seprêtent
aux effets les
plus paradoxaux :
il estpossible
de concevoir des suites fi- nies de 12 sonsqui, répétés indéfiniment,
semblent s’élever sans cesse oudescendre sans cesse ; bien
qu’en réalité, répétons-le,
iln’y
ait que douzestimuli).
Dessujets apprennent
à associer les six sons à six lettres : le code étant(comme plus
haut avec lescouleurs)
différent desujet
àsujet.
Ilen résulte une matrice de confusion 6 x 6 :
k(s, s’)
étant le nombre de foisqu’un
son s est associé à la lettre liée au son s’.L’analyse
de cette matrice fournit deux facteurssignificatifs (au
sensdu critère du
x2, applicable
icipuisqu’il s’agit
d’une suite d’essais élémen-taires peu corrélés entre
eux),
d’où une doublereprésentation plane
de l’en-semble des six sons, à la fois comme stimuli s et comme
réponses
s’. Lesdouze
points
serépartissent
sur un arc deparabole,
dans l’ordre des fré- quences ;chaque réponse
estproche
du stimuluscorrespondant
mais avecun
décalage systématique
desréponses
vers les graves. L’examen du tableau des données(cf.
tableau2.1)
nous assure en effet quelorsque
laréponse
est
fausse,
c’est leplus
souvent que lesujet
a donné une lettrequi repré-
sente un son
plus
grave que le stimulusqu’il
a entendu(e. g. réponse
R3pour le stimulus
S2). Quant
à ladisposition parabolique,
elleprovient
de ceque l’on
peut appeler
l’effet Guttman.L’analyse
fournit certes des facteursnon corrélés entre eux ; mais ceci n’exclut pas que le deuxième facteur soit
une fonction
quadratique
dupremier.
3 - VISION
TACHISTOSCOPIQUE
DE L’ANNEAU DE LANDOLT3.0 - L’anneau de
Landolt,
cercled’épaisseur
constanteinterrompu
enun
point,
est communément utilisé dans l’étude de l’acuitévisuelle,
notam-ment chez les
illétrés ;
lesujet examiné,
àqui
onprésente
des anneaux deplus
enplus petits,
doit dire laposition, variable,
de la lacune. Dansl’expé-
rience ci-dessous -conçue par J. -F. Richard et H. Rouanet
(1968),
unanneau de 40 mm, de
diamètre,
2 mm.d’épaisseur,
offrant une lacune de1 mm. est
présenté
en visiontachistoscopique,
i.e.pendant
untemps
trèscourt -
3/100
de seconde - nepermettant
pas à l’observateur de faire mou- voir un oeil pourexplorer l’objet.
Lesujet
rendcompte
de laposition
où ila vu la lacune en
marquant
au crayon unpoint
sur un cercle. Puisl’expé-
rimentateur
présente
l’anneau en visionprolongée permettant
ausujet
des’assurer de la
position
véritable de la lacune. Pour lesauteurs,
il ne s’a-git
pas d’étudierl’apprentissage
de la visiontachistoscopique
maisl’adapta-
tion des
sujets
à diversesrègles
aléatoires dedisposition
de la lacune. Eneffet,
lesujet, qui
nepeut
bienvoir, accomplit plus
ou moins inconsciemmentune tâche de
prédiction :
il tend àplacer
la lacune soit là où elleapparaît
le
plus fréquemment, (effet
defréquence),
soit là où elle était à l’essaipré-
cédent
(effet
dit derécence),
etc..Quant
à nous, nous nous bornerons àrapporter ici,
lesanalyses
faites par Mme B. LeRoux,
des erreurs d’obser - vation de la lacune.3.1 - Une
première
série de donnéesanalysées
par B. Le Roux(cf . thèse) proviennent
de 10sujets ayant
effectué chacuns environ 240 essais.Dans
chaque série,
lespositions
vraies successives de la lacune sont indé-pendantes
les unes desautres ;
la loi derépartition
en est uniforme surle cercle. Plus
précisément,
la lacunepeut
occuper 40positions équipro-
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
16 Tableau 2.1
Une
expérience
de LeNy
relative à un ensemble de six stimuli sonores pursFigure 2.1 - Analyse de l’expérience de Le Ny.
Revue de Statistique Appliquée. 1970 - vol. XVIII ? 3
17
bables dont les abscisses
angulaires comptées
àpartir
dupoint supérieur
ducercle,
s’échelonnent de 9 en 9degrés
àpartir
de 4°. Lecouple
stimulus-réponse (i. e.
lecouple position
vraie de lalacune-place marquée
par l’obser-vateur)
est ici uncouple
depoints
du cercle. Il n’est pasquestion
de faire icil’analyse
sur leproduit
S x R de deux ensembles continus : une telleanalyse
intéressante dans le casthéorique
où on connait exactement la loi deprobabilité
ducouple (s - r),
nepeut jamais
être faite sur un ensemble fini de données.Ici,
aucontraire,
le peu de donnéesdisponibles,
même encumulant les essais effectués par les dix
sujets, suggère
de réduire S et R à être des ensembles à 10éléments,
en divisant la circonférence en 10 arcségaux découpés
àpartir
dupoint supérieur. (de
0° à36°,
de 36° à 72°etc.. ) . Chaque paire (s, r)
devient ainsi unepaire
de nombrescompris
entre 1 et10.
Toutefois afin de ne pas codertrop grossièrement l’information,
unpoint
situé àproximité
de la limite des deux arcs est affecté à la fois à l’un et à l’autre avec despoids
convenables.Ainsi,
parexemple,
uncouple (32°, 72°)
se trouveracompté
commequatre couples,
chacun de masse1/4 : (1, 2), (2, 2), (1, 3), (2, 3).
Onpeut présenter
autrement cetterègle,
eten même
temps
lajustifier,
en disant que, dans le cas d’ungrand
nombrede
couples (s, r),
elle revient à coder aléatoirement un s ou un rproche
dela
jonction
de deux arcs, soit par le numéro de l’un de ces arcs, soit par le numéro de l’autre.Ce
codage achevé,
on a une matrice de confusion 10 x 10 dont l’ana-lyse
factorielle fournit sur les erreurs commises par lessujets,
des loisque le
simple
examen des données n’avait quepartiellement
révélées.On retrouve
d’abord,
dans leplan
des deuxpremiers facteurs,
la suitedes stimuli et celle des
réponses rangés
de 1 à 10 sur un contour à peuprès
circulaire. Stimuli et
réponses
de même rang secorrespondent
à peuprès :
toutefois il y a dans la moitié
supérieure
ducercle,
undécalage systéma- tique
desréponses :
ainsi lepoint
R9 est entre S9 etS8 ;
cequi indique qu’une réponse
fausse seraplutôt
dutype
R9 pour S8(ou, symétriquement
par
rapport
à laverticale,
R2 pourS3),
i. e. décalée vers lepoint supé-
rieur du cercle. Dans la moitié inférieure du
cercle,
stimuli etréponses
sont le
plus
étroitement resserrés. En sorte que, dansl’ensemble,
l’ana-lyse
factorielle fournit de laconfiguration
circulaire étudiée une carte à échelle variable : l’échelle étant maxima aupoint supérieur (où
lessujets
commettent le moins
d’erreurs)
et minima aupoint
inférieur. Lespsycho- logues
avaient bien vu sansanalyse
decorrespondance,
l’erreursystéma- tique
dedécalage,
vers le sommet commise dans le demi-cerclesupérieur ;
le
grand
nombre d’erreurs affectant les stimuli inférieurs ne leur avait pasé chappé ;
mais ils n’avaient pas encore conçu l’existence d’une cartequasi- régulière.
3.2 - Ceux
qui
ont étudié lagéométrie
différentielle n’ont pas depeine
à sereprésenter
comment unchangement
d’échelle variable d’unpoint
à unautre, peut
modifier la forme d’unobjet :
il s uffitd’évoquer
le s des 2 rieman-niens,
lesreprésentations
conformes... Pour les moinsgéomètres
disons quec’est une sorte de déformation
perspective,
comme dans unportrait pris
detrès
près
où les mains sontgigantesques
et l’extrémité dudoigt
leplus proche
del’objectif peut
dissimuler un bras... Dansl’exemple analysé
icile
changement
variable d’échelle ne conduit à rien detel,
parcequ’un cercle , allongé
dans une de sesparties,
raccourciailleurs,
reste une courbesimple
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
18
formée. Mais des déformations fort
grotesques
se sontdéjà
rencontrées enpsychologie, plus précisément
enneurophysiologie.
Figure 3.1 - Analyse d’une expérience de vision tachistoscopique ; on a représenté
sur un polygone les numéros attribués aux 10 secteurs en lesquels on a divisé la circonférence.
On sait que la sensibilité cutanée est très variable à la surface du corps :
ainsi,
enappliquant
un compas àpointe sèche, (l’esthésiomètre
deWeber),
sur le dos de lamain,
on constate que lesujet
nedistingue
deuxpiqûres
quelorsque
l’écartement despointes
est de l’ordre de 16 mm.(il
faut pour mesurer ce seuil uneprocédure expérimentale compliquée,
mê-lant,
e. g., auxpiqûres
doubles de l’esthésiomètre despiqûres
faites avecune seule
pointe :
et finalement cequ’on
mesure est l’écartement despointes
àpartir duquel
lesujet
a une chance sur deux de reconnaitre si on lepique
avec un compas ou une
pointe unique) ;
à l’extrémité de lalangue,
au con-traire,
le seuilesthésiométrique
est de 1 mm. Si l’onrapporte
toute la sur- face du corps à une échelle variablepartout égale
au seuilesthésiométrique,
Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3
19
(autrement
dit si l’oncompte
les distancessuperficielles
entre deuxpoints
non en un ou en mm., mais en nombre de
seuils)
etqu’on
tente de faireune
carte,
on obtient uneétrange gargouille
aux lèvresénormes,
à lalangue proéminente,
et dont les extrémitésdigitales, plus épaisses
que les brasrappellent
leportrait
malpris
que nousévoquions
tout à l’heure. Or cette carte n’est pas seulement un divertissement degéomètre :
elle se trouve matérialisée sur les aires deprojection
corticale. En effet si la sensibilité cutanéevarie,
c’est que varie la densité desrécepteurs
sensoriels. De cesrécepteurs
sont issues des fibres nerveusesqui après
des circuitscompli- qués
se trouventreprésentées
dans l’écorce(la périphérie)
du cerveau. Auxfibres issues de
récepteurs
voisinscorrespondent
despoints contigus
du cor- tex ; à ceniveau,
se matérialise dans une carte dont l’échelle(certes
trèsréduite)
est naturellementproportionnelle
à l’écartement desrécepteurs (à
deux
récepteurs
cutanéslimitrophes, correspondent
despoints
du cortexdont la distance ne
dépend
pas du territoire cutanéd’origine) donc,
on l’adit,
au seuil. Cette cartecervicale,
que laneurophysiologie
a puquelque
peuexplorer,
est cequ’on appelle l’homonculus,
lepetit
bonhomme. Plusgéné- ralement,
lespsychophysiologues parlent
d’homonculuschaque
foisqu’à
unniveau des relais nerveux se matérialise une carte
(à
échellevariable)
d’undomaine
d’objets.
Et nous pouvons encore convenird’appeler
homonculus unereprésentation spatiale
quel’analyse
factorielle révèle êtresous-jacente,
enquelque manière,
à notreconception
d’unchamps
duréel,
concret ou même abstrait. Comme le montre brillamment R.N.Shepard,
à l’attention quenous
portons
auxobjets, correspond
une structuremétrique,
éventuellementnon euclidienne.
(cf.
Attention and the Metricle Structure of the StimulusSpace, 1964a ;
article dont le titresignificatif
vaut d’être cité enentier).
3. 3 - Revenons aux travaux de Richard et Rouanet pour exposer les
analyses
faites par B. Le Roux de deux autres sériesd’expérience.
Dansces
expériences,
à la différence de cellesanalysées
aux n" 3.1, la loi dedistribution du
stimulus,
-c’est-à-dire de la lacune dans l’anneau de Landolt- n’est pas uniforme. Laprobabilité,
maxima en unpoint
du cercle que nousappellerons
le mode del’expérience,
décroitrégulièrement
pour s’annulerau
point
diamétralementopposé.
Dans l’une des sériesd’expérience ;
lacourbe
représentative
de la densité deprobabilité
du stimulus en fonction de l’abscisseangulaire comprend
deuxsegments
dedroite,
formant untriangle
avec l’axe des
abscisses ;
dans l’autre série la courbe est sinusoïdale. Nousparlerons,
enbref,
de loitriangulaire
et de loi sinusoïdale. Notons!0 -p! 1
la mesure du
plus petit
des deux arcs de circonférence reliant deuxpoints
d’abscisse 8 et
(p
; notons0~
l’abscisse du mode d’unedistribution ; et
tl’abscisse du
point
diamétralementopposé à 9m ;
alors on a les formules : Loitriangulaire
Loi s inus oidale
Chaque
sériecomprend
10expériences,
dont les modes sont les som- mets d’undécagone régulier ;
etchaque expérience,
faite avec unsujet
dif-férent, comprend
environ 300 essais.Bien que stimulus et
réponse puissent
occuper sur le cercle ungrand
nombre de
positions,
onconstruit,
comme ci-dessus(cf.
n°3.1),
une ma-Revue de Statistique Appliquée. 1970 - vol. XVIII N° 3