G. D
ROUET D’A
UBIGNYL’utilisation des méthodes ordinales en analyse des données
Statistique et analyse des données, tome 1, no2 (1976), p. 63-84
<http://www.numdam.org/item?id=SAD_1976__1_2_63_0>
© Association pour la statistique et ses utilisations, 1976, tous droits réservés.
L’accès aux archives de la revue « Statistique et analyse des données » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commer- ciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impres- sion de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L'UTILISATION DES METHODES ORDINALES en ANALYSE DES DONNEES
p a r
G. DROUET D'AUBIGNY (*)
I - INTRODUCTION
Avec l e développement des moyens i n f o r m a t i q u e s , de nombreuses p r o p o s i t i o n s méthodologiques d ' a n a l y s e de données ont marqué l a d e r n i è r e décade. Leur u t i l i s a t i o n en sciences s o c i a l e s se h e u r t e , l e p l u s souvent, aux d i f f i c u l t é s de détermination du type d ' i n f o r m a t i o n contenue dans l e s données.
Dans ce cas YOUNG e t de LEEUW (21) proposent de déterminer le niveau de mesure des o b s e r v a t i o n s , de façon empirique : i l s e f f e c t u e n t p l u s i e u r s analyses des données é t u d i é e s , sous d i f f é r e n t e s hypothèses
concernant l ' é c h e l l e de mesure. Le niveau r e t e n u e s t l e p l u s élevé de ceux qui conduisent au m e i l l e u r ajustement du modèle d e s c r i p t i f aux données.
Nous montrons qu'une démarche a u s s i coûteuse s ' a v è r e i n u t i l e s i n o t r e i n t é r ê t premier ne r é s i d e pas dans l ' e x p l o i t a t i o n du niveau de mesure des données. Le r é s u l t a t e s t t o u t d'abord é t a b l i à propos des méthodes d'analyse du t r i p l e ( I , < i j , P j ) - Puis nous montrons q u ' i l r e s t e v a l i d e pour l'ensemble des méthodes exprimables dans n o t r e formulation p r o b a b i l i s t e ( 8 , 9 ) , t e l l e s que l ' a n a l y s e des d i f f é r e n c e s i n d i v i d u e l l e s ou l ' a n a l y s e de données de dominance.
Notre étude nous conduit de p l u s à nous i n t e r r o g e r s u r
l ' é q u i v a l e n c e courairanent admise e n t r e l ' a n a l y s e d'un t a b l e a u de d i s t a n c e s euclidiennes e t l ' é t u d e de l a s t r u c t u r e de l a matrice de Gransn a s s o c i é e , dans le cadre de méthodes d'ajustement aux moindres c a r r é s .
T^nT-mptique e t Mathématiques en Sciences Sociales » USSG SAD 2-3 1976
II - DEFINITION ET PROPRIETES D'UN INDICE DE CORRELATION ISOTONE
Les méthodes de régression étudient la liaison entre une variable aléatoire Y, à valeurs r é e l l e s , e t un élément aléatoire X, défini sur le même espace probabilisé ( J T , G , P) - X est en général à valeurs dans un espace mesurable (E, £ ) où E est un espace
vectoriel réel. Lorsque la seule information pertinente sur le phénomène observé est traduite par une relation-d'ordre ^ft-définie sur E, notre intérêt est limité aux éléments V de c dont l ' i n d i c a t r i c e (L (.) est une fonction isotone de (E, ^ . ) dans ({0,1 } , ?/). On définit ainsi une classe % de parties de E qui a structure de sous - en- t r e m i s imitaire de % #
Définition 1 (2)
- liie classe ^ de parties de E est un £ - t r e i l l i s s i e l l e est stable par union et intersection dénonbrâbles.Elle est unitaire s i e l l e contient 0 et E.
- uie fonction m définie sur E et à valeurs dans I? est %- mesurable (m *J[ (W) s i m ([ x, + ««^appartient à IL pour tout réel x .
Par suite m est élément de/£ (y) si et seulement s i m est une fonction istone ( i . e , monotone croissante) de (E,fc) dans (<#,*) et <L
mesurable.
Définition 2
M » i liin •
couple (E,îl) définit un espace mesurable ordsmté e t toute fonction x : ( A 4 P ) » (JE,H)
t e l l e que :
J* = x (%) s o i t ime partie de <c est uie variable {aléatoire ordinale
SAD 2-3 197é
On vérifie aisément que <% est un s o u s - t e t r e i l l i s unitaire de GL e t non une sous tribu puisque Q> n ' e s t pas stable par dualité. Osa peut cependant construire l a notion dfespérance conditionnelle par rapport à ^ e n termes de dérivée de Radon Nikodym (2). Notre exposé étant limité aux méthodes de moindres carrés, nous nous limitons dans l a suite à l'étude de variables
2 2 de carré intégrable (éléments donc de L^ ((Q = LR («fl^P)) • Théorème 1 (2)
i) lrensemble 1 ^ ( ¾ ) des variables a l é a t o i r e s , à valeurs r é e l l e s , <&- mesurables vérifie.
l £ $ > - I j j [ ( Q n f m o X ; mtfy^Oûî
2 2
ii) L~ $ ) est un cône convexe feimé dans l^ (CjJ
2 2 i i i ) Ita <$) est un t r e i l l i s £-couplet dans 1^ (Qj
La structure algébrique ( i i i ) de L~ Çb) donne un fondement théorique à l'algorithme "inverse-rank-image" de GUTCTMW (11). Nous nous intéressons i c i à la structure géométrique (ii) de LZ ÇB) qui assure l ' u n i c i t é de l a projection orthogonale de tout élémeitt Y de i i ($) sur L^ flb>) comme point
le plus proche de Y, dans L« (JA). On peut donc poser l a Définition 3
(ki appelle espérance conditionnelle de Y par rapport à (¾ , l'unique point de Lj. (jfë), le plus proche de Y, que l'on note E(YAh). I l vérifie donc 2
/ IY - E(Y/fc) ! 2 dP < f l Y - m o X l dP
où m est élément àe/( (&) et E(Y/Ô) e s t identifié à l'une de ses versions suivant l'abus de langage classique.
Lhe deuxième conséquence importante de la structure géométrique de L~ Çb) est que l a fonaile de décomposition de l a variance oreste valide dans le cadre ordinal.
SAD 2-3 1976
Var (Y) = Var (E(Yyfc) + E ( | Y - E(Y#>) | 2}
L'analogie avec le rapport de corrélation conduit donc à l a Définition 4 (8)
L'indice de corrélation isotone e s t défini par
^ / Y = g 2 ( Y ^ C Y A ) ) = 1 - ^ l Y - E ^ ^
vA Var(Y)
ou p ( . . . ) est le coefficient de corrélation l i n é r a i r e de PEARSON-BRAVAIS Cet indice asymétrique a une interprétation immédiate en terme de
réduction d'erreur (au sens de BLALOCK (1)) puisque t2 = Var (E(Y/ft)
Y / X Var (Y)
ce qui assure que son domaine de variations est fO» 13 Proposition 1
i) » y/Y ~ Y/TT s* e s t s e u l e f f i e n t si TTS moX» m^^f(V)
ii) ^ y/Y " ° s^ e s t seulement s i tout élément non dégénéré de L-. £B>) a nie corrélation linéaire négative avec Y. Alors E(Y) appartient à E(Y/S) i i i ) S ' i l existe in élément non dégénéré de IZ (%) dont l a corrélation 2 linéaire avec Y est positive, E(Y/0§ vérifie :
^Y / x = Max{p2(Y,V) ; V € ' l £ (¾) Eléments de démonstration
i> est une conséquence directe de l a définition. Uhe démonstration directe de ii) e t iii) est donnée dans (8) • Plus simplement, i l suffit de remarquer que ces deux propriétés sont des conséquences t r i v i a l e s du théorème de dualité convexe.
Les propriétés i) et ii) de la proposition 1 font de » Y/Y u n i*1^0^1 1 1* de dépendance positive au sens de LEHMWN. Mais puisque 0$ n ' e s t pas une tribu,l'opérateur espérance conditionnelle E(./(&) n ' e s t plus l i n é a i r e . I l e s t donc iiçossible d'évaluer V „/v sans construire E(Y/&) . On retrouve
lène classique en régression non l i n é a i r e .
SAD 2-3 1976
Lorsque l'on a observé un échantillon pondéré £l (Xi ,Yi), p i j ; i = 1 . . . n j issu de (X,Y), on peut construire l ' i n d i c e de corrélation isotone empirique
* Y/X = 1 " S Y/X
où S2 Y / X = Inff S2 y / X (m) ; m M (¾)]
n
2 j i . Pi l r i - • C*j)l
2Hy - « w II fr,
S ( m ) = _ = _ _ —
z. p |
y. -
y| 2 « y - r - J l L x
i=l
x 1 noù l'on note | z JL la norme euclidienne du vecteur z de HT pour l a métrique des poids.
n n D = diag ( p . ) , p. > 0 , Z pi = 1 , y.= Z p i y i
n x x i=1 i=1
e t J est le vecteur de ÎE?1 de composantes toutes égales-à 1.
L'évaluation de S , (appelé STRESS) se f a i t en u t i l i s a n t l'algorithme 2 pool-adjacent-violator ([2] , [13)-)
L'essentiel de la discussion future repose sur le r é s u l t a t t r è s sinple suivant, démontré dans un contexte e t sous une forme différentes par WVYER (14) :
Proposition 2
Si l'espérance conditionnelle de Y s a c h a n t e ) e s t une fonction affine de X,
alors T1 2
Y/X converge presque sûrement vers f (X,Y) Elenfônts_de_greuve
Le r é s u l t a t i i i j de la proposition 1 nous assure - sous nos hypothèses - que lorsque * v/v converge, c ' e s t vers le meilleur prédicteur l i n é a i r e de Y - La preuve ' consiste donc à montrer l a convergence presque sure de
SAD 2-3 1976
Remarques:
i) Le cœfficie&t de corrélation linéaire eaçirique est un estimateur fortement consiste
grand :
consistent de p (X,Y) et donc l a proposition 2 assure que pour n assez 2
P( I $ 2 - r2 w ' > £ ) < £ pour tout réel t p o s i t i f
^Y/X XY
et puisque
t
«V^Y/I • * L <*
Y/U VrtaliS£ S2Y/X
en peut écrire pour n grand
« V
£' " * Y / X -
£ < rM <*Y/U
ce qui permet d ' u t i l i s e r Vv, sous l'hypothèse l i n é a i r e , conrae estimateur biaisé (par excès) de f> (#Y)
• ^ A^2
i i ) La comparaison des comportements àe^^/Y e t de l'indice de déteimnation métrique proposé par YOING (20) est éclairée par le r é s u l t a t précédent.
Le biais dû au choix d e ^ Yy^ étant asynptotiquement négligeable, l ' é c a r t entre les estimations des deux indices traduit en f a i t le degré de non respect de l'hypothèse l i n é a i r e . Les simulations de SHEKMNM e t YOUNG (20), interprétées dans cet e s p r i t , montrent, s ' i l en é t a i t besoin, la robustesse des méthodes linéaires aux violations de l'hypothèse de l i n é a r i t é .
SAD 2-3 l»7#
III - APPLICATICN A L'ANALYSE DU TRIPI£
L'expérimentation en sciences sociales conduit très souvent à l'analyse d'un t r i p l e (I,<^T, PT) où I est un ensemble d'objets auxquels e s t affectée une ponde ration î
n
PT : i ^ > p . , p. > 0 , Z p. = 1 , s i 11\ = n .
1 x x
i*1
xe t i . est un indice de dissimilarité entre objets de I :
^ j : (i,e) ^ > Ti e i,e * I
dont l'échelle de mesure - nous excluons à dessein le cas de données, nominales - est l'un des t r o i s suivants.
i) Les données sont d'échelle ordinale s i l'information contenue dans le tableau de données A e s t préservée par toute bijection isotone
i i ) Les données sont d'échelle d ' i n t e r v a l l e s i l'information contenue dans le tableau A est préservée pour toute bijection affine.
t j * a ^ + c } a * JR+ **{<> J } c £ {R
i i i ) Les données sont d'échelle de proportion s i l'information contenue dans le tableau 4 est préservée par toute bijection l i n é a i r e .
h
s a^ 1 >
a €&
+ Nf ° J
Par suite les échelles de mesure i i ) e t i i i ) act59^3eiitde l'inportance à la valeur mjraérique de l ' i n d i c e de dissimilarité - conduisant ainsi
aux méthodes dites métriques - alors que les échelles ordinales -
conduisant aux néthoctes dites ordinales (ou non métrique) - ne retiennent que l'ordonnance induite par <Tr sur I .
SAD 2-3 l*?é
III—1 Le problème posé en aaalyse du t r i p l e
Etant donné le t r i p l e ( I , ôT, PT) nous nous proposons de représenter I dans un espace vectoriel norme V (mais notons H - M v l a norme s u r V)
X : I >> V
i ^ - » X(i) = (xk ( i ) )k = 1 _ r , r = dim (V) , de t e l l e sorte que
i) l a dimension de V soit minimale
i i ) l'ajustement entre les données A e t les distances interpoints reconstruites D soit optimale (au sens des moindres carrés)
D
= ^ i , e e l
die = H * i ) - X M
VLorsque l'on connaît r nous sonnes confrontés à un problème de régression simple, qui s'exprime en termes de moindres carrést
( P J ( D - T | |2 = Min !
DP
où D est la métriqi» des poids dans B^, p = nv» "V , D e t T étant
P L identifiés à des vecteurs de HT ainsi
Dp • diag (¾) , où Pj, a Pt Px s i b = ( i , l ) .
Lorsque ^ j est mesurée sur une échelle ordinale, le problème (P.) e s t résolu par l'algorithme de KBBBKAL(13) qui calcule
ID - T "2
- ttD - T "D -
CD d W ) , %) » MN [ « N (- - y - Ê ; T« IT) ; D* D(I)J li>-d.J |f JJ
où le ctee
SAD 2-3 19H
fe° = { T : T« 1!^ Z T ; / 0 i 2 PP
est l'ensenble des indices de disparité : tT = m o& T, m fonction isotone de (E,R) dans (Rf> ) .
L'ensenble D(I) des distances interpoints d-r compatibles avec norme sur V, e s t un cône non polyédral,dont la convexité n ' e s t assurée (C.F (8)) que lorsque V est un espace euclidien «
En réécrivait (1) sous la forme
d( D(I), %°) = M i n [ M i n C \ 2/ T ; T * fc°) ; D « D(I)]
la proposition 2 nous assure de ce que pour n assez grand» l'algorithme de KRUSKAL permet de construire l a représentation optimale X non seulement dais le cas ordinal, mais aussi
i) lorsque les données sont d'échelle d ' i n t e r v a l l e ; Ceci donne une solution aux moindres carrés au problème de la constante additive
(C.F. TORŒRSCN) (19) très senblable à l'approche de COOPER (5).
i i ) lorsque les données sont d'échelle de proportion, ceci donne \me méthode directe d'analyse du t r i p l e , bien préférable à l'approche
heuristique de SANM3N (17), et conpârable à la téceote oroposition de DE LEEUW ( 7 ) .
SAD 2-3 1IM
III-2 Comparaison à l'analyse factorielle du triple (I, <fr>Pj)
SoitTT le projecteur D orthogonal sur l'hyperplsffi H. orthogonal à la droite des constantes (engendrée par le vecteur J) de IK\
*^= (ï - D, J J) où I est la matrice identité surfflP.
n n J n
La méthode de double centrage de TORŒBSCN (19) associe au tableau d'indices de distsices A la matrice de GRA£ftf
W = J - T AZ\V A2 =(C2 )
* 2 v i l Ji , l € l
Remarque
La matrice W est me matrice de coefficients d'association, au sais de ŒfcâER (10) qui peut ne pas être semi-définie positive. Nous n'abordons pas ce problème i c i et renvoyons le lecteur à (3) ou (8) pour une discussion des difficultés alors rencontrées.
L'opérateur associé à W est le projecteur aux moindres carrés sur la variété linéaire V de pP, support du nuage de points, que l'on cherche à décrire (G. F. OBENCHAIM (15)) - Aussi la démarche adoptée en analyse factorielle du triple (I, <£l ,Pj) consiste à construire X en interprétant l'opérateur WoD dans le schéma de dualité (3)
M W
W * lZ - D M o Z V = Z o Dno u Z M - V"1
SAD 2-3 1976
où la matrice centrée Z = YTT est associée à un tableau f i c t i f de données Y figurant des caractères latents en nonfcre inconnu, mesurés sur I , qui ont permis la construction de A . L e modèle implicite du processus d'élaboration des données doit être mis en question par l ' u t i l i s a t e u r éventuel. D'im point de vue mathématique, i l conduit à juger de la qualité de la représentation X par le critère usuel en analyse en composantes principales (3) :
j^ .V
g
rapport des inerties du nuage w = { (Y(i), pi) ; i £ I J de D^1 par rapport à la variété affine D - orthogonale à V d'une part e t au barycentre g de w d'autre part. I l est immédiat de vérifier q u ' i c i
lP.-I<2~ " T ^ { P i P l ^ i l ; ( i>1 ) 6 I x I ? l
v
s?
d2-
s7 ^f Pi Pi
d 2ii >
( i' ^
€ l x JJ
ce qui conduit à un critère-A. bien peu satisfaisant dans le cas présent.
L'inadéquation de cette démarche à la situation apparaît,d'un point de vue s t a t i s t i q u e , en terme d'invariance. Pour être reconnue valide, une méthode d'analyse doit respecter le niveau d'invariance des données. Cependant alors que l'analyse en composantes principales n ' e s t invariante que par symétrie et translations, W et A ^ J sont deux s t a t i s t i q u e s maximales L(p) - invariantes (15),où nous avons noté L(p) le groupe des transformations affines de plein rang,opérant sur F.
La méthode affine invariante la plus proche (en termes de c r i t è r e optimisé) de l'analyse factorielle du triple>semble ê t r e celle proposée par OBENCHAIN.
(16). On se propose de minimiser
« ( 2 ) ( 2 ) I I2 n t n2 t 2 t Il A - D II D = 4 IIWDn - XX II IL + 2C JD e )4 + 2n leD e
P avec
SAD 2-3 1976
i) î|WD - A X | jn Le critère minimisé en analyse en composantes principales P
i i ) e le vecteur de w comptabilisant les écarts entre distances carrées des n points représentatifs de I à leur barycentres, calculées respectivement dans les configurations Y et X.
C'est dire que les méthodes affines invariantes accordent plus d'importance à l'ajustement des distances aux barycentres que l'approche f a c t o r i e l l e . Celle-cijcomme toute méthode d'analyse de la structure d'une matrice de
GRAM^optimise en f a i t l'ajustement des angles entre vecteurs représentatifs.
De plus, en écrivant (2) (2)
on constate qu'un t e l critère accorde plus de poids aux grandes distances, que la méthode affine invariante de de LEEUW (7), qui minimise
IU -D IID
P=Z {V^-^9 .
b € Bj
critère qui respecte au mieux les données t r a i t é e s .
Dès lors que l'on admet la différence de f i n a l i t é entre méthodes d'analyse d'un tableau de distances d'une part e t de description de l a structure d'une matrice de GRAMM, i l convient de définir une ifiéthode ordinale dans le second cas. Une t e l l e méthode d'analyse factorielle ordinale fut
proposée par GtlTTMAN et LINQOES (12) qui minimisent le "coefficient d'alié- nation";
r 2 i 1 / 2
où r est le coefficient de corrélation linéaire et T e s t un», tableau obtenu par permutation des termes du tableau XX r
T - 111(½) SAD 2-3 1976
en u t i l i s a n t l'algorithme "inverse-rank-image" de GUTTMAN, pour construire m, à chaque itération.
Nous étudions actuellement un modèle équivalent construisant X en termes de régression isotcne aux moindres carrés, par maximisation de*v
^ tXX/WDn La configuration X ainsi construite réalise le minimum de
Il WD - T || S où T = m (tXX) et m est une fonction isotcne
p de (E, ) dans (R, ) .
L'application de la proposition 2 montre l ' u t i l i s a t i o n possible de cette méthode dans un but de protection contre les violations de l'hypothèse linéaire, dues à des transformations isotoies des données.
Remarque :
L'intérêt pratique d'une t e l l e méthode a été souligné par GUTTMAN (12) :
soi u t i l i s a t i o n pour la description des relations d'indépendance d'une famille de caractères ordinaux à p a r t i r de la matrice des corrélations de KENDALL s ' e s t révélée très encourageante. Cependant le coût accru de mise en oeuvre de ce modèle ainsi que l a robustesse des méthodes l i n é a i r e s , signalée plus haut, limite son emploi au cas de fortes non-linéarités.
SAD 2 - 3 1976
IV - EXTENSION DE CES RESULTATS
L'extension des méthodes de régression i s o t c n e , à l ' é t u d e de l a dépendance d'un vecteur a l é a t o i r e Y a valeurs dans $T, de c a r r é i n t é g r a b l e , p a r rapport à une v a r i a b l e a l é a t o i r e ordinale X, d é f i n i sur l e même espace p r o b a b i l i s é (AQ^P) n é c e s s i t e une hypothèse complémentaire. Nous supposons i c i l ' e x i s t e n c e d'une forme l i n é a i r e < . , W> sur L -JI\ (<$ , t e l l e que s o i t élément de l^ (Q) l a variable a l é a t o i r e .
Z : u u n ^ z(u/) = < Y(uu), W >
La mise en oeuvre du modèle l i n é a i r e ordinal consiste à c o n s t r u i r e l a meilleure approximation d e < - , w > au sens des moindres c a r r é s en é t u d i a n t
la régression isotone de Z en X.
Remarque
La régression multiple e t l a régression polynomiale isotones e n t r e n t dans œ modèle q u i , de façon plus g é n é r a l e , couvre tous les modèles de mesures conjointes (YOUNG (20))- Ainsi en posant
Y?- - 1 s i l ' o b s e r v a t i o n (i,l> a p p a r t i e n t à l a classe j , j * J
= 0 sinon | j | = m
où les m-classes SLont déterminées par un plan d'expérience à deux facteurs (correspondant aux indices i e t j ) , l a régression isotone de Z en X permet alors un ajustement ordinal du modèle d'analyse de variance é t u d i é p a r KRUSKAL (13), de LEEUW ( 6 ) , YOING e t de LEEUV (21) :
Z i l = < Y n , - y - a i + b 1 + 6 u
où 6 . , e s t un terme d ' e r r e u r .
SAD 2-3 1976
IV-1 L'aaialyse multiple du t r i p l e
Le problème abordé par ce type d'analyse, plus connu des psychomé- triciens sous le nom d'analyse des différences individuelles, e s t l'étude du t r i p l e .
( I , ( £ j ; j e j j , { Pj ; j 6 j j )
où l'on dispose de m replications ( jj/ = m) de l a mesure de l a dissimi- l a r i t é ô T entre éléments de I . Nous nous proposons de représenter I dans un espace vectoriel norme V de dimension r , e t de représenter J dans le dual V* de V :
X : I >V Y : J -> V*
i ^ x ( i ) - ( x
k( i )
k = 1. .
r ). , J ^ > Y ( j ) - Cy
kU)
k = 1..
r)
de t e l l e sorte que
i) la dimension r de V soit minimale
i i ) l'ajustement entre les données A =)A^ ; j e J j e t les distances inteipoints reconstruites D dans l'espace commun V, soit optimale
(au sens des moindres carrés).
D = ^ 1 , 1 6 I di l = ^ ¾ " XW 4^v
i i i ) Y(j) traduit, dans AT, la contribution (au sens le Loading) de l a donnée A J dans l'espace commun V.
Lorsque r est connu, la détermination de X est ui problème de régression multiple de D en fonction des TJ = f(AJ) où l'expression de f dépend du niveau d'échelle des mesures A ^. On e s t donc conduit à poser l a
SAD 2-3 1976
Définition 5
Oh appelle indice de corrélation ordinale multiple
où $ est le sous ^ - t r e i l l i s de CL engendré par les variables ordinales
/ x . , j € j ] , c'est-à-dire le plus petit sous ^ - t w i l U s et <k contenait les
<T-treillis engendrés par les X-
de plus si nous notons "v / f 7
ordinale multiple, défini cane dans le cas imivarié par âz H T"T | I%
7 i! indice eapirique de corrélation
Le résultat de la proposition 2 s'étend alors de façon iJHtââiate au cas présent Le problème réside en fait en la construction de l'espérai** conditionnelle T . nous avons proposé (8) d'utiliser, dans le cadre oitàinal, des techniques
d'analyse multi-critère, afin de construire une relation d*ordre médian, traduisant l'information portée par le f1 t r e i l l i s , suivant divers critères d'agrégation.
Mais Inapplication de ces méthodes à l'analyse du triple devient très vite fort coûteuse, aussi les approches de Y0U4G et de LEEIW (21) et de LEEW
(7) nous semble t-elles plus proiœtteuses.
La construction de Y utilise le modèle linéaire ordinal. Bn effet s i l'on associe à tort j dans J une ré trique euclidienne èe mftfiâ» W( j ) ,
a pour tout b dansB (b = ( i , l ) )
(2) [ < ^ ]
2- | [ ( i ) - X(1)((J
W(j) Alors
SAD 2-3 19?*
db
2 =jfjPj^bJ
=i
x^ -
x(«l'î
d é f i n i t une distance euclidienne sur V associée à l a fonne quadratique W = -t y P- W(j) où l'on suppose donnée une pondération P . s u r J De l a même façon que dans le modèle INDSCAL de CARROLL (20), nous i n t e r p r é t o n s W comme la métrique sur l'espace commun V, i n d u i s a n t l a distance D e t nous
imposons aux W(j) d ' ê t r e diagonales. Si nous notons Y(j) le vecteur des termes diagonaux de W(j) e t
zk (b) = (xk (i) - xk ( l ) )2 , Z(b) = Uk( b )k = 1_r) î b = ( i , 1 ) * L'expression (2) s ' é c r i t :
W
2 = < Z(b), Y(j) 7Ainsi en maximisant ^ rJ/AJ c o n s t r u i t - t o n Y(j) pour t o u t j dans J . De
A -
plus le tableau de décomposition de l a variance associée aux y - e t
C 2 T^/A-t à ^¾ • permet-il un meilleur jugement de l a q u a l i t é
D/£J,j^ Jj
des représentations c o n s t r u i t e s . La proposition 2 montre qu'une t e l l e méthode généralise le modèle INDSCAL, dont i l partage l e s f a i b l e s s e s , l i é e s à l a contrainte non t e s t é e de diagonalité des W(j) .
SAD 2-3 1976
IV-2 L'analyse en composantes p r i n c i p a l e s ordinale
De noîiforeuses méthodes d'analyse de données de dominance ont été proposées e t leur expression en termes de régression isotone e s t donnée dans (8)* Nous nous limitons i c i à l'approche de SHEPARD e t KRUSKAL (18).
Les données de dominance se présentent sous l ' u n e des deux formes suivantes :
i) un tableau A résume un ensemble J de classements des éléments d'un ensemble f i n i I .
i i ) une famille de tableaux de comparaisons par p a i r e s des éléments de I { ^ ^ 9 J e J J n o u s e s t donnée .
Nous supposerons dans la s u i t e la t r a n s i t i v i t é des comparaisons par p a i r e s de s o r t e que l'équivalence de i) e t i i ) e s t assurée.
On se propose de c o n s t r u i r e , dans un espace e u c l i d i e n V de
dimension r minimale, une r e p r é s e n t a t i o n X de L L'ensemble J e s t d é c r i t dans le dual Ar de V de t e l l e s o r t e que les d i s t a n c e s à l ' o r i g i n e des projections des points r e p r é s e n t a t i f s X(i) s u r la d r o i t e D., associée dans V à la forme l i n é a i r e Y(j) r e s p e c t e n t au mieux l e s classements donnés.
A i n s i , s i l'on impose à Y(j) d ' ê t r e norme à 1, on demande au produit s c a l a i r e
Z ^ = < X ( i ) , Y(j)>
d ' ê t r e une fonction isotone des données o . .
SAD 2-3 1976
On impose de plias l e s c o n t r a i n t e s u s u e l l e s en analyse en composantes p r i n c i p a l e s i ) de centrage des X(i)
i ) de centrages des X(i)
i i ) de s p h é r i c i t é du nuage des X(i)
*XX = n i
qui assurent l ' u n i c i t é de la r e p r é s e n t a t i o n .
Le modèle l i n é a i r e o r d i n a l permet de c o n s t r u i r e X e t Y, en posant
Zj - ^ ( j ) .
La régression isotone de Z. enA** maximise l ' i n d i c e ^ ^ ,T- e t l e s a u t e u r s proposent de juger la q u a l i t é de l a r e p r é s e n t a t i o n p a r l ' i n d i c e
« 2 - £ p < i D -%-]
où T- e s t uie fonction isotone d e AJ. Un t e l c r i t è r e nous semble moins adapté au problème que l ' i n d i c e empirique de c o r r é l a t i o n o r d i n a l e , ce q u i p o u r r a i t expliquer l a s e n s i b i l i t é de c e t t e méthode aux phénomènes de dégénérescence s i g n a l é s par les auteurs (18).
Remarques
* L ' u t i l i s a t i o n de la p r o p o s i t i o n 2 dans ce cadre ne p r é s e n t e qu'un i n t é r ê t t h é o r i q u e , compte tenu du coût accru de c e t t e méthode comparativement à une analyse en composantes p r i n c i p a l e s l i n é a i r e . La r o b u s t e s s e de c e l l e - c i aux n o n - l i n é a r i t é s v i e n t c o n f o r t e r ce jugement.
- L ' i n t r o d u c t i o n d'une pondération Py s u r l'ensemble des o b j e t s c l a s s é s bien que non étudiée p a r l e s a u t e u r s , e s t immédiate e t p r é s e n t e un grand i n t é r ê t p r a t i q u e en sciences s o c i a l e s .
SAD 2-3 1976
V - REFERENCES
(1) BLALOCK, H.M. (1974) - Ivfeasurement i n the s o c i a l s c i e n c e s - t h é o r i e s an s t r a t é g i e s - Aldine p u b l . comp. - CHICAG3 • (2) BARLOW,R.E and Alt (1972) - S t a t i s t i c a l inference under order r e s t r i c -
t i o n s - Wiley and sons - New York • (3) CAILLEZ, F and Alt* (1976) - I n t r o d u c t i o n à l ' a n a l y s e des données -
S.M.A.S.H. - 9 , rue Duban - 75016 PARIS . (4) C00MBS,C-H (1964) - A theoiy of d a t a - Wiley - New York .
(5) G0OPER,L.G. (1972) - A new s o l u t i o n t o the a d d i t i v e c o n s t a n t problem i n metric n u l t i d i m e n s i o n a l s c a l i n g -
PSYCHQfcETRIKA - Vol 37 n° 3 pp 311-322 •
(6) de LEEUW,J (1968) - Non m e t r i c l i n e a e model - Mimeographed EN 00369 EF of d a t a theory - Leiden - the Netherlands • (7) de LEEUW, J (1976) - Application of ccnvex a n a l y s i s t o multidimen-
s i o n a l s c a l i n g - I n v i t e d paper - European meeting of s t a t i s t i c i a n s - Grenoble • (8) DRDUET D'AUBIOW, G. (1975) - Description s t a t i s t i q u e des données
o r d i n a l e s : Analyse multidimensionnelle thèse de 3° cycle - GRENOBLE •
(9) DROUET D'AUBKNY, G. (1976) - Description multidimensionnelle des données o r d i n a l e s - SEMINAIRE I . R . I . A . en c l a s s i f i c a t i o n automatique (à p a r a î t r e ) • (10) GOWER, J . C . (1966) - Some d i s t a n c e p r o p e r t i e s of l a t e n t r o o t
and v e c t o r methods used in m u l t i v a r i a t e a n a l y s i s - BIOSŒTRIKA n° 53 pp 325-338 •
SAD 2-3 1976
(11) GUTTMAN, L. (1968) - A gênerai non metric technique for finding the smallest coordinate space for a configuration of points - PSYCHCMETRIKA - Vol 33 n° 4 pp469-506 •
(12) GuTTMAN, L. e t
LINGŒS J.C. (1967) - Non metric factor analysis a rank reducing alternative t o linear factor analysis -
MH.TIVARIATE BEHAVIORAL RESEARCH - october 1967 pp 485-505 -
(13) KRUSKAL, J.B. (1964) - Hiltidimensional s c a l i n g for optimising goodness of f i t t o a non-metric hypothesis -
PSYCHCMETRIKA vol 29 pp 1-27 e t vol 29 pp 115-12Î
(14) MMfER, L.S (1973) - Estimating a corrélation c o e f f i c i e n t when one variable i s not d i r e c t l y observed - J.A.S.A.
n° '68 pp 420-421 .
(15) OBENCHAIN, R.N. (1971) - Multivariate procédures invariant under linear transformations - ANNALS OF MATHEMVTICAL STATISTICS - Vol 42 n° 5 pp 1569-1578.
(16) OBENCHAIN, R.N. (1973) - Affine multidimensional s c a l i n g - Mimeographed BELL LABORATORIES - MURRHY HILL - New Jersey USA .
(17) SAMNON, J*W. (1969) - A nén linear mapping for data structure analysis I.E.E.E. TRANS ON COMPUTERS Vol. C 18 n° 5 MAÏ"
pp 401-409 .
(18) SHEPARD, R.N e t
KRUSKAL J.B. (1974) - A non-metric variety of linear factor analysis PSYCHONETRIKA Vol 39 n° 2 pp 123-156 .
SAD 2-3 1976
(19) TORGERSON, W.S (1958) - Theory and methods of scaling - Wiley - New York (20) YOUNG, F.W. (1972) - A model for polynomial conjoint analysis algorithms
dans - Multidimensional scaling - SHEPARD - ROMIEY NERLOVE edi- SEMINAR PRESS - New York .
(21) YOING, F.W., de LEEUW, J (1975) - Non-netric individual différences
multidimensional scaling - PSYCHOMETRIC LABORATORY REPORT n° 146
University of north Carolina -
G. DROUET D'AUBIGNY Département Statistiques
Bt Sciences Humaines e t Mathématiques
Université des Sciences Sociales de Grenoble 47X - 38040 GRENOBLE-CEDEX
SAD 2-3 -1976