L'utilisation des méthodes ordinales en analyse des données

(1)

G. D

^{ROUET D}

’A

^UBIGNY

L’utilisation des méthodes ordinales en analyse des données

Statistique et analyse des données, tome 1, n^o2 (1976), p. 63-84

<http://www.numdam.org/item?id=SAD_1976__1_2_63_0>

L’accès aux archives de la revue « Statistique et analyse des données » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commer- ciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

L'UTILISATION DES METHODES ORDINALES en ANALYSE DES DONNEES

p a r

G. DROUET D'AUBIGNY (*)

I - INTRODUCTION

Avec l e développement des moyens i n f o r m a t i q u e s , de nombreuses p r o p o s i t i o n s méthodologiques d ' a n a l y s e de données ont marqué l a d e r n i è r e décade. Leur u t i l i s a t i o n en sciences s o c i a l e s se h e u r t e , l e p l u s souvent, aux d i f f i c u l t é s de détermination du type d ' i n f o r m a t i o n contenue dans l e s données.

Dans ce cas YOUNG e t de LEEUW (21) proposent de déterminer le niveau de mesure des o b s e r v a t i o n s , de façon empirique : i l s e f f e c t u e n t p l u s i e u r s analyses des données é t u d i é e s , sous d i f f é r e n t e s hypothèses

concernant l ' é c h e l l e de mesure. Le niveau r e t e n u e s t l e p l u s élevé de ceux qui conduisent au m e i l l e u r ajustement du modèle d e s c r i p t i f aux données.

Nous montrons qu'une démarche a u s s i coûteuse s ' a v è r e i n u t i l e s i n o t r e i n t é r ê t premier ne r é s i d e pas dans l ' e x p l o i t a t i o n du niveau de mesure des données. Le r é s u l t a t e s t t o u t d'abord é t a b l i à propos des méthodes d'analyse du t r i p l e ( I , < i j , P j ) - Puis nous montrons q u ' i l r e s t e v a l i d e pour l'ensemble des méthodes exprimables dans n o t r e formulation p r o b a b i l i s t e ( 8 , 9 ) , t e l l e s que l ' a n a l y s e des d i f f é r e n c e s i n d i v i d u e l l e s ou l ' a n a l y s e de données de dominance.

Notre étude nous conduit de p l u s à nous i n t e r r o g e r s u r

l ' é q u i v a l e n c e courairanent admise e n t r e l ' a n a l y s e d'un t a b l e a u de d i s t a n c e s euclidiennes e t l ' é t u d e de l a s t r u c t u r e de l a matrice de Gransn a s s o c i é e , dans le cadre de méthodes d'ajustement aux moindres c a r r é s .

T^nT-mptique e t Mathématiques en Sciences Sociales » USSG SAD 2-3 1976

(3)

II - DEFINITION ET PROPRIETES D'UN INDICE DE CORRELATION ISOTONE

Les méthodes de régression étudient la liaison entre une variable aléatoire Y, à valeurs r é e l l e s , e t un élément aléatoire X, défini sur le même espace probabilisé ( J T , G , P) - X est en général à valeurs dans un espace mesurable (E, £ ) où E est un espace

vectoriel réel. Lorsque la seule information pertinente sur le phénomène observé est traduite par une relation-d'ordre ^ft-définie sur E, notre intérêt est limité aux éléments V de c dont l ' i n d i c a t r i c e (L (.) est une fonction isotone de (E, ^ . ) dans ({0,1 } , ?/). On définit ainsi une classe % de parties de E qui a structure de sous - en- t r e m i s imitaire de %^#

Définition 1 (2)

- liie classe ^ de parties de E est un £ - t r e i l l i s s i e l l e est stable par union et intersection dénonbrâbles.Elle est unitaire s i e l l e contient 0 et E.

- uie fonction m définie sur E et à valeurs dans I? est %- mesurable (m *J[ (W) s i m ([ x, + ««^appartient à IL pour tout réel x .

Par suite m est élément de/£ (y) si et seulement s i m est une fonction istone ( i . e , monotone croissante) de (E,fc) dans (<#,*) et <L

mesurable.

Définition 2

M » i liin •

couple (E,îl) définit un espace mesurable ordsmté e t toute fonction x : ( A 4 P ) » (JE,H)

t e l l e que :

J* = x (%) s o i t ime partie de <c est uie variable {aléatoire ordinale

SAD 2-3 197é

(4)

On vérifie aisément que <% est un s o u s - t e t r e i l l i s unitaire de GL e t non une sous tribu puisque Q> n ' e s t pas stable par dualité. Osa peut cependant construire l a notion d^fespérance conditionnelle par rapport à ^ e n termes de dérivée de Radon Nikodym (2). Notre exposé étant limité aux méthodes de moindres carrés, nous nous limitons dans l a suite à l'étude de variables

2 2 de carré intégrable (éléments donc de L^ ((Q = L^R («fl^P)) • Théorème 1 (2)

i) l^rensemble 1 ^ ( ¾ ) des variables a l é a t o i r e s , à valeurs r é e l l e s , <&- mesurables vérifie.

l £ $ > - I j j [ ( Q n f m o X ; mtfy^Oûî

2 2

ii) L~ $ ) est un cône convexe feimé dans l^ (CjJ

2 2 i i i ) Ita <$) est un t r e i l l i s £-couplet dans 1^ (Qj

La structure algébrique ( i i i ) de L~ Çb) donne un fondement théorique à l'algorithme "inverse-rank-image" de GUTCTMW (11). Nous nous intéressons i c i à la structure géométrique (ii) de LZ ÇB) qui assure l ' u n i c i t é de l a projection orthogonale de tout élémeitt Y de i i ($) sur L^ flb>) comme point

le plus proche de Y, dans L« (JA). On peut donc poser l a Définition 3

(ki appelle espérance conditionnelle de Y par rapport à (¾ , l'unique point de Lj. (jfë), le plus proche de Y, que l'on note E(YAh). I l vérifie donc 2

/ IY - E(Y/fc) !² dP < f l Y - m o X l dP

où m est élément àe/( (&) et E(Y/Ô) e s t identifié à l'une de ses versions suivant l'abus de langage classique.

Lhe deuxième conséquence importante de la structure géométrique de L~ Çb) est que l a fonaile de décomposition de l a variance oreste valide dans le cadre ordinal.

SAD 2-3 1976

Var (Y) = Var (E(Yyfc) + E ( | Y - E(Y#>) | 2^}

(5)

L'analogie avec le rapport de corrélation conduit donc à l a Définition 4 (8)

L'indice de corrélation isotone e s t défini par

^ ^{/ Y} = g ² ( Y ^ C Y A ) ) = 1 - ^ ^{l Y} - ^E ^ ^

vA Var(Y)

ou p ( . . . ) est le coefficient de corrélation l i n é r a i r e de PEARSON-BRAVAIS Cet indice asymétrique a une interprétation immédiate en terme de

réduction d'erreur (au sens de BLALOCK (1)) puisque t^{2 =} Var (E(Y/ft)

Y / X Var (Y)

ce qui assure que son domaine de variations est fO» 13 Proposition 1

i) » y/Y ~ Y/TT^s* e s t s e u l e f f i e n t si TT^S moX» m^^f(V)

ii) ^ y/Y " °^s^^{e s t} seulement s i tout élément non dégénéré de L-. £B>) a nie corrélation linéaire négative avec Y. Alors E(Y) appartient à E(Y/S) i i i ) S ' i l existe in élément non dégénéré de IZ (%) dont l a corrélation 2 linéaire avec Y est positive, E(Y/0§ vérifie :

^^{Y / x} = Max{p²(Y,V) ; V € ' l £ (¾) Eléments de démonstration

i> est une conséquence directe de l a définition. Uhe démonstration directe de ii) e t iii) est donnée dans (8) • Plus simplement, i l suffit de remarquer que ces deux propriétés sont des conséquences t r i v i a l e s du théorème de dualité convexe.

Les propriétés i) et ii) de la proposition 1 font de »^Y/Y^{u n} i*¹^⁰^^{1 1 1}* de dépendance positive au sens de LEHMWN. Mais puisque 0$ n ' e s t pas une tribu,l'opérateur espérance conditionnelle E(./(&) n ' e s t plus l i n é a i r e . I l e s t donc iiçossible d'évaluer V „/v sans construire E(Y/&) . On retrouve

lène classique en régression non l i n é a i r e .

SAD 2-3 1976

(6)

Lorsque l'on a observé un échantillon pondéré £l (Xi ,Yi), p i j ; i = 1 . . . n j issu de (X,Y), on peut construire l ' i n d i c e de corrélation isotone empirique

* Y/X^{= 1} "^S Y/X

où S^{2 Y / X} = Inff S^{2 y / X} (m) ; m M (¾)]

n

2 j i . Pi l r i - • C*j)l

²

Hy - « w II fr,

S ( m ) = _ = _ _ —

z. p |

^y

. -

^y

| 2 « y - r - J l L x

i=l

x 1 n

où l'on note | z JL la norme euclidienne du vecteur z de HT pour l a métrique des poids.

n n D = diag ( p . ) , p. > 0 , Z pi = 1 , y.= Z p i y i

n x x i=1 i=1

e t J est le vecteur de ÎE?¹ de composantes toutes égales-à 1.

L'évaluation de S , (appelé STRESS) se f a i t en u t i l i s a n t l'algorithme 2 pool-adjacent-violator ([2] , [13)-)

L'essentiel de la discussion future repose sur le r é s u l t a t t r è s sinple suivant, démontré dans un contexte e t sous une forme différentes par WVYER (14) :

Proposition 2

Si l'espérance conditionnelle de Y s a c h a n t e ) e s t une fonction affine de X,

alors T^{1 2}

Y/X converge presque sûrement vers f (X,Y) Elenfônts_de_greuve

Le r é s u l t a t i i i j de la proposition 1 nous assure - sous nos hypothèses - que lorsque * v/v converge, c ' e s t vers le meilleur prédicteur l i n é a i r e de Y - La preuve ' consiste donc à montrer l a convergence presque sure de

SAD 2-3 1976

(7)

Remarques:

i) Le cœfficie&t de corrélation linéaire eaçirique est un estimateur fortement consiste

grand :

consistent de p (X,Y) et donc l a proposition 2 assure que pour n assez 2

P( I $² - r^{2 w} '^> £ ) < £ pour tout réel t p o s i t i f

^Y/X^XY

et puisque

t

«V^Y/I • * L <*

Y/U VrtaliS£ S2

Y/X

en peut écrire pour n grand

« V

^£

**' " * Y / X -**

^{£ < r}

**M <*Y/U**

ce qui permet d ' u t i l i s e r Vv, sous l'hypothèse l i n é a i r e , conrae estimateur biaisé (par excès) de f> (#Y)

• ^ A^2

i i ) La comparaison des comportements àe^^/Y e t de l'indice de déteimnation métrique proposé par YOING (20) est éclairée par le r é s u l t a t précédent.

Le biais dû au choix d e ^^Yy^ étant asynptotiquement négligeable, l ' é c a r t entre les estimations des deux indices traduit en f a i t le degré de non respect de l'hypothèse l i n é a i r e . Les simulations de SHEKMNM e t YOUNG (20), interprétées dans cet e s p r i t , montrent, s ' i l en é t a i t besoin, la robustesse des méthodes linéaires aux violations de l'hypothèse de l i n é a r i t é .

SAD 2-3 l»7#

(8)

III - APPLICATICN A L'ANALYSE DU TRIPI£

L'expérimentation en sciences sociales conduit très souvent à l'analyse d'un t r i p l e (I,<^^T, P^T) où I est un ensemble d'objets auxquels e s t affectée une ponde ration î

n

P^T : i ^ > p . , p. > 0 , Z p. = 1 , s i 11\ = n .

1 x x

i*1

^x

e t i . est un indice de dissimilarité entre objets de I :

^ j : (i,e) ^ > Ti e i,e * I

dont l'échelle de mesure - nous excluons à dessein le cas de données, nominales - est l'un des t r o i s suivants.

i) Les données sont d'échelle ordinale s i l'information contenue dans le tableau de données A e s t préservée par toute bijection isotone

i i ) Les données sont d'échelle d ' i n t e r v a l l e s i l'information contenue dans le tableau A est préservée pour toute bijection affine.

t j * a ^ +^{c }} a * JR⁺ **{<> J^} c £ {R

i i i ) Les données sont d'échelle de proportion s i l'information contenue dans le tableau 4 est préservée par toute bijection l i n é a i r e .

h

^{s a}

^ 1 >

^{a €}

&

^{+ N}

f ° J

Par suite les échelles de mesure i i ) e t i i i ) act59^3eiitde l'inportance à la valeur mjraérique de l ' i n d i c e de dissimilarité - conduisant ainsi

aux méthodes dites métriques - alors que les échelles ordinales -

conduisant aux néthoctes dites ordinales (ou non métrique) - ne retiennent que l'ordonnance induite par <Tr sur I .

SAD 2-3 l*?é

(9)

III—1 Le problème posé en aaalyse du t r i p l e

Etant donné le t r i p l e ( I , ô^T, P^T) nous nous proposons de représenter I dans un espace vectoriel norme V (mais notons H - M^v l a norme s u r V)

X : I >> V

i ^ - » X(i) = (x^k ( i ) )^{k = 1} _ ^r , r = dim (V) , de t e l l e sorte que

i) l a dimension de V soit minimale

i i ) l'ajustement entre les données A e t les distances interpoints reconstruites D soit optimale (au sens des moindres carrés)

D

= ^ i , e e l

^d

ie = H * i ) - X M

_V

Lorsque l'on connaît r nous sonnes confrontés à un problème de régression simple, qui s'exprime en termes de moindres carrést

( P J ( D - T | |² = Min !

DP

où D est la métriqi» des poids dans B^, p =ⁿv» "V , D e t T étant

P L identifiés à des vecteurs de HT ainsi

Dp • diag (¾) , où Pj,^a P^t P^x s i b = ( i , l ) .

Lorsque ^ j est mesurée sur une échelle ordinale, le problème (P.) e s t résolu par l'algorithme de KBBBKAL(13) qui calcule

ID - T "²

- ttD - T "^D -

**CD d W ) , %) » MN [ « N (- - y - Ê ; T« IT) ; D* D(I)J li>-d.J |f JJ**

où le ctee

SAD 2-3 19H

(10)

fe° = { T : T« 1!^ Z T ; / 0 i 2 PP

est l'ensenble des indices de disparité : t^T = m o&^T, m fonction isotone de (E,R) dans (R^f> ) .

L'ensenble D(I) des distances interpoints d-r compatibles avec norme sur V, e s t un cône non polyédral,dont la convexité n ' e s t assurée (C.F (8)) que lorsque V est un espace euclidien «

En réécrivait (1) sous la forme

d( D(I), %°) = M i n [ M i n C \ 2^{/ T} ; T * fc°) ; D « D(I)]

la proposition 2 nous assure de ce que pour n assez grand» l'algorithme de KRUSKAL permet de construire l a représentation optimale X non seulement dais le cas ordinal, mais aussi

i) lorsque les données sont d'échelle d ' i n t e r v a l l e ; Ceci donne une solution aux moindres carrés au problème de la constante additive

(C.F. TORŒRSCN) (19) très senblable à l'approche de COOPER (5).

i i ) lorsque les données sont d'échelle de proportion, ceci donne \me méthode directe d'analyse du t r i p l e , bien préférable à l'approche

heuristique de SANM3N (17), et conpârable à la téceote oroposition de DE LEEUW ( 7 ) .

SAD 2-3 1IM

(11)

III-2 Comparaison à l'analyse factorielle du triple (I, <fr>Pj)

SoitTT le projecteur D orthogonal sur l'hyperplsffi H. orthogonal à la droite des constantes (engendrée par le vecteur J) de IK\

*^⁼ (ï - D, J J) où I est la matrice identité surfflP.

n n^J n

La méthode de double centrage de TORŒBSCN (19) associe au tableau d'indices de distsices A la matrice de GRA£ftf

W = J - T A^Z\V A² =(C² )

* 2^v i l^Ji , l € l

Remarque

La matrice W est me matrice de coefficients d'association, au sais de ŒfcâER (10) qui peut ne pas être semi-définie positive. Nous n'abordons pas ce problème i c i et renvoyons le lecteur à (3) ou (8) pour une discussion des difficultés alors rencontrées.

L'opérateur associé à W est le projecteur aux moindres carrés sur la variété linéaire V de pP, support du nuage de points, que l'on cherche à décrire (G. F. OBENCHAIM (15)) - Aussi la démarche adoptée en analyse factorielle du triple (I, <£l ,Pj) consiste à construire X en interprétant l'opérateur WoD dans le schéma de dualité (3)

M ^W

W *^lZ - D M o Z V = Z o Dⁿo^u Z M - V"¹

SAD 2-3 1976

(12)

où la matrice centrée Z = YTT est associée à un tableau f i c t i f de données Y figurant des caractères latents en nonfcre inconnu, mesurés sur I , qui ont permis la construction de A . L e modèle implicite du processus d'élaboration des données doit être mis en question par l ' u t i l i s a t e u r éventuel. D'im point de vue mathématique, i l conduit à juger de la qualité de la représentation X par le critère usuel en analyse en composantes principales (3) :

j^ .V

g

rapport des inerties du nuage w = { (Y(i), pi) ; i £ I J de D^¹ par rapport à la variété affine D - orthogonale à V d'une part e t au barycentre g de w d'autre part. I l est immédiat de vérifier q u ' i c i

lP.-I^<2~ " T ^ { P i P l ^ i l^{; ( i}>1 ) 6 I x I ? l

v

s

?

d2

-

s

7 ^f Pi Pi

d 2

ii >

( i

' ^

€ l x J

J

ce qui conduit à un critère-A. bien peu satisfaisant dans le cas présent.

L'inadéquation de cette démarche à la situation apparaît,d'un point de vue s t a t i s t i q u e , en terme d'invariance. Pour être reconnue valide, une méthode d'analyse doit respecter le niveau d'invariance des données. Cependant alors que l'analyse en composantes principales n ' e s t invariante que par symétrie et translations, W et A ^^J sont deux s t a t i s t i q u e s maximales L(p) - invariantes (15),où nous avons noté L(p) le groupe des transformations affines de plein rang,opérant sur F.

La méthode affine invariante la plus proche (en termes de c r i t è r e optimisé) de l'analyse factorielle du triple^>semble ê t r e celle proposée par OBENCHAIN.

(16). On se propose de minimiser

« ( 2 ) ( 2 ) I I² n^t n² t 2 t Il A - D II^D = 4 IIWDⁿ - XX II IL + 2C JD e )⁴ + 2n^leD e

P avec

SAD 2-3 1976

(13)

i) î|WD - A X | jⁿ Le critère minimisé en analyse en composantes principales P

i i ) e le vecteur de w comptabilisant les écarts entre distances carrées des n points représentatifs de I à leur barycentres, calculées respectivement dans les configurations Y et X.

C'est dire que les méthodes affines invariantes accordent plus d'importance à l'ajustement des distances aux barycentres que l'approche f a c t o r i e l l e . Celle-cijcomme toute méthode d'analyse de la structure d'une matrice de

GRAM^optimise en f a i t l'ajustement des angles entre vecteurs représentatifs.

De plus, en écrivant (2) (2)

on constate qu'un t e l critère accorde plus de poids aux grandes distances, que la méthode affine invariante de de LEEUW (7), qui minimise

IU -D IID

^P

=Z {V^-^9 .

b € B

j

critère qui respecte au mieux les données t r a i t é e s .

Dès lors que l'on admet la différence de f i n a l i t é entre méthodes d'analyse d'un tableau de distances d'une part e t de description de l a structure d'une matrice de GRAMM, i l convient de définir une ifiéthode ordinale dans le second cas. Une t e l l e méthode d'analyse factorielle ordinale fut

proposée par GtlTTMAN et LINQOES (12) qui minimisent le "coefficient d'alié- nation";

r 2 i^{1 / 2}

où r est le coefficient de corrélation linéaire et T e s t un», tableau obtenu par permutation des termes du tableau XX r

T - 111(½) SAD 2-3 1976

(14)

en u t i l i s a n t l'algorithme "inverse-rank-image" de GUTTMAN, pour construire m, à chaque itération.

Nous étudions actuellement un modèle équivalent construisant X en termes de régression isotcne aux moindres carrés, par maximisation de*v

^^tXX/WDⁿ La configuration X ainsi construite réalise le minimum de

Il WD - T || S où T = m (^tXX) et m est une fonction isotcne

p de (E, ) dans (R, ) .

L'application de la proposition 2 montre l ' u t i l i s a t i o n possible de cette méthode dans un but de protection contre les violations de l'hypothèse linéaire, dues à des transformations isotoies des données.

Remarque :

L'intérêt pratique d'une t e l l e méthode a été souligné par GUTTMAN (12) :

soi u t i l i s a t i o n pour la description des relations d'indépendance d'une famille de caractères ordinaux à p a r t i r de la matrice des corrélations de KENDALL s ' e s t révélée très encourageante. Cependant le coût accru de mise en oeuvre de ce modèle ainsi que l a robustesse des méthodes l i n é a i r e s , signalée plus haut, limite son emploi au cas de fortes non-linéarités.

SAD 2 - 3 1976

(15)

IV - EXTENSION DE CES RESULTATS

L'extension des méthodes de régression i s o t c n e , à l ' é t u d e de l a dépendance d'un vecteur a l é a t o i r e Y a valeurs dans $T, de c a r r é i n t é g r a b l e , p a r rapport à une v a r i a b l e a l é a t o i r e ordinale X, d é f i n i sur l e même espace p r o b a b i l i s é (AQ^P) n é c e s s i t e une hypothèse complémentaire. Nous supposons i c i l ' e x i s t e n c e d'une forme l i n é a i r e < . , W> sur L -JI\ (<$ , t e l l e que s o i t élément de l^ (Q) l a variable a l é a t o i r e .

Z : u u n ^ z(u/) = < Y(uu), W >

La mise en oeuvre du modèle l i n é a i r e ordinal consiste à c o n s t r u i r e l a meilleure approximation d e < - , w > au sens des moindres c a r r é s en é t u d i a n t

la régression isotone de Z en X.

Remarque

La régression multiple e t l a régression polynomiale isotones e n t r e n t dans œ modèle q u i , de façon plus g é n é r a l e , couvre tous les modèles de mesures conjointes (YOUNG (20))- Ainsi en posant

Y?- - 1 s i l ' o b s e r v a t i o n (i,l> a p p a r t i e n t à l a classe j , j * J

= 0 sinon | j | = m

où les m-classes SLont déterminées par un plan d'expérience à deux facteurs (correspondant aux indices i e t j ) , l a régression isotone de Z en X permet alors un ajustement ordinal du modèle d'analyse de variance é t u d i é p a r KRUSKAL (13), de LEEUW ( 6 ) , YOING e t de LEEUV (21) :

Z i l = < Y n , - y - a i + b 1 + 6 u

où 6 . , e s t un terme d ' e r r e u r .

SAD 2-3 1976

(16)

IV-1 L'aaialyse multiple du t r i p l e

Le problème abordé par ce type d'analyse, plus connu des psychomé- triciens sous le nom d'analyse des différences individuelles, e s t l'étude du t r i p l e .

( I , ( £ j ; j e j j , { Pj ; j 6 j j )

où l'on dispose de m replications ( jj/ = m) de l a mesure de l a dissimi- l a r i t é ô^T entre éléments de I . Nous nous proposons de représenter I dans un espace vectoriel norme V de dimension r , e t de représenter J dans le dual V* de V :

X : I >V Y : J -> V*

i ^ x ( i ) - ( x

^k

( i )

^{k = 1}

. .

^{r )}

. , J ^ > Y ( j ) - Cy

^k

U)

^{k = 1}

..

^r

)

de t e l l e sorte que

i) la dimension r de V soit minimale

i i ) l'ajustement entre les données A =)A^ ; j e J j e t les distances inteipoints reconstruites D dans l'espace commun V, soit optimale

(au sens des moindres carrés).

D = ^ 1 , 1 6 I^di l⁼ ^ ¾ "^XW⁴^v

i i i ) Y(j) traduit, dans AT, la contribution (au sens le Loading) de l a donnée A^J dans l'espace commun V.

Lorsque r est connu, la détermination de X est ui problème de régression multiple de D en fonction des T^J = f(A^J) où l'expression de f dépend du niveau d'échelle des mesures A ^. On e s t donc conduit à poser l a

SAD 2-3 1976

(17)

Définition 5

Oh appelle indice de corrélation ordinale multiple

où $ est le sous ^ - t r e i l l i s de CL engendré par les variables ordinales

/ x . , j € j ] , c'est-à-dire le plus petit sous ^ - t w i l U s et <k contenait les

<T-treillis engendrés par les X-

de plus si nous notons "v^{/ f 7}

ordinale multiple, défini cane dans le cas imivarié par âz^{H T}"^{T | I}%

7 i^! indice eapirique de corrélation

Le résultat de la proposition 2 s'étend alors de façon iJHtââiate au cas présent Le problème réside en fait en la construction de l'espérai** conditionnelle T . nous avons proposé (8) d'utiliser, dans le cadre oitàinal, des techniques

d'analyse multi-critère, afin de construire une relation d*ordre médian, traduisant l'information portée par le f¹ t r e i l l i s , suivant divers critères d'agrégation.

Mais Inapplication de ces méthodes à l'analyse du triple devient très vite fort coûteuse, aussi les approches de Y0U4G et de LEEIW (21) et de LEEW

(7) nous semble t-elles plus proiœtteuses.

La construction de Y utilise le modèle linéaire ordinal. Bn effet s i l'on associe à tort j dans J une ré trique euclidienne èe mftfiâ» W( j ) ,

a pour tout b dansB (b = ( i , l ) )

(2) [ < ^ ]

²

- | [ ( i ) - X(1)((J

W(j) Alors

SAD 2-3 19?*

(18)

db

^{2 =}

jfjPj^bJ

⁼

i

^x

^ -

^x

(«l'î

d é f i n i t une distance euclidienne sur V associée à l a fonne quadratique W = -t y P- W(j) où l'on suppose donnée une pondération P . s u r J De l a même façon que dans le modèle INDSCAL de CARROLL (20), nous i n t e r p r é t o n s W comme la métrique sur l'espace commun V, i n d u i s a n t l a distance D e t nous

imposons aux W(j) d ' ê t r e diagonales. Si nous notons Y(j) le vecteur des termes diagonaux de W(j) e t

zk (b) = (xk (i) - xk ( l ) )2 , Z(b) = Uk( b )k = 1_r) î b = ( i , 1 ) * L'expression (2) s ' é c r i t :

W

2 = < Z(b), Y(j) 7

Ainsi en maximisant ^ rJ/AJ c o n s t r u i t - t o n Y(j) pour t o u t j dans J . De

A -

plus le tableau de décomposition de l a variance associée aux y - e t

C 2 T^/A-t à ^¾ • permet-il un meilleur jugement de l a q u a l i t é

D/£^J,j^ Jj

des représentations c o n s t r u i t e s . La proposition 2 montre qu'une t e l l e méthode généralise le modèle INDSCAL, dont i l partage l e s f a i b l e s s e s , l i é e s à l a contrainte non t e s t é e de diagonalité des W(j) .

SAD 2-3 1976

(19)

IV-2 L'analyse en composantes p r i n c i p a l e s ordinale

De noîiforeuses méthodes d'analyse de données de dominance ont été proposées e t leur expression en termes de régression isotone e s t donnée dans (8)* Nous nous limitons i c i à l'approche de SHEPARD e t KRUSKAL (18).

Les données de dominance se présentent sous l ' u n e des deux formes suivantes :

i) un tableau A résume un ensemble J de classements des éléments d'un ensemble f i n i I .

i i ) une famille de tableaux de comparaisons par p a i r e s des éléments de I { ^ ^ 9 J e J J n o u s e s t donnée .

Nous supposerons dans la s u i t e la t r a n s i t i v i t é des comparaisons par p a i r e s de s o r t e que l'équivalence de i) e t i i ) e s t assurée.

On se propose de c o n s t r u i r e , dans un espace e u c l i d i e n V de

dimension r minimale, une r e p r é s e n t a t i o n X de L L'ensemble J e s t d é c r i t dans le dual Ar de V de t e l l e s o r t e que les d i s t a n c e s à l ' o r i g i n e des projections des points r e p r é s e n t a t i f s X(i) s u r la d r o i t e D., associée dans V à la forme l i n é a i r e Y(j) r e s p e c t e n t au mieux l e s classements donnés.

A i n s i , s i l'on impose à Y(j) d ' ê t r e norme à 1, on demande au produit s c a l a i r e

Z ^ = < X ( i ) , Y(j)>

d ' ê t r e une fonction isotone des données o . .

SAD 2-3 1976

(20)

On impose de plias l e s c o n t r a i n t e s u s u e l l e s en analyse en composantes p r i n c i p a l e s i ) de centrage des X(i)

i ) de centrages des X(i)

i i ) de s p h é r i c i t é du nuage des X(i)

*XX = n i

qui assurent l ' u n i c i t é de la r e p r é s e n t a t i o n .

Le modèle l i n é a i r e o r d i n a l permet de c o n s t r u i r e X e t Y, en posant

Zj - ^ ( j ) .

La régression isotone de Z. enA** maximise l ' i n d i c e ^ ^ ,T- e t l e s a u t e u r s proposent de juger la q u a l i t é de l a r e p r é s e n t a t i o n p a r l ' i n d i c e

« ² - £ p < i D -%-]

où T- e s t uie fonction isotone d e AJ. Un t e l c r i t è r e nous semble moins adapté au problème que l ' i n d i c e empirique de c o r r é l a t i o n o r d i n a l e , ce q u i p o u r r a i t expliquer l a s e n s i b i l i t é de c e t t e méthode aux phénomènes de dégénérescence s i g n a l é s par les auteurs (18).

Remarques

* L ' u t i l i s a t i o n de la p r o p o s i t i o n 2 dans ce cadre ne p r é s e n t e qu'un i n t é r ê t t h é o r i q u e , compte tenu du coût accru de c e t t e méthode comparativement à une analyse en composantes p r i n c i p a l e s l i n é a i r e . La r o b u s t e s s e de c e l l e - c i aux n o n - l i n é a r i t é s v i e n t c o n f o r t e r ce jugement.

- L ' i n t r o d u c t i o n d'une pondération Py s u r l'ensemble des o b j e t s c l a s s é s bien que non étudiée p a r l e s a u t e u r s , e s t immédiate e t p r é s e n t e un grand i n t é r ê t p r a t i q u e en sciences s o c i a l e s .

SAD 2-3 1976

(21)

V - REFERENCES

(1) BLALOCK, H.M. (1974) - Ivfeasurement i n the s o c i a l s c i e n c e s - t h é o r i e s an s t r a t é g i e s - Aldine p u b l . comp. - CHICAG3 • (2) BARLOW,R.E and Alt (1972) - S t a t i s t i c a l inference under order r e s t r i c -

t i o n s - Wiley and sons - New York • (3) CAILLEZ, F and Alt* (1976) - I n t r o d u c t i o n à l ' a n a l y s e des données -

S.M.A.S.H. - 9 , rue Duban - 75016 PARIS . (4) C00MBS,C-H (1964) - A theoiy of d a t a - Wiley - New York .

(5) G0OPER,L.G. (1972) - A new s o l u t i o n t o the a d d i t i v e c o n s t a n t problem i n metric n u l t i d i m e n s i o n a l s c a l i n g -

PSYCHQfcETRIKA - Vol 37 n° 3 pp 311-322 •

(6) de LEEUW,J (1968) - Non m e t r i c l i n e a e model - Mimeographed EN 00369 EF of d a t a theory - Leiden - the Netherlands • (7) de LEEUW, J (1976) - Application of ccnvex a n a l y s i s t o multidimen-

s i o n a l s c a l i n g - I n v i t e d paper - European meeting of s t a t i s t i c i a n s - Grenoble • (8) DRDUET D'AUBIOW, G. (1975) - Description s t a t i s t i q u e des données

o r d i n a l e s : Analyse multidimensionnelle thèse de 3° cycle - GRENOBLE •

(9) DROUET D'AUBKNY, G. (1976) - Description multidimensionnelle des données o r d i n a l e s - SEMINAIRE I . R . I . A . en c l a s s i f i c a t i o n automatique (à p a r a î t r e ) • (10) GOWER, J . C . (1966) - Some d i s t a n c e p r o p e r t i e s of l a t e n t r o o t

and v e c t o r methods used in m u l t i v a r i a t e a n a l y s i s - BIOSŒTRIKA n° 53 pp 325-338 •

SAD 2-3 1976

(22)

(11) GUTTMAN, L. (1968) - A gênerai non metric technique for finding the smallest coordinate space for a configuration of points - PSYCHCMETRIKA - Vol 33 n° 4 pp469-506 •

(12) GuTTMAN, L. e t

LINGŒS J.C. (1967) - Non metric factor analysis a rank reducing alternative t o linear factor analysis -

MH.TIVARIATE BEHAVIORAL RESEARCH - october 1967 pp 485-505 -

(13) KRUSKAL, J.B. (1964) - Hiltidimensional s c a l i n g for optimising goodness of f i t t o a non-metric hypothesis -

PSYCHCMETRIKA vol 29 pp 1-27 e t vol 29 pp 115-12Î

(14) MMfER, L.S (1973) - Estimating a corrélation c o e f f i c i e n t when one variable i s not d i r e c t l y observed - J.A.S.A.

n° '68 pp 420-421 .

(15) OBENCHAIN, R.N. (1971) - Multivariate procédures invariant under linear transformations - ANNALS OF MATHEMVTICAL STATISTICS - Vol 42 n° 5 pp 1569-1578.

(16) OBENCHAIN, R.N. (1973) - Affine multidimensional s c a l i n g - Mimeographed BELL LABORATORIES - MURRHY HILL - New Jersey USA .

(17) SAMNON, J*W. (1969) - A nén linear mapping for data structure analysis I.E.E.E. TRANS ON COMPUTERS Vol. C 18 n° 5 MAÏ"

pp 401-409 .

(18) SHEPARD, R.N e t

KRUSKAL J.B. (1974) - A non-metric variety of linear factor analysis PSYCHONETRIKA Vol 39 n° 2 pp 123-156 .

SAD 2-3 1976

(23)

(19) TORGERSON, W.S (1958) - Theory and methods of scaling - Wiley - New York (20) YOUNG, F.W. (1972) - A model for polynomial conjoint analysis algorithms

dans - Multidimensional scaling - SHEPARD - ROMIEY NERLOVE edi- SEMINAR PRESS - New York .

(21) YOING, F.W., de LEEUW, J (1975) - Non-netric individual différences

multidimensional scaling - PSYCHOMETRIC LABORATORY REPORT n° 146

University of north Carolina -

G. DROUET D'AUBIGNY Département Statistiques

Bt Sciences Humaines e t Mathématiques

Université des Sciences Sociales de Grenoble 47X - 38040 GRENOBLE-CEDEX

SAD 2-3 -1976

L'utilisation des méthodes ordinales en analyse des données

G. D

’A

2 j i . Pi l r i - • C*j)l

Hy - « w II fr,

z. p |

. -

| 2 « y - r - J l L x

i=l

«V^Y/I • * L <*

Y/X

« V

' " * Y / X -

M <*Y/U

i*1

h

^ 1 >

&

f ° J

= ^ i , e e l

ie = H * i ) - X M

CD d W ) , %) » MN [ « N (- - y - Ê ; T« IT) ; D* D(I)J li>-d.J |f JJ

j^ .V

v

?

-

7 ^f Pi Pi

ii >

' ^

J

IU -D IID

=Z {V^-^9 .

j

( I , ( £ j ; j e j j , { Pj ; j 6 j j )

i ^ x ( i ) - ( x

( i )

. .

. , J ^ > Y ( j ) - Cy

U)

..

)

(2) [ < ^ ]

- | [ ( i ) - X(1)((J

db

jfjPj^bJ

i

^ -

(«l'î

W

« 2 - £ p < i D -%-]

**' " * Y / X -**

**M <*Y/U**

**CD d W ) , %) » MN [ « N (- - y - Ê ; T« IT) ; D* D(I)J li>-d.J |f JJ**

« ² - £ p < i D -%-]