R EVUE DE STATISTIQUE APPLIQUÉE
M. C. W EISS
Décomposition hiérarchique du Khi-deux associé à un tableau de contingence à plusieurs entrées
Revue de statistique appliquée, tome 26, n
o1 (1978), p. 23-33
<http://www.numdam.org/item?id=RSA_1978__26_1_23_0>
© Société française de statistique, 1978, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
23
DÉCOMPOSITION HIÉRARCHIQUE DU KHI-DEUX
ASSOCIÉ A UN TABLEAU DE CONTINGENCE A PLUSIEURS ENTRÉES
M.C. WEISS
Maître Assistant à l’Université René Descartes
INTRODUCTION
Le but de ce texte est de donner une
présentation
unifiée de résultats sur ladécomposition
du Khi-deux associé à un tableau decontingence
àplusieurs
entréesdans le cas où on
dispose
d’une classificationhiérarchique
sur chacune des entrées.Le résultat
principal
estrepris
de la thèse de troisièmecycle
de CAPERAA(1968)
mais lesjustifications,
au lieu d’utiliser des formulationsmatricielles,
sontfondées sur la
décomposition
des mesures considérées comme vecteurs d’un espace linéaire tellequ’elle
a été mise en oeuvre par H. ROUANET et D. LEPINE(1976).
Après
avoirrappelé
leconcept
de classificationhiérarchique
et enparticulier dichotomique,
on introduit la notion de base centrée selon une mesure deproba-
bilité et on montre
qu’on peut
construire une telle base associée à unproduit
de classificationsdichotomiques complètes.
En seplaçant
dans le cadre d’une mesure-produit
on donne les formulesgénérales
pourchaque
terme de ladécomposition,
d’une
part
du Khi-deuxd’adéquation,
d’autrepart
du Khi-deuxd’indépendance.
Un
exemple
concretcorrespondant
à un tableau à trois entrées est traité numé-riquement.
1. CLASSIFICATION
HIERARCHIQUE ;
CLASSIFICATIONDICHOTOMIQUE.
Notation
allégée
pour lespartitions
Si 1 =
{a, b,
c,d,
e,f, g}
lapartition {{a, b} , {c} , {d,
e,f, g}}
sera écrite[a,b;c;d,e,f,g].
a)
Classificationhiérarchique
On
appelle
dichotomie unepartition
en deux classes d’unensemble ;
laparti-
tion
grossière
seraappelée pseudo-dichotomie (on
l’assimile à une dichotomiequi
serait constituée par l’ensemble lui-même et l’ensemble
vide).
Dans ce
qui
suit on considérera un ensemble 1 fini de cardinalsupérieur
ouégal
àdeux,
et despartitions
departies l’
de cet ensemble que l’onappellera parti-
tions dans
I,
onprécisera partielles lorsque I’
sera strictement inclus dansI,
et par- tition sur 1lorsque
1 =l’.
Revue de Statistique Appliquée, 1978 vol. XXVI N° 1
Mots-clés : Tableau de
contingence.
Hiérarchies departies. Décomposition
Algébrique.
Khi-deux.24
Une famille de
partitions
dans 1 seraappelée classification hiérarchique
notéeH,
ouclassification, si,
ordonnée par inclusion desparties :
1)
il y a une seulepartition
initiale(sur 1) ;
2)
toute classeI’
à-plus
d’un élémentengendre
unepartition (sur l’)
de laclassification ;
3)
toutes les classes à un élément de 1appartiennent
à despartitions
de laclassification.
Exemple
avec 1 ={a, b,
c,d,
e,f}
A[a, b ; c; d, e, f] il faut adjoindre [d, e ; f] pour 1
avoir une classification.[a ;b] [d ;e]
Si
H
est une classificationhiérarchique
de 1 onpeut
lacompléter
par lapseudo-dichotomie.
Onl’appellera
classificationcomplète
notée* R =
[Je U[1 ; (j>].
Les
partitions, rangées
dans l’ordreindiqué,
sont les sommets d’un arbre.b)
Classificationdichotomique
On
appelle
classificationdichotomique (resp. complète)
notée 0-(resp. *e)
toute classification
hiérarchique (resp. complète)
forméeuniquement
de dichoto- mies. Une telle famille ordonnée forme un arbreà III -
1(resp. III)
sommets dontchaque
embranchement est au maximum d’ordre deux.A toute classification
hiérarchique
[If onpeut
associer au moins une classifica- tiondichotomique
faisantapparaître
les mêmes classes. Onappelle décomposition dichotomique
(D une sous-famille de cette classificationdichotomique
associée auxclasses d’une
partition
deH.
Engénéral
il y aplusieurs
classifications dichoto-miques,
et doncplusieurs décompositions
despartitions.
Par
exemple
à[a, b ;
c ;d ; e]
onpeut
associer :etc.
(il
y a sixdécompositions
de cettepartition).
On
peut compléter
une telledécomposition
en classificationdichotomique
e.Exemple :
Si 1 ={a, b,
c,d,
e,f}
il suffirad’adjoindre [a, b,
c,d,
e ;f]
et[a;b] à
l’une des
décompositions
ci-dessus.c)
Produit de classificationsSoit 1 =
11
x12
x ... xIIKJ
noté 1 = TIIk, k E K
={l, 2, ... , |K|} (supposé
K
aussi fini avec
IKI
>2).
On noterail i2,
... ,ilKI
un élément de I. Pourchaque k,
soit
{3Lk
=(Blk)’ Qk
ELk
unepartition
dansQk
dont lesBlk
sont les|Lk parties.
({3Lk E pk
ensemble despartitions
danslk).
TIB1k
est(pour
lesQk fixés)
unepartie
de Q. K
Si
PK
est l’ensemble despartitions
dans 1 = IlIk
onappellera produit
de clas-K
sifications dans
Ik(k
EK)
le résultat del’opération qui
associe aux{3Lk (k
EK)
lapartition
notée K{3Lk E PK
formée desparties n Blk lk E Lk
etqui
a donckEK
Il |Lk| classes.
K
Revue de Statistique Appliquee, 1978 vol XXVI N° 1
25
Si
Hk
est une classification deIk ,
on définiraRK
comme la famille desproduits
despartitions
dechaque
ensemblecomposant
et on noteraHK = Hk,
K
kEK.
De même on définira
*HK
=*Hk
àpartir
des classificationscomplètes
k
K
dans
chaque Ik.
Sitoujours |Lk 1 =
2 Vk ~ K onobtient eK = 0 ek
d’oùK
Exemple :
Les
partitions [a, b ; c ; d ; e]
0[f; g] et [a; b] [f,
g;h, i]
ne sont pas compa- rables en finesse sur{a, b}
x{f, g}
et nepeuvent
êtreengendrées
l’une par l’autre.(Un produit HK
de classificationshiérarchiques
n’est pas uneclassification).
2. DECOMPOSITION DE MESURES ET CLASSIFICATIONS
DICHOTOMIQUES
Dans ce
paragraphe
on se donnera sur l’ensemble 1 une mesure deprobabilité
strictement
positive
PI(pi > 0,
Vi~ I).
a)
Préalables et notationsLa mesure
PI
sera considérée comme un vecteur del’espace
des mesures sur 1(on
notera cet espaceRI)
muni de la basecanonique i
E 1(mesures
deproba-
bilité
ponctuelles) :
Comme tous les coefficients pi sont strictement
positifs
onpeut prendre
pIcomme mesure de référence et définir le
produit
scalaire de deux mesuressur I,
xI etyI,
par~xI |yI~ = 7 Xi yi pi
Avec ceproduit
scalaire la basecanonique
estorthogonale
mais n’est pas norméeRevue de Statistique Appliquée, 1978 vol. XXVI N° 1
26
On
appelle
base centrée selon pI toute baseorthogonale
deRj
notée(03B11I),
~ ~L={0,1,.., |~|)20131}
dont levecteur â
coïncide avecPI.
Il résulte de cette définition quepour =0,03B1°I|03B1°I >=~ 03B1°I ~2 = 1, et pour l~0 03B1°I |03B1lI >=0.
Les vecteur de
RI orthogonaux
àai
sont donc les mesures dont la sommedes coefficients est nulle. On les
appellera
des contrastes et leurensemble,
compa- raisonglobale
surI,
les mesuresproportionnelles à 03B1°I
sontappelées pseudo-
contrastes sur 1.
, et si les zQ sont les coordonnées
de xI
dans une base centréeSoit maintenant
f une
mesure defréquence
sur 1 et u~ ses coordonnées dans la même base.~03B1°I |03B1°I~
= 1 :d’où
Donc
Dans la suite on indexera souvent par a,
b,
c desparties disjointes
de I. Ainsion notera
xa = 2:
xi= Y
xi.Quand
une sommation a lieu sur 1 dans soni~a a
entier,
on pourra omettre l’indice.Ex.,
si a et b indexent les deux classes d’une dichotomie surI,
on écrira03A3
xi+ 03A3
xi = xa + x x = xI s’il est besoin dea b
le
préciser.
De même avec
plusieurs
indices : ainsi siil
EIl
et si al indexe unepartie
de
I1,
sii2 E 12
et que a2 etb2
indexent les deux classes d’une dichotomie sur12 :
b)
Base centrée associée à une classificationdichotomique complète
sur I.A la
pseudo-dichotomie [1 ø]
on associera03B1°I = PI.
Ilreste 1 | -
1 dicho-tomies de la classification que nous numéroterons
selon ~~{1,2,...|I| - 1}.
Associons à la dichotomie
[al ; b9 ] la
mesureayant
pour coefficient vpi/p~a si i ~ a~ ; 2013 pi/p~b si i ~ b~, 0 sinon.
Cette mesure associée à la dichotomie sera
appelée
contraste normalisé carla somme de ses coefficients
positifs
estégale
à 1(et
celle de ses coefficientsnégatifs
à -1).
Elle est évidemmentorthogonale
à03B1°I.
Revue de Statistique Appliquée, 1978 vol XXVI N° 1
27 Le carré de sa norme est
Soient deux dichotomies
[a1 ; b 1]
et[a2 ; b2] J
et03B11I
etÊî 2
les contrastesassociés. Ils sont
orthogonaux,
soit parce que leurssupports
sontdisjoints,
soitparce que le
support
de l’un est inclus dans l’une desparties
de l’autre.Nous avons donc bien construit une base associée à la classification. Elle est
définie au
signe près
car on a utilisé l’ordre d’écriture desparties a2
etbe
des dichotomies.Remarque :
si on a une base centrée telle quepour 2 e
0 les coefficients sontproportionnels
àpi/pa~,
i EaQ,
àpi/pb~ ,
i Eb~,
0 sinon(avec pa~ = 03A3
pi etaQ
Pb2 p.), on peut
associer àchaque
vecteur de la base la dichotomie[a~ ; b~ ].
03A3b~
La famille de ces dichotomies formera une classification
dichotomique
de I.c)
Base centrée associée à unproduit
de classificationsdichotomiques complètes
Soit 1 = n
Ik,
k E K ={1,2,..., |K|}, chaque Ik
étant muni d’une mesurek
de
probabilité
strictementpositive EIk
etRIk
duproduit
scalaire associé.On associera à 1 la mesure
produit
- PI =Pjk
que l’onpeut également
écrireK
pj = 03A3I (II pi ) avec
i =(il . i2, ... , iK), et
on muniraRI
duproduit
scalairecorrespondant.
On vérifiera que
lorsque
1 est muni de la mesureproduit PI
leproduit
scalairede deux mesures
produits
03BCI et 03BDI estégal
auproduit
desproduits
scalairescomposants
surchaque Ik.
Considérons maintenant un
produit
de classificationsdichotomiques complètes
sur lesIk
*ek =
*e k
onpeut
lui associer la base obtenue par leK
produit
tensoriel des bases centrées associées àchaque
*e k; = 2 k Q
E IlLk
et
Lk
={0, ,1,... J |Ik|
-1}.
Montrons que cette base estcentrée (selon
lamesure
produit pj).
En effetpremièrement
ellecomporte 1 1
=Il 1 Ik vecteurs,
deuxièmement03B1(0,0,..0)I K03B10Ik = PIk = PI,
troisièmement les vecteurs sont bienorthogonaux.
Selon lethéorème précédent
leproduit
scalaire surRI
est nuldès que l’un des
produits
scalairescomposants s’annule,
cequi
arrivelorsque
deux indices sont différents pour un
Ik,
soit dès que i =~i’, i,i’ E
I.Contrastes
globaux
et contrastes d’interactionSoit
’Ylk
un contraste surIk,
k E K ={1 , 2, ... , K |}muni
de la mesure deprobabilité PIk :
on définira les notions suivantes relatives à des contrastes sur1 = Il
Ik
muni de lamesure-produit pIk :
K K -
- un contraste de la forme
comparaison globale
surIk ;
sera dit
appartenir
à laRevue de Statistique Appliquée, 1978 vol. XXVI N° 1
28
- un contraste de la forme
’Yiki
-"Ylk2 09
nPlk
sera dit appar-k~K- {k1,k2}
tenir à la
comparaison
d’interaction(simple)
entreIk
1 etIk 2 (kl =1= k2)
notée
Ik1 . Ik 2 ;
- un contraste de la forme 03B3Ik1
03B3Ik2 03B3Ik3 kEK- II {k1,k2,k3} Pjk
seradit
appartenir
à lacomparaison
d’interaction(double)
entreIk1, Ik 2
etIk3 (k1 ~ k2 ~ k3)
notéeIk1 . Ik 2 . Ik 3,
et ainsi de suitejusqu’à
lacomparaison
d’interactiond’ordre 1 K 1 - 1
notéeIl . I2
...IIKI.
On
peut
maintenantdécomposer RI en
ces sous-espacesorthogonaux.
Les
projections
d’un vecteurquelconque
surIk, Ik . Ik’,
...I1. 12 ... Ik
sont
orthogonales,
donc le carré de sa norme est la somme des carrés des normes desprojections.
3 . VARIABLE
MULTINOMIALE,
VARIABLEQ2
ET SA DECOMPOSITIONa)
Un ensemb le 1Soit PI la mesure de
probabilité
sur 1(strictement positive),
on noteraNi
les
variables-effectifs,
i EI, qui
suivent une loi multinomiale deparamètres
n et PI* On considèreraégalement
lesvariables-fréquences Fi
=Ni/n ;
on noterafI
la mesure constituée par celles-ci.
Soit maintenant
(03B1~I), ~ ~ L,
une base centrée orthonormée selon pI(cf. 2a).
étant un ensemble de
variables,
lesUQ
sont aussi des variables dont onpeut
connaître la distribution. On vérifie lespropriétés :
On a
donc |I| 2013~
variables non-corrélées de varianceégale
à1 /n.
Dans les conditions
asymptotiques
où lesFi - pi
suivent une loi deGauss, il
en est de même des
U~
et la famille(n U~)
est constituée de variables normales réduitesindépendantes.
On en déduit quemultipliant
par n : npour n
grand.
Supposons
maintenant que(03B1~I), ~
EL,
soit la base associée à une classi- ficationdichotomique complète.
Achaque
dichotomie onpeut
associer la variablenU2 correspondante
distribuéeasymptotiquement
comme unX2
à 1 d.Q.Q2 (lire khi-deux)
est la somme des variables associées à toutes ces dichotomies.Revue de Statistique Appliquée, 1978 vol. XXVI N° 1
29
Soit
{3M
=(Bm),
mE M unepartition
surl’
C 1(|M| ~ 2)
dont ladécomposi-
tion
dichotomique (cf. lb) appartient
à la classification ci-dessus. Onpeut
associer à{3M
le sous-espaceengendré
par les vecteurs de base associés aux dichotomies de cettedécomposition.
Il nedépend
en fait que desparties Bm
de lapartition
initiale.Soit
UM
laprojection
deFI
sur ce sous-espace.nU2
est un élément de ladécompo-
sition de
Q2
selon une hiérarchiecomprenant {3M.
Si on pose pi, on vérifie que
cette variable associée à
(3M
suitasymptotiquement
unX 2
àlM 1 -
1 d.l.b)
Unproduit
cartésien d’ensembles muni d’une mesureproduit
Nous
prendrons
les mêmes conventionsqu’en
2c. Si 1 = nIk,
PI = 0Pjk
K K -
mesure de
probabilité
strictementpositive,
ondésignera
parNi
=Ni1,i2...i|K| les
variables-effectifs suivant la loi multinomiale de
paramètres
n et pj.Suivant les conventions
indiquées
en2a,
on écrira les variables-effectifsmargi-
naux
N ikl ik E Ik.
La variableQ2
définieplus
haut sur 1 sera désormais écriteQ2 T
(comme Q2 total).
Munissons
chaque 1
d’une base centrée orthonormée(03B1~kIk), ~k~ L
et 1 duproduit
tensoriel de ces bases.Q2T/n
est le carré de la norme deFI 2013 pI qui
est uncontraste
orthogonal
àaz
etappartient
donc à un sous-espace vectoriel àIII
- 1 dimensions deRI.
Ce dernier est la somme directe des sous-espacesorthogonaux
suivants: Ck comparaison globale
surIk
et de toutes lescomparaisons
d’interac-tions CK’ = Ik1 Ikr avec K’
C- Ket K’ {k1, k ..., kr}, |K’| ~ 2 CK’
estengendré par
et a parconséquent
dimensions.
On noteraQ2K,
le carré de la norme de laprojection
de. Toutes ces
projections
étantorthogonales
on a :Q2K
seraappelé Q2
associé à lacomparaison globale
surIk.
Pour|K’|
> 1.QK
, seraappelé Q2
d’interaction d’ordre|K’|
- 1 entre lesIk’, (k’~K’).
est distribué
asymptotiquement
commeun
x’
àIIK 1 -
1d.l.,
et peut sedécomposer
selon les éléments d’une classificationdichotomique
associée àIk .
est
asymptotiquement
distribué comme unRevue de Statistique Appliquée, 1978 vol. XXVI N° 1
30
effet comme la base
comprend
les vecteurs03B1°Ik
pourk ~ K’ la. projection
surCK’ se
fait par addition
sur
tous ces1
CeQu peut
sedécomposer
selon toute base decontrastes de
CK
parprojection
den(FI - pi)
surchaque
vecteur debase,
unterme de la
décomposition
suivantasymptotiquement un X2
à 1 d.l.Supposons
maintenant que(03B11Ik),
~~Lk
soit la base associée à une classifica- tiondichotomique complète
suret
considérons unepartition
surl’
Cpouvant
être
engendrée
par les dichotomiesci-dessus,
soit03B2kMk
={Bkm},
m EMk ( IMk | ~ 2);
on lui associera les
|Mk| -
1 vecteurscorrespondants
de labase,
et03B1MkIk
le sous-espace
engendré.
Faisons de même pour tous les
Ik.
Auproduit 13
= kE! K1II · 03B2kMk, "
on associera lesous-espace de
CK engendré
par2ik 0 a ik -
SoitU/3
laprojection
dek~K-K’
I kGK’ ’ Ipl, nU 2
sera la variable associée à13,
élément de ladécomposition
deQ2K,
suivant
asymptotiquement un ~2 à n K’ (|Mk| - 1)
d.l. On obtient k~K’avec K’ = {k1, k2, ... , k|K’|}désignés
par{1,2, ... , /K’n
jk E Jk = {Bk1, Bk
...,Bk I’k}, nj
nombre d’indices tels quejk = I’k.
Les indices inférieurs des N et pindiquent
les sommations effectuées selon les conventionsindiquées
en 2a.4. DECOMPOSITION DE
Qi
DANS LE CAS D’UN PRODUIT CARTESIEN D’ENSEMBLES MUNI D’UNEMESURE-PRODUIT,
LES PARAMETRES ETANT INCONNUS
On
reprendra
les mêmes notations que dans leparagraphe précédent.
Les
probabilités marginales, inconnues,
seront estimées par lesfréquences
correspondantes :
Vk EK pik - Fil,
=Nik/n.
On supposera dans la suiteNik ~ 0,
Vik E 1
L’estimation deQi
est alors lastatistique :
Prenons
P k
comme mesure de référence surIk (et k
pourI). Qi
est le1
K’
carré de la norme de
B/îT (FI - pj).
Soit*ek
une classificationdichotomique complète
deIk
et(â~kIk) ~k ~ Lk
la base centrée orthonorméeassociée,
elle estformée des estimateurs
de la
base associée àk
avecpjk
comme mesure de réfé-rence. De même la base associée à
*ek
= K 0*~k
avec -pj, (oj) =
0 K(â~kIk), ~ 0 Lk,
Q E L = fiLk.
est la famille des estimateurs de la base centrée orthonormée avecK
Revue de Statistique Appliquée, 1978 vol. XXVI N° 1
31
PI = comme mesure de référence. On
peut projeter n(FI - pI)
sur les diffé-_
Rik
"_
rents
vecteurs
de(â~I)
et obtenir unedécomposition
deÔ2T
commeprécédemment (cf. 3b).
a)
Les termes associés auxcomparaisons globales
dechaque Ik
sont nulsSoit
03B2kMk
={Bkm},
m EMk
unepartition
surI’k ~ Ik (dont
la décom-position dichotomique appartient à @k),
etLJMk
laprojection
deFI 2013 pI
surComme il y
a III
- 1 dichotomies associées àvecteurs pour
lesquels
laprojection
estidentiquement
nulle.b)
Termes associés auxcomparaisons
d’interactionsSoit
K’
C K(|K’|
>1), 03B2kMk
={Bkm}, m E Mk’ VkEK’
despartitions
surl’k C Ik (dont les décompositions dichotomiques appartiennent
àchaque e k)
et{3
=03B2kMk, le K
terme deQ2K’ qui
lui est associé est :Dans les conditions où la distribution de
i =
il i2 ... i|K|, peut
êtreapprochée
par une loi de Gauss centrée réduite à II|Ik|-1
K
dimensions
QT -2
est distribuéasymptotiquement
comme unX2
à|I1 I 1121 I
...|I|k|| I
- 1 - 1
(|Ik|
20131) degrés
de liberté. Lesdegrés
de libertéperdus correspondent
auxprojections
sur lescomparaisons globales (et
au nombre deparamètres estimés).
c) Applications
à des données de mobilité sociale de GlassGlass
(1954)
a étudié larépartition
de 3 450 individus selon trois caractèresI, J, K :
- la
catégorie socio-professionnelle
dupère
encinq catégories :
1 ={a,b,
c,d, e}
de laplus
favorisée à la moins favorisée : Cadresupérieur, cadre,
cadremoyen, ouvrier
qualifié,
ouvrierspécialisé ;
Revue de Statistique Appliquée, 1978 vol. XXVI N° 1
32
- le niveau d’instruction du fils en
quatre catégories :
J ={f,
g,h, i}
du ni-veau
supérieur
au niveau inférieur : secondaire+, secondaire, primaire +, primaire ;
- la
catégorie socio-professionnelle
du fils(mêmes
que pour lepère)
K =
{s,t,u,v,w}
L’hypothèse d’indépendance
totalesignifierait
unegrande
mobilitésociale ;
QT
est une distance à cettehypothèse.
Nous donnerons successivement : le tableau des
données, (Q2I.J.K, Q2I.J, Q2I.K et
leurs
degrés
de liberté en faisant les calculs directement sur lespartitions
lesplus
fines pour
chaque ensemble,
et nous les reconstituerons en utilisant pour 1 et J les hiérarchies données enexemple
en le. et pour K lapartition
la fine. Ceci illustrera la méthode dedécomposition exposée.
Notations :
Partitions dans 1 : A
= [a, b ; c ; d ; e ],
B =[a ; b] ,
1 =[a;b;c;d;e]
dans J : C =
[f, g; h, i] ,
D =[f; g] , E = [h; i],
J =[f; g; h; i],
sur K : K
= [s;t;u;v;w].
Ceci
permettra
de voir si pour une "distance àl’indépendance"
il y aavantage
à regrouper les CSP dupère
cadresupérieur
etcadre,
et pour les études du fils à neconsidérer que deux
niveaux, primaire
ouprimaire +,
secondaire ou secondaire+,
ce
qui
a pour effetd’augmenter
les effectifs descatégories.
Tableau des
65
avec le d.l. entreparenthèses après
laspécification
dej3 :
Partition la
plus
fine :Revue de Statistique Appliquée, 1978 vol XXVI N° 1
33
On
peut
voir que lesQ2
d’interaction sont reconstitués à la deuxième déci- maleprès,
ainsi queQi qui
vaut4545,92
si on le calcule directement par la formule- n
(formule
valable pour troiscaractères).
Tous les
Q2
d’interactionsimple correspondent
à des effectifsthéoriques
estimés
supérieurs
à 14. Ils sont toussignificatifs
à un seuil a0,001
saufQ2AD, E
nonsignificatifs, et QBD significatif
à0,05.
Lanon-significativité
deQ2AD
(resp. Q2BE)
veut direque la séparation
de f et g pour C(resp.
a et b pourA,
et het i pour
C) n’augmente
pas lasignificativité
deQ2A[f;g;h,i] (resp. Q2I[f,g;h;i]).
Pour les
Q2
d’interaction double seuls les effectifsthéoriques
minimaux deACF et AEK sont
supérieurs
à 5. Ils sontcependant
toussupérieurs
à 1.Les seuils observés lus dans la table du
X2
sont tous inférieurs à0,01.
Si on admet que les distributionsde Q2
sousl’hypothèse d’indépendance
nes’éloignent
pas
trop
de celles desX2
vers lesgrandes
valeurs onpeut
dire quechaque Q2 triple
contribue à la
significativité
deQ2I.J.K
et doncde Q2T.
n étant facteur dans
les Q2, leur
valeur croît avec l’effectifglobal,
pour un même tableau defréquences.
Onpeut
essayer d’utiliser cettedécomposition
pour utiliser lesregroupements qui
rendentcompte
d’une forteproportion
de la valeurglobale.
En retenant ceuxqui
sontsupérieurs
à 100 on considère le tableau re-groupé :
I C 0 K car A et B interviennentpartout (on
neprend
pas E introduit par2 seulement)
Dans ce tableau les CSP du
père
sont toutesdistinguées
mais les études du fils sontregroupées
en deux niveaux.N.B. Le programme de calcul
qui
a été utilisé pour le calcul des différentsQ203B2,
directement à
partir
du tableau des effectifs à troisentrées,
a étérédigé
enFortran par J.P. LE MOAN et est
disponible
à l’U.E.R. deMathématiques, Logique
Formelle etInformatique
de l’Université René Descartes(Paris V).
Un programme
général
estenvisagé
par H. ROUANET et M.O. LEBEAUX.BIBLIOGRAPHIE
P. CAPERAA. - Sur un test
applicable
au contenupartiel
d’un tableau de contin- gence, Thèse de3ème cycle.
Paris 1968(ISUP).
D. GLASS. - Social
mobility in Britain, London, Routledge
etKegan Paul,
1954.H.
ROUANET,
D. LEPINE. - Structure linéaire etanalyse
descomparaisons, Mathématiques et Sciences Humaines, 56,
1976.Revue de Statistique Appliquée, 1978 vol. XXVI N° 1