A NNALES DE LA FACULTÉ DES SCIENCES DE T OULOUSE
H ENRI C AUSSINUS
Contribution à l’analyse statistique des tableaux de corrélation
Annales de la faculté des sciences de Toulouse 4
esérie, tome 29 (1965), p. 77-183
<http://www.numdam.org/item?id=AFST_1965_4_29__77_0>
© Université Paul Sabatier, 1965, tous droits réservés.
L’accès aux archives de la revue « Annales de la faculté des sciences de Toulouse » (http://picard.ups-tlse.fr/~annales/) implique l’accord avec les conditions générales d’utilisa- tion (http://www.numdam.org/conditions). Toute utilisation commerciale ou impression sys- tématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fi- chier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
Contribution à l’analyse statistique
des tableaux de corrélation
par Henri CAUSSINUS
I~NTR~O’D U~CTI~O~N
L’étude des tables de
contingence,
ou tableaux decorrélation,
est l’une despremières qui
ontpréoccupé
les statisticiens.Cependant, jusqu’à
unepériode récente,
n’avaient étéenvisagés,
àquelques
raresexceptions près,
que des tableaux à deux dimensions et, liées à
ceux-ci,
deuxquestions :
testde
l’hypothèse d’indépendance
entre les deux classifications et mesuresglo-
bales d’association. Plusrécemment,
l’on a assisté à une recrudescence de l’intérêtporté
aux tableaux decorrélation;
de nouveauxproblèmes
étaientexaminés;
,c’étaient d’uncôté,
sousl’impulsion
de M.FRÉCHET,
lesproblèmes
d’existence et de construction ,de tableaux à marges fixées
ayant
certainespropriétés,
d’un autrecôté,
lacomparaison
deplusieurs
tables de contin- gences et l’étude voisine des tables à trois dimensions ouplus;
lespubli-
cations sur ce dernier
sujet
sont essentiellementd’origine anglo-saxonne
et orientées vers lesproblèmes
d’estimation et de tests.Toutefois,
pour tout cequi
concerne l’étude de la structure d’une table decontingence,
peu de travaux avaient étéentrepris.
Il nous a semblé utile de rechercher des méthodesstatistiques qui permettraient l’analyse
du modede corrélation des variables
qualitatives.
Dans cebut,
unpremier
paspouvait consister, lorsque l’hypothèse d’indépendance
étaitinadmissible,
àéprouver
deshypothèses plus
faibles que cette dernière mais dephysionomie
voisine. Ceci nous conduisit à
envisager
des tables decontingence
« volon-tairement »
tronquées;
mais cette étudepouvait
avoir un intérêt au-delà de cettequestion, puisqu’elle
étaitapplicable
aux tables decontingence tronquées
par la force deschoses,
soit paraccident,
soit à cause de lanature même du
problème envisagé.
Vu sous ce nouvelaspect,
leproblème paraissait d’actualité,
il venait de susciterplusieurs publications.
Celles-ci netraitaient
cependant
que des casparticuliers, importants
mais assezsimples,
concernant surtout l’estimation des
paramètres
d’une distribution multi- nomiale paradjonction
deplusieurs
échantillonsincomplets.
Nous avonsessayé
d’abord de poser les bases ,d’une étude trèsgénérale
de cesquestions (Chapitre I), puis
de trouver des méthodes d’estimation aussisimples
quepossible
pour tous les cas de troncature(Chapitre II) ;
nous avons constaté78
que l’on
pouvait
se ramener pour cela à la construction d’un certain tableau à marges fixées et notre étude utilisequelques
théorèmes relatifs à cettequestion,
établissant ainsi unejonction
entre lespréoccupations
de l’écolefrançaise
et de l’écoleanglo-saxonne.
Après cela,
nous exposonsquelques
tests pour les tables decontingence tronquées.
Ceux-cipeuvent
être utiles à des finsvariées,
d’abord pour les tablestronquées proprement dites,
ensuite pour les tables decontingence
usuelles dont ils
peuvent permettre d’analyser plus
avant la structure.Toutes ces
questions
ont été traitées auChapitre
III. Nous comparons aussinos
techniques
à de nouvelles méthodes que l’onpeut adapter
d’unepublication
récente de GOODMAN sur la recherche d’intervalles de confiance pour les interactions dupremier ordre, publication qui
a paru alors que leprésent
travail étaitdéjà entrepris.
Dans le
Chapitre IV,
nous étudionsquelques généralisations.
Nous mon-trons d’abord comment l’on
peut
étudierquelques
nouvelleshypothèses
surla structure d’un tableau de corrélation à deux dimensions. Nous
envisageons
ensuite les tableaux à trois dimensions.
Essayant
enfin depoursuivre
notre étude surl’analyse
d’une table decontingence (à
deuxdimensions)
nous avons étudiéplus particulièrement
au
Chapitre V,
des modèles d’association pour des tableaux carrés. Outre lespropriétés mathématiques
de cesmodèles,
nous examinons leursignifi-
cation et leur
portée pratique.
Comme on le verra, celle-ci semble assezvaste,
enparticulier
pour les tableauxqui
décrivent certains processus de transition(au
sens leplus large)
de grouper d’individus.Pour
terminer,
nous exposons auChapitre
VIquelques applications
desméthodes que nous avons
introduites,
tant pour illustrer lestechniques mathématiques impliquées
que lespossibilités pratiques
de ces méthodes.M. le Professeur
Léopold ESCANDE,
Membre del’Institut,
a bien vouluprésenter
à l’Académie des Sciencesplusieurs
notes contenant lesprincipaux
résultats de ce
mémoire; qu’il
veuille bien trouver icil’expression
de mavive et
respectueuse gratitude.
M. le Professeur Jean
CoMBES, qui
fut l’un de mespremiers
maîtres àla Faculté des Sciences de
Toulouse,
m’a fait l’honneurd’accepter
laprésidence
duJury; qu’il
soit assuré de ma très sincère reconnaissance.NI. le Professeur
Roger HURON, qui
m’a accueilli dans son Laboratoire deStatistique,
est àl’origine
de cetravail;
les conseils et lesencouragements qu’il
m’aprodigués
ont été nécessaires à sonaboutissement; je
leprie
decroire à ma
profonde gratitude
et à mon fidèle attachement.M. le Professeur Henri MASCART a bien voulu me proposer le
sujet
deseconde thèse et m’a aidé à sa
préparation
avec une bienveillantesollicitude,
je
l’en remercie très vivement.M. le Professeur Jean MÉRIC a bien voulu se
joindre
auJury,
me témoi-gnant
une nouvelle fois sasympathie; je
lui adresse ici mes remerciements chaleureux.Mes remerciements vont aussi à M"e
Élisabeth LAMBERT,
Collaboratricetechnique, qui
m’a aidé pour la mise en ,oeuvre des méthodesnumériques,
et à Mme Irène CORACIN
qui
a assuré avec dévouement etcompétence
la miseen pages de ce travail.
Je ne peux citer ici tous les autres chercheurs et techniciens du Labo- ratoire de
Statistique, pourtant
leur amitié dévouée m’est une aide constante :qu’ils
soient assurés de toute masympathie.
ÉTUDE DES RELATIONS DU TYPE HR
A. -
THÉORÈMES
GÉNÉRAUX PRÉLIMINAIRESNous avons rassemblé dans cette
partie
les énoncés et démonstrations dequelques
théorèmes purementalgébriques,
dont nous nous servironsdans l’étude
statistique qui
suit.L Notation.s et définitions.
On considère un ensemble de r indices que l’on notera
1,2,
..., r et unensemble de s indices notés
1,2,
..., s. Soit C l’ensembleproduit.
R étantune
partie
deC,
on pose :Les
propriétés
suivantes se déduisent immédiatement de ces définitions :Dimensions de R : : Si RcC est telle que Card
(R) = 1,
Card(R*)
= c ondira que R est
(1, c) .
.Connexité : On dira que R c C est connexe si
Relation : Soit G un groupe dont nous noterons la loi de
composition multiplicativement (l’opposé
dex E G
seradésigné
par x-1 ) . Sauf mention ducontraire,
les lettres indicées p., q ;,etc...)
seront des éléments de G.A tout
(i, j ) appartenant
à C on associe un élément deG,
soit gij. HR seradéfinie par :
HR
vraie, signifie
donc que les g,; sont tels que lesystème
g~; = pourtout
(i, j ) E R
admet une solution que l’on noterasimplement (p, q) .
. Cettesolution n’est pas
unique,
eneffet, quel
que soitk E G,
sip;’
=p;k (i ER)
etq’;
=k-iq, (j E R*)
l’ensemble(pB q’) répond
aussi à laquestion. Cependant,
l’on conviendra de dire que la solution
(p, q)
estunique,
si pour toute autre solution(p’, q’)
il existek E G
tel quep;’
=p;k
pour tout iER,
cequi implique q;’
= pourtout j E R*.
Il.
Propriétés
desparties
connexes.Nous démontrons ici
quelques propriétés simples qui
nous seront utilespar la
suite;
dans cette étude Rdésigne toujours
unepartie
de C et noussupposerons
(ce qui
ne restreint pas lagénéralité)
R ={1, 2,
..,I~
etR~ _ ~ 1, 2,
..,c~ lorsque
ceci pourrasimpliner
les notations.Lemme 1. - Si R est connexe,
quelle
que soit R’cR telle queR’~ ~
R~et
R’.;
=R.;
pourtout j appartenant
àR’*,
ilexiste j appartenant
à R* - R’*tel que
En
effet,
l’on a iciSi le lemme ci-dessus était
faux,
l’on aurait en outreR.j
nR’ _ ~
pour tout~ ~
o--j .,-, -, , --~
contredirait
l’hypothèse
.de connexité de R.Bien
entendu,
l’on démontrera de même lapropriété
duale : Si R est con,nexe,-quelle
que s.oit R’~R te.lle que R’#
R etR’;,= Ri.
pour tout- - -- --
Lemmes II. - Soit R connexe
(l, c) )
et r ={ (i, j ) } c C,
alors :Pour montrer la
proposition lia)
supposons R U r non connexe; dans cesconditions,
l’on devraitavoir,
soit r n R = r* n R* =~,
cequi
est contraire àl’hypothèse,
soit pour unepartie R’c R, (R’ U r) (1 (R - R’) _ (R’Ur)*n (R - R’) ~ _ ~;
ceciimplique :
donc nécessairement et de même
ce
qui
est contraire àl’hypothèse.
Les démonstrations de II b et II c sont
identiques;
montrons parexemple
II~b. Il est évident d’abord que R U r est(1 + 1, c).
Montrons que R U r est connexe : si l’on considère unepartition
de R U r en deux compo-santes,
elle est nécessairement dutype (R’ U r, R - R’) ;
dans le cas où R’est
vide,
l’on a r* n parhypothèse
et si :Utilisant la connexité de
R,
l’une des deux intersections ci-dessus estnon vide.
C. q. f. d.
En
appliquant
autant de foisqu’il
sera nécessaire les trois résultats ci-dessus on obtient :Lemme III. - Si R est connexe
)
et lapartie
S e C est telle que S*cR*(resp. SCR)
et S - Ra l1
éléments(resp.
S* - R* a ciéléments),
R U S est connexe(1 + l1, c) [resp. l,
c +ci) ]
.Nous montrerons maintenant le :
Lemme IV. -
a)
Si R est connexe et telle que, pour un idonné,
Ri.a un seul
élé~ment j,
lapartie
S =R - ~ (i, j) ~
est connexe(1 - 1, c).
b)
Si R est connexe et telle que, pourun j donné, R.;
a un seulélément 1,
lapartie
S = R -{ (i, j) ~
est connexe(1, c -1 ) .
Raisonnons sur le cas
a) ;
il est évident que S est(I -1, c) ;
montronsqu’elle
est connexe. Notant r ={(i, j) ~,
on a R = et parhypothèse
(1)
cequi implique puisque
R est connexe.Supposons
S non connexe; ceci entraîne l’existence de S’cS(S’ ~
Set S’ 5~
~)
telle que :On
peut toujours
supposer quel’unique
élément de r*qui
est aussiun élément de
appartient
àS’*;
dans ces conditions il vient par(3) :
en utilisant
(1)
et(2),
et :en utilisant
(3)
et(4).
Dans ces conditions R ne serait pas connexe, ce
qui
est contraire àl’hypothèse.
Donc S est connexe.Théorème 1. - Si R est connexe
(1, c)
alors Card(R) >
1 + c -1.Posons t = Card
(R).
O’n admet t~ t
+ c - 1(1). Supposons >
c. Dansces
conditions,
il existei E R
tel que R;, est réduit à un seulélément,
soit j (en effet,
dans le cascontraire,
l’on auraitt > 2 I > I + c > ~ + c -1 ) .
Soit alors r la
partie
réduite à l’élément(i, j ) ;
R-r a t-1éléments,
et,d’après
le lemmeIV-a,
R - r est connexe(I -1, c);
; sur R - r on pourra raisonner commeci-dessus, l’inégalité (1 ) gardant toujours
le même senspuisque
les deux nombres sont diminués d’une unité.En
appliquant l -
c + 1 fois ce processus def ormation,
on arriveraà une
partie
connexe(c
-1, c)
à t -(1 -
c +1) )
éléments que l’on traitera defaçon analogue
enpermutant
seulement les rôles desindices,
etc.... Onpourra
ainsi,
en 1 + c -- 2 pas, construire unepartie (1, 1 )
à t -(1
+ c -2)
éléments. Or cettepartie
a nécessairement unélément,
donc t = 1 + c -1,
et t ne
peut
être strictement inférieur à 1 + c - 1.On remarquera que,
quels
que soient 1 et c, il estpossible
de construireune
partie
R e C connexe de dimension(l, c),
à 1 + c -1 éléments : parexemple
lapartie
formée des éléments(i, 1) pour i
=1, 2, .., 1
et(1, j) pour j
=1, 2,
.., c(partir de ( (1, 1 ) ~ qui
est évidemment connexe etappli-
quer les lemmes II-b et
II-c).
D’autres
exemples
sont donnés par le théorème suivant.Théorème II. - De toute
partie
R connexe(l, c)
à t éléments(~>/+c20141) )
il estpossible
d’extraire unepartie
connexe(1, c)
à 1 + c - 1 éléments.
La démonstration ci-dessous
donne,
enoutre,
une méthode de construction d’une tellepartie.
On
partira
parexemple
de l’ensembleRi
descouples (1, j)
Si
RI.
a ciéléments,
onpeut
supposerqu’il s’agit
de1, 2,
.., ci.Ri
estconnexe
(ci, 1 ) ,
a ciéléments,
est inclue dans R. Pour R le théorème estdémontré;
sinon considérons tous les indices i différents de 1 tels queR1.
n Ri.~ 03C6 (il
en existe en vertu du LemmeI )
: numérotons2, 3,
..,Il
ces
indices;
lapartie R~
sera constituée de la réunion deRi
et deLI - 1 couples (i, j ) E R
où i vaut successivement2, 3,
..,Il
etoù,
àc’haque i,
est associéun j
et un seul(j peut
être1, 2,
.., ouCI),
cequi
estpossible puisque Ri
n R~.~ ~
pour tout i =1, 2,
..,i. R2
est unepartie (i, CI)
à
Il
+cl -1 éléments,
contenue dans R et connexed’après
le lemme III.Si
Il = 1
et CI == c la démonstration estterminée, sinon, appliquons,
le Lemme 1 avec R’ = et considérons les
indices j
tels queR.~
nR’ ~
soient ci +1,
ci +2,
..., c.2 cesindices; R3
sera formée dela réunion de
R2
et de c., - ci éléments(i, j) où j
= ci +1,
ci +2,
..., c~successivement,
et àchaque j est
associé un indice iE R2. R3
est(1,, c~ )
à
Il
+ c,, -1éléments,
contenue dans R et connexe(Lemme III).
Si
1 ~ t
et c2 ~ c, on continue le processusjusqu’à
obtention d’unepartie
T à l’ + c’ - 1 éléments telle que l’ = 1 ou c’ = c.Si,
parexemple,
l’
= 1,
onadjoindra
à T pourchaque j (j
= c’ +1,
...,c)
un élémentLa
partie
S c R ainsi obtenue est bien connexe(l,c),
avec éléments.Evidemment,
S n’est pas engénéral unique.
I I I.
Propriétés
de la relationH fi .
Le
premier problème qui
se pose est la recherche desparties
R de Cpour
lesquelles
lesystème (p, q)
lié à HR estunique
dans le sens définiau
paragraphe
1.Théorème III. -
(Unicité).
Lorsque
HR estvraie,
lesystème (p, q) )
lié àHR
estunique,
si et seule-ment si R est connexe.
1 °
Supposons
R non connexe; il existe donc et R’~R )
telle que(avec
R" =R - R’) :
Supposons :
Posons
avec
k E G, h E G, /c =7~ h,
cequi
estpossible puisque
R’n R" estvide,
etce
qui
estpossible puisque
R’* n R"* est vide.On a bien pour tout
(i, j ) E R’
comme pour tout(ï, 7) E R",
doncquel
que soit
(i, j) ER:
: gi; = piqj = et l’unicité est en défautpuisque
n.2°
Supposons
R connexe(1, c)
et p~; = p% q; =p’~ q’; pour
tout(i,
d’où pourtout j E
R* et pour tout iE R.; : p’v
=k;.
Le théorème seradémontré,
si l’on montre que pourtout j E R~, k~
= k(.k indépendant :de j).
Partant,
parexemple, de j = 1,
l’on a =kl
pour tout iD’après
le lemmeI,
il existe desindices j ( j ~ 1 )
tels queR.1 fl R.; ~ ~ :
: considérons les tous, onpeut
supposerqu’il s’agit
des indices2, 3,
..,j1.
Ainsi pour
tout j
inférieur ouégal
àj1,
il existera au moins un i ER.i
nR.;
et donc tel que
p’i
= d’où :kl = k2
~- .... =k;l.
Si jl
= c le théorème est démontré.n
Si c, considérons le nouvel ensemble
U d’après
le lemmeI,
, k=1
il existe des indices
j,
différents de1, 2,
..ji,
tels que :On
peut
supposer que ce sont lesindices j1
+1, j1
+2,
.. ,j2,; il
vient enraisonnant comme
plus
haut :ki
=k2 =
... =k;2. Après
mopérations analogues
on aura montré :ki
=k2
= ... =kJm avec jm
>donc, après
un nombre fini de pas, l’on obtiendra bienA’i
=k2
= ... =k~
= k.Théorème IV. - Si
ScR, HIt=->
Hs.(On
aura donc aussi :non
Hs
===~ nonHR) .
La démonstration est immédiate : si il existe p~ et qi tels que, pour tout
(i, j) ER,
g;; j = cette relation sera vraie enparticulier
pour
(i, j) E S.
Théorème V. - Si S = R U
{ (h, k)}
avechER
et(ou
bienh~R
et
k ER*),
Hn ~=>Hs.
On a d’une
part, puisque
R est contenue dans S : Hs _~ HR. D’autrepart, HR
s’écrit :tels que
Si l’on
se place
dans le cas oùh E R
etk g R*,
on a S = R et S* = R* U{k} ;
en
posant
qk =ph 1
ghk l’on vérifie immédiatement queHs
est vraiequel
que soit ghk. DoncHB=) Hs,
cequi
achève la démonstration. Cethéorème
est encore vrai pourh ~
R etk g
R*(mais,
dans ce cas, S n’est pasconnexe)
.Théorème VI. - Si R est connexe
(1, c)
à 1 + c -1élém~ents, HR
est vraiequels
que soient les g~~ associés aux éléments de R.Il suffit de
reprendre
ladécomposition
du théorème 1(dans
le cast = 1 +
c20141).
. On pourra obtenir R enpartant
d’unepartie (1, 1 )
soit r,à
laquelle
onajoutera 1
+ c - 2 fois un élément dans les conditionsd’appli-
cation du théorème
précédent.
D’où HR =>H,.,
or Hr est évidemment tou-jours
vraie.Remarqu.e.
- Si R n’est pas connexe, mêmeayant
un nombre d’éléments inférieur ouégal
à 1 +c -1,
il estpossible
queHp
ne soit pas vraie.Théorème VII. - Si R et S sont telles que R n S = R* n
(HR
etHs)
_> HD’une
part, puisque ReR U S et S cRU S,
l’on aH(RUS)
=>(HR
etHs) (Théorème IV).
D’autre
part, HR
etHs
sont définies par : tels que Vet
tels que ~
Puisque
R n S et R* n S* sont vides et en utilisantR U S =
R U S et R* U S* =(RUS)*,
laconjonction
de ces deux assertions estéquivalente
à :tels que Donc H~ et Hs ==>
Remarque.
- On a utilisé le fait que R n S et Rrc sontvi,des,
et cesconditions sont bien suffisantes pour
impliquer
la conclusion du théorèmeVII,
mais elles ne sont pas nécessaires et il estpossible
de trouver d’autres conditions sur R et Squi
entraînent :(HR
etH~)
_~(en
dehors aussi de la condition triviale R =S).
Le théorème VII est surtout
important
pour le corollairequi
suit. Notons d’abord que, si R n’est pas connexe, il serapossible
de ladécomposer
encomposantes
connexesRi
telles que :L’on a alors
immédiatement
le :Corollaire. - Si R admet k
composantes Ri, R2,
...,Rk,
Théorème VIII. - Si R est connexe
(l, c)
à t éléments(t
> I+c-1),
H~ fixe les valeurs de v = t - I - c + 1 des en foncton de I + c -1 d’entre eux.D’après
le théorèmeII,
il estpossible
d’extraire de R unepartie
connexe(l, c)
à I + c -1éléments,
soitS.Hs
est vérifiéequels
que soient les g~, associés aux éléments deS,
maispuisque
S est connexe lesystème (p, q)
obtenu est
unique
et tel que est bien déterminé pour tout(i, j) E R
et enparticulier
pour tout(i, j ) E R - S. Donc,
les gu associés aux t - I - c + 1 éléments de R - S nepeuvent
pas êtrequelconques,
mais sont fixés en fonc- tion de(p, q) , c’est-à-dire
en fonction des g~; associés aux éléments de S.Corollaire. - ,Si R est
(I, c)
à t éléments et admet kcomposantes
con-nexes, HR fixe les valeurs de v = f - I - c + k des gij en fonction de 1 + c - k d’entre eux.
Supposons
que lacomposante
connexeR~
soitc; )
avecéléments ; HRi
fixe alors Vi = L - Ci + 1 des gij en fonction de li + Ci -1 d’entrefixent donc en fonction de
d’entre eux, et,
puisque
la
proposition
est démontrée.IV. Relations avec la théorie des
graphes.
Considérons le
graphe
r non orienté dont les sommets sont les éléments deR,
et dont l’ensemble r des arêtes est défini par :(s E ~ j, k [ signifiant : s
strictementsupérieur
auplus petit
et inférieur auplus grand
des deuxindices j
etlc,
étant entendu que les deux ensemblesfinis
d’indicespeuvent toujours
êtreordonnés).
Avec cette
définition,
on voit d’abord que la connexité deR,
tellequ’elle
est définie
plus haut,
estéquivalente
à la connexité dugraphe
r.On pourra montrer que, si R est
(1, c)
à t éléments le nombre d’arêtes de r est 2 t - 1 - c.Si R admet k
composantes
connexes, le nombrecyclomatique
dugraphe
sera v = t - 1 -
c + k,
c’est-à-dire le nombre des gi; fixés par la relationHR.
Or,
on sait que v est le nombre decycles
linéairementindépendants
dugraphe, et,
enfait,
toutcycle
de rcorrespond
bien à une relation entre lesg4~
imposée
par HR. Si ces considérationspermettent peut-être
de rendreplus parlantes
certainespropriétés,
nous ne pensons pascependant qu’elles
auraient pu nous
dispenser
des démonstrationsqui précèdent,
ni même lesabréger.
V. Étude d’une extension.
Si l’on considère
maintenant E Go
= G U~0},
où l’élément 0 est tel que, yx E G,
Ox = x0 =0,
on pourratoujours
définir HR de la même manière queprécédemment,
enremplaçant simplement
G parGo.
Si HR estvraie,
et si ghk =
0,
l’on aura :Supposons
parexemple
la deuxième conditionremplie
et notons R’ lapartie
déduite de R en lui retranchant ses éléments de la forme(~ k) ,
kfixé,
On aura encore
ici, puisque
R’ c R : HR ==> Ha Mais on a aussi :en
effet, Hp
s’écrit :et, avec qk =
0,
on aura bien :c’est-à-dire
H~.
En
recommençant
un raisonnementanalogue
s’il existe(i, j) E R’
pourlequel
gR; =0,
l’on voit que l’onpeut
ramener l’étude de Hu à l’étudepré-
cédente pour une
partie
R’ telle que : y(i, j ) E R’,
g~;Cependant,
même si R est connexe, R’ ne l’est pas nécessairement. Dansces
conditions,
le théorème IIIprécédent
n’est pas nécessairement vérifié dans le casprésent,
c’est-à-dire enremplaçant
G parGo;
il en sera demême des théorèmes V - VI et VIII. Par
contre,
les théorèmes IV et VII restent valides.VI.
Propriétés
d’une nouvelle relation.1. . Définition.
On considère
toujours
unepartie
R deC ;
on associe àchaque
élémentde R un élément gi; de G.
La relation
HR
est définie par :~ i ~ R
UR*, 3 fi E G
tels que y(i, j) E R
gij =(on
noteraf
l’ensemble desf
4 ainsidéfinis.)
Remarque.
- Alors queHR
est invariante sous une renumérotationquelconque
des indicesappartenant
à R et de ceuxappartenant
àR~,
iln’en est pas ainsi de cette
opération peut
être faite sur les éléments de R - R* ou ceux de R* -R,
mais si l’onchange
le nom des indices deRn R*,
ce doit être de la mêmefaçon
pour ceux de R et ceux de R~.2.
Propriétés.
a)
On a évidemment: =~ HR(mais
laréciproque
est fausse si R* n R n’est pasvide).
b) )
Unicité. - En uti~li~sant lapropriété analogue
deHR,
on montrefacilement que si R est connexe l’ensemble
f
lié àH;
estunique
en cesens que pour toute autre solution
f’,
il existek E G
tel quef ~’
= ,pour toutiERUR*.
c)
Si R et S sont connexes(1, c)
et S cR,
alors :En
effet, évident,
et a été notéplus
haut.Récipro-
quement,
pour tout(i, j ) E R
on a Yij = pqj en vertu deHR,
et pour toutet en utilisant le théorème d’unicité il vient :
d)
Si R est connnexe(1, c) à t éléments,
le nombre des relations entre les g;;imposées
parHR
estDémonstration. - On
peut
extraire de R unepartie
S connexe(1, c)
à 1 + c -1éléments (Théorème II).
Pour(f, 7) E S
onpeut
écrire gij =f;q;
(de façon unique
au sens utiliséjusqu’ici). D’après
lapropriété précédente
HRest équivalente
à or, onpeut toujours
poser q, = pour maisH s impose
entre les où(i, j ) appartient
àS,
les drelations q; =
pour j ERn R*,
d’autrepart, Hp
fixe en fonction de ces g;; où(i, j ) E S,
les t - I - c + 1 gd; où(i, j )
B. - INTRODUCTION A L’ÉTUDE
STATISTIQUE
DES TA’BLES D.E CON~TIN~GEN~C~ETRONQUÉES
1. Notations et définitions.On considère maintenant une
population
dont les élémentsprésentent
chacun un caractère A sous une forme a, et un caractère B sous une forme
03B2j.
L’association descaractères 03B1i
et{3j
sera notée ai03B2j [(i, j)
EC] .
La
probabilité qu’un
individu tiré au hasard de cettepopulation
ait lecaractère ai
~3;
est :Sachant que
(i, j ) appartient
à un sous-ensemble donné R deC,
cetteprobabilité
est(en supposant L p~~O) :
:II.
L’hypothèse HR:
ses différentes formes.R étant
toujours
unepartie
deC,
supposons d’abord que, pour tout(i, j) E R,
p~; est strictementpositif.
Prenant pour G le groupemultiplicatif
des nombres réels strictement
positifs,
onpeut
associer à tout(1, j)
deR,
laprobabilité
p;; =/?,] ;
; la relationHR
définieplus haut
comme étantune
propriété
de cesnombres,
sera considérée maintenant comme unehypothèse statistique.
En associant aux éléments de R les nombres
P~,
au lieu des p;;, on pourra définirtoujours
de la mêmefaçon
une relationHR’
entre cesnombres.
Il est immédiat que
HR
etHR
sontéquivalentes puisque,
pour tout(~, j)
de
R,
le rapport est constant.Enfin
HR
etHR’
sontéquivalentes
àHR"
etH~"’
définiesrespectivement
par :
Montrons par
exemple :
donc,
si estvraie,
il existe des Piet q~
j tels que :d’où:
Réciproquement,
si HR" estvraie,
il existe des p~ tels que :etPr
nous donne :
On
peut
alors poser,puisque
nedépendent
quede j
pour tout
d’où
On montrera de même
l’équivalence
deHR
etHR"’.
Finalement :Remarque.
- H~ ouH~
sont deshypothèses d’indépendance classiques.
Discussion. - Si certains des
(i, j) ER,
sontnuls,
on utilisera les résultats du A - V. Dans lapratique,
il suffira de voir si les p~; nuls sontcompatibles
avecHR
ou non, et, dans lepremier
cas, d’étudier au lieu deHR l’hypothèse HR,
où R’ c R est telle que p~; est nul pour(ï, 7) E R - R’,
aiorsque, pour tout
(i, j) E R’,
p;; est strictementpositif.
On pourra donc dans l’étude de HR se ramenertoujours
à desparties
R telles que p;; est différent de zéro pour tout(i, j)
de R.III.
Hypothèse
HR et interactions.Supposons
p~; > 0 pour tout(i, j) E C.
A la suite de GOODMAN(1964 a),
nous
désignerons
sous le nom d’interactions dupremier
ordre ,dans unetable de
contingence
rX s,
lesquantités :
où u est un vecteur de à rs
composantes (i, j) E C,
telles que :désigne
l’ensemble des nombresréels).
Sous
l’hypothèse HR,
l’on aura :pour tout u tel que :
En
effet,
si u vérifie(1)
et(2 )
et si HR estvraie,
l’on a :Nous allons montrer que la
réciproque
est vraie. Ondésignera
par u àpartir
de maintenant un vecteur de( t
=Card (R) )
decomposantes
lltj,
(i, j ) E R.
On noteraI (R )
l’ensemble des vecteurs deffi.t
tels que(2)
est vérifié ; 1
(R)
est un sous-espace vectoriel de Pour touti E R,
notons le vecteur de
~t
decomposantes
= Oih est lesymbole
de
KRONECKER).
Demême,
est le vecteur de~‘
decomposantes 2014ô~.
O.n a pour tout
i E R :
et de
même
pour toutDonc la condition
(2)
estéquivalente
àl’orthogonalité
de u et des vecteurs e(i) etSoit maintenant E le sous-espace vectoriel de
~/ engendré
pare~i’,
iE R,
et F le sous-espace
engendré
parD’après
ce que l’on vient devoir,
1(R)
estl’espace orthogonal complémentaire
de E + F.Supposons :
ceci entraîne que le vecteur de
composantes L,og p~; appartient
à E + F.O’r,
toutvecteur g
de E + Fpeut
s’écrire :donc :
Log
phk s’écrira doncLog
phk = Àh+ ~,k
et par suite phk pourra s’écrire sousla forme phk = ph qk .pour tout
(h, k) ER.
Dans ces conditions HR est vérifiée. On a donc le : :Théorème IX. -
HR
estéquivalente
à l’ensemble des relations entre les interactions dupremier
ordre :S (H, p) = 0
Remarque. -
En vertu du théorème d’unicitéIII,
onpeut
montrerque, si R est connexe, E + F est de
rang l
+ c -1. Eneffet,
en écrivantque la combinaison linéaire :
est
nulle,
on obtient :Cette condition est réalisée pour
mais cette solution est
unique
en vertu du théorème IIIpuisque
R estconnexe
(associer
à tout(h, k) E R
l’élémentzéro,
G étant le groupe additif des nombresréels).
Donc 1
(R)
est de rang t -1- c + 1 et l’ensem,ble des relations 8l’u, p)
=0, u E I(R),
contient v = i - l - c + 1 relationsindépendantes (on
retrouve un résultatprécédent).
En notant(k = l, 2,
...,v)
v vecteurs
indépendants
deI(R),
i~l estpossible
d’extraire des relationso(u, p)
=0, v
relationsindépendantes p)
= 0qui
sontéquivalentes
à
Hp.
IV. Problèmes
statistiques
concernantl’hypothèse
HR.Notons d’abord
qu’il
serapossible
de se restreindre à l’étude departies
connexes, en utilisant le théorème VII et son corollaire.
Dans ces
conditions,
si l’onécrit,
sousl’hypothèse HR, P~;
= p. q;, l’ensemble(p, q)
estunique (théorème III)
à uneproportionnalité près,
et bien déterminé si l’on
fixe J’
p~(ou ¿ q;) ;
; si bien que, sousie R
jeR*
sous
l’hypothèse HR,
ces nombre p~ et q~peuvent
être considérés commeles
paramètres
de la distribution conditionnelle des caractères sachant que(i, j ). E R.
On pourra se proposer, à
partir
d’un échantillon tiré au hasard de lapopulation parente :
a)
D’estimer lesparamètres
p; et q;.b) 1 De réaliser un test de
l’hypothèse
HR.Selon la méthode
d’échantillonnage,
lesproblèmes posés diffèrent,
maisnous verrons
qu’ils
sont très voisins dans lapratique.
On étudiera les casoù l’échantillon est extrait sans restriction de la
population complète, puis
où l’échantillon obtenu est extraituniquement
du sous-ensemble des éléments de lapopulation parente ayant
les caractères a~~3;
où(i, j) E R,
la taille de l’échantillon étant seule
fixée,
ou bien aussi certaines « marges », parexemple
le nombre d’individusayant
le caractère(étude
de
plusieurs
distributionsmultinomiales, supposées homogènes,
dontcertaines
peuvent
être «tronquées » ) .
Un échantillon est caractérisé par la
fréquence
des diversescatégories;
l’ensemble des
fréquences
relatives aux caractères ~b~3;
où(i, j) E R (R
strictement contenue dansC)
seraappelé
tableau de corrélation(ou
table de
contingence) tronqué (e)
ouincomplet (e).
R seradésignée
comme la
partie
~de C associée à ce tableau.Les
problèmes posés
par les tables decontingence tronquées
ne sontpas limités à ceux
qui
concernent unehypothèse
dutype HR;
nouscommencerons par l’étude de ces
derniers,
mais nous en aborderons denouveaux par la suite.
V. Domaines
d’application.
L’étude
statistique
des tables decontingence tronquées
et de HR enparticulier peut
être utile dans les cas suivants :a)
Certaines données sontmanquantes
par accident dans un échantillon.Si elles concernent les caractères «~
R;
où(i, j ) E
C -R,
on pourra étudier Hn faute depouvoir
étudierHc.
b)
Il n’estpossible
de sélectionner de lapopulation parente
que des individusayant
les caractères aifi;
où(i, j) E R.
c)
Enprésence
d’une table decontingence
ordinaire(échantillon
extrait au hasard de lapopulation parente complète ) ,
l’étude de HRpeut présenter
un intérêtparticulier
dans le cas où Ho est fausse. Onpeut
ainsienvisager d’analyser
la forme de la corrélation.Notons enfin que les résultats concernant
l’hypothèse Hp peuvent
avoir
quelque
intérêt dans l’étude deproblèmes apparemment
assez différents : nous en verrons unexemple
auChapitre
V.VI. Travaux antérieurs.
Si aucune étude tout à fait
systématique
ne semble avoir étéfaite,
diversauteurs ont étudié des
problèmes particuliers
relatifs aux tables decontingence tronquées.
Un despremiers
en date doit être WAITE(1915) ;
HARRIS(1927, 1929 ) envisage
deuxquestions
dont lapremière
estidentique
à celle de WAITE.
Le problème
que seposent
ces deux auteurs est différent de ceuxindiqués plus
hautpuisqu’ils
désirent essentiellement calculer un « coef- ficient decontingence
». Ils sontcependant
amenés à chercher des«
fréquences théoriques »
sous unehypothèse HR
où R est unepartie
«
triangulaire »
sii O j ~ ;
la solution de HARRIS estcritiquée
par PEARSON(1930) qui
avaitsuggéré
sur des bases intuitives la solution deWaite;
cette dernière s’accorde avec les résultats que l’on obtiendra par la suite par la méthode du maximum de vraisemblance.Le second
problème
de Harris concerne un cas où R n’est pas connexe : un traitement parséparation
des deuxparties
connexes estpréconisé
par PEAR SON(1930).
Les études
plus
récentes rentrent toutes dans le cadre fixéplus
haut :WATSON
(1956) envisage
leproblème (a)
des donnéesmanquantes
pourun cas
particulier
et donnequelques
indications sur le casgénéral.
KASTENBAUM
(1958)
traite un autre casparticulier.
BATSCHELET
(1960 a), puis
GEPPERT~(1961 )
ont étudié les tables trian-gulaires lorsque
les totaux par colonne(ou
parligne)
sont fixés. BATSCHELET(1960 b)
donne uneapplication
à un intéressantproblème pratique
dutype (b)
concernant des distributions multimonialestronquées.
ASANO
(1965) généralise sur quelques points
les études ,de ces derniers auteurs sur la réunion de distributions multinomialestronquées.
CHAPITRE II
PROBLÈMES D’ESTIMATION
POUR UNE TABLE DE CONTINGENCE TRONQUÉE
Une
population parente
étantdonnée,
pourlaquelle
HR estsupposée vérifiée,
on étudie dans cettepartie
lesproblèmes
d’estimation desparamètres
inconnus attachés à cettepopulation.
L Distribution d’un échantillon -
Statistiques exhaustives.
Pour les raisons données au
chapitre précédent,
R sera(sauf
mention ducontraire)
connexe.Un échantillon est constitué d’éléments tirés au
hasard,
defaçon
nonexhaustive,
de lapopulation parente.
On notera lafréquence
observéede l’élément ai
~;.
HR peut
être étudiée pour différentstypes
d’échantillons :cas. - Echantillon de taille fixée extrait de la
population
réduiteaux éléments a;
03B2j
oùER.
Icil’hypothèse HR
s’écrit :Pz;
= Prj) E RJ
= p~ q~~La vraisemblance de l’échantillon est
donc,
enappelant
p(resp. q)
l’ensemble des p~ pour
i E R (resp.
l’ensembledes q;
et endésignant
par n la taille de l’échantillon :avec a; = :r.
/ - 1 l2 v
et la
relation :
Puisque
R estsupposée
connexe, lesparamètres
Pi et q; sontparfaitement
déterminés si l’on pose par