B. L ECOUTRE
Extensions de l’analyse de la variance : l’analyse bayésienne des comparaisons
Mathématiques et sciences humaines, tome 75 (1981), p. 49-69
<http://www.numdam.org/item?id=MSH_1981__75__49_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1981, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
EXTENSIONS DE L’ANALYSE DE LA VARIANCE :
L’ANALYSE BAYESIENNE DES COMPARAISONS
B.
LECOUTRE
AVANT-PROPOS
Sur le
plan conceptuel
les méthodes d’inférencebayésienne
semblent susciterdepuis quelques
années un intérêtcroissant,
comme entémoigne
notamment unesérie d’articles récemment parus dans la Revue de
Statistique
Par ailleurs les difficultés
techniques
ne peuventaujourd’hui
ques’estomper grâce
auprogrès
des instrumentsinformatiques.
Il semble donc
désormais,
non seulementsouhaitable,
maispossible, d’envisager
l’utilisation de méthodes d’inférencebayésiennes
dans lessituations les
plus
usuelles de traitement dedonnées,
même dans les situationsqui,
par leur structurecomplexe
de recueil desdonnées,
relèvent tradition- nellement del’analyse
de la variance.On sait que nous avons
entrepris
de refondre l’ensemble des méthodesd’analyse statistique
des donnéesexpérimentales
et enparticulier d’analyse
dela
variance,
àpartir
d’une formalisationalgébrique,
linéaire et ensembliste.Cet article et le
prochain (Lecoutre
et Rouanet[12]) appartiennent
auxprolongements bayésiens
de cetteentreprise.
Cesprolongements
sont renduspraticables grâce
aux deux idées suivantes :1)
la formalisationalgébrique
permet de
dégager
un certain nombre de structuresqui
interviennent à titre de composants de laplupart
desplans usuels ; 2)
l’idée d’inférencespécifique
permet, à l’intérieur de
chaque
situationd’appliquer
lesprocédures bayésiennes
standard pour les structures
qui
interviennent dans cette situation.~ Laboratoire de
Psychologie (ERA 235),
Université Paris-VIII etGroupe Mathématiques
etPsychologie,
Université René Descartes.* * notamment les articles suivants : dans le vol.26
(1978),
G.Morlat ;
A. Vessereau ; dans le vol.27
(1979),
J.Ringler ;
dans le vol.28(1980),
M. Dumas ~; A. Vesserau ; dans le vol. 29
(1981),
G.Brunschwig.
Le
premier
article fournit uneprésentation
d’ensemble de la thèse deB. Lecoutre
[8],
consacrée aux extensionsbayésiennes
del’analyse
de la variance.Le second article est consacré
plus spécialement
à deux structuresqui
inter-viennent constamment en
analyse
de lavariance,
univariée et multivariée.H. ROUANET *
1. INTRODUCTION
L’analyse
de lavariance,
dans ses formulationsclassiques (Fisher [4]
et[ 5];
Scheffé
[22]),
apporte indéniablement un certain nombre deréponses
auxproblèmes posés
parl’analyse
des donnéesexpérimentales,
enparticulier
par laprise
encompte
explicite
duplan d’expérience
et par sa visée inductive.Cependant,
dès que l’on cherche à
approfondir l’approche traditionnelle,
un certain nombrede difficultés
surgissent :
d’abord lapanoplie
desplans d’analyse
ressemble àun véritable
dédale,
danslequel
on ne cheminequ’au prix
decomplications extrêmes ;
ensuitel’exposé
desprocédures, s’appuyant
sur l’utilisation du calculmatriciel,
masque très souvent les structuresmathématiques
sous-jacentes ; enfin,
en cequi
concerneplus particulièrement
laportée
de laméthode,
lesdéveloppements,
soit se limitent à laconception
traditionnelle des tests designification, soit,
dans le cadrebayésien, apparaissent
d’unecomplexité
assez rebutante dèsqu’il s’agit
dedépasser
les cas lesplus
élémentaires(comparaison
de deuxmoyennes)..
A
l’examen,
le remède à ces difficultésapparaît
résider dans le recoursexplicite
à laformalisation algébrique,
absent des formulationsclassiques, qui
permet dedégager
etd’expliciter
les structuresmathématiques fondamentales,
et, enconséquence,
de réduire d’une manière considérable la diversité des cas.Si,
à la formalisationabstraite,
onajoute
unprincipe essentiel,
leprincipe d’inférence spécifique,
onparvient
toutsimplement
au résultat que les solutionsvont
pouvoir
êtrecalquées
sur les solutions duproblème
de l’inférence sur unemoyenne, sous le modèle normal. Cette nouvelle
approche
del’analyse
de lavariance conduit à ce que nous
appelons l’analyse bayésienne
descomparaisons.
1)
Laformalisation algébrique,
linéaire etensembliste,
issue des travauxthéoriques
de Rouanet etLépine (cf. [19J
pour une introductiond’ensemble)
constitue la clef de
l’analyse bayésienne
descomparaisons :
on formalise eton
généralise
ainsi toutes les notions fondamentales del’analyse
de lavariance : contraste,
comparaison, somme-des-carrés,
facteur,plan
... Nousferons en 2. un bref
rappel
de cette formalisation.* Groupe
Mathématiques
etPsychologie,
Université René Descartes2)
Les notionsd’inférence spécifique
et, endécoulant,
de structurestatistique spécifique,
que nousprésenterons
en3.,
fournissent unprincipe
essentiel pourl’inférence. La notion d’inférence
spécifique
est à opposer à l’idée d’effectuerune inférence simultanée sur tous les
paramètres
d’un modèlegénéral,
relatif àun corps de données considéré comme une même "unité
expérimentale" :
mêmelorsque
une telle inférence simultanée esttechniquement envisageable,
elleapparaît
souventlargement arbitraire,
dès lorsqu’il faut, premièrement
expliciter
un modèlegénéral
pour unplan
un tant soit peucomplexe -
nous pen-sons
plus particulièrement
ici au fameux "General Linear Model" souventposé
au début des
analyses -
et,deuxièmement,
dans le cadrebayésien,
choisir unedistribution initiale relative à tous les
paramètres
de ce modèle.Au
contraire,
une inférencespécifique,
pourchaque comparaison
àanalyser,
aura souvent un caractère raisonnable dans les situations courantesd’analyse
dedonnées,
ceci d’autantplus qu’elle
reposera sur une structurestatistique spécifique,
elle-même obtenue sous un modèlespécifique,
mettant enjeu
unpetit
nombre deparamètres,
etbeaucoup plus
réalistequ’un
modèlegénéral.
3)
Nous proposerons pourl’analyse
descomparaisons
desprocédures bayésiennes
"standard",
en ce sensqu’elles
constituent des solutions derechange
directesaux tests de
signification,
dans tous les cas où ceux-ci sont insuffisantset/ou
ne conduisent pas à des solutions
techniques
satisfaisantes. Nous résumeronsen
4.,
5. et 6. les solutions standard ainsi obtenues pourl’analyse
de donnéesnumériques univariées,
suivant unelarge
classe deplans d’analyse.
Nous accorderons un intérêt tout
particulier
auxprocédures fiducio-bayésiennes, qui
peuvent êtreobtenues,
soit directement à la fois dans le cadrebayésien non-informatif,
introduit parJeffreys (notamment Jeffreys [7]),
et dans lecadre
fiduciaire (notamment
Fisher[4]et [6]),
soit encore comme limite deprocédures bayésiennes
au sensstrict,
cequi
leur confère le statut dedistributions de référence
(cf.
Lecoutre et Rouanet[12J).
Cesprocédures présentent
ungrand intérêt, puisqu’elles
constituent une extension directe du test designification (qui
est lui-même une inférencespécifique)
etqu’on
peut les
regarder
commeexprimant
l’informationapportée
par lesdonnées,
enécartant toute information
étrangère
à ces données(on
sait que cesprocédures
ont été conçues pour chercher à
exprimer
un état initiald’ignorance
vis-à-visdes
paramètres).
Nous proposerons
également
desprocédures bayésiennes
(au sensstrict),
danslesquelles
la distribution initiale("a priori")
sera une distribution du même type que la distributionfiducio-bayésienne (distribution conjuguée) ;
ladistribution finale
("a posteriori")
sera encore une distribution du même type.En
pratique,
il sera éclairant deregarder
cette contrainte sur le choix de la distribution initiale commel’expression
du fait que cette distributionreprésente
une informationéquivalente
à cellequi
seraitapportée
par une certaineexpérience (avec
comme casparticulier
uneexpérience antérieure).
Enfin,
étant donné lepetit
nombre deparamètres
intervenant dans l’inférencespécifique,
il seratoujours envisageable,
dans un casparticulier,
de "traiter"une distribution initiale
quelconque
sur cesparamètres.
L’analyse bayésienne
descomparaisons
sera illustrée en 7. par unexemple
à valeur
générale.
2. RAPPEL DES FONDEMENTS
ALGEBRIQUES
2.1. Structures linéaires
La notion formalisée de
comparaison, qui
est au centre de la formalisation linéaire(Rouanet
etLépine [1~]),
peut êtreregardée
comme une extension de la notionclassique
de source de variation.Il suffira ici de
rappeler, qu’étant
donné unprotocole numérique
(ici
une variablenumérique)
de support fini J, on définit : un contrastesur J comme une mesure sur J de masse totale
nulle ;
unecomparaison
sur Jcomme un sous-espace de contrastes dans
l’espace
vectoriel des mesures, la dimension de ce sous-espace étantappelée
le nombre dedegrés
de liberté de lacomparaison.
Le support J étant muni d’une
pondération (n.).EJ ,
JJappelée
mesurefondamentale
sur J,l’espace
desprotocoles (ou variables)
sur J etl’espace (dual)
des mesures sur J secorrespondent
parl’isomorphisme qui,
à une mesuredonnée
(u.).
, associe sa densité par rapport à la mesurefondamentale,
c’est-J J
.à-dire la variable
L’espace
desprotocoles
de support J est muni duproduit
scalairecanoniquement
associé à la mesurefondamentale,
c’est-à-dire leproduit
scalairequi,
à toutcouple (xj)’EJ J EJ
etJ EJ
associe lescalaire ~ n.xi yi.
J ’ EJ J
On définit alors la somme-des-carrés
(ou inertie)
d’unprotocole
associée à une
comparaison
comme le carré de la norme de laprojection
surl’image
de cettecomparaison
parl’isomorphisme précédent.
Lecarré-moyen
est le rapport de la somme des carrés au nombre de
degrés
de liberté de lacomparaison.
2.2. Structures ensemblistes
La formalisation ensembliste conduit à des définitions
rigoureuses
des notionsde
facteur
et deplan,
que nous utiliserons ici sans lesrappeler (cf. Lépine [13]
et
[ 14]).
Nous
appellerons plan d’analyse
unplan
duprotocole
àanalyser
défini commele
composé
d’une famille defaeteurs élémentaires,
pourlequel
chacun des facteurs élémentaires a été caractérisé(distinction méthodologique) :
soit comme unfacteur
de groupe(qui,
dans laprobabilisation,
deviendra un facteuraléatoire),
c’est-à-dire un facteur dont les modalités seront
toujours
traitées defaçon symétrique (cf.
Rouanet etLépine [17]) ;
soit comme unfacteur systématique,
c’est-à-dire un facteur aux modalités
spécifiques duquel
on s’intéresse enprincipe.
Nous
envisagerons
unelarge
classe deplans d’analyse,
incluant desplans à
unfacteur
de groupe et desplans
à deuxfacteurs
de groupe.(1)
Lesplans
à un facteur de groupe, sont, dans lelangage
formaliséutilisé,
des
plans
dutype A
G>*T(on
lira"A,
facteur de groupe, emboîté dans G ero2sé avecT"),
avec comme casparticuliers
desplans
AG> et A*T. Unexemple typique
d’un telplan
est,en,psychologie,
le cas où A est un facteur(de groupe) Sujets,
G un facteursystématique Groupes
et T un facteursystématique Traitements,
G et T pouvant être chacun les
composés (quelconques)
deplusieurs
facteursélémentaires ;
pourchaque sujet
a, affecté s’il y a lieu au groupe g, on aune observation pour
chaque (s’il
y alieu)
traitement t. Le type deplans
AG>
correspond
ainsi à la structure dite des"groupes indépendants"
et letype de
plans
A*T à la structure dite des"groupes appareillés",
le type deplans
AG>*T combinant ces deux structures._
(2)
Lesplans
à deux facteurs de groupe sont desplans
du type BAG>*T>("B,
facteur de groupe, emboîté dansAG>*T",
où AG>*T se lit commeprécédemment),
avec comme cas
particuliers
desplans
BAG» etBA*T>,
Unexemple typique
estle cas
où,
pourchaque sujet
a(affecté
s’il y a lieu au groupeg)
ondispose
de
plusieurs
observations pourchaque (s’il
y alieu)
traitement t, d’où l’introduction d’un second facteur de groupe B,Répétitions.
3. L’ANALYSE
SPECIFIQUE
D’UN CONTRASTE D’UNE COMPARAISON3.1. Caractérisation
numérique
de l’effet associé à un contraste), à unecomparaison
L’effet peut être défini au niveau
descriptif -
nousparlerons
del’effet
observé -ou au niveau inductif - nous
parlerons
ici deZ’effet théorique,
mais nouspourrions
encoredire,
suivant lessituations,
effetvrai,
effetparent
oueffet dans la
population.
La caractérisationnumérique
de l’effet observé sefera à
partir
des moyennesobservées,
et celle de l’effetthéorique
àpartir
de moyennes, elles-mêmes
qualifiées
dethéoriques, qui
seront desparamètres
dumodèle
d’échantillonnage.
_Formellement,
nousdistinguerons
le cas de l’effet associé à un contraste et le cas de l’effet associé à unecomparaison (à
mdegrés
deliberté).
1)
Dans lepremier
cas, la caractérisationnumérique
de l’effet est asseznaturelle : c’est par
exemple
une différence de moyennes, une différence de différences de moyennes, la pente d’une droite derégression,
etc. Formellementl’effet
observé associé à un contraste(ou, simplement, l’effet
observé ducontraste)
sur un support J est défini commed -
où les c. sont lesl i
J J
coefficients du contraste et les
x"
les moyennes observées associées àchaque
modalitéj.
De mêmel’effet théorique
associé au contraste(l’effet
...
théorique du
contraste) est défini comme à =L c pi
où lespi
sont cettei ~J
J . .fois des
paramètres (moyennes théoriques) ’je J
associées achaque
modalitéj.
2)
Dans le second cas, la caractérisationnumérique
de l’effet associé à unecomparaison
àplusieurs degrés
de liberté n’estqu’un
résumé de ceteffet ;
c’est
pourquoi
nousparlerons
dans ce cas d’indicateur del’importance
del’effet,
ou
simplement d’importance
del’effet. Formellement,
nous définissonsl’importance
del’effet
associé à unecomparaison
C, définie sur un support J,comme une
quantité
de la forme1 2 =
bsc C (ou
encore sa racinecarrée),
où b estune constante
dépendant
des effectifs que l’on choisira de sorte que 1puisse
être
regardé
commehomogène
à l’effet(en
valeurabsolue)
d’un contraste, etscc
est la somme-des-carrés associée à lacomparaison
C, calculée àpartir
des’ 9
moyennes observées
xi. L’importance
del’effet théorique,À2 (ou
sa racinecarrée),
>est définie de la même
manière,
àpartir
cette fois desparamètres il
Si nous nous donnons une base
(orthogonale)
de lacomparaison
C,représentée
parune matrice C telle que q J m où N. J est la matrice
diagonale
g dont leséléments
diagonaux
sont les éléments n. de la mesure fondamentale sur J ; enJ J . J
notant x et
respectivement
les vecteurs colonnes des x11
et des p , nouspouvons alors définir i =
C’xJ
et 8 =C’j (d et e
peuvent être considérés comme des"représentants" multinumériques
de l’effet à mdegrés
deliberté)
et nousavons alors les formules : ’
et
qui
sont déduites de la formule matricielle de la somme-des-carrés :3.2. La notion d’inférence
spécifique
L’analyse bayésienne
d’unecomparaison
consistera en une inférencespécifique
sur le
paramètre numérique,
6 ouÀ 2
caractérisant l’effetthéorique.
Cetteinférence sera
calquée
sur le casclassique
de l’inférence sur une moyenne sous le modèle normal. Or on sait que dans ce cas les solutionsbayésiennes classiques (cf. Lindley [15]),
commed’ailleurs
le test designification,
peuvent êtredirectement déduites des distributions
d’échantillonnage
de la moyenne et de lavariance-corrigée :
ces deux distributions sontindépendantes,
lapremière
étant une distribution
normale, qui dépend
de la moyenne et de la variancethéoriques,
la seconde étant une distribution dukhi-deux, qui dépend
seulementde la variance
théorique.
Nous rencontrons là la notion de structure statis-tique spée2fique
"normaZe-khi-deux".Les solutions pour l’inférence sur une moyenne
s’appliquent
immédiate-ment au cas de l’inférence sur l’effet d’un contraste
(6),
dès lors que l’ona
posé
pour cette inférence la structurestatistique spécifique
"normale-khi-deux",
la moyenne étantremplacée
par lastatistique
"effetobservé", d,
etla
variance-corrigée
par une certainestatistique s ,
2homogène
à une variance-corrigée
ou encore à uncarré-moyen (1).
L’extension au cas de 1’inférence sur
l’importance
de l’effet d’unecomparaison (À2)
sera obtenue en posant la structurestatistique spécifique
"muZtinormaZe-khi-deux",
lastatistique numérique
d étantremplacée
par lastatistique multinumérique d
telle que nous l’avons définie en 3.1.(2).
En ce
qui
concerne lesdéveloppements formels,
le casprécédent
pourra donc être traité comme un casparticulier
de celui-ci(avec m=l) ;
mais leparamètre numérique principal
est 6 dans lepremier
cas etÀ 2
dans lesecond,
ce
qui,
auplan conceptuel, correspond
à desproblèmes différents.
(1)
Leproblème
du"’calibrage"
de82 (et
duparamètre correspondant a2
n’est
pas directement pertinent
pour l’inférence sur leparamètre rinci-
pal
6 oua
et nous nous limiterons ici àprendre
lastatistique
ségale
à un
carré-moyen.
Pour des casoù6l’inférence
recherchée porteégalement
sur
a2
ou encore sur le rapport 2013, et où ceproblème
estabordé,
voirLecoutre
[9]
et[ 10 ] .
(2)
Un certain nombre de résultats(tests
designification
etprocédures fiducio-bayésiennes)
peuvent, comme nous l’avons fait dans[8],
êtreobtenus directement à
partir
de la structurestatistique
dérivée"khi-deux non-centré -
kh2-deux",
relative aux distributions d’éçhantillon-nage des
statistiques £2
ets2.
Les solutions
précédentes s’appliqueront
auxplans
à un facteur de groupe. En cequi
concerne lesplans
à deux facteurs de groupe, la variancethéorique
a deux composantesadditives,
et il conviendra alors de poser la structurestatistique spécifique
"muZtZnormaZe(avec
le casparticulier normale)-
khi-deux -khi-deux!!,
obtenue en définissant unestatistique
supplémentaire, u2
dont la distributiond’échantillonnage, indépendante
desprécédentes,
est une distribution du khi-deuxqui dépend
seulement de l’unedes. composantes
de la variancethéorique.
L’inférence est ainsicalquée
sur leproblème
de l’inférence sur une moyenne, pour unplan
BA>(cf,
dans le cadrebayésien non-informatif, lesorandom effect
models" de Box et Tiao[ 1 ] ) .
.
3.3. Vers des solutions effectives
’
La mise en oeuvre du
principe
d’inférencespécifique
dans le cadre de la formalisationalgébrique
permet de réduire à un trèspetit
nombre lessolutions
générales (c’est-à-dire exprimées
àpartir
des2
et éventuellementu2)
pourl’analyse bayésienne
descomparaisons.
Ces solutionsgénérales
serontprésentées
en 4..Nous nous limiterons ici aux résultats concernant le
paramètre numérique princi- pal,
6 ouX2@
c’est-à-dire portant sur la distributionmarginale
relative àce
paramètre ;
on trouvera dans unprochain
article une étude détaillée de lastructure
statistique
"multinormale - khi-deux"(Lecoutre
et Rouanet[121), qui,
pour lesplans
à un facteur de groupe, fournira des résultatscomplets
(distributions conjointes, conditionnelles,
concernant desparamètres dérivés).
Nous énoncerons en 5. les
solutions~particulières,
c’est-à-dire le choix desstatistiques s2
etéventuellement u2 ~
en fonction duplan d’analyse (à
un ouà deux facteurs de
groupe),
endistinguant
troisgrands
types decomparaisons.
Dans
chaque
cas serontproposées
différentessolutions,
pouvant êtreregardées
comme
"plus
ou moinsspécifiques".
Enfin,
nous donnerons en 6. lajustification
des solutionsprécédentes,
en fournissant pour
chaque
solutionparticulière
un modèle conduisant à cettesolution. Ce modèle sera un modèle
spécifique,
dans la mesure où il estseulement
spécifié
au niveau d’unprotocole
dérivé : dans la démarche del’analyse
du contraste ou de lacomparaison,
c’est leprotocole qui
estjugé pertinent
etqui
constitue les données de base pour l’inférencespécifique.
Le lien avec les méthodes
classiques
est assuré par le fait que cemodèle,
au niveau du
protocole
dérivéconsidéré,
est l’un des modèles de baseusuels,
normal ou multinormal.
4. SOLUTIONS GENERALES 4.1. Plans AG>*T
Nous poserons pour ces
plans
la structurestatistique spécifique
"multinormale - khi-deux" :’
Test de
signification .
On définit lastatistique
de testou encore,
lorsque
m(distribution
usuelle du F à m et qdegrés
deliberté)
ou
lorsque
m =1 , ~ ~ t q (distribution
usuelle du t de Student à qdegrés
deliberté)
Nous
désignerons
parFobs
la valeurprise
par lastatistique
F(lorsque
m =1,
2 obs
on a encore t2 = Fobs
).
Procédures
fiducio-bayésiennes.
On obtient les distributionsfiducio-bayésiennes (que
nous marquons d’unastérisque) :
. pour l’effet d’un contraste
(m=l)
distribution du t
généralisé
à qdegrés
de liberté(cf. annexe)
ce que l’on peut encore écrire
. pour
l’importance
de l’effet decomparaison (m quelconque)
distribution du
psi-deux
à m et qdegrés
de liberté(cf. annexe)
ce que l’on peut encore écrire
Procédures
bayésiennes
"standard". Si on choisit pour(;,CY2)
une distribution initiale de la même forme que la distributionfiducio-bayésienne,
caractériséear d b
s2
et la distribution finale est encore t e on l’ob ’e tpar
doi0bo9s2et
q , la distribution finale est encore du même type ; on l’obtientp o o o 0 du meme yp , ti n
en
remplaçant
dans lesexpressions
donnant les distributionsfiducio-bayésiennes :
Nous poserons pour ces
plans
la structurestatistique spécifique
"multinormale - khi-deux -khi-deux,
avec contrainte" :. 2 2
contrainte =
Le
principe
suivi est de dériver d’abord les distributionsfinales,
compte non-tenu de la contrainte
(on
utilise les résultats de la structure "multinormale -khi-deux", puis
de "réviser’’ ces distributions en introduisant la contraintecr 2 ~ n 2 (cf.
Lecoutre[ 8 J ) .
Procédures
fiducio-bayésiennes.
On obtient les distributionsfiducio-bayésiennes,
données par leur densité :
. pour l’effet d’un contraste
(m=l)
. pour
l’importance
de l’effet d’unecomparaison (m quelconque)
désignent
des variables de distributionsrespectives
1Procédures
bayésiennes
"standard" . Si on choisit pour(8, a z
unedistribution initiale de la même forme que la distribution
fiducio-bayésienne,
- 8 -
d b 2 2
1 d8 8b 8 f8 1 d
caractérisée
q , u
etpo’
la distribution finale est encore du01 01 0 01
même type ; on l’obtient en
remplaçant
dans lesexpressions
donnant lesdistributions
fiducio-bayésiennes :
définis
précédemment
pour les5. SOLUTIONS PARTICULIERES
Nous
envisageons
les solutionsparticulières
concernant trois types decomparaisons,
ou de contrastes (dans ce cas latypologie
se réfère à lacomparaison engendrée
par lecontraste) :
.
comparaisons
du typeV/Tl, comparaison
sur G conditionnelle à unepartie
Tlde T
(éventuellement
lapartie pleine ;
~ nousdésignerons
par GI lesupport (3 )
de la
comparaison ’J(GlG) ;
.
comparaisons
du typeW/Gl, comparaison
sur T conditionnelle à unepartie
GIde G (éventuellement la
partie pleine) ;
nousdésignerons
par TI le support de lacomparaison W(TlcT) ;
.
comparaison
du type V.W,comparaison
d’interaction entre unecomparaison
V surG et une
comparaison
W sur T ; nousdésignerons
par GI et Tl les supportsrespectifs
descomparaisons
V et W (Glc G etTICT).
Dans
chaque
cas différentes solutions sontenvisageables ;
elles sontrésumées
ci-après.
(3)"Support
de lacomparaison" :
sous-ensemble des éléments g de G pourlesquels
il existe des contrastes dont le coefficient c est non nul.
g
5.1. Plans AG>*T
5.1.1.
Comparaisons V/Tl
Il
où G,
carré-moyen
associé à lacomparaison
"A àl’intérieur de
G
conditionnelle à Tl"où
n g
est "l’effectif du groupeg" (nombre
de modalités de A affectées àg)
et, dans le cas de l’effet d’un contraste :
carré de la norme du contraste.
(Dans
le cas del’importance
d’unecomparaison,
b est déterminé par la définition de12) .
5.1.2.
Comparaisons W/Gl
et V.Woù
Glc G c G
et C est unecomparaison
sur T dont W est une sous-comparaison, carré-moyen
associé a lacomparaison
d’interactionentre la
comparaison
"A à l’intérieur deG"
et lacomparaison
C.dl(C),
oùdl(C) désigne
le nombre dedegrés
de liberté de lacomparaison
Cet, dans le
cas
de l’effet d’un contraste :, carré de la norme du contraste pour un contraste
engendrant
une
comparaison W/Gl
, carré de la norme du contraste pour un contraste
engendrant
une
comparaison
V.W .5.2. Plans BAG>*T>
5.2.1.
Comparaisons V/Tl,
N ~
où GIXTIc
GxTc
GxT,carré-moyen
associé à lacomparaison
B à l’intérieur de
AG>*T"
, où
kt
est le nombre de modalités de B affectées au traitement(
etsupposé
le même pour tous les a affectés à un groupegEG)
et, dans
le cas
de l’effet d’un contrastecarré de la norme du contraste;
5.2.2.
Comparaisons W/Gl
ou V.Wu2
et p sont définis comme pour le casV/Tl
et, dans le
cas2de
l’effet d’un contraste, carré de la norme pour un contraste
engendrant
unecomparaison W/Gl
carré de la norme pour un contraste
engendrant
unecomparaison
V.W6. MODELES
Pour chacune des
comparaisons particulières envisagées ci-dessus,
nousindique-
rons un modèle
spécifique
conduisant à cette solution.Pour les
plans
à un facteur de groupe, AG>*T, nous supposerons l’existence de tous les moments d’ordre 1 et 2 : moyennesthéoriques (gtEGxT)
et. - .
gttttt C4 )
...covariances
théoriques paramètres
de base apartir desquels
seront définis lesparamètres
du modèlespécifique d’échantillonnage.
Pour les
plans
à deux facteurs de groupe, BAG>*T>, le modèle seradécomposé :
. en un modèle
d’échantillonnage, qui prend
en compte le statut de facteur de groupe de B, A étant à ce niveau traité comme un facteursystématique ;
sont ainsiintroduits des
paramètres
"individuels"(relatifs
àchaque a),
enparticulier
les
moyennes théoriques uag’t
:. en un modèle de
population qui
Dortera sur les Daramètresindividuels.,
lesmodalités a étant considérées comme des "individus" extraits d’une certaine
population ;
ils’agira
despécifier
la distribution desparamètres
individuels dans lapopulation ;
sont ainsi introduits desparamètres
depopulation
(sur lesquels
porteral’inférence).
4. Nous nous limiterons ici à la situation usuelle où on suppose que l’emboîtement du facteur de groupe entraîne
l’indépendance
des observations "entre lesgroupes"
(et
par suite la nullité descovariances).
Onpourrait
aisément étendre les résultats à des cas denon-indépendance,
enparticulier
en supposant un modèle markovien.6.1. Plans AG>*T
6.1.1.
Comparaisons V/Tl
La solution
s2 =
1 est obtenue en posant le modèlespécifique
d’échantillonnage,
que nous notons caractérisé de la manière suivante :. On définit le
protocole
dérivéqui,
àchaque
modalité a, affectée àgEG,
associe la moyenne sur tETI des valeurs observées
xag>t ,
, soit :. On pose pour ce
protocole
dérivé le modèleéquinormal
usuel des"groupes indépendants":
On remarquera que le terme
1 card(TI)
permet p de tenir compte p de lapondération
pintroduite sur A par la dérivation effectuée.
Par ailleurs les
paramètres
du modèle peuvent être définis àpartir
desparamètres
de base comme :
a 2
est doncsuppose
ne pasdépendre de g,
pourgEÔ :
le modèle introduit doncune condition
d’homogénéité (qui dépend
du choix deG).
6.1.2.
Comparaisons W/G1
et V.WLa solution
s2 -
est obtenue en posant le modèlespécifique
A
(G) .
C p P qd’échantillonnage,
que nous notonsMG-C,
caractérisé de_la manière suivante :. C étant une matrice
représentant
lacomparaison
C, telle que C’C =l ,
mon définit le
protocole (multinumérique)
dérivéqui,
àchaque
modalité a, affectée àgEG, associe
le vecteur est le vecteurdes valeurs observées , t parcourant T :
(5) w
peut être considéré commereprésentant
l’ensemble desparamètres
d’unmodèle