R EVUE DE STATISTIQUE APPLIQUÉE
C. D UBY Y. M OUGEY J. U LMO
Analyse de plans d’expériences à deux facteurs contrôlés quand l’écart type est une fonction connue de la moyenne
Revue de statistique appliquée, tome 23, n
o1 (1975), p. 5-33
<http://www.numdam.org/item?id=RSA_1975__23_1_5_0>
© Société française de statistique, 1975, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ANALYSE DE PLANS D’EXPÉRIENCES
A DEUX FACTEURS CONTROLÉS
QUAND L’ÉCART TYPE
EST UNE FONCTION CONNUE DE LA MOYENNE(1)
C.
DUBY,
Y.MOUGEY,
J.ULMO
Les laboratoires industriels sont souvent
amenés,
pour ledéveloppement
deleurs
produits,
à effectuer desexpérimentations
mettant en oeuvre des métho-des de mesures normalisées. Ces
méthodes,
bien connues, ont faitl’objet
avantpublication,
d’études au coursdesquelles
est notamment déterminée larépéta-
bilité du résultat de la mesure. Il se trouve que cette
répétabilité -
et doncl’écart-type
de l’erreur de mesure - est presquetoujours
donnée en fonction de la valeur de lacaractéristique
mesurée. On trouvera de nombreux cas de ce type dans les recueils de méthodes d’essais normalisés[0].
Par
ailleurs, quand
de telles méthodes sontutilisées,
les conditionsexpéri-
mentales sont suffisamment bien contrôlées pour que l’erreur résiduelle soit essentiellement constituée par l’erreur de mesure.
Jusqu’à présent, l’analyse
des résultatsexpérimentaux
ainsi obtenus s’ef- fectuait enappliquant
les méthodesclassiques d’analyse
de variancequi -
on lesait -
supposent
constante la variance d’erreur dans le domaineexpérimental
étudié. La
question
se pose de savoir dansquelle
mesure les conclusions obte-nues par une telle
pratique
sont valables.Pour
répondre
à cettequestion,
il faut définir une méthoded’analyse
mieux
adaptée
auproblème posé.
Pour cela nous nous
placerons
dans le cas de 2 facteurs contrôlés en sa-chant que ce cas
peut
aisément être étendu.Si
iiij
est la valeur de lacaractéristique
mesurée pour les niveauxAi
etBj
des facteurs contrôlés A et
B,
ondispose
seulement des mesuresYijm
de cettevaleur,
m variant de 1 ànij,
si on aprocédé
ànez
1 essais dans les conditions(Ai, Bj)
On
peut
considérér que lesyijm
sontnij
variables aléatoiresindépendantes
de même
loi,
de moyenne03BCij
et d’écarttype aij
=f(03BCij)
où f est une fonctionconnue.
La loi de
yij.
serasupposée normale,
cequi parait légitime
compte tenu de la nature des fluctuations résiduelles.Le modèle
statistique adopté
est le modèleclassique
6
les erreurs
eii.
étantindépendantes
entreelles, normales,
de moyenne nulle et d’écarttype ait
=f(03BCij)
Les
problèmes
que l’on cherche à résoudre sont :- estimation des
paramètres J.l¡j
-tests d’absence d’effet d’un des facteurs contrôlés et d’absence d’interac- tion entre les 2 facteurs.
La méthode
proposée
pour l’estimation despij
est la méthode du maxi-mum de vraisemblance. Les
propriétés
des estimateurs et des testsqu’on
a pro-posés
etexplicités complètement
dans le cassimple
oùaij
est fonction affine de la moyenne ne sont vraiesqu’asymptotiquement
par rapport à l’ensemble desn,j.
C’est
pourquoi
on aprocédé
à une étude par simulation de la validité des résultats trouvés et de ceux que donnent les méthodesclassiques (qui
supposentaij constant)
dans des conditionsexpérimentales correspondant
auxproblèmes qui
ont étéposés,
PREMIERE PARTIE
RECHERCHE D’UNE METHODE D’ANALYSE DES RESULTATS
1 1 - ESTIMATION DES
PARA1VIETRES 03BCij
La méthode à
laquelle
nous avonspensé
est la méthode du maximum de vraisemblance(M.V.) ;
c’est du reste, ellequi
est utilisée dans le casclassique
où :
Il 1-RECHERCHE DES ESTIMATEURS DU MAXIMUM DE VRAISEM- B LANCE
p-¡j
Compte-tenu
del’hypothèse d’indépendance
desYijm,
la vraisemblance de l’ensemble despis correspondant
à l’ensembley
e Rn des n résultatsY¡jm
obtenus est -
où (X
désigne
l’ensemble des combinaisons(i, j)
effectivementessayées.
(Xpeut
n’êtrequ’une partie
de l’ensembledes combinaisons
possibles. Quand,
commeici,
on ne fait aucunehypothèse
surla structure des
pij,
c’est-à-dire sur la nature des effets des traitements(Ai, Bj),
on ne
peut
estimer que lesJ.lij
tels que(i, j )
E (X.Revue de Statistique Appliquée, 1975 vol. XXIII I N° 1
Cette vraisemblance est le
produit
des vraisemblances de chacun des
J.lij
pour l’ensemble desnij
résultatsyij.
cor-respondants.
mi,
est donc l’estimateur du M.V. demis correspondant
au sous ensemble d’observationsyij1, Yi)’ 2 ’ ..., Yijn .
effectués avec le seul traitement(Ai, Bj).
Les
ij
sont chacun fonction des seules observationsyij 1 e yij 2 1 Yijn i,
de même indice
(i, j).
Ils sont, parsuite, indépendants
enprobabilité.
1)1 1. 2 - Etude des
M ij
1 1.2.1 - Pour des
nij finis
Contrairement à ce
qui
se passe dans le cas habituelaij = ct e ,
lesP-ij
nesont pas des estimateurs exhaustifs des
03BCij
siaij dépend
effectivement demij.
Ils ne sont par suite pas non
plus
efficaces comme dans le cas babituel(sans
biais et de variance laplus petite possible) [
1chap.
4].
Puisque 03BCij
n’est fonction que du sous-ensembleYij 1 , 1 yij 21 ..., yijnjj
desobservations
correspondant
au traitement(Ai, Bj),
il suffit de montrerqu’il
n’existe pas de résumé exhaustif de ces observations pour
J.lij’
On sait en effet
(Théorème
deDarmois-Koopman [1] et [2])
que si Y est une variable aléatoire réelle dont la densité g(y , u) dépend
duparamètre réels
et dont le domaine de variation nedépend
pas de jn, une condition nécessaire et suffisante pourqu’un
échantillon de taille n > 1 de y admette un résumé exhaustif pour li est que g soit de formeexponentielle,
c’est-à-dire que l’onpuisse
écrireIci
ne
peut
se mettre sous la forme ci-dessus à moins quef(ilij)
=ct e
1 1.2.2 Existence et
propriétés asymptotiques
desP-ij
Si f est une fonction deux fois continûment dérivable de
03BCij
sur l’ensem-ble 0 des valeurs
possibles
pourpij (0
est l’ensemble des jn tels quef(jn)
>0),
ce
qu’on
supposera, la densitéLij (yij, 03BCij)
deYij
satisfait aux conditions de ré-gularité qui justifient
la recherche dePij
comme solution del’équation
devraisemblance.
on
impose
en outre la condition :8
qui
assure un maximum(relatif)
de la vraisemblance.On trouvera en
[ 1 ] et [2] l’énoncé
de ces conditions derégularité qui
por-a
a2
tent sur les variables aléatoires
- Log
L(Yij, jn.,)
et- Log
L(Yij, 03BCij).
Ces conditions sont réalisées
puisque
la formedéveloppée
de(lij)
montreque ces variables
peuvent
se mettre sous la formeave c
A(03BCij), B(03BCij), C(03BCij),
finies et continues pour tout03BCij
E 0398.Dans ces
conditions,
il existe une suite de racinesij(nij)
del’équation
(1 il,) qui, quand nij
~ converge presque sûrement vers la vraie valeur03BCoij.
Si
ij (nij)
est une suite de racines del’équation (1i,j) qui
converge presquesûrement vers
mjj,
àpartir
d’une certaine valeur de nij,ij(nij)
réalise un maxi-mum relatif de la vraisemblance
correspondant
à l’échantillon.Enfin,
toutesuite - (nij)
de racines del’équation (1 i,j)
convergeant p.s.vers
go,
est telle quenij (ij - 03BCoij)
converge en loi vers une variable nor-male centrée d’écart-t Yp e 1
,
ou I
(03BCij)
est la q uantité d’information de Fisher fournie parYij
surbtij.
Les estimateurs
’j(nij)
du M.V. des03BCij
sont doncasymptotiquement
sansbiais, asymptotiquement
efficaces etasymptotiquement
normaux.1 1. 3 - Calcul de I
(pii )
1La variance
asymptotique
depii "" (nij)
est, on l’a vu,égale
ànij 1 (Pii)’
, borneinférieure de
Fréchet, Darmois, Cramer,
Rao de la variance de tout estimateursans biais de
uij,
basé sur un échantillon de taillenij
deYij.
V
signifiant
"variance de".Comme
mais
Revue de Statistique Appliquée, 1975 vol. XXIII N°1
et comme carré d’une variable normale centrée réduite suit une loi de
X2
à 1degré de liberté,
dont on sait que la variance estégale
à 2.On a donc
1 1.4 -
Application
au casparticulier aij
=a(03BCij - mo)
avec a et ma connus.La condition
aij
> 0implique Jlij
> mo si a > 0 et03BCij
mo si a 0Dans le cas le
plus fréquent
où on a a >0,
l’ensemble des valeurspossibles
pour les
pij
est donc l’intervalle ouvert] mo, ~ [
1 1.41 - Il est
facile
de se ramener au cas où03C3ij
=a03BCij.
En effet si on pose
Zi j m - Yij m -
mo etOij = 03BCij -
mo , on ales
Zijm
étantindépendantes.
Puisque
hZ,03BC et hZ,03BC désignant respectivement
les densités des variablesZij
etYij expri-
mées en fonction de
03BCij,
avec
03B8ij = 03BCij - mo
L’estimateur du M.V. de
03BCij
déduit de l’échantillon desnij
réalisationsYijm
deYij
est donc le même que celui déduit de l’échantilloncorrespondant
des
nij
réalisationszij m
deZ ij
et on aij = ij -
nio.Il suffit donc de considérer les observations
zijm
deZij d’écart-type 03C3ij = a() ij
Dans la suite de
l’exposé
on posera donc03C3ij
=api
et ondésignera
parYij
et
pij
cequi,
dans leparagraphe précédent,
étaitappelé Zij
et() ij
1 1.4.2 - Détermination de
ij
dans le cas oùa a03BCij
10 et
l’équation (1 i,j)
s’écritsi
a > 0 on doit se limiter aux solutionsij
> 0 et si a 0 aux solutionsij
0On voit facilement que
l’équation (2)
admet 2 racines designes
contraires.On choisira celle
qui
a le mêmesigne
que (X Commeet
la solution choisie réalise un maximum de
Lij(03BCij)
sur l’ensemble 0398 des03BCij
telsque
a03BCij
> 0.Donc il existe un estimateur du M.V. de
03BCij ;
c’est la solution del’équation ( 2) qui
a mêmesigne
que aIl
s’exprime
en fonction des deuxstatistiques 03A3Yijm
et03A3Y2ijm,
tandisque dans le cas
classique 03C3ij = ct e ,
l’estimateur du M.V. de03BCij
estet n’est donc fonction que de la seule
statistique 03A3 Yijm.
1 + 2a2
I(jHij)
=1 + 2a2 a203BCij
en sorte que la varianceasymptotique
deij
est1 2 - RECHERCHE DE TESTS DE L’HYPOTHESE D’ABSENCE D’EFFET D’UN FACTEUR CONTROLE OU D’ABSENCE D’INTERACTION ENTRE LES FACTEURS
12.1 - Formulation
générale
duproblème
et des méthodes de testenvisagées
Soit p le cardinal
de (X,
c’est-à-dire le nombre de combinaisons(Ai, Bj)
ef-fectivement
essayées et li C-
RP le vecteur dont lescomposantes
sont les,g,j, (i, j ) ~ 03B1 rangés
dans l’ordre03BC11, 03BC12,...,03BC1l, 03BC21, 03BC22,...,03BC2l,...,
03BCk1,..., J.lk 1Les
hypothèses qu’on
se propose de testerpeuvent s’exprimer
par un en- semble de q relations dutype
Revue de Statistique Appliquée, 1975 vol. XXIII N°1
où cpl, cp2, ...,
cpa
sont des fonctions à valeur réellesde 03BC.
C’est ainsi quel’hy- pothèse HB
d’absence d’effet du facteur Bqui s’écrit,
sitoutes
les combinai-sons
(Ai, Bj)
ont étéessayées,
peut,
parexemple
se mettre sous la formeSoit ~
(03BC)
le vecteur de Rq decomposantes
~1, ~2 ,...,~q.
Quant,
àpartir
d’un échantillon de taille n d’une variable aléatoireX,
réelle ou vectorielle dont la densité deprobabilité dépend
d’unparamètre
vec-toriel 03BC
on se propose de testerl’hypothèse
H :~(03BC)
= 0 contre l’alternative laplus générale
soit K :~(03BC) quelconque,
ondispose
de deux testsasymptotiques,
basés sur l’estimation
de 03BC
par la méthode du maximum de vraisemblance(cf.
1 ] chap.
5 par7).
Il faut donc supposer que la densité
g(x, jn)
de X vérifie les conditions derégularité
à la base despropriétés asymptotiques
des estimateurs de M.V.(cf.
[1] chap.
4 ou[2]).
Ces tests
supposent
que lescomposantes
~i(,y)
de~(03BC)
satisfont aux condi-tions suivantes :
- elles
possèdent
pour tout1:. possible
des dérivéespartielles premières
etsecondes uniformément continues et bornées
- elles sont fonctionnellement
indépendantes,
c’est-à-dire que la matricejacobienne
est de rang maximal
q
p pour toute valeurpossible de 03BC
Ces deux tests sont les suivants :1 2.1.1 - Test du
rapport
des vraisemblances maximales.Soit
x(n)
l’ensemble des n observations de X constituant l’échantillon etLn(x(n),03BC)
la densité de x (n) Soitoù
"03BC
E H"signifie
que M satisfait à Het
"03BC.
E K"signifie
que satisfait à K et est doncquelconque.
Si
l’hypothèse
nulle H est réalisée lastatistique
12
converge en loi vers un
X2
à qdegrés
de libertéquand
n tend vers l’infini et lestests de
régions
derejet
définies par -2Log Xn (x(n))
c où c est une constantedépendant
du seuil designification
aadopté,
sont convergents(leur puissance
tend vers 1
quand
n pour toute valeurde 03BC
ne satisfaisant pas àH).
12.1.2 -- Test de Wald
Soit
(n)
l’estimateur du M.V.de 03BC
sousl’hypothèse K, correspondant
à unéchantillon de taille n.
On sait que la matrice
I-1n (03BC)
inverse de la matrice d’informationIn (03BC)
de03BC
correspondant
à un échantillon de taille n(ln Q9
= n1 (03BC)
= n1 (H:))
peut être considérée comme la matrice de covarianceasymptotique
de(n).
Pour éviter les notations à double
indice,
on suppose dans la suite de cet énoncé que 03BC est de dimension p et a pourcomposantes
Mi, i =1, 2, ...,
p.Soit
où
I-1rs (03BC) désigne
l’élément(r, s)
de la matriceI-1n (03BC)
(n)
Les
b(n)ij
peuvent êtreinterprétés
comme les covariancesasymptotiques
desstatistiques ~i()
et~j().
Cela résulte del’application
de la formule des accrois- sements finis aux~i(1, 2,
...,jUp)
auvoisinage
de~i(03BC1,
03BC2, ..1.,jUp) (Cf.
[5] , chap. 6,
par.a.2).
Soit
B(n)(03BC)
la matrice q x q d’élémentsb(n)ij(03BC)
Puisque
a une distributionasymptotiquement normale,
il en est de même pour~()
avec une moyenne~()
et une matrice decovariance B(n) (03BC).
(Cf. [5], Chap. 6,
para.2).
On en déduit que
(où ’
est unsymbole
detransposition)
a une distributionasymptotique
dex2
à q
degrés
de liberté.Par suite si H :
~(03BC)
= 0 estréalisée, (~())’ [B(n)(03BC)]-1 ~()
a une dis-tribution
asymptotique
de~2,
tandis que si H n’est pasréalisée, elle
tend pres- que sûrement vers l’infini avec n.y étant inconnu ce résultat n’est pas intéressant pour la
pratique
mais Wald amontré que la
statistique
converge aussi en loi vers un
X2
à qdegrés
de liberté si H est réalisée et que les tests derégions
derejet
définies parWn ()
c, où c est une constantedépen-
dant du seuil de
signification
achoisi,
sont convergents. Si H n’est pas réaliséeW n (M
~.Revue de Statistique Appliquée, 1975 vol. XXIII N°1
1 2.2. -
Application
auxplans d’expériences
1 2.2.1 - Cas
particulier n ii
= n pour tout(i, j)
E aL’extension est alors immédiate. Il suffit de
prendre
pour variable X des tests définisprécédemment
le vecteur Y de RP de composantesYij ; (i,j))~03B1
Puisque
lesYij
sontindépendants,
Y suit une loi normale demoyenne y
de matrice de covarianceZ, diagonale,
dont l’élément de laligne (i, j)
est03C32ij = [f(03BCij)]2
1 2.2.2 - Cas
général
Quand
lesnij
ne sont pas touségaux
on nepeut plus
définir un n échantil-lon de la variable vectorielle Y. Il a donc fallu étendre les deux méthodes de test
précédentes
à ce cas. Nous nous sommes limités au cas où les composantesYij
de Y sontindépendantes
enprobabilité.
Pour
pouvoir parler
de convergence et depropriétés asymptotiques,
ilfallait définir un mode de croissance de l’ensemble des p valeurs
nij
vers l’infini.On a
supposé
que la structure duplan
restait lamême,
c’est-à-direqu’on
avait
nij =
vpij,
lespij
étant des constantespositives
ou nulles définissant cette structure et v un entierqu’on
fait tendre vers l’infini.On aura donc V
(i, j) ~ 03B1 c’est-à-dire
tel quePij
>0, nij
~ ~ si et seulement si v oo. Dans ces conditions l’énoncé du test durapport
des vraisemblances maximales n’est pas modifié à condition deremplacer
n par v etx (n)
pary(03C5),
ensemble des observations
I.2.2.3 2013 Extension du théorème de Wald
Pour voir sous
quelle
forme ils’étend,
il faut faire intervenir defaçon plus explicite
la taille n de l’échantillon dansl’expression
deWn.
Puisque ln (9)
= n1 (IÀ), 1 (y)
étant l’informationsur y
fournie par une seule observation de X.et
Dans le cas
présent,
les composantesYij
de Y étantindépendantes
on aI(03BC)
= matricediagonale
d’élémentI(03BCij)
Soit
4,
le vecteur decomposantes ij(nij)
avecnij = vpij
on sait que
Les
ij
étaientindépendants
on en conclut que14
la matrice de covariance
K (bi)
étant une matricediagonale
d’élémentsPosons
où est la matrice
(q
xp)
de composantes -B, (03BC)
a pour élément(r, s) :
Quand
H n’ext pasréalisée, W v (ju) quand
03C5 ~ oo et les tests de ré-gion critique Wv ()
c sont convergents.Nous avons choisi d’utiliser le test de
Wald,
depréférence
au test du rap-port
des vraisemblancesmaximales,
parce que le test de Wald est exclusivement basé sur le calculde
estimation du M.V. de jn sousl’hypothèse
laplus générale
tandis que le test du
rapport
des vraisemblances maximales nécessiteégalement
le calcul de
H
estimateur de M.V. de J.lquand
on suppose Hréalisée,
et de la valeur de la vraisemblancecorrespondante
pour l’échantillon. Ce calcul est no-tablement
plus compliqué
que celui de J.l parce que les liaisons introduites intro- duites entre les03BCij
par les relations~(03BC)
= 0 ne permettentplus
d’estimersépa-
rément
chaque pij
àpartir
des seules observationsyijm correspondant
à la com- binaison(i,j)
considérée.On notera pour
l’application pratique
du test que v et lespij
ne sont pasconnus. Seul les
produits nij =
vpij
sont connus. Ceci est sansimportance puis-
que la matrice v
B- () qui figure
dansl’expression
deW()
est l’inverse de la matrice~~ ~(03BC)() T ()[~~ ~03BC()]
’ oùT()
est la matricediagonale
d’élémentsOn a
ainsi
1.2.3 - Mise en oeuvre
pratique
du test de Waldquand
les fonctions~i(03BC)
sontdes formes linéaires
Les
~i(03BC)
sont en effet linéairesquand
Hexprime
l’absence d’effet d’un facteur contrôlé comme on l’a vu en 12.1,
ou l’absence d’interaction entre les facteurs comme on le verraplus
loin. Il estpossible
dans ce cas d’utiliser un ar- Revue de Statistique Appliquée, 1975 vol. XXIII N°1tifice pour calculer
W()
defaçon
relativementsimple
en utilisant les résul- tats de la théorieclassique
des modèles linéairesappliquée à Ê
En
effet,
si~(03BC) = AH
avec A matrice(q
xp)
de rang qOn a vu
qu’on
avaitasymptotiquement
et que les
ij
étaientindépendants.
Nous allons faire comme si on
pouvait
écrireles
rii
étant connus et lesFij indépendantes
Soit
Les variables
lij
satisfont au modèle linéaireL’hypothèse
H :~(03BC)
= 0 où les ~i sont des formes linéairesindépendan-
tes
devient 4/(X) =
0où les Vli
sont des formeslinéaires, indépendantes, de 03BB.
L’estimateur du M.V. de
X dans (3)
est1 de composantes 1..
et la théorieclassique
du modèle linéaire permet de testerl’hypothèse
linéaire H :03C8(03BB)
= 0en écrivant que la différence
SH (T)
des sommes de carrés résiduelle sous H et sous K suit unX2
à qdegrés
de liberté(a
est constant etégal
à1).
K estl’hypothèse
laplus générale : li m quelconques
mais tels quef(03BCij)
> 0. En fait lasomme de carrés résiduelle sous K est nulle
puisque 03BBij
est estimé parlij
etSH (T)
est la somme des carrés résiduelles sous H. On sait que(on
testel’hypothèse
d’une moyenne nullepour 03C8 ( 1 )
E Rq dont la distribution estnormale).
Puisque
en
désignant
parDT
la matricediagonale
d’élémentsrii
On a doncOn voit
qu’en prenant
16
on obtient
Le processus
opératoire
de test est donc le suivant1)
On calcule les estimations duM.V., fi,
desbtij
sousl’hypothèse
laplus générale
K :pij quelconques
mais tels que f(03BCij)
> 0 .2)
Onprocède
au test del’hypothèse
linéaire H dans le modèle linéaireEij
EN(0, 1)
etindépendantes,en prenant
pour valeur des03C4ij supposés
connustij(ij) = 1 nijI(ij) qu’on désignera simplement
partij
dans la suite del’exposé.
W()
estégale
à lastatistique
de testSH (T),
somme des carrés résiduellesous
H,
et sa distributionasymptotique
sous H est celle deSH (T)
sousH,
c’est-à-dire un
X2
à qdegrés
de liberté si H est d’ordre qI.2.3.1 2013
Application au
test del’hypothèse HB "pas d’effet
dufacteur
B".On suppose pour
simplifier
les notations que leplan
est factorielL’hypothèse Ha
est d’ordre q =k(l - 1)
et on peutl’exprimer
sous la formeOn a alors pour tout i le modèle linéaire
Eij E N (0, 1)
etindépendantes.
L’estimation des moindres carrésSi
deSi
corres-pondante
est solution del’équation
normaleOn a donc
En revenant aux
ij,
on obtientRevue de Statistique Appliquée, 1975 vol. XXIII N°1
qui,
sousHB ,
suitasymptotiquement
une loide y2
à K(1
-1 ) degrés
de libertéRemarque :
Sil’hypothèse Ha
estacceptée
on peutprendre Si
pour estimateurde la valeur commune J.li des
uij
car onpeut
montrerqu’il
converge p.s. vers Mi sousHB (cf. [3]).
Il semble toutefoisplus logique
d’estimer y. par le M.V.en
supposant Ha réalisée,
c’est-à-dire que l’ensemble desni. nij
observa- tionsyijm, U
=1, 2,
...,1)
à même moyenne J.li’L’équationj
de vraisem- blance se déduit immédiatement del’équation (li,j)
donnantij
en yrempla-
çant 03BCij
par J.li’nij
par ni. etY par Y.
m fm
1.2.3.2 - Test de
l’hypothèse
d’absence d’interaction entre lesdeux facteurs
Il n’est pas nécessaire
d’avoir,
comme dans le casclassique, nij
> 1 pour aumoins un
couple (i, j)
pourpouvoir procéder
à ce test. Ceci est dû à cequ’on
n’aplus
besoin d’estimerséparément
l’écart type et la moyenne.On suppose, là encore, que le
plan
réalisé est factoriel.L’hypothèse HA B
à testerpeut
se formulerElle
exprime
que le vecteur Iu de composantesgij appartient
au sousespace vectoriel
VA + B
deRk défini
par(4)
On sait
(cf, [4])
que leséquations (4)
ne définissent pas 03BCo, ai etj6j
de fa-çon
unique
en fonction des03BCij.
Pour que ceux-ci soient définis de
façon unique
onajoutera
les conditionsles ai et
bj
étantquelconque
mais telsque ,
Les conditions
(5) généralisent
les conditions de centrage habituelleset un choix convenable des ai et des
bj
permettra desimplifier
un peu la miseen oeuvre du test.
La résolution du
système d’équations (4)
+(5)
en 03BCo, ai et{3j
conduit auxexpressions
voir note
(1)
(1) L’astérisque indique qu’il s’agit de la solution particulière correspondant au système de
18 En posant
l’hypothèse HA B prend
la forme~*ij(03BC)
= 0~(i, j)
Les
~*ij
ne sont pas linéairementindépendantes.
Eneffet,
le noyau del’ap-
plication y - ~* (lu),
ensemble desM
satisfaisant les relations(4)
et(5)
est de di- mension k + l - 1puisqu’il dépend
de k + 1 + 1paramètres
03BCo, ai,(3j
liés parles deux relations
(5). (On peut
du reste voir aisément que :de ces relations entraînant la
dernière).
L’application y - çr, * (y)
est donc de rangkl - (k
+ 1. -1 )
=(k
--1 ) (l- 1 )
et ce rang est l’ordre de
l’hypothèse HA B .
VA+B qui
est le noyau del’application ~*
est de dimension k + 1 - 1 Nous allons encore calculerW(ju)
en testantl’hypothèse HA B
dans le mo-dèle
(3).
Elle se formule alorsLe
système
deséquations
normales donnant les estimateurs des moindrescarrés, 03BC*o, a*i’ j3*j
sousHA B et
les conditions(5)
estPour résoudre ce
système,
on peutsupprimer
leslignes (k)
et(l’) puisque ( 1 )
+(2)
+ ... +(k) = (1)’
+(2)’
+ ... +(1)’
=(0)
cequi
permet de se rame-ner à un
système
de Cramer.Le
procédé
ci-dessous permet, par un choix convenable des ai etbj,
de ré-soudre ce
système
d’une manière astucieuse. On peut aussi utiliser une méthodegénérale (inversion
d’une matriceprincipale
dusystème) qui s’applique quels
que soient les
poids
ai etb..
On sait(Cf. [4])
que la somme des carrés résiduel- le nedépend
dep* , â*i, 03B2*j
que par l’intermédiaire des estimateurs des moin- dres carréseij
=pe
+a*i + 03B2*j des 03BCij
sousHA B,
dans le modèle(3)
et que ceux-ci nedépendent
pas du choix dusystème
depoids (ai, bj) adopté
pour dé-finir 03BCo, les ci et les
j3j.
On trouvera donc pourW
la mêmeexpression
que ci- dessous(7)
en fonction desij.
Ceci résulte aussi de la théoriegénérale précé-
Revue de Statistique Appliquée, 1975 vol. XXIII N°1
dente
(1.2.3).
Defaçon plus précise, l’expression
deW()
en fonction desij,
03BC*o, i, {3* j
est aisée à trouver et nedépend
pas du choix despoids
ai etbj
adoptés
pour définir03BC*o, &*i, 03B2*j.
On sait en effet(Cf. [4])
que, dans un modèlelinéaire
général
dutype Y
=X Ê
+ E avecE(E) =
0 et une matrice X non né-cessairement de
plein
rang, la somme des carrés résiduelle peuttoujours
se mettre sous la forme
où b est un estimateur des moindres carrés d’un
j3
tel que E(Y)
=X03B2,
tandis que Y = Xb estl’unique
estimateur des m.c. de E(Y)
=Xfi,
et P = X’Y est le vecteurdes seconds membres du
système
deséquations
normales définissant les estima- teurs des m.c. b desfi.
On a donc dans le cas
présent
où Y =1
decomposantes lij = ij tij et 03B2
apour
composantes
u. , les ai et lesj8j
:-
pour tout
système (03BCo *, 03B1*i’ 03B2j*)
de solutions deséquations (0), (i), (j)’
Si on
prend
En éliminant
j3*j
+03BC*o
dans leséquations (i) pour
i de 1 à k -1,
et enremplaçant lij par ij tij,
on obtient pour l’ensemble de ceséquations
et de l’é-quation 03A3
ai03B1*i = 0, l’expression :
20 et C’ =
(cl ,
c2 , ...,ck)
avecet
Les
ff* j
peuvent êtreexprimés
en fonction desa* et
de03BC*o
paret
W()
donné parl’expression (7)
ci-dessus a une loiasymptotique
de~2(k-1)(l-1)
siHA
B est réalisée.Remarque :
Estimation deseffets
desfacteurs
contrôlés sousl’hypothèse
d’ad-divité
On trouvera dans
[3]
en annexe, leséquations
de la vraisemblance pour es-timer 03BCo, ai,
j3j,
àpartir
des observationsyijm .
Il semble que même dans le cassimple aij = a03BCij,
ilfaille,
pour lesrésoudre,
utiliser des méthodes itératives C’est la raison pourlaquelle
on peut attacherquelqu’intérêt
à laproposition qui
suit.
Les
ij
ne peuvent être utilisés à laplace
des03BCij
dans lesexpressions (6)
pour déduire des estimateurs
d’effets,
li., ai,Pi
définis par unsystème
depoids
indépendants
desnij
et desij,
parexemple
par les conditions habituelles(9) 03A303B1i = 03A303B2j
= 0(ai = bj = 1), puisque
n’a aucune raisond’appartenir
à
VA + B
c’est-à-dire de satisfaire leséquations (4).
Par ailleurs les estimateurs03BC
* 03B1i*,
03B2j*corres ondant
auxoids
a. -03A31 tij
etb. - 03A31 tij adoptés
neprésentent
pasgrand intérêt.
En
effet,
les effets03BC*o, a* 03B2*j, qu’ils estiment,ne
sont définisqu’étant
don-nés les
poids
ai,bj
et lespoids
utilisésdépendent
des effectifsnij
et despii puis-
que
t,j
=1 nijI(ij) (Le fait que les poids
augmentent indéfiniment avec les nij
n’est pas
gênant puisque
les résultats sontinchangés
si onremplace
cespoids
par des
poids qui
leur sontproportionnels.
On peut doncremplacer
lesnij
parles
pij
dans lesexpressions
de cespoids).
Revue de Statistique Appliquée, 1975 vol. XXIII N°1
Par contre les
’iXij
=03BC*o
+a*
+j8*j qui
sont les solutions duproblème)
ne
dépendent
pas dusystème (ai, bp
depoids adopté
pour définir les03BC*o, a*;, 03B2*j. (10)
définit eneffet 03BC
comme l’élément deVA + B le plus proche
dejn
pour lamétrique
euclidienne définie par la matricediagonale
d’élémentsI(ij)pij
On
peut
alors utiliser lesexpressions (6)
danslesquelles
les03BCij
sont rem-placés
par lesij
pour en déduire les estimateurso, i, j
des effets o, 03B1i,03B2j
définis par
(9) (On
notera quesi 03BC
EVA+ B,
on aij
=ij~(i,j)). On
obtientainsi des estimateurs convergents des 03BCo, 03B1i,
03B2j
siHA B
est réaliséepuisque,
comme on va le
voir,
lesij
sont, dans ce cas, des estimateurs convergents des03BCij.
Démonstration de la convergence
des ij
vers les03BCij si HA B
est réaliséeOn a
Mais
lim
(p.s.) 03A3 (ij - btij)2
1(ij) pij
= 0 avec03BC ~ VA + B,
si
HA B
estréalisée, puisque 03BCij 03BCij
et lim(p s)
1(Aij)
= 1(03BCij)
où1
(Mu)
est fini.On a donc
ce
qui implique puisque
et par suite
L’interprétation géométrique
du raisonnementprécédent
est évidente :puisque 03BC~ VA+B, le point
deVA + B
leplus proche de
pour une mé-trique
nondegénérée quelconque
converge nécessairement vers bi.1 2.4 -
Application
du test de Wald au cas oùqj
=a(03BCij - ma)
On
peut
ici encore se ramener au casaij
= abiij.
On suppose donc dans la suite que mo = 0On a
22 et par suite :
12.4.1 - Test de
l’hypothèse HB
La
statistique
de test estWB
1.2.4.2 -
Test del’hypothèse
d’addivité deseffets
de A et BLes
poids
sont :et les
expressions qui
interviennent dans les éléments de A et C(équation (8))
sont :
et par suite
et
Revue de Statistique Appliquée, 1975 vol. XXlla N°1
1 3 - CONCLUSION DE LA 1 ere PARTIE 1 3.1 - Estimation
On a la
possibilité
d’estimer les moyennes03BCij correspondant
aux combinai-sons
(Ai, Bj)
sousl’hypothèse
laplus générale
par la méthode du maximum de vraisemblance.Les estimateurs
ij
sontindépendants
enprobabilité
etij
nedépend
quedes observations
correspondant
au traitement(Ai, Bj).
Dans le cas oùest la solution de même
signe
que a d’uneéquation
du seconddegré.
Les
ij
existenttoujours
et convergent presque sûrement vers les valeurs vraies. Ils sontasymptotiquement
efficaces et normaux. Dansl’hypothèse
d’ab-sence d’effet d’un
facteur,
B parexemple,
les moyennes Pi peuvent être es- timées de la mêmefaçon.
Dans
l’hypothèse HA B
d’addivité des effets de A etB,
les estimateurs du M.V. des effets ai etj3j
des facteurs sont donnés par deséquations complexes
faisant intervenir l’ensemble des observations
qu’il
faut résoudre par des mé- thodes itératives. Onpeut
déduire d’éléments intervenant dans le test deHA B
des estimateurs convergents des
paramètres
03BCo, ai,j3j
du modèle. Ils sont fonc- tion des seuls,1ij.
1.3.2 - Tests
On a la
possibilité
d’utiliser un testasymptotique
pour tester leshypothè-
ses d’absence d’effet d’un facteur ou d’absence d’interaction
(même
dans le cas d’unplan
factoriel sansrépétitions)
et deshypothèses plus générales
de la forme~i
(p)
= 0 où les ~i sont des fonctions dérivables desgij,
fonctionnellement in-dépendantes.
Deux méthodes ont étéenvisagées :
le test du rapport des vraisem- blances maximales et le test de Wald. Il a fallugénéraliser
ces tests au cas denombres de
répétitions nij inégaux
enfixant, puisqu’il s’agit
depropriétés asymptotiques,
le processus de croissance vers l’infini desnij (On
aposé nij = 03C5pij, pij finis,
v -~).
Dans les deux cas, lastatistique
utilisée convergevers un
X2
à qdegrés
de liberté si q est l’ordre del’hypothèse
H à tester(nom-
bre de relations fonctionnellementindépendantes
entre lesgij imposées
parH).
Le test de Wald a été
préféré
parcequ’il n’exige
pas le calcul des estima- teurs du M.V. desparamètres
sousH,
mais seulement sousl’hypothèse
laplus générale.
Lastatistique W(jn)
utilisée dans ce testpeut :
dans le cas d’unehypothèse
linéaire être calculée assez aisémentgrâce
à un artificepermettant
de se ramener à la somme des carrés résiduelle sous H dans un modèle linéaireclassique.
Le
problème
de succession des tests se pose avec un acuité d’autantplus grande
que les estimateurs du M.V. des03BCij
sousl’hypothèse
d’absence d’interac- tion sont difficilement accessibles. Ilparaît
donc assezpeu opportun
de testerter d’abord
l’hypothèse HA B si
on ne lui porte pas un intérêt essentiel.Un schéma
possible
de tests pourra être celui de lafigure
1. On y notera24 LEGENDE : K : hypothèse générale
H : hypothèse nulle à tester
(1) A est le facteur qui a, à priori, la plus grande probabilité d’être sans effet
Figure 1 - Schéma possible de tests
C’est
pourquoi
on pourrapréférer
le test(1, 2, l’)
au test(1, 2, 1).
Si onpréfère
le test
(1, 2, l’)
et si(1, 2, l’, 1)
seproduit,
il convient d’examiner attentive- ment les résultats obtenus au cours des différents tests avant de conclure.Enfin,
il ne faut pas oublierqu’estimations
et testsreposent
sur des mé- thodesasymptotiques.
C’est la raison pourlaquelle
il a paru nécessaire de pro- céder à l’étude par simulation dont rendcompte
la deuxièmepartie
de cettenote.
Revue de Statistique Appliquée, 1975 vol. XXIII N°1