R EVUE DE STATISTIQUE APPLIQUÉE
Y. M ORILLON
Théorie de la randomisation
Revue de statistique appliquée, tome 8, n
o1 (1960), p. 29-44
<
http://www.numdam.org/item?id=RSA_1960__8_1_29_0>
© Société française de statistique, 1960, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
THÉORIE DE LA RANDOMISATION
Y. MORILLON
Ingénieur
àl’Institut de Recherches de la Sidérurgie
Cette no te ne
pré tend
donnerqu’un
ape rçu sommaire desproblè-
mes
posés
et de leurs solutions. Elle est basée essentiellement surles
publications
deKempthorne.
(1) (2)Cette note concerne 4
types
de plans dont lacaractéristique
commune est d’utiliser toutes les unités
expérimentales
soumises àl’opération
de randomisation. Comme on le verra, l’étude des distri- but ions des rapports de carrés moyens est, dans ces conditions, sim-pl if iée
car certains termesfigurant
dans ladécomposi
t ion de la som- me de carrés ne sont pas aléatoires dansl’hypothèse
nulle (du moinsavec certains
modèles).
La théorie de la randomisation a étéappli- quée
à desplans
neprésentant
pas cettecaractéristique;
on en trou-vera un
exemple
dans un article de Wilk etKempthorne.(3)
On
conçoit
bien quelorsque
le nombre d’unitésexpérimentales
utilisées est petit devant le nombre total 1 d’unités
disponibles,
onretrouve
l’analyse
de varianceclassique
sanstoutefois que les hypo-
thèses de normalité etc. soient nécessairementsatisfaites.
Ceci re-joint l’objet
d’une autre étude et nousn’envisagerons
pas ces pro- blèmes dans laprésente
note.I - TYPES DE PLANS ETUDIES -
A - Plans
complètement
randomisés.Il y a t traitements à comparer
repérés j 1, 2,.. ,t)
et ondispose
deN = rt unités
expérimentales, appelées "plots", repérées
i(i= 1, 2,..., N),
cha-que traitement étant
répétée
fois(Kempthorne
étudie donc un casparticulier
car,en
général
le nombre derépétitions peut
varier d’un traitement àl’autre).
Pourréaliser la
randomisation,
on utilisera unepermutation
au hasard des N nom-bres
(Cochran
et Cox donnent des tables depermutation
au hasard allantjusqu’à N=16 ;
onpeut
aussi utiliser facilement les tablesclassiques
de nombres au ha-sard) ;
les rpremiers plots (dans
l’ordre de lectureaprès permutation)
serontaffectés
au traitement 1,
les r suivants au traitement2,
etc. De cattefaçon,
les---
(1) "Desl~. and analysis of experiments" et
(2) "Random izat ion theory of experimental 1 inference" J. A. S. A. 50,271 (1955) pp. 946-67.
(3) "Fixed, mixed and random models" J.A.S.A. 50,272 (1955) pp.1154 et suite.
.20132013
tsystèmes
d’association desplots
et des traitements sontéquiprobables , (r .)
B - Blocs randomisés
complets.
Il y a
toujours
t traitements à comparer et ondispose
de r ensembles de chacun tplots, appelés
"blocs".Chaque
traitement doit être affecté une fois àchaque
bloc. Pour réaliser larandomisation,
on utilisera danschaque
bloc unepermutation
au hasard des tplots
et les traitements1,2,3,....t
seront affectésaux
plots
dans l’ordre de lectureaprès permutation.
Les
(t!) systèmes
d’association desplots
et destraitements sontéquipro- bables.
C - Plans du
type split-plot( *).
Partant du
plan
Bci-dessus,
nous considérerons le cas oùchaque plot peut
être fractionné en
split-plots
affectés chacun à un sous-traitement différent(les
mêmes ensembles de sous-traitements pour tous les
plots).
L’affectation des sous-traitements s’effectue en utilisant pour
chaque plot
une
permutation
au hasard dessplit-plots.
Nous noterons :
- s le nombre de
sous-traitements,
donc desplit-plots
parplot,
- t le nombre de
traitements,
donc deplots
parbloc,
- r le nombre de blocs.
Les
(t!
1(s!)t ) ~ systèmes
d’association dessplit-plots,
traitements et sous-traitements sont
équiprobables.
D - Carrés latins.
Pourcomparer
ttraitements,
ondispose
det2 plots pouvant
êtregroupés
en t blocs de t
plots
de 2façons
différentes :groupement
parlignes
et groupe- ment parcolonnes, chaque plot correspondant
à une combinaisonligne-colonne
différente.
Chaque
traitement ne doit être affectéqu’une
seule fois à uneligne
ou àune colonne donnée.
Les méthodes utilisées pour introduire un processus aléatoire dans l’af- fectation des traitements aux cases sont décrites par divers
auteurs,
notamment par Cochran et Cox("Experimental Design"). Lorsqu’on applique
cesméthodes ,
on
peut
considérer que le carré latinadopté
a été tiré au hasard dans une famille de carréslatins ;
une telle famille necomprend
pas toutefois tous les carrés la- tinspossibles lorsque
t > 5(avec
la méthode de sélection deCox).
II - DEFINITION DE L’ADDITIVITE -
Si on
désigne
parZ i j
la valeur de la variable mesuréelorsque
le traite-ment
déterminé j
estappliqué
auplot
déterminéi,
il y a additivité au sens strict si :Z e i + t i (z
est alors une variablecertaine)
---
(* ) Plans
"split-plot" = plans
expérimentaux dans lesquels des traitements additionnels ou sub- sidiaires sont introduits en partageant chaque"plot"
en deux ou plusieurs parties.et additivité au sens
large
siLes
e~.
étant des variables aléatoiresindépendantes (par exemple,
des er-reurs de
mesure).
III - TEST DIRECT DE L’HYPOTHESE NULLE
tj =
0Réf ( 1)
pp 128 et suite. J
lR.éf(2)p
947Kempthorne
citel’exemple emprunté
à Fisher de lacomparaison
de 2 trai-tements
répétés
sur 15 blocs randomiséscomplets (t=2, r=15).
S’il y aadditivitéau sens strict et s’il
n’y
a pas d’effet du traitement(hypothèse nulle),
la diffé-rence
Tl - T2
observée entre la somme des 15 résultats du traitement 1 et lasomme des 15 résultats du traitement 2 résulte d’un
tirage
au hasardparmi
les(2’)15
différences de cetype correspondant
à toutes lesfaçons
de fractionner les 30 résultats en 2 séries de 15 enrespectant
larègle prescrite (1
résultat dechaque
série parbloc).
Il est donc
possible
de déterminer dansl’hypothèse
nulle le nombre de tel- les différencessupérieures
ouégales
àTl - T2,
donc de calculer lerisque
atta -ché à
l’hypothèse
nulle.Dans
l’exemple cité,
cerisque
est de5,267%
alors que ledépouillement
suivant une
analyse
de varianceclassique
à 2 dimensions donne4,97%.
D’autre
part, Kempthorne
donne une liste de 24 séries de résultats deplans complètement
randomisés artificiellement construits etdépouillés
suivant la mé- thodeclassique
del’analyse
de variance à 1 dimension(test F)
et suivant le test direct. Il constate ainsi que lesrisques
depremière espèce
déterminés suivant les deux méthodes sont en assez bon accord. Cesrisques
sont assezrégulière-
ment échelonnés de
0,006
à0,967 (pour
le testF).
Notons toutefois que c’est larégion
des faiblesprobabilités qui
estpratiquement
intéressante etqu’une
seuleprobabilité
de cette liste est inférieure à10% (pour
le testF).
IV - BASES
MATHEMATIQUES
DU DEPOUILLEMENT PAR L’ANALYSE DE VARIANCE -Dans le cas le
plus général,
il y a t traitementsrepérés j (j=l,2,...,t)
chacun d’eux
pouvant
êtrerépété
un nombre illimité de fois et Nplots repérés
i
(i=1, 2, ... , N).
Un
système
d’affectation des traitements auxplots peut
êtrereprésenté
par un
point
de coordonnéesjl
dans un espace à N dimensions(on
affecte un... J2 JN
vecteur de base à
chaque plot).
Chacune des coordonnéespeut prendre
les t va-leurs, 1, 2,... t; il y a
donc tNsystèmes possibles représentés
part points.
Laloi de distribution de ces
systèmes peut
êtrereprésentée
en associant une pro- babilité ou masse àchaque point,
la somme des masses étantégale
à 1.Toutes ces masses sont déterminées par le
plan expérimental,
par exem- N’ple,
dans le cas duplan complètement randomisé,
il ya =t
masseségales
à(ri)t
N Nrr.
et ~ ~~
t- _ N
~~ masses nulles.(r.1 Y ’
~~~~~~ ~~~~~~°Kempthorne
introduit la variable aléatoire :valant 1 si le
traitement j,
est affecté auplot 1,
le traitementj2
auplot 2,
etc .et zéro
autrement;
ils’agit
donc d’une variable de Bernouilli. On obtient les va-riante s de cette variable aléatoire en donnant à chacun de s
indices j , j ... j les
tvaleurs
1, 2, ...
t. La masse affectée aupoint
decoordonnées jl dans
larepré-
sentation
envisagée plus
haut est donc :La distribution
marginale
sur l’axe affectée auplot
i est constituée de t massescorrespondant
auxprobabilités P(8 ~’ = 1), j ~ prenant
les valeurs1, 2,
... ,t.
i
i .
Nous
noterons,
comme le faitKempthorne,8
i au lieu de5 1.
Les
5 i jouissent
de lapropriété ci-après,
trèsimportante
pour la suite des calculs’: puisque s j
i nepeut prendre
que la valeur 0 ou1,
on a, en effet:pour toutes valeurs non nulles de r, p, q.
Les valeurs de ces
probabilités peuvent
être calculées pour untype
deplan
donné. Parexemple,
pour leplan complètement randomisé,
on a :D’où le calcul de :
par
application
du théorème desprobabilités composées,
etc.Ceci
permet
le calcul des moments de variables aléatoiresqui s’expriment
en fonction de
8 ii
.V - DEPOUILLEMENT
MATHEMATIQUE
DES PLANS ENVISAGES EN I - A - Planscomplètement
randomisés(réf.
2 page952).
Traitements
repérés j (j=1, 2.... t)
Plots
repérés
i(i=1, 2, ... N)
N =rt
1/
Modèle avec additivité au sens strict.Pour introduire les j /
définisplus haut,
nous considérerons la somme des résultats observés pour letraitement j
déterminé : c’est une variable aléatoirequi
s’écrit :LI
Il ,
tj
et e; étant des variables certaines vérifiant les conditionsLes
5 sont
les variables aléatoires définiesplus
haut.On montre facilement que l’on a :
E~20132013t== ~ r +tj (ceci
résulte immédiatement du fait queE(8 ~ )
estconstant)
i
var = - r t--1-
t2013
r Cr 2 enposant
p Q2=20132013~
rt-1,!Z e 2
iOn montre
qu’on
a :Une telle corrélation
négative
entre les moyennes de traitement existe dans tous lesproblèmes
de modèles finis. Sa connaissancepeut présenterun
certainintérêt
lorsqu’on
veutcompléter l’analyse
de varianceenvisagée ci-après
par descomparaisons
des traitements 2 à 2(Une
tellecomparaison
pose d’ailleurs d’au- tresproblèmes
sur la distribution desTj - 17il
dansl’hypothèse nulle).
Test de
l’hypothèse
nulletj = 0.
Ce test s’effectue par une
analyse
de variance à une dimension. Lapartie algébrique
de la méthode :décomposition
de la somme de carrés totale centrée entre observations etdegrés
de liberté attachés aux diverses formesquadrati-
ques
figurant
dans cettedécomposition
est la même quelorsqu’on adopte
le mo-dèle normal
classique (Mo ci-après) :
L’indice k
(k = 1, 2, ... r) repérant
lesrépétitions
dutraitement j.
---
(*) On pourrait songer à éc rire le modèle pour une observation individuelle. Cela suppose qu’on
se définisse un second système de
repérage
des plots i * (i* =1, 2,..., N) basé, par exem-ple, JI sur l’ordre dans lequel ils sont écrits après permutation aléatoire. On peut évidem-
ment mettre i* sous la forme
i* =jkJl
l’indice k repérant les répétitions destraitements j .
Il faut alors se définir des
8 !*
de la mêmefaçon
que plus haut et le résultat sera une va-riable aléatoire pouvant s’écrire :
Il est plus simple de raisonner directement sur les sommes
Tj = Xj.
Par
contre,
les lois de distribution des diversesstatistiques
considéréesne sont pas les mêmes pour les modèles
(Mo)
et(Ml).
La
décomposition
est :___
Tableau 1
____
Cr 2 est défini
plus
haut dans le cas du modèle(Mi)
et dans le cas du modèle(MJ,
on a u2 =2 E’
On voit que dans
l’hypothèse
nullet~
= 0 :E(Q~.)
=E(Q~).
Il reste à étudier dans cette
hypothèse,
la distributionQ
de QR.
Il est
plus
facile de passer par l’intermédiaire durapport ~ T ~2 car
avec lemodèle (M~L S~
n’est pas aléatoire dansl’hypothèse nulle,
le hasard nejouant
que sur le
partage
deS 2
entre T et R.(Dans l’hypothèse
nulleS 2
=f e 2). i QT
Dans le cas du modèle normal
(M~), T,
R etS 2sont
aléatoireset QR
estt i T
distribué comme
F :;~-J.) ;
on en déduitque 7 suit
une distribution dite"distribu-
-
2
tion
béta"
dont la densité deprobabilité
est :1 T*
Q
Si
2013
est distribué commebéta, Qt
est distribué comme F.S, Q R
Les deux
premiers
moments de la distribution béta sont :On voit que :
pour r
grand
Or
Kempthorne
a calculé les momentsde T 2
T dans le cas du modèle(Mi)
etil a
trouvé, toujours
dansl’hypothèse
nulletj = 0, qu’on
avait :Reste à savoir à
partir
dequelle
valeur rpeut
être considéré commegrand. Kempthorne indique qu’il
a étudiéquelques
cas avec r = 4(qu’il
consi-dère comme une valeur
petite
der)
etqu’il
a trouvé que même dans ce cas, le test suivantle
modèle normal(Mo) pouvait
constituer uneapproximation
accep- table.On
peut
évidemment se demander encore si l’identité des deuxpremiers
moments constitue un critère suffisant de similitude des distributions surtout dans les
régions
des faiblesprobabilités
utilisées pour les tests.2/
Modèle avec additivité au senslarge.
Admettons maintenant
qu’il
y ait enplus
des variations entreplots
e; uneerreur de mesure
e’ok (l’indice
krepérant
larépétition
du traitementj)
et queE ik 1 - N(o, QÉ 2 )
lesEl jk
étantindépendants. (* )
2
Il est bien clair
qu’avec
cemodèle,
il faudraajoutera’
auxespérances
mathématiques
des carrés moyens du tableau 1. ESi les
eB
sontgrands
devant lese;,
on se trouverapratiquement
dans lecas du modèle
(Mo)
et la randomisation n’aplus qu’une importance secondaire.
On
conçoit
donc bien que le modèle avec additivité au senslarge (qu’il
sembleraisonnable d’admettre dans
beaucoup
de caspratiques)
est intermédiaire entre le modèle normal(Mo)
et le modèle de randomisation(Ml).
On
peut
donc penser que le test det. =0
en utilisant une loi de F est alorsune
approximation
encore meilleure dans ce modèle que dans(M ).
Bien
entendu,
il n’est paspossible
d’estimerQÉ2.
B - Blocs randomisés
complets (réf. (1)
p. 136 etsuite) (réf. (2)
p. 958)
Les traitements sont
repérés j (j = 1, 2,...., t)
Les bloc s sont
repérés
u(u=1, 2, .... , r)
Les
plots
à l’intérieur desblocs sont
repérés
v(v=1, 2, .... ,t) 1/
Modèle avec additivité au sens strict.Le résultat du traitement
déterminé j
observé sur le bloc déterminé u estune variable aléatoire
qui
s’écrit :(* ) Nous n’envisagerons pas dans cette note le cas où les
e’.~ne
seraient pas distribués nor-malement. ~
Les
grandeurs
1.1,bu, tj
et euv sont des variables certaines vérifiant les conditions :Les
5~
sont les variables. aléatoiresdéjà définies,
lesplots
étantrepé-
rés par uv
(au
lieu dei).
On aévidemment ¡ J Õ j uv = 1 quel
que soit uv.La moyenne observée
dutraitement j
est une variable aléatoirequi
s’écrit :On trouve facilement que l’on a :
Test de
l’hypothèse
nullet ~ -
0.La somme de carrés totale centrée
peut
êtredécomposée
en une sommede 3 termes comme dans le cas d’une
analyse
de varianceclassique
à 2 dimen- sions. On trouve que l’on a :Tableau 2
(modèle Ml)
La somme
SI = T + R = S2 - B
n’est pas aléatoire dansl’hypothèse
nulle etle hasard
ne joue
que sur le fractionnement deSi
entre T et R.Au lieu d’étudier la distribution de
QT,
il est doncplus simple
d’étudierla distribution T
dans
l’hypothèse
nulle.~R
la distribution
de 2013
dansl’hypothèse
nulle.R
~i
C’est ce
qu’ont
fait Welch et Pitman dans des articlesexposés
dans Bio-metrika en 1937 et 1938 ; nous ne
possédons
pas pour l’instant ces articles maisKempthorne
en expose lesprincipales
conclusions dans le casparticulier
où1 e~.
estconstant, c’est-à-dire,
le cas où lesvariances
entreplots
sont lesmêmes
dans tous les blocs.Le calcul montre que, dans
l’hypothèse nulle,
on a alors :Considérons maintenant le modèle factoriel normal à 2 dimensions :
On admettra un tel modèle si on considère par
exemple
que les blocs sonthomogènes
mais que les mesures se font avec une erreur.Le
dépouillement
des résultats suivant uneanalyse
de variance à 2 dimen- sionscorrespond
au tableauprécédent
mais lesespérances mathématiques
descarrés moyens sont
Tableau 3
(Modèle Mo1
Notons
qu’avec
cemodèle,
les 4 termesB, T,
R etS 2
sont considéréscomme aléatoires.
Qr
t-lDans
l’hypothèse
nullet
=0,
lerapport -
est distribuécommeF(r-lXt-l)
etrp fp
i
~p
(r-lxt-l)le
rapport 20132013- =2013-
suit une distribution béta.(Cf. plus haut)
deparamètres :
.
On en déduit que
toujours
dansl’hypothèse
nulle :Pitman a vérifié de
plus
que les moments centrés d’ordre 3 et 4de T
dans~i l’hypothèse
nulle étaient voisins pour(Mo)
et(Ml ).
Kempthorne
a étudié cequi
sepassait
si les variances entreplots
étaient différentes. Sa conclusion est que le test Frisque
alors de sous-estimer le ni-veau de
signification, c’est-à-dire,
que lerisque
depremière espèce "vrai"
se-rait
plutôt
inférieur aurisque
nominal.2/
Modèle avec additivité au senslarge.
Le nouveau modèle s’obtient en
ajoutant
au modèle(Ml)
une erreurIEI u N(0, QÉ2).
Nous pouvonsrépéter les
remarquesdéjà faites
à propos desplans complètement
randomisés : siles e~.sont grands
devant les euv, on se trouvepratiquement
dans le cas du modèle(Mo).
Dans le casgénéral,
le nouveau mo-dèle est intermédiaire entre
(Mo)
et(Ml).
Notonscependant qu’avec
cemodèle,
il n’est
toujours
paspossible
de tester l’effet bloc car leseuv
n’interviennent pas dans le carré moyenQB
alorsqu’ils
interviennent dansQp.
C - Plan du
type split-plot (Réf. (1),
p. 370 etsuite).
Les traitements sont
repérés j (j = 1, 2, .... , t)
Les sous-traitements sont
repérés k (k
=1, 2,...., s)
Les blocs sont
repérés
u(u = 1, 2, .... , r)
Les
plots
à l’intérieur desblocs sont
repérés v (v - 1, 2, .... , t)
Les
split-plots
à l’intérieurdes
plots
sontrepérés
w(w = 1, 2,...., s)
1/
Modèle avec additivité au sens strict.Le résultat observé pour le bloc u avec le
traitement j
et le sous-traite- ment k s’écrit :Dans ce modèle
figurent
les variables certaines Il,bu, t j’
eu~, sk,(ts)jk et
e’ vérifiant les conditions :
uvw
et les vari ables aléatoires :
5~ déjà
définie dans le cas de blocs randomiséscomplets,
ô
~
telle queÔ =
1 si letraitement j
et le sous-traitement k sontappli- qués
ausplit-plot
uvw.Le calcul des
espérances mathématiques
desexpressions
faisant interve- nir lesô jk
k s’effectue en utilisant les relationsgénérales
et enremarquant
que l’on a :uv w
etc.
Par
exemple,
on voit immédiatement que :puisque
et
sont constants.
Test des
hypothèses
nulles.Tableau 4
(modèle Ml )
La somme de carrés totale
S2 = 1 (yu~k - Y...)2 peut
êtredécomposée
dela manière habituelle en une somme de
sonimes
de carréspartiels.
Pourplus
declarté,
nous scinderons cettedécomposition
en deuxparties : (
voir tableau4).
La somme
Si
= T + IB =S 2 -
B n’est pas aléatoire sitj =
0quel
quesoit j
et le hasard ne
joue
alors que sur le fractionnement de cette somme entre T et IB.La somme
SI = T’ + Tf’ + IP = S2 - S;
n’est pas aléatoire si : Sk = 0quel
que soit k(ts)~
= 0quels
quesoient j et
ket le hasard
ne joue
alors que sur le fractionnement de cette somme entreT’ ,
TT’ 1 et IP.Le
dépouillement
des résultats suivant le modèlehiérarchique
mixte clas-sique :
dans
lequel n, b~, t j,
s k,(ts) jk sont
définis commeplus
haut alors queTlu" etEu"k
sont des variables aléatoires normales
indépendantes supposées
tirées de popu- lations infinies avec :conduit à la même
décomposition
de la somme des carrés totale et desdegrés
deliberté mais avec les
espérances mathématiques :
Dans ce modèle
(Mo ),
on teste l’effet T parrapport
àQ,get
les effets T’ etTT’ par
rapport
àQ, P
en utilisant le test F. Onpeut également
tester l’effet Ben formant
=ou
tester l’h othèse2
0 en formantQ’B
Dans uelle mesureen
formant--2013-ou
tester1 ’hypothèse o
= 0 enformant201320132013 Dans quelle
mesure1 B
Yp P 1 P qde tels test sont-ils encore
possibles
dans le modèle de randomisation ?Tout
d’abord,
comme le fait remarquerKempthorne,
iln’y
a aucune raisonpour que l’on ait
cr 2 >
a’2 car
les variations entre e~~W
ne s’introduisent pas dans les variations entre euv ; il n’est donc pasquestion
de comparerQ 1 B à Q 1 p.
Lesseuls tests que l’on
peut envisager
sont les suivants :QT 1/ /
Nullité é en e moyenne de y l’effet T enformant=
QI B 2/
Nullité en moyenne de l’effet T’ en formant-~-2013 QT’
1 P
3/
Nullité de l’interaction T xT’,
c’est-à-dire nullité au sensstrict,
des effets T et r’ si1/
et2/
sont vérifiés en formantQTT’ 1 P
La
décomposition
de la somme de carrésentre plots exposée plus
haut(décomposition I)
est exactement celle des blocs randomiséscomplets
que nousavons étudiée
plus
haut. L’étude effectuée dans ce cas restant doncvalable,
nousadmettrons
qu’on peut,
~ dansl’hypothèse nulle,
~approcher
la loi deQT
~)B par uneloi ~~ F avec
( r-1)
et(r-l)(t-l) degrés
de liberté sir(t-l)
» 2.QTT’
Qr QiT’
Le
problème
p de la validité del’approximation
pp des loisde20132013
1 I Pet -~-2013 par
1 p p deslois de F ne semble pas avoir été traité mais il
paraît
très voisin duprécédent ;
ilfaudrait montrer que les lois de
T et TT’
suivent à peuprès
desT+TT +IP r+T r +IP
distributions bétas ce
qui, toujours
paranalogie
avec le casprécédent,
sembleassez
naturel,
si onprend
commehypothèse
nulle sk = 0 et(ts) jk
= 0. En est-ilde même
quand
on suppose, parexemple Sk f
0 etqu’on
veut tester(ts)j~
= 0 ?2/
Modèles avecadditivité
au senslarge.
On
obtient
un tel modèle enajoutant
une erreur~û ~ k au modèle (Ml ) . ej
=N(O, aE,2).
· Si lesE 1.
sontgrands
devant lese’~w , on
voit immédiatementqu’il
u j k u j k uvw 2
suffit de
remplacer
dans les tableauxprécédents
a’ parQÉ2
2 etl’analyse
de va-riance au niveau inférieur
(c’est-à-dire,
tout le test résultant de ladécomposi- tion II)
se fera comme dans le cas du modèleN1fl .
Onpourrait imaginer qu’il
y aiten plus
une autre erreur aléatoirer~.
liée à unplot
donné etdue,
parexemple ,
à des variations aléatoires dans les
applications
des traitements auxplots,
cesvariations
pouvant
être considérées comme tirées au hasard dans unepopulation
normale infinie.
Si les
llu’o
sontgrands
devant leseuv’
on se ramènepratiquement au modèle Mo.
Onconçoit
donc bien que les modèles de randomisation avec additivité au senslarge
sont intermédiaires entre les modèlesMo
etMl.
Etant donné que les modèles de randomisation au sens
large
semblent apriori
lesplus aptes
àreprésenter
convenablement laréalité,
onpeut
penser le test des effetsT,
T’et T x T’peut-être
effectué convenablement de lafaçon
ha-bituelle. Nous serons, par
contre, plus
réservé en cequi
concerne le test del’effet
"bloc"
ou lacomparaison
deQ’6
àQ, qui
ne sontjustifiés
que dans le cas du modèle1~~ ;
ces tests n’ontd’ailleurs,
engénéral, qu’un
intérêtpratique
réduit.D - Carrés
latins. Réf. ( 1)
p. 189Réf.
(2)
p. 962Les traitements sont
repérés j (1, 2,
... ,t)
Les
lignes
sontrepérées
u u =( 1, 2, ... , t)
Les colonnes sont
repérées
v v =( 1, 2,
... ,t)
Un
plot
est doncrepéré
uv.La somme des résultats observés pour le
traitement j peut
s’écrire dans le modèle d’additivité au sens strict :4 1
lu,
CI,tj
et euv étant desvariables
certaines vérifiant les conditions1 1 = 0
u
Les 5
sont,
’ commeplus haut,
’ des variables aléatoires dont on conna3t les lois deprobabilité :
Test de
l’hypothèse
nullet i
0.La somme de carrés centrée entre observations
peut
êtredécomposée
enune somme de 4 termes comme
lorsqu’on
utilise le modèle normal :Mais avec le modèle
( M1) ,
on trouve pourespérances mathématiques
descarrés moyens :
Tableau 5
(Nous
poseronsalors
qu’avec
le modèle(Mo),
lesespérances mathématiques
des carrés moyens sont :Pour justifier
l’assimilation durappo rt Q Q T R à Q
une distribution de F dans~R
l’hypothèse
nulle pour le modèleMl,
on estconduit,
comme dans le casprécé- dent, à
comparer à une distribution béta la distribution durapport :
avec
SI = S 2 - L - C
constant dansl’hypothèse
nulle.On montre facilement que
E(U) =";2013";
t-1 mais l’étude de var(U)
estbeaucoup
plus
difficile.Le
problème
a été étudié pour t = 5 et t = 6 par Welchqui
a trouvé que cette variancedépendait
notamment du groupe de carrés latins dont le carré latin uti- liséprovient ( pou r t ~ 4,
onpeut distinguer
des groupes de transformation dans l’ensemble des carrés latinspossibles).
Dans un cas
particulier
Welch a trouvé en utilisant des données artificiel- lement construites que laproportion
de valeurs de Udépassant
la valeur cor-respondant
àFO,05
variait entre2, 7
à6, 2%.
L ’opinion
deKempthorne peut
se résumer ainsi :- pour t
7,
l’utilisation du test F semble devoir être assezsatisfaisante
- pour t = 6 ou t =
5,
on nepeut
rien dire de bien net.(C’est
leproblème qu’a
étudiéWelch ;
nous n’avons pas actuellement les articles en ques-tion) ;
-
pourt 4,
il y a intérêt à recourir à des tests nonparamétriques
directsdu genre de ceux
envisagés
auparagraphe
III.Par
exemple,
onpeut
se baser sur le fait que la somme T + R. est constanteQT
pour étudier dans
Qi l’hypothèse
nulle la distribution desdivers"-~* ~ possibles
VUS et luicomparerle7
p observé.Kempthorne
arrive d’ailleurs à la conclusionqu’un
uni-R
p 9
que carré randomisé 3- x 3 est sans valeur et
qu’il
faut desrépétitions.
Quand il y
aune erreur de mesure(additivité
au senslarge),
onpeut
pensercomme
plus
hautqu’on
doit serapprocher
du modèle(Mo )
et que le test F est alors mieuxjustifié.
V - CONCLUSION -
L’utilisation
du test F pour
ledépouillement
deplans
d’essais faisant inter- venir des processus de randomisation semble sejustifier
assez bien dans lescas suivants :
Par
contre,
certainstests,
tels que celui de l’effet bloc dans leplan (B)
où la
comparaison
des 2 résiduelles dans leplan (C)
ne sejustifient
pas dans la théorie de la randomisation. Ces tests n’ont d’ailleurs pas, engénéral,
d’inté-rêt
pratique.
Par
ailleurs,
onpeut
penser quel’approximation
par le test F doit êtreencore meilleure
quand
il y a une erreur de mesure normale(additivité
au senslarge).
Les conclusions concernant les carrés latins semblent peu nettes et le pro- blème mériterait d’être étudié de