R EVUE DE STATISTIQUE APPLIQUÉE
A. B ARDIN
J. M. A ZAIS
Une hypothèse minimale pour une théorie des plans d’expériences randomisés
Revue de statistique appliquée, tome 38, n
o2 (1990), p. 21-41
<http://www.numdam.org/item?id=RSA_1990__38_2_21_0>
© Société française de statistique, 1990, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE HYPOTHÈSE MINIMALE
POUR UNE THÉORIE DES PLANS
D’EXPÉRIENCES RANDOMISÉS
A. BARDIN & J.M. AZAIS
Laboratoire de Biométrie, INRA, F78026 Versailles
RÉSUMÉ
Dans un
premier
temps nousprésentons
de manièreprécise
lesplans
randomisés parpermutation
aléatoire des unitésexpérimentales.
Dans un deuxième temps nous étudions le modèle obtenu sous unehypothèse
très faible portant sur l’ensemble despermutations possibles :
celui-ci forme un groupesimplement transitif;
c’est-à-dire quen’importe quelle
unité est
l’image,
par au moins unepermutation
du groupe, den’importe quelle
autre. Sansautre
hypothèse,
nous montrons que les données peuvent êtreanalysées
par un modèle mixterégulier
dont la forme estindépendante
des valeursparcellaires.
Enfin, àl’opposé
de
l’approche classique,
nous introduisons la notion de modèle mixte stratifiable. Nous montrons, par un contreexemple,
que le modèle issu de la randomisation est engénéral
non stratifiable. Celui-ci est
cependant toujours analysable
en ayant recours à des moindres carrésgénéralisés.
Mots-clés : groupe, modèle mixte,
permutation, plan d’expérience,
randomisation, strate.SUMMARY
In the first part we
give
aprecise description
of randomization ofdesigned experiments
via a random
permutation
of theexperimental
units. In the second part westudy
the modelobtained under a very weak
asumption
about the set ofpossible permutations :
it fonns asimply
transitive group i.e. : anyplot
is theimage
of any otherplot.
Without any otherasumptions
we show that the data obtained can beanalysed by
aregular
mixedmodel,
theform of which does not
depend
on theplot
values.Finally
we introduce the concept of a stratifiable mixed model whichdistinguishes
ourapproach
from classical ones. We showby
acounter-example
that the model obtained after randomization is notalways
stratifiable.However it can
always
beanalysed by generalised
least squares.Key-words : designs of experiments,
randomization, groupof permutations,
mixed models,stratum.
I. Introduction
Comment comparer des traitements que l’on observe sur des unités
expéri-
mentales
(ou parcelles)
distinctes ? Cela atoujours
constitué unproblème
statisti-22 A. BARDIN, JM. AZAIS
que délicat même si les
réponses proposées
ont varié au cours dutemps
et sontsusceptibles
de varier dans le futur.Ces méthodes ont été introduites
historiquement
dans un contexteagronomi-
que : le
problème
est de comparer différents traitements comme desengrais
ou desvariétés sur un
champ découpé
enpetites parcelles
de même taille. On désire éli- miner l’effet de la fertilité du terrain pourpouvoir
comparer des mesures effectuéessur des
parcelles physiquement éloignées.
La
première
méthodeproposée
semble être la méthode desparcelles
témoins(Wiancko 1914).
Elle consiste à introduire dansl’expérience
enplus
des traitements à comparer, un traitement témoin que l’onplace
sur desparcelles régulièrement espacées
dans ledispositif.
Cetype
de"plan"
était conçu audépart
pour desdispositifs
sansrépétition :
un traitement n’était observéqu’une
fois et sa valeurétait estimée par la différence ou le
rapport
entre d’unepart
la mesure faite sur le traitementlui-même,
et d’autrepart
un indexpondérant
les valeurs desparcelles
témoins les
plus
voisines. Cette méthode a connu certains raffinements dans le casoù l’on fait des
répétitions
des traitements(Wiancko, Amy
et Salmon1921).
Une autre voie a été l’utilisation de
plans systématiques
enessayant
derépartir
au mieux les différentes
répétitions
des traitements dans lechamp.
Onpeut
parexemple
lesdéplacer
suivant la marche du cavalier aux échecs(Tedin 1931 ).
Lesvaleurs des traitements étaient alors estimées par de
simples
moyennes.Nommé à la station
expérimentale
de Rothamsted àpartir
de1919,
Fisher s’est trouvé confronté auproblème
decomparaisons
variétales et il aproposé
l’utilisation de la randomisation pour remédier au
principal
défaut de la méthode desplans systématiques :
l’absence d’estimation fiable de l’erreur d’estimation des traitements. La randomisationpermet
en effet de valider uneanalyse statistique
avec des erreurs
indépendantes
et de tester lasignificativité
du résultat par le testqui s’appelle
maintenant le test de Fisher(1925, 1935).
Pour cette raison la méthode des
plans systématiques
a été peu à peu abandonnée. Par ailleurs Yates(1936)
a montré que la méthode desparcelles
témoins était moins efficace
qu’un plan
en blocsincomplets
randomiséappelé
à devenir
classique :
le lattice. En effet toutes lesparcelles
utilisées pour le témoin sontperdues
pourl’expérience
elle-même. la méthode desparcelles
témoins a doncelle aussi été
grandement
abandonnée et lesexpériences
randomisées sont devenues larègle
courante.Au cours du
temps
la démarche de Fisher a été considérablementgénéralisée.
Yates
(1936, 1940)
a introduit lesblocs incomplets; Grundy
etHealy (1950)
ontintroduit la randomisation resteinte : dans ce dernier cas on ne
dispose plus
lestraitements au
hasard,
mais onimpose
desconditions,
parexemple
sur laprésence
des traitements dans les
lignes
ou les colonnes ou surl’équilibre
desvoisinages (Azaïs, 1987).
Cependant
laphilosophie
de la randomisation n’est passimple :
on considèreune
population d’expériences.
Aussi dès que l’onquitte
les casoriginels
de larandomisation totale ou des blocs
complets,
il faut introduire certaines entités abstraites comme les"parcelles
virtuelles"(cf § IV.1 )
pourpouvoir
faire uneprésentation rigoureuse.
Nous insistons bien sur le faitqu’il
nes’agit
pas d’un formalismegratuit
mais d’une nécessité incontournable.L’objet
de cet article est donc d’introduire ce formalisme àpartir d’exemples simples
et de montrerqu’il permet
ensuite d’étendre la théorie de la randomisation à des cas bienplus généraux
que cequi
a étépublié jusqu’à présent (à
notreconnaissance).
En effet sous deshypothèses
minimales on obtient un modèle(au
second
ordre,
c.a.d. défini par sonespérance
et savariance) qui
nedépend plus
des valeurs
parcellaires.
Ce modèle rendpossible
uneanalyse statistique
et unecomparaison
des traitements.H. Cadre de l’étude
Nous considérons des
expériences
dont le but est de comparer un ensemble de traitements. Nous supposons deplus,
comme c’est souvent le cas enpratique, qu’un
seul traitementpeut
être observé sur une unitéexpérimentale donnée;
lescomparaisons
doivent donc se faire àpartir
de données issues d’unitésexpérimen-
tales différentes.
La théorie des
plans d’expériences
vise à obtenir descomparaisons
aussifiables que
possible. Bailey (1981)
aproposé
uneprésentation générale
de cettethéorie en
quatre étapes :
1°) Description :
choix d’un modèledéterministe,
senséreprésenter
l’état dela nature
(non analysable).
2° )
Randomisation : du modèleprécédent
on déduit un modèlestatistiquement analysable (on parlera
de modèle randomisé oud’expérience randomisée).
3°) Planification :
choix dutype d’expérience
déterminant lespropriétés statistiques
du modèle.4° ) Analyse : analyse
du modèlestatistique
surl’expérience
réalisée.Tout en
distinguant
les mêmesquatre étapes,
nousadoptons quelques points
de vue
originaux
parrapport
à laprésentation
deBailey.
Enparticulier,
lors dela seconde
étape,
la randomisation sera décrite par un groupe depermutations simplement
transitifquelconque, généralisant
ainsil’approche
deBailey qui
selimite à l’étude des groupes de
permutations
conservant des structures de blocs(allowable permutations).
Cette
généralisation implique,
comme nous le verrons, l’abandon de ladécomposition
du modèle en strates, chère à l’écoleanglaise.
Ladécomposition
enstrates nous
paraît
une notion extrêmement intéressante pour lesplans orthogonaux
comme les
split-plots.
Dans les autres cas elle était incontournable dutemps
de Yates(1936)
pour des raisons calculatoires. A l’heure actuellel’informatique permet
de réaliser des calculs de moindres carrésgénéralisés (Fraser 1957).
L’intérêt des strates réside donc essentiellement dansl’interprétation
des confusions.La
question
se pose de savoir si les modèles mixtesgénéraux peuvent
êtredécomposés
en strates. Comme nous le montrons par uncontre-exemple,
laréponse
est non, même dans le cas
particulier
des modèles issus d’une randomisation. Nous introduisons donc les notions de modèles mixtesstratifiables
ounon-stratifiables.
Enfin,
à propos de laquatrième étape,
nous utilisons la notion"d’équivalence
de modèles" pour donner une base
théorique permettant
de contourner leproblème
de
singularité
de la matrice de covariance.24 A. BARDIN, JM. AZAIS
Nous notons T l’ensemble des t
traitements,
U l’ensemble des n unitésexpérimentales,
etZko:
laréponse
de l’unité a au traitement k. L’ensemble desréponses possibles
n’existe bien sûr que virtuellementpuisqu’il n’y
aqu’une
seuleobservation par unité. Le modèle que nous posons sur les
réponses Zjba
est lemodèle additif pour les deux effets traitement et unité
(pour
une étude sans cettehypothèse
voir Coursol1981),
soit :où 8k
et uareprésentent respectivement
l’effet traitement et l’effet unité ou valeurparcellaire.
Deplus,
pour éviter que cesquantités
ne restent définiesqu’à
uneconstante
près,
nousposons u.=1 n 03A3ui=0. n i=l
Lorsque l’expérience
estréalisée, n
mesures sontdisponibles.
Eliminons dans(1)
les nt - néquations correspondant
aux combinaisons non réalisées. Les néquations
restantes forment ce que nousappelons
un modèle réalisable. Celui-ciest non
analysable
carsurparamétré : n
+ t -1paramètres
pour n données.Nous verrons
plus
loin que la randomisation est un moyen de contournerce
problème.
Pourcomprendre
cette méthode il suffit de remarquer que leséquations
du modèle réalisable obtenuplus
haut nedépendent
que du choix desn combinaisons traitement-unité de
l’expérimentateur.
Or celui-ci a engénéral
une certaine
plage
de combinaisonspossibles
entrelesquelles
il nepeut
choisirqu’arbitrairement.
La randomisation secomprend
donc intuitivementpuisqu’elle s’interprète
comme une élimination de cet arbitraire par letirage
d’une variable aléatoire uniforme sur l’ensemble des modèles réalisablespossibles.
Comme
indiqué
enintroduction,
différentes méthodes ont étéenvisagées
pour éliminer leproblème
desurparamétrisation.
Une solutionqui
semble attractive estsimplement d’assigner
une structure aléatoire apriori
aux effets unité au lieu de lesgarder
commepramètres
fixes inconnus. Ceci est une démarcheclassique
enstatistique
maisqui,
contrairement à larandomisation,
est basée sur deshypothèses
difficilement vérifiables relatives aux u03B1.
Il faut noter que la randomisation
peut
apriori
diminuer laprécision
desestimations,
car l’information relative à l’allocation des traitements estignorée.
Mais le
point
de vue deFisher, qui
est aussi lenôtre,
est que la randomisation est certainement la meilleurefaçon d’ignorer
cetteinformation,
cequi peut
êtrepréférable
à une mauvaise utilisation de celle-ci.On
peut distinguer
deuxtypes
de randomisations : la randomisation totale et les randomisations restreintes. EnIV)
nous ferons uneprésentation
des randomisa- tions construites àpartir
de groupes depermutations,
dont la randomisation totale est un casparticulier.
Avantcela,
nous allons détaillerl’exemple
de la randomisa- tion totale et introduire ainsi la démarchegénérale.
Dans toute la suite nous noterons :
li
le vecteur colonne delongueur
i formé de1,
Ii
la matrice identité(i, i),
Ji
la matrice(i, i)
d’éléments touségaux
à1,
lEI
pour le cardinal de l’ensembleE,
1~i l’orthogonal (pour
leproduit
scalaireusuel)
dansRi
du sous-espace{À1i/ Àf.R}.
ni. Plan
complètement
randomisé à rrépétitions
La randomisation est
présentée
ici dans le cas leplus simple : n
estsupposé multiple
de t : n =tr,
où r est le nombre derépétitions
dechaque
traitement.La randomisation totale se définit ainsi de
façon simple (pour
les autres cas il faututiliser la méthode
générale du § IV)) :
pour chacune des rrépétitions
dechaque
traitement on tire sans remise dans
U,
et defaçon équiprobable,
une unité. Pour larépétition j
du traitementk,
soient :Ykj
laréponse (aléatoire)
de laparcelle correspondante.
8k
commeprécédemment
l’effet traitement(non aléatoire).
03B5kj l’eNët (aléatoire)
de laparcelle correspondante.
Nousl’appelerons
erreurpour la
distinguer
de l’effet unité(non aléatoire).
Le modèle issu de
(1)
s’écrit donc :Soit matriciellement :
où 8 est le t-vecteur des effets
traitement,
X la matrice(n, t)
=(tr, t)
duplan d’expérience :
etc est le n-vecteur aléatoire des erreurs.
Le
plan
randomisé est presque entièrement décrit par le modèle(2).
Il reste àpréciser
la structure aléatoire du vecteur c. Ses deuxpremiers
moments sont donnés par le lemme suivant :Lemme I : Soit 03B5 le vecteur obtenu par n
tirages
sans remisesparmi
n valeursn
u1, ...., un
vérifiant : L
ui = nu. = 0. Alors :i=l
26 A. BARDIN, JM. AZAIS avec :
Preuve : On voit facilement par
dénombrement, ~~, ~~’~~.
Remarque :
L’événement
(el
=Ua)
doit êtrecompris :
"leaième
élément de la suite u1,...,un est tiré au~ème tirage".
Cela pour éviter lescomplications
dues àd’éventuelles
égalités
de termes dans cette suite.On voit que le modèle
(2)
est différent du modèled’analyse
de variance àun facteur :
cependant,
pour l’estimation des contrastes(c’est-à-dire
des différences entretraitement),
il est immédiat que(2)
et(2’)
sontéquivalents
au sens suivant :Définition
I : Deux vecteursaléatoires,
de dimension n,Y1
etY2
suivent deux modèles ditséquivalents
pour l’estimation des contrastes siQY1
etQY2,où :
ont même
espérance
et même variance.Cette définition doit se
comprendre
enremarquant
queQ
est la matrice deprojection orthogonale
sur1;
dans Rn. Il est bien connu(voir
parexemple Coursol, 1981)
que cetteprojection
est seulepertinente
pour l’estimation linéaire des contrastes. Ainsi onpeut remplacer
un modèle par un autrepuisqu’on
travailletoujours
au deuxième ordre etqu’on
ne s’intéressequ’aux
contrastes.En
conclusion,
nousprétendons
que(2) peut
être traité comme un modèled’analyse
de variance à un facteur. L’intérêt du résultat obtenu est double : d’unepart
ilpermet
dejustifier
unepratique
courante, et d’autrepart
on remarque que la matrice de covariance du modèle initialementsingulière
a pu être ramenée à une matricerégulière.
IV. Plan randomisé par un groupe de
permutations
Remarquons
d’abord que la randomisation totalepeut
être vue comme un casparticulier
d’une famille trèsgénérale
de randomisations. Eneffet,
nous avons vuqu’elle
consiste à tirer sans remise les n unités. Cela est strictementéquivalent
àtirer,
de manièreéquiprobable,
unepermutation
dans l’ensembleSn
de toutes lespermutations
de nobjets (en
l’occurence ici : les nunités).
La randomisation totalepeut
donc être décrite de lafaçon
suivante : on alloue les traitements aux unités de manièrequelconque;
on tireensuite,
de manièreéquiprobable,
unepermutation
deSn ;
à l’aide de cettepermutation
onpermute
l’allocation initiale des traitements auxunités. Une
généralisation
immédiate consiste à choisir lapermutation
de manièreuniforme dans un sous ensemble M de
Sn.
Pourdisposer
des outils combinatoires de la théorie des groupesfinis,
et pour avoir un ensemble suffisammentriche,
nousconsidérons le cas où :
1° )
H est un sous-groupe deSn,
et2°)
M estsimplement
transitif
(cf. Iv.2,
définitionn).
La classe de randomisation ainsi obtenue
englobe
toutes les randomisationsclassiques,
ellepermet
degénéraliser
les résultats deBailey
etRowley (1988).
1 °)
Détermination des modèles réalisablesDans la
description ci-dessus,
lapremière
allocation des traitements aux unités n’est pas réalisée : elle est virtuelle. Nous introduisons donc la notion deparcelles
virtuelles
qui
n’a pas de réalitématérielle,
maispermet
unedescription rigoureuse
de la randomisation. En effet on ne
peut
pas, à cause de larandomisation,
écrireun modèle sur les unités
expérimentales (les parcelles
duchamp).
En dehors decas
simples,
tel que la randomisation totale(§ m),
on doit avoir recours à cesparcelles
virtuelles pour obtenir un modèle. Cette notionpermet,
dans tous les cas, l’obtention d’uneindispensable
numérotation des données.Soient donc C l’ensemble des n
parcelles virtuelles,
a unebijection
de C surU,
et k uneapplication
de C sur T. Nous obtenons le modèleréalisable, compte
tenu de k et a, en
procédant
comme ci-dessous :C :
parcelles
virtuelles28 A. BARDIN, J.M. AZAIS
Sous
l’hypothèse
d’additivité(1)
le modèle réalisablepour k
et a s’écrit( j
indice les
parcelles virtuelles) :
Soit sous forme matricielle :
où : X est la matrice
(n, t)
duplan d’expérience, dépendant uniquement
dek, ZOo
est la matrice(n, n)d’incidence
desunités, dépendant uniquement
de a.2°)
Randomisation du modèle(3)
Le modèle
(3)
ne contient pas, pourl’instant,
de terme aléatoirepuisque
noussupposons que les
applications
k et a sont données. La randomisation intervient auniveau du choix aléatoire de la
bijection
a.Puisque
C = U ={1,
....,n},
et pouréviter d’introduire des notations
trop lourdes,
nous assimilons a à unepermutation
aléatoire de
{1,...., n}.
Comme
déjà indiqué
nous limitons notre attention aux cas ou a a une loi uniforme sur un sous-groupe M deSn simplement transitif,
soit :Nous
rappelons
la définition de la transitivité :Définition
II : On dit queli,
sous-groupe deSn,
estsimplement
transitif si :Nous
appelons
modèle randomisé le modèle déduit de(3)
oùZa
est maintenant une matrice aléatoire. Soit en notant 03B5 le vecteur aléatoireZa u :
3°) Equivalence
avec un modèle mixtesingulier
Dans ce
sous-paragraphe
nous allons montrer que le modèle(4)
estéquivalent (définition I)
à un modèle mixtesingulier
dans un sens trèsproche
de celui donné par C.R. Rao et J. Kleffe(1980),
soit :Définition
III : Soit un vecteur aléatoire Y tel que Y = X03B8 + 03B5, où : Xest une matrice
donnée,
03B8 est un vecteur inconnu deparamètres fixes,
et 03B5 est unvecteur aléatoire tel que :
où les
Vi
sont des matricessymétriques
connues, et lesAi, appelées composantes
de lavariance,
sont desparamètres fixes
inconnus tels que V soitsemi-définie positive.
On dira que Y suit le modèle mixte
(5)
si 03BB =(03BB1, ...,03BBk)’ appartient
à une
partie
contenant un ouvert deRk.
On dira deplus
que le modèle est,respectivement, régulier
ousingulier
suivant que V est une matricetoujours (i.e.
pour tout 03BB dans l’ensemble des valeurs
précédemment défini) régulière
outoujours singulière (notons qu’il
existe des modèles niréguliers
nisinguliers).
Evidemment toute matrice
symétrique peut
être écrite comme combinaison linéaire de matricessymétriques
connues. Leproblème
est d’obtenir une décom-position
de la matrice de covariance telle que les contraintes sur lescomposantes
de la variance ne soient pas"trop importantes".
Ceciexplique l’hypothèse
faitesur 03BB. Toutefois s’il n’existe
qu’une
contraintelinéaire,
ellepeut
être éliminée parreparamétrisation
de sorte que ladéfinition
M soit vérifiée(cf. 4°)).
Montrons d’abord que le vecteur eest
d’espérance
nulle. Nous avons,compte
tenu des
hypothèses,
pour toutiEC :
Nous en déduisons la matrice de covariance du vecteur c : Soit :
Ou
bien;
Nous
rappelons
ci-dessous lesquelques
définitions et résultats relatifs à la théorie des groupesqui
nous seront utiles(Hall,
1959 ouLedermann, 1973).
30 A. BARDIN, J.M. AZAIS
Définition
IV : Soit 7Y un sous-groupe deSn:
i) 2022
Onappellera
orbites doubles deli,
les orbites de ce groupeopérant
sur{1, ...., n}2;
c’est-à-dire les ensembles decouples
du type(pour (i, j)
dansUxU) :
Oij 1(u(i), 03C3(j))/03C3~H}.
Par lasuite,
comme iln’y
aura pasd’ambiguïté,
nousles dénommerons "orbites".
2022
Oji,
encore notéeO’ij,
estappelée
orbitesymétrique
deOij,
et on dit queOij
estsymétrique
si :Oij = Oji.
2022 On notera
R(H)
l’ensemble des orbites deH, R1 (li)
l’ensemble des or- bitessymétriques,
etR2 (H)
un ensemble dereprésentants
despaires {O, O’}
pourles orbites 0 non
symétriques (i.e.O~R(H)/R1(H)).
S’iln’y
a pasd’ambiguïté
on notera encore ces ensembles
respectivement : IZ, R1
etR2.
ii)
Onappellera
matrice indicatrice de l’orbite0,
la matriceM(O) définie
par :
Ces définitions
impliquent
de manière évidente le résultat :Proposition
I :i)
L’ensemble des orbitesR(H)
constitue unepartition
de l’ensemble descouples de 11, ....,n}2.
Celasignifie
que toutcouple appartient
à une orbite etune
seule,
cequi
peut se traduire par : les matrices indicatrices d’orbites ont des supportsdisjoints
et leur somme est la matriceformée
de1 ;
c’est-à-dire :et :
ii)
Pour toute orbite 0 dansR(H) : M(O)’
=M(O’).
iii)
Le vecteurln
est vecteur propre de toute matrice indicatriced’orbite, précisément : ~O~R; M(O).1n
=|O| n.1n.
La raison essentielle de l’introduction des orbites tient dans la
proposition
suivante :
Proposition
II : Si H est un sous groupesimplement transitif
deSn,
lestermes
génériques
de la matrice V = E(Z03B1uu’Z)
sont constants sur toute orbitede H.
Preuve : Nous avons
Vij
=1
etpuisque
dans un groupe les translations sont desbijections 8
Des
propositions I.i)
et II nous déduisons que V est une combinaison linéaire des matrices indicatricesd’orbites,
soit(une
formuleexplicite
desparamètres 0(0)
est donnée en
annexe) :
De
plus
cette somme se réécrit aisément de manière à ne faireapparaître
que des matricessymétriques.
En effet lasymétrie
de Vimplique
de manière immédiate0(0)
=0(0’)
pour tout 0 dans R. Il vient donc :où, d’après
laproposition I.ii),
les matrices[M(O)
+M(O’)]
sontsymétriques.
Enfin
compte
tenu de lasingularité
de V et de laproposition I.iii)
les k =|R1| + In21 paramètres 0(0)
vérifiantl’équation :
Soit F l’ensemble parcouru par
les 0(0)
dansRk quant u parcourt
Rn avec la contrainte u. = O.Fappartient
à la sous-variété linéaire £ deR k
définie parl’équation (6).
Nous montrons en annexe que F est fermé et d’intérieur non vide dansf-,
cequi correspond
bien aux contraintes sur l’ensemble descomposantes
de la variance(à
une contrainte linéaireprès)
du modèle mixte(5).
Nous obtenons donc :Proposition
III : Si H est ungroupe simplement transitif
deSn,
alors lemodèle randomisé
(4)
est un modèle mixte(à
unereparamétrisation près) singulier
tel que :
où :
- les
(0)
sontdes paramètres
inconnusdépendant
de H et de u,, sont des matrices
symétriques
ned’épendâcnt què des
orbites de U.Cette
proposition
montre bien quel’espérance
et la variance du vecteur 03B5 nedépendent
pas des valeursparcellaires,
maisuniquement
du groupe U.32 A. BARDIN, JM. AZAIS
4°) Equivalence
avec un modèlerégulier, reparamétrisation
Nous avons montré que toute
expérience
randomisée conduit à un modèle mixtesingulier.
Lasingularité
est engénéral
unecaractéristique
indésirable. En effet ellesignifie
que le vecteur des observationsY,
de dimension n, se trouve dans un sous-espace strict de Rn. Deplus,
lesalgorithmes
d’estimations sontplus complexes
car ils doivent faireappel
à despseudo-inverses.
Toutefois onpeut
ici s’affranchir de ces difficultés enprocédant,
commeau § III),
paréquivalence
demodèles. Il nous suffit de montrer que le modèle
(4)
estéquivalent,
au sens de ladéfinition
I,
à un modèle mixterégulier.
Soit
Q,
définie enm),
la matrice deprojection orthogonale
surl’espace
descontrastes, et soit le modèle :
Il est immédiat que
(4)
et(4’)
sontéquivalents
au sens de la définition 1puisque Q.Jn =
0. Il reste à vérifier queV
est effectivementrégulière.
Or nousrappelons
que pour toute matrice Asymétrique
et semi-définiepositive :
et :
et
prenant 0’ égal
à l’identité.Comme u est
quelconque
sousl’unique
contrainte u. =0,
le noyau de V seréduit à la droite
engendré
par le vecteur1n. D’où, compte
tenu de Ker(Jn)
=1 n ,
nous obtenons :
Proposition
IV : Le modèle mixtesingulier (4)
issu de la randomisation estéquivalent (pour
l’estimation descontrastes)
à tout modèle mixterégulier
dutype (4’ ).
Nous pouvons maintenant donner une
reparamétrisation
de la matrice de covariance obtenue à laproposition m,
conduisantexplicitement
à un modèlemixte
régulier.
Eneffet,
la relation(6)
s’écrit :où les
a(O)
sont des entierspositifs proportionnels
aux101. Puisque
les0(0)
ne
peuvent
être tousnuls,
il existe nécessairementOk
dansRl
Un2
telle que0 (Ok)
0. D’autrepart, compte
tenu de laproposition I.i) :
D’où:
Puisque 0 (Ok) 0,
nous pouvons éliminer leterme 0 (Ok). Jn
dans V pour obtenir un modèle mixterégulier équivalent
au modèle randomisé. D’où :Proposition
V : Le modèle randomisé(4)
estéquivalent (pour
l’estimation descontrastes)
au modèle mixterégulier :
= X03B8 +iE,
où :
avec :
03BC(O) = 0(0) - 0 (Ok) ,les (O)et V(O)
étant comme à laproposition III ;
et
Ok
est une orbite deRl
UR2
telleque 0 (0k)
O.Evidemment ce résultat n’est réellement intéressant que si l’on sait en
pratique
trouver une orbite
Ok
telleque 0 (Ok)
O. Si onpeut
deplus
trouver l’orbiteOk
telleque Ø(Ok)
soitminimum,
lescomposantes 03BC(O)
sont assurées d’êtrepositives.
Mais l’essentiel estl’équivalence
du modèle randomisé avec un modèle mixterégulier,
etcelui-ci,
comme tout modèlemixte, peut
êtreanalysé
par des méthodesclassiques (C.R.
Rao and J. Kleffe1980,
C.R. Henderson1986).
Nous allons maintenant revenir sur une
présentation classique
de la rando- misation. Celle-ci aboutit aussi à un modèlemixte,
maisqui possède
unepropriété supplémentaire :
la stratifiabilité. En6° )
nous donnerons une définitionprécise
decette notion dans un cadre
général,
et nous verrons que la stratifiabilité n’est pas nécessairementacquise
pour le modèle randomisé.5°)
Modèlestratifiable, décomposition
en stratesLa
décomposition
en strates est unetechnique
couramment utilisée dansl’analyse
desexpériences
randomisées(Bailey 1981,
Coursol1981,
Nelder 1965aet
1965b, Tjur 1984,
Yates1940). Lorsque
cettetechnique peut
être mise en oeuvrenous dirons que le modèle est
stratifiable.
Pour illustrer cette
technique
nous allons détaillerl’exemple classique
dela randomisation des
plans
en blocs. Onparle
de telsplans lorsqu’il apparaît
une(des) partition(s) naturelle(s)
de l’ensemble des unitésexpérimentales
en différentesparties (blocs)
de même taille. Nous traitons indistinctement lesplans
en blocs ditscomplets, incomplets, équilibrés
ou non. En effet ces distinctionsdépendent
de lamatrice
X,
et nous avons vu que la randomisation n’intervient pas à ce niveau.34 A. BARDIN, JM. AZAIS
L’obtention des modèles réalisables se fait comme
au § III,
et la randomisation est basée sur le groupe despermutations
conservant la structure de bloc. Le cassimple
que nous traitons est celui où il y a une seule structure de bloc. Les ensembles des unités et desparcelles
virtuelles sont doncpartitionnés,
defaçon analogue,
en b blocs de taille k. Lespermutations envisagées
se déduisent d’unepermutation
des blocs(par
un élément deSb)
suivi de bpermutations
"interblocs"indépendantes (par
éléments deSk).
Ce groupe estappelé
parBailey
"wreathproduct"
deSk
etSb.
Il est clair que celui-ci estsimplement
transitif. Ces orbitessont au nombre de trois et
correspondent
à lapartition
suivante de l’ensemble desparcelles virtuelles;
si(i, j) désigne
leième parcelle
dujième
bloc :*
(i, j)
=(i’, j)
~ orbite de matrice indicatriceIkb,
* j = j’
~ orbite de matrice indicatrice M -Ikb,
* j 7É j’
~ orbite de matrice indicatriceJkb -
M.Nous obtenons donc pour la matrice de variance du modèle randomisé :
On montre que
0s
estnégatif.
Doncd’après
laproposition V,
nous obtenonsun modèle
équivalent
enprenant :
A ce stade
l’analyse peut-être
menée de deuxfaçons
différentes :1°)
comme un modèle mixtegénéral (définition m), 2°)
par ladécomposition
en strates.Nous
préconisons
lapremière
méthode à cause de sagénéralité.
Latechnique
de
décomposition
en strates consiste à écrireV
comme une combinaison linéaire deprojecteurs orthogonaux,
soient ici. :Ce
qui
conduit à(avec :
03B3intra = 03BC1, tinter = 03BC1 +k03BC2):
V
=ïinttal1ntra
+03B3interPinter
Les dénominations intra et inter font référence à la
terminologie classique lorsqu’il
estquestion
de strate intra-bloc et de strate inter-bloc. EcrivonsPintta =
BintmB’intra
avecBintmBintra = Ikb-k,
et de même pourPinter
à l’aideBinter.
On obtient ainsi en
prémultipliant
par,respectivement B’intra
etB!inter,
les deuxmodèles
d’analyse
de variance à un facteur de la strate intra-bloc et de la strateinter-bloc :
Yinter
=B’interX03B8 +03B5inter, Var(03B5inter) = 03B3itnerIkb-k, lintta = B’intraX03B8 +03B5intra, Var (eintra) = 03B3intraIk.
Ces modèles sont de
plus orthogonaux puisque :
Cov
(6iter6itra)
=B’interBintra
=
(tinter
+cintra) BinterPinterPintraBintra
= 0-Deux estimations de 8 sont ainsi obtenues dans les deux strates. Il se pose alors le
problème
délicat de recombinaisonoptimale
de ces estimateurs cequi
nécessite en
général
des estimations deïintra et
tinter- Très souvent tinter n’est pas estimable dans sa strate. On l’estime alors dans le modèle initial enayant
recours à une méthode d’ Henderson(cf.
Cochran &Cox, 1957, Coursol, 1981).
De
façon générale
ladécomposition
en stratess’opère
comme suit : soit le modèle mixte(5),
la matrice de covariance V de ce modèle estsymétrique,
doncil existe m
projecteurs orthogonaux symétriques P1, ...., Pm,
sur m sous-espaces deRn,
et mparamètres
03B3i, i =1,
...., m tels que :Les
Pi
sont nécessairement lesprojecteurs
sur des sous-espaces des espaces propres deV,
etdépendent
donc apriori
de À. Mais ilpeut
arriver que(bien
que variant avec
A)
Vpossède
une base de vecteurs propres invariante par À. Il existe alors desprojecteurs Pi
nedépendant
pas de À et il estpossible
de faireune
décomposition
en strates parprojections
du modèle sur les différents espaces im(Pi).
Ainsi onappelle
modèle de la strate i :Ecrivant
Pi
sous la formeBiBi’,.
avecB’iBi
=le
modèle de la strate i s’écrit defaçon équivalente (prémultiplier
parB’i) :
36 A. BARDIN, JM. AZAIS
Un calcul
simple
montre alors que les modèles de strates sont des modèlesclassiques d’analyse
de variance etstatistiquement orthogonaux.
Dans ce
qui
suit nous nous contentons d’examinersi
ladécomposition
enstrates est une donnée essentielle dans
l’analyse
d’un modèle randomisé stratifiable.Nous voulons ainsi tenter de comparer deux
techniques d’analyse envisageables :
l’une
essayant
de mettre àprofit
ladécomposition
en stratespossible
dumodèle,
et donc a
priori plus
fine mais aussiplus particulière;
l’autre n’utilisant que le fait que le modèle estmixte,
et donc basée sur une théorieplus générale.
Il est bien connu que la "stratification" est déterminante dans le cas des modèles dits
"orthogonaux".
C’est-à-direlorsque
X est choisi de sortequ’il
existeune
décomposition
naturelle deIm(X)
suivant les différents espaces 7m(pi).
Eneffet,
les estimations des contrastes et des(nouvelles) composantes
de la variance 03B3 se résument alors à desanalyses
de variance sur les différents modèles de strates.Dans les cas non
orthogonaux
des méthodes de recombinaisons des estimateurs des traitements obtenus dans les différentes strates ont étéenvisagées.
Yates(1940)
futle
premier
à proposer une telleméthode, possédant
certainespropriétés d’ optimalité (à
03B3connu),
pour lesplans équilibrés (Blocs Incomplets Equilibrés ; BIE,...).
Sans utiliser la
décomposition
en strates, la méthode d’estimation naturelle des traitements consiste à faire des moindres carrésgénéralisés (Generalised
LeastSquares : GLS)
dèsqu’une
estimation de V est obtenue. Considérons le modèle mixte(5)
stratifiable où V estsupposé
connugrâce
à une estimationpréalable
descomposantes
de lavariance -y (par exemple
par les méthodesd’Henderson,
1953 oude Rao et
Kleffe, 1980).
L’estimation de8par
les GLS est obtenue en minimisantla somme de carrés
(Y - X03B8)’V-1(Y - X03B8).
On obtient la formule :On
peut
montrer que la méthode de Yates estéquivalente
aux G.L.S.lorsque
les
composantes
de la variance sont estimées par la troisième méthode d’Henderson.En conclusion la stratification ne
permet
en aucun cas de faire l’économie de l’estimation descomposantes
de la variance 03B3(ou 03BB),
et ladécomposition
enstrates nous semble avoir pour seuls intérêts
l’allégement
des calculsnumériques
ou
l’interprétation
des confusions par uneanalyse plus
fine de l’infonnation.6°)
Conditions destratifiabilité,
cas du modèle randomiséD’après
cequi précède,
ilapparaît
naturel de définir la stratifiabilité commesuit :
Définition
V : On dit que le modèle mixte(5)
eststratifiable
s’il existe unebase de vecteurs propres de V
indépendante
de 03BB.La