R EVUE DE STATISTIQUE APPLIQUÉE
O DILE C ADET
Un exemple de plan d’expériences
Revue de statistique appliquée, tome 29, n
o3 (1981), p. 43-53
<http://www.numdam.org/item?id=RSA_1981__29_3_43_0>
© Société française de statistique, 1981, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
43
UN EXEMPLE DE PLAN D’EXPERIENCES
Mme Odile CADET
(1)
1. INTRODUCTION
Le
type
deplan d’expériences
décrit etanalysé
ci-dessousprésente
laparti-
cularitéd’expérimenter
successivement sur une même unitéexpérimentale
tousles niveaux de certains facteurs étudiés. De
façon plus précise
les facteurs étudiésse
décomposent
en deux groupes. A niveaux fixés des facteurs dupremier
groupe,on considère un certain nombre d’unités
expérimentales,
chacune recevantsuccessivement tous les niveaux du facteur du second groupe lors d’une
expérience qui
se déroule enplusieurs étapes (autant qu’il
y a de niveaux des facteurs du secondgroupe).
Si on considère
qu’il peut
y avoir un effet del’étape
del’expérience,
sansinteraction avec tout autre
facteur,
l’ordre danslequel
sontexpérimentés
lestraitements ne doit pas être
identique
pourchaque
unitéexpérimentale ;
enconséquence
onorganise l’expérience
de tellefaçon
que tous les ordrespossibles
de ces traitements soient
expérimentés;
à niveaux fixés des facteurs dupremier
groupe, le nombre d’unités
expérimentales
choisi est alorségal
au nombre depermutations possibles
des traitements.Un cas
particulier
d’un telplan
a été utilisé dans uneexpérience d’appren- tissage
de la lecture et faitl’objet d’exemple d’application
dans cetexposé.
II. PLAN D’EXPERIENCE
On considère deux facteurs
Flet F3 ayant respectivement 03BD1
et v3 niveaux et dont on veut étudier les effetsprincipaux
et les interactions. Pour cela ondispose
pour
chaque
niveau deF1
d’unitésexpérimentales qui
ne constituent pas unepopulation
apriori homogène.
Pour contrôler cettehétérogénéité
onapplique
à
chaque
unitéexpérimentale
successivement chacun des 03BD3 traitements définissant les niveaux deF3,
ces unitésexpérimentales jouant
alors un rôle de "bloc". Afin de ne pasnégliger
l’effet éventuel de l’ordre danslequel
sontappliqués
à une(1) Laboratoire de Statistique et Probabilités Université Paul Sabatier 118 Route de Narbonne 31 06 2 Toulouse Cédex.
Revue de Statistique Appliquée, 1981, vol. XXIX, n° 3
44
même unité
expérimentale
les03BD3 traitements,
on considère suffisamment d’unitésexpérimentales
pour que chacunedes 03BD3 ! permutations
des niveaux deF3
soitappliquée
à une unitéexpérimentale
cequi
nécessite au total un nombre d’unitésexpérimentales égal à 03BD1. v3 ! .
Prenons comme
exemple,
leplan
dont nous avons été amenés àanalyser
les
résultats ; l’expérience
se déroule de lafaçon
suivante : Deux classes(CM1 - CE1)
de garçons(respectivement
defilles)
sont soumises àl’expérience
décriteci-dessous :
- on
présente
àchaque
enfantquatre
groupescomposés
de trois motschacun,
où un groupe de mots est établi en fonction du caractèreimagé
et de lafréquence d’apparition
de ces mots dans lelangage
courant. Cesquatre
groupes sont définis par lescaractéristiques :
"mots imagés
etfréquents"
"mots non
imagés
etfréquents"
"mots imagés
et nonfréquents"
’mots non
imagés
et nonfréquents".
Dans
chaque
groupe, les mots sont de naturesyllabique
différente. Surchaque
enfant on mesure le seuilperceptif
et letemps
de réaction verbale. Les niveaux deF1
sont alors définis par le croisement de deux facteurs(sexe
etâge),
quant
au facteurF3,
d’unepart
il résulteégalement
du croisement de deux facteurs(image
etfréquence),
d’autrepart
la mise en oeuvre de l’unquelconque
de cesV3
traitements consiste enplusieurs
"sous-traitements"qui
sont en nombre a si bienqu’il
intervient en facteurF4 (dans l’exemple :
naturesyllabique
dumot)
hiérar-chisé dans
F 3 .
Les
permutations
considéréesplus
haut n’ontporté
que sur les niveaux deF3
c’est dire dans
l’exemple
sur les groupes de mots ; à niveau fixé deF3,
l’ordre deprésentation
des niveaux deF4
est considéré comme sans influence.On
peut
donc considérer la situationgénérale
définie par :.. un
premier
groupe dek1
facteursFil
...F1,k1. (dont
le croisement définit le facteurF1) ayant respectivement 03BD1,1
...v l,k 1
niveaux avec. un second groupe de
k3
facteursF3 1
...F3,k3 (dont
le croisement définit le facteur3
etayant respectivement V3,1
...V3,k3
niveaux avecet un facteur
F4
hiérarchisé dans le croisement de cesk3
facteurs etayant
autotal 03BD4 = v3 . a niveaux dont a sont "emboités" dans chacun des niveaux de
F3
et constituent les aopérations
dont se compose le traitement défini par ce niveau deF3.
. un facteur
F2 (dans l’exemple :
facteurenfant) ayant V2
niveauxqui
constituele facteur unité
expérimentale
etqui
est emboité dans le facteurF1 : chaque
unité
expérimentale
est soumise à chacun des niveaux du facteurF4 ,
une unitéexpérimentale
donnée recevant au cours de v3étapes
consécutives les v3Revue de Statistique Appliquée, 1981, vol. XXIX, n° 3
niveaux du facteur
F3
suivant l’une despermutations
de ces03BD3
niveaux.On
peut
donc considérer l’ensemble E des cellules e définies par :où 2022
e1,1
...e1,k1
sont les niveauxrespectivement de F1,1
...F1,k1
a
e2
est la coordonnée de l’unitéexpérimentale
1e2 03BD2 ;
une unitéexpérimentale
donnée est affectée à des niveaux donnés des facteurs dupremier
kl
groupe si bien
qu’il
existe uneapplication surjective 03B32 de v2
sur03A0 03BD1,i qui
à toute unité
expérimentale
donnéee2
associe les niveaux des facteurs dupremier
groupeauxquels
elle est affectée.(de façon générale v- désigne
l’ensemble{1, 2,
...,03BD}
où 03BD est un entier naturelquelconque). 12
est telle que card(03B3-12)(e1)) = 03BD3 !.
.
(e3 1,
... ,e3 k )
sont les niveaux définissantF3
ete4
est le niveauF4
avec1
e4 v4 aV3)’ Il
existe uneapplication surjective
14de v4
surk3
03BD3,i qui précise
les niveaux deF4
hiérarchisés dans chacun des niveaux deF3 ;
card{03B3-14 (e3)} =
a.2022
es désigne l’étape
del’expérience
et varie de 1 àv3.
Le
plan d’expérience
utilisé est lapartie
E* de l’ensemble ci-dessusqui
contient les cellules
telles que es
est une fonction dee2
et dee3 = (e3 1 ... e3 k )
puisque
une unitéexpérimentale
donnéee2 reçoit
tous les traitementsdans
unordre
déterminé,
si bienqu’un
traitement donné lui estappliqué
à uneétape
donnée del’expérience.
De
façon plus précise,
à toute unitéexpérimentale e2,
onpeut
associer la per- mutationire 2 de 03BD3
sur lui-mêmequi précise
l’ordre danslesquels
sontappliqués
àe2
lestraitements e3 ;
on a alorses
=rre 2 (e3)
et par suite :Puisque
pourel
fixé il y a autant de valeurs dee2
que depermutations de ï13
sur
lui-même,
onpeut
identifierchaque
unitéexpérimentale e2
à lapermutation
Ire 2et
c’estpourquoi
onpeut
éventuellement écrire E* sous la forme :où 7r
appartient
au groupesymétrique SV3
dedegré 03BD3
despermutations
dev3
sur lui-même.
Pour
el
et7r(eg) fixés, lorsque
7r décritSV3
on rencontre alorschaque
valeurde
e3
un même nombre de foisqui
est(03BD3 -1 ) !.
46 III. MODELE
On suppose que pour
chaque
élément e de E* ondispose
d’une observation xe d’une variable aléatoire :Xe: N[m(e), 03C32] où m(e)
eta2
sont inconnus etoù les
n(= vl v3 ! 03BD3 a)
variables aléatoiresXe
sontsupposées indépendantes
entreelles.
(La présentation
et les notationsspécifiées
sont celles utilisées par J.R.BARRA
[1]).
m est uneapplication
de E* dans R et on note nl’espace
vectorieldes
applications
de E* dansR,
muni duproduit
scalaire :Puisque
leplan
E* estincomplet
on est amené à supposer dans le modèle que certaines interactions sont nulles. On suppose donc que mpeut
s’écrire de lafaçon
suivante :nous supposons de
plus
que les relations suivantes sont satisfaites :la
signification
de ces différentsparamètres
est alors :m :
effet moyengénéral
rn,. (ei) :
effet différentiel du niveauei
du facteurFi :
pour i E{1, 3,
03C0(3)}
’5’,j (ei) (ei, ej) :
effet différentieldu niveau e.
deFj (emboité
dans le facteurFi)
àniveau ei
du facteurFi
fixé : pour(i,j(ei))
E{(1, 2(ei)), (3, 4(e3))}
mi,j(ei, ej):
effet d’interaction entre le niveauei
du facteurFi
et le niveauej
du
facteur F. :
pour(i, j) = (1, 3).
Revue de Statistique Appliquée, 1981, vol. XXIX, n° 3
mi,j(ei),k (ei, ej, ek) : à
niveau ei du facteurFi fixé,
effet d’interaction entre le niveauej
du facteurFj (emboîté
dans le facteurFi)
et le niveau ek dufacteur
Fk
pour
(i, j (ei), k)
E{(1, 2 (e 3), (3, 4 (e 1
Remarque
m3,4(e3),1 (e3’ e4, e1) a
mêmesignification
quem1,3,4(e3) (e1,e3, e4)
Implicitement, compte
tenu de la structure duplan d’expérience,
nous sup- posons nulles les interactions entre le facteurF 5
et tout autrefacteur,
ainsi quel’interaction
entre le facteurF2
et le facteurF4
ceci à niveaux e ,du
facteurFlet
e3 du facteur
F3
fixés.D’autre
part mi(ei)
est uneapplication appartenant
àn,
constante parrapport
à toute~ ~ ~ i,
de mêmemi,j(ei, ej)
est uneapplication
den,
constantepar
rapport
à touteQ Q =1=
iet ~ ~ j, mi,j(ei) (e., e.)
est uneapplication
de n cons-tante par
rapport
à toute~ ~ ~
iet ~ ~ j(ei) einfin mi,i(ei),k (ei, ej, ek)
est uneapplication
den,
constante parrapport
à toute~ ~ ~ i, ~ ~ j (ei)
et ~ ~ k.Si on
désigne
par :03A9~
le sous ensemble de n desapplications
constantesni
le sous ensemble de SI desapplications
constantes parrapport
àtout
e~ ~ ~
i pour i E{1, 3, 03C0(3)}
03A9i,j(ei)
le sous ensemble de n desapplications
constantes parrapport
àtout
e~ ~ ~
i et £ ~j(ei)
pour(i,j(ei))
E{(1, 2(ei)), (3,4(e3))}
03A9i,j
le sous ensemble de SI desapplications
constantes parrapport
àtout
eQ Q =1=
i etQ =1= j
pour(i, j) = (1,3)
03A9i,j(ei), k le
sous ensemble de 03A9 desapplications constantes
parrapport
àtout
eQ Q=I= i, ~ ~ j(ei)
et ~ ~k,
pour(i,j(ei),k) ~ {(1, 2(ei), 3), (3,4(e3), 1)}.
Tous ces sous ensembles de
n,
sontorthogonaux
deux àdeux,
relativement au pro- duit scalaire défini sur S2.D’autre
part
n est la somme directe des sous espacesnI (I
EJ)
et du sous-espace
orthogonal
à ~nI,
noté03A9~J (03A9~J
est en fait la somme directe des sous- IEE 5espace de n définissant les interactions
négligées
dans le modèleci-dessus).
Onpeut
écrire : 03A9 = 003A9I
e03A9~J
Chaque
ml estlaprojection
de m sur le sous espaceQI (1
EJ),
laprojection
de m sur
03A9~J
étantsupposée
nulle m= mj(e).
Remarque
Cette
décomposition
ainsi obtenue est unedécomposition
"condensée". Eneffet,
citons unexemple ; m1(e1)
est en réalitém1(e1,1,...e1,k1)
etpeut
sedécomposer
en fonction del’effet principal
de chacun des facteursF1,1,...F1,k1,
de leurs interactions d’ordre
1, 2....,
dont les diverses estimations fontappel
à des
procédures classiques d’analyse
de la variance.48 IV. ANALYSE Le modèle est le suivant :
où -
U(e)
est une variable aléatoireN(0, a2) (a2
ER+*) ;
toutes les variables aléatoiresU(e)
étantsupposées indépendantes
entre elles.-
m(e)
résume l’influence de l’ensemble des facteursFI.... F 5
et a pourdécomposition m(e) mj(e).
Par la méthode d’estimation moindre carré nous pouvons déterminer les
ml (e)
dem, (e) (I ~ J).
iiYl(e)
=xI(e)
oùxI(e)
a pourexpression
celle demI(e)
danslaquelle m(e)
estremplacé
par son estimationx(e).
On a donc :
Revue de Statistique Appliquée 1981, vol. XXIX, n° 3
où on
désigne
par :Ei*(ei) :
l’ensemble des éléments e de E* pourlesquels
le facteurFi
est fixéau niveau ei
(pour
i~ {1,3,03C0(3)}).
E*. (ei, ei) :
l’ensemble des éléments e de E* pourlesquels
à niveau ei fixé du facteurFi,
le facteur F.(emboité
dans le facteurFi)
est au niveauej (pour (ij(e,)) e {(1, 2(e1)), (3, 4(e3))})
E*.(e., ej):
l’ensemble des éléments e de E* pourlesquels
les facteursFi
et
Fj
sontfixés respectivement
aux niveaux ei etej (pour (i, j) = (1, 3))
E*i,j
(ei),k(ei, ej’ ek) :
l’ensemble des éléments e de E* pourlesquels
à niveauel
fixé du facteurFi,
le facteurFi (emboité
dans le facteurFi)
est au niveauej
et le facteur
Fk
au niveau ek(pour (i,j(ei), k)
E{(1, 2(e1), 3), (3, 4(e3), 1)}).
L’estimateur
â2(x)
de la variance résiduellea2
est défini par :où
S2(x) = 03A3 (x(e) - 03A3 xI(e))2, représente
l’estimation du carré de la normee(=E* IE
de la
projection
de m sur03A9~J.
n
désigne
le nombre total d’observations c’est-à-dire03BD103BD3 ! 03BD3
ar, nombre de
paramètres
à estimer a pour valeurTests
d’hypothèses
On
peut
construire àpartir
des résultatsprécédents
de nombreux testsd’hypothèses
relatives aux effets des facteursF1 ... F5 ;
ceshypothèses
sont de laforme :
rJeo: "mI (e)
= OIEJ0 ~ J" (J0
nonvide)
Le test de
l’hypothèse3eo
est alors défini par lastatistique
suivante :où
S2 (x),
n, r sont définis dans leparagraphe précédent.
50
Sous
l’hypothèse H0 la statistique FH0(x)
a pour loi une loi de Fisherayant
pourdegrés
de libertéV
dimnI
et n - r.IE.1 0
Le seuil a étant
fixé,
le test del’hypothèse H0
est alors immédiat.Remarque :
Dans toute
l’analyse
nous avonssupposé qu’il
y avait une seule observation par unitéexpérimentale.
Dans le cas deplusieurs observations,
il serait alorspossible
d’introduire un terme d’interaction
supplémentaire
dans lemodèle,
on sera d’autrepart
conduit à diverses modifications enparticulier
dans la détermination de l’esti- mateur de la variance résiduelle du modèle.V. APPLICATION
L’exemple
deplan d’expériences
décrit dans leparagraphe
II a pour butd’analyser
l’influence de différents facteursrespectivement
sur le seuilperceptif
etsur le
temps
de réaction verbale de l’enfant.En dehors des facteurs
image
etfréquence
dont l’étude estl’objet
mêmede
l’expérience, l’organisation
del’expérience
a nécessité la recherche des facteurssusceptibles
d’influencer les résultatslorsqu’ils
auront été introduits dans ledispositif expérimental (ex. :
sexe,âge).
Le matérielexpérimental
nonhomogène
a été stratifié en sous groupes aussi
homogènes
quepossible (sexe
etâge fixés).
Al’intérieur de chacun des sous groupes,
chaque
unitéexpérimentale (enfant), jouant
ici le rôle de
"bloc",
a été choisie au hasard et soumise à la séried’expériences.
Ilest naturel de penser
qu’un
effet d’accoutumancepeut
intervenir. Considérant ainsi que l’ordre deprésentation
des groupespeut
avoir uneinfluence,
lesquatre
groupes de mots sontprésentés
àchaque
enfant dans un ordre différent. L’ordreprécis
danslequel
sontprésentées
àchaque
unitéexpérimentale
les différentesexpériences (différents groupes)
est apparu un moyen d’atténuer voir d’éviter des liaisons entreexpériences
successives et d’éviter de favoriser certainesexpé-
riences au détriment des autres. Le nombre de
permutations possibles
desquatre
groupes détermine le nombre d’enfants choisis au hasard danschaque
classe. Bienque dans
l’expérience,
l’ordre deprésentation
des mots à l’intérieur d’un groupe soitpermuté,
nous faisonsl’hypothèse
que l’ordre des mots pour un groupe donné est sansinfluence ; peut
être est-ce làl’hypothèse
laplus
contestable...L’ensemble des facteurs retenus est alors :
F1,1 :
facteur "sexe"03BD11 = 2} Fi :
facteur"catégorie
d’enfant"F ’ .
facteur"âge" 03BD12 = 2
v = 4F2 :
facteur "enfant"v2 4 x 4!
facteur emboîté dans les deuxpré-
cédents.
F3,1 :
facteur"image" 03BD3,1
=2} F 3 facteur "groupe
de mots"
F3,2 :
facteur"fréquence" 03BD3,2 = 2 03BD3 = 4
F4
: facteur "nature dumot" 03BD4 =
4 x 3(a
=3)
F 5
: facteur "ordre deprésentation
desgroupes" vs -
4(= v3)
Cette
organisation
del’expérience
nous conduit à supposer quechaque
observation résulte de l’additivité d’un certain nombre de
paramètres (partie fixe)
Revue de Statistique Appliquée, 1981, vol XXIX n° 3
et d’un terme "erreur"
(partie aléatoire).
Ce dernier terme estsupposé
de distribu- tion normale etindépendant.
Bien que cetype
de modèle se rencontre dans lalittérature (ex. : [4])
il est certain que cette dernièrehypothèse
est contestable. Il serait souhaitable depouvoir auparavant procéder,
dans les mêmesconditions,
àdes
expériences (identiques
àcelle-ci) permettant
de vérifier enparticulier l’hypo-
thèse de normalité et
d’indépendance
des erreurs.La
partie
fixe sedécompose
de lafaçon
suivante :où
ml (e1)
sedécompose
en fonction de l’effetprincipal
des facteursF1,1 (sexe)
et
F 1,2 (âge)
et de leur interactionm3(e3)
sedécompose
en fonction de l’effetprincipal
des facteursF3,1 (image)
et
F 3,2 (fréquence)
et de leur interaction.m1,3 (eu, e3)
sedécompose :
en fonction de l’effet d’interaction d’ordre 2 entre les facteurs
F1,1 (sexe)
etF3,1 (image) (respectivement F1,1
etF3,2 ; F1,2
etF3,1 ; F1,2
etF3,2) puis
en fonc-tion de l’effet d’interaction d’ordre 3 entre les facteurs
F1,1, F1,2
etF3,1 (respec- tivement F1,1, F1,2
etF3,2 ; F1,1, F3,1 et F3,2 ; F1,2, F3,1
etF3,2).
enfin en fonction de l’effet d’interaction d’ordre 4 entre les facteurs
F1,1, F1,2, F3,1 et F3,2.
ml
,3,4 (e3)(el ,
e3,e4)
sedécompose :
en fonction de l’effet d’interaction d’ordre 2 entre les facteurs
F1,1
etF4 (nature
dumot) (respectivement F1,2
etF4), puis
en fonction de l’effet d’inter- action d’ordre 3 entre les facteursF 1,1, F 1,2
etF4,
ceci à niveau fixé du facteurF3 (c’est-à-dire
pour un groupe de motsdonné).
Dans ce modèle nous supposons
qu’à
niveau fixé du facteurFI,
c’est-à-dire pour un groupe d’enfantsdéterminé,
iln’y
a pas d’interaction entre les facteursF2 (enfant)
etF 3 (groupe
demots).
Les résultats concernant le seuil
perceptif
et letemps
de réaction verbale sont résumés dans les tableaux 1 et II.L’expérience
s’est déroulée sur 96sujets
et ondispose
pour chacune des deux variables étudiées de n = 1 152observations ;
sur l’ensemble de lapopulation étudiée,
letemps
de réaction verbale moyen est de 1 183.58 ms. et le seuilperceptif
moyen est de 55.97 ms.
Les tests
significatifs
obtenus dans le cas des deuxanalyses
sontindiqués
dansles tableaux 1 et
II ;
à titred’exemple analysons
un des résultats obtenus pour le seuilperceptif,
àsavoir,
l’existence d’interactionsignificative
entre les facteurs:âge -
sexe etfréquence.
-Pour cela considérons les
performances
moyennes résumées dans les deux tableaux suivants :52
Considérons ensuite les écarts entre les
performances
des filles et des garçons :la différence de
supériorité fille,
garçon entre lespetits
et lesgrands
n’est pas la même pour lafréquence
forte et lafréquence
faible. Cephénomène
se traduit parune interaction
significative
entre les facteursâge -
sexe etfréquence.
Uneinterprétation plus approfondie
de tous ces résultats a été faite par lepraticien, compte
tenu de ses connaissances et de sonexpérience [2].
TABLEAU 1 Seuil de
perception
* signifie test significatif au seuil de 5 %
Revue de Statistique Appliquée, 1981, vol. XXIX, n° 3
TABLEAU II
Temps
deréponse
verbale* signifie "test
significatif
au seuil de 5 % "REFERENCES
[1]
J.R. BARRA. - Notionsfondamentales
deStatistique mathématique, Dunod,
1980.