A NNALES DE L ’I. H. P.
F. Y ATES
Bases logiques de la planification des expériences
Annales de l’I. H. P., tome 12, n
o2 (1951), p. 97-112
<http://www.numdam.org/item?id=AIHP_1951__12_2_97_0>
© Gauthier-Villars, 1951, tous droits réservés.
L’accès aux archives de la revue « Annales de l’I. H. P. » implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions).
Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
Bases logiques de la planification
des expériences
par F. YATES.
La
planification
etl’analyse
desexpériences
est la branche .de latechnique statistique
moderne danslaquelle
lalogique,
surlaquelle
sont basées les inductions
statistiques,
est laplus simple
et laplus
nettement tranchée. C’est
aussi,
dans un certain sens, lepropres
leplus
révolutionnaire des récentes
années,
car c’est dans la théorie de laplani-
fication des
expériences
que lalogique
de l’inductionstatistique
a étéclarifiée pour la
première
fois. C’est aussi dans lesexpériences
conve-nablement
planifiées
que l’édificelogique correspond
vraiment à lasituation
pratique existante,
de telle sorteque
les inductions sontconformes à la réalité. Pour ces ràisons
j’ai toujours
conseillé à ceuxqui
s’intéressent à la
statistique
d’étudier lesprincipes
de laplanification
des
expériences,
même s’ils ne doiventjamais
s’intéresser directement àl’organisation
de celles-ci.Je
n’ai,
parconséquent,
aucune hésitation à consacrer lapremière
deces deux conférences à l’étude
théorique
de cettequestion,
d’autantplus
que les
explications
données dans divers ouvragesclassiques
de statis-tique mathématique
sont défectueuses à diverségards.
Dans ma secondeconférence, je
me propose de décrirequelques-uns
desdéveloppements
récents les
plus importants, particulièrement
dupoint
de vuethéorique.
Estimation et tests de
signification.
- La théorie fondamentale seraplus
facile à décrire àpartir
d’unexemple
concret :Fig. i. - Blocs avec répartition au hasard pour quatre répétitions de six traitements’
.
98
La
figure
i montre unarrangement
pour uneexpérience
enplein champ,
de 6traitement
ouvariétés,
avec4 répétitions
dechaque
trai-tement. Le
plan expérimental
ainsiconçu
est unexemple
de ce que l’ondésigne
sous le nom de blocs avecrépartit.ion
au hasard : l’ensemble des24 parcelles
est divisé en4
blocs de 6parcelles chacun,
les 6 traite-ments considérés étant
répartis
au hasard dans les 6parcelles
dechaque
bloc.L’importance
de cette condition derépartition
au hasardapparaîtra
ultérieurement.L’analyse numérique
des résultats d’une telleexpérience
est trèssimple.
Les récoltes des24 parcelles
sont notées dansune
table
à doubleentrée (tableau I) :
TABLEAU J. - Récoltes dans une expérience
avec répartition au hasard dans les blocs. ,
Les effets des traitements sont estimes à
partir
des différences entreles traitements totaux
Ta, T~,
..., ou entre les moyennes correspon-dantes, exprimés
en unités convenables. Les erreurs de ces estimationssont évaluées au moyen de la méthode connue sous le nom
d’analyse
dela variance. Dans notre
exemple,
celle-ciprend
la formeindiquée
dansle tableau
II,
danslequel dev2 y représente
la somme des carrés desdéviations des y à
partir
de leur moyenne, etc.TABLEAU JI. - Analyse de la variance.
L’erreur
quadratique
moyenne R donne une estimation s2 de~2,
variance de l’erreur parparcelle,
de sorte que la variance de l’erreur99
d’une moyenne de
’traitements (moyenne
de4 parcelles) est ~ ~~,
etcelle de la différence de 2 moyennes de traitements est
2
~~. , ,Cette forme
d’analyse peut
facilement êtrejustifiée
par la méthode des moindrescarrés,
àpartir
del’hypothèse
que les récoltes desparcelles
sont des fonctions de la forme
.
y~., == 11. +
~,~ +
+ Ers,dans
laquelle
est une constante pourl’ensemble, ~,.
est une constanterelative à un bloc avec
S (r)
= o, zs est une constante relative à un trai- -tement, avec = o, et est une erreur
aléatoire,
tous les ers étantnormalement et
indépendamment distribués,
avec la mêmevariance
a’2.L’erreur
quadratique moyenne R a
pourespérance mathématique a2,
et,par
conséquent,
fournit une estimation correcte en moyenne de03C32,
c’est- à-dire une estimation sans erreursystématique,
ou .sans biais.La méthode des moindres carrés a été
développée
par Gauss. Elle°
peut
aussi être considérée comme un casparticulier
de la méthode pro-posée
par R. A.Fisher,
sous le nom de méthode de maximum likelihood(maximum
devraisemblance).
Fisher a étendu la théorie en observant que si les ~~ sont normalement
et
indépendamment
distribués avec la même variance 7~( tous les ~
ettous
1 é 1 )
lesquantités n1Q 03C32
etn2R 03C32
sont distribuées mdé-pendamment comme
avec no, nj et n2degrés
de libertérespective-
ment
[dans
le casactuel 3, 5
et 15degrés
de liberté(1)1. De plus
lerapport
des carrés moyens~, qu’on appelle
aussi lerappport
desvariances,
estdistribué comme le
rapport n2~21 n1~22, qui
estindépendant
de (12. Fisher adéterminé et mis en tables la distribution
équivalente
de lavariable z,
danslaquelle e2z’ est
lerapport
desvariances,
fournissant ainsi un test exactde
signification
pour les traitements considérés dans leur ensemble.Si,
par
exemple,
la valeur de z, calculée àpartir
del’expérience, dépassé
la valeur
qui correspond
au seuil 5% .
de la distribution de z, onpeut
conclure que, s’iln’y
a pas d’effet destraitements,
les différences entre( 1 ) La distribution dè ~2, pour n degrés de liberté, peut être définie comme la distribution de la somme des carrés de Il quantités, chacune étant normalement et
indépendamment distribuée avec un écart-type égal à l’unité.
les moyennes des traitements
( qui doivent,
dans ce cas, être dues entiè-rement aux fluctuations
aléatoires),
aussigrandes
ouplus grandes
quecelles
observées,
ne seprésenteraient,
parhasard,
que dans moins . de 5%
de toutes lesexpériences analogues.
Le test z est une extension du test t
qui
futproposé précédemment
par Gosset
(Student).
Le test t fournit un test designification
pour la différence entre les résultats d’unepaire quelconque
de traitements etest
équivalent
au test z pour ni == 1. Son caractèrerévolutionnaire,
enfournissant un test exact de
signification
pour lespetits échantillons
d’observations
quantitatives,
a été mis en évidence pour lapremière
foispar Fisher. ’
’
Orthogonalité. -
La structure del’analyse
de lavariance,
dans lecas d’une
expérience
avecrépartition
au hasard dans lesblocs,
est par- culièrementsimple,
pour la raison que les blocs et les traitements sontorthogonaux.
Dans laterminologie
des moindrescarrés,
la réduction dans la somme descarrés
des déviations due àl’ajustement
des cons-tantes relatives aux traitements est la
même,
que les constantes relativesaux blocs aient été aussi
ajustées
ou non. Cettepropriété
résulte du faitque
chaque
traitement seprésente
unefois,
et une foisseulement,
danschaque bloc,
de telle sorte que les différences entre blocs n’affectent pas lescomparaisons
entre traitements : desaugmentations égales
dansles récoltes de toutes les
parcelles
d’un mêmebloc,
parexemple,
augmenteront
également
toutes les moyennes de traitements..C’est seu-lement
lorsque
deuxgroupes
dedegrés
de liberté sontorthogonaux
que les sommescorrespondantes
de carrés sont additives. En ce cas lasomme des carrés relative à l’erreur
peut
être obtenuesimplement par
différence. ,
Si les blocs et les traitements n’étaient pas
orthogonaux,
cequi
seraitle cas si les traitements étaient
inégalement représentés
dans les difIé- ,rents
blocs,
une solution par la méthode des moindres carrés seraitencore
possible,
mais les constantes relatives aux blocs et aux traite-ments devraient être déduites
d’équations
linéaires simultanées au lieu d’être déduites directement des moyennes de blocs et de traitements. Lasomme des
carrés,
relative auxtraitements, qui
seraitappropriée
àl’emploi
du test z, s’obtiendrait en déduisant la part de la sommedes
carrés provenant
de l’ajustement des
constantes relatives aux blocsseuls,
I0I
de celle
provenant
del’ajustement
simultané des constantes relatives ’aux blocs et aux traitements. ’
La
symétrie, qui
donne lieu àl’orthogonalité,
a comme autre consé-quence
importante
que lescomparaisons
entretraitements
sont toutesde la même
précision..’ ,
-Les
types
lesplus simples
deplanification
desexpériences
sont com-plètement orthogonaux,
mais un certaindegré
denon-orthogonalité peut
être admis dans des types
plus
élaborés deplans d’expérience
à condi-tion
qu’ils soient
d’une nature telle que l’estimation des elféls dus auxtraitements et
l’analyse
de la variance ne soient pascompliquée
àl’excès. Je donnerai ultérieurement
quelques exemples
de telsplans d’expérience.
Pourl’instant, j’attire simplement
l’attention sur leplan
d’expérience
connu sous le nom de carré latinqui
est tel quechaque
traitement se
présente
unefois,
et une foisseulement,
danschaque rangée
et danschaque
colonne d’un ensemble carré deparcelles.
Onvoit aisément que ce
plan
estcomplètement orthogonal
à la foispour
les rangs, les colonnes et les traitements. Par
conséquent, l’analyse
de lavariance
a la mêmesimplicité
que dans les blocsrépartis
auhasard.
Le rôle de la
répartition
au hasard. - Il y a lieu maintenant de considérer le rôle de larépartition
au hasard. On voit immédiatement quel’hypothèse que.les
résidus Ers sont normalement etindépendam-
ment distribués avec la même variance
quel
que soitl’arrangement
destraitements,
n’est pasjustifiée.
Dansl’expérimentation agricole,
parexemple,
il est bien connu que les récoltes desparcelles
voisines onttendance à
être plus
ou moins liées et que cet effetpersiste
mêmelorsque
l’on calcule les résidus àpartir
des moyennes de blocs et detraitements.
Nous pouvons d’abord considérer le résultat d’une étude de
l’analyse
de
la variance dans le cas où les traitements sontfictifs,
c’est-à-dire dans le cas où toutesles parcelles
ont subi le même traitement.Dans notre
exemple, il y
a(6 !)4
arrangementspossibles
dessymboles caractéristiques
des traitements fictifs. Ceci donne lieu à(6 ~3
valeursdes carrés moyens relatifs aux traitements et à
l’erreur,
et aussi(6 ~3
valeurs de z. Il est facile de montrer que, si l’on considère tous les arrangements
possibles,
la valeur moyenne du carré moyen relatif à l’erreur estégale
à la valeur moyenne du carré moyen relatif aux trai-I02
tements. Si le
plan d’expérience
est tel que cette condition soitréalisée,
le carré moyen relatif à l’erreur
peut
être considéré comme donnant une estimation nonsystématiquement
faussée de la variance relative àl’erreur.
L’absence de déviationsystématique
est clairement une condi- . tion nécessaire pour que la distribution de zpuisse
être valablementemployée.
~ ,Ces
(6!)3
valeursde z,
enelles-lIlêllles"
fournissent un test de la valeursignificative
des effets destraitements,
testqui
estindépendant
de toute
hypothèse
relative à la normalité.Si la valeur de z,
correspondant
àl’arrangement
effectif des traite-ments dans une
expérience,
se trouve êtredépassée
par moins de 5%
detoutes les valeurs
de z,
alors les effets des traitementspeuvent
êtrejugés significatifs
au seuil designification
5% .
Ceci constitue ce
que
l’onappelle
le test derépartition
au hasard. Onnotera
qu’avant
de le réaliser il est nécessaired’assigner préalablement
un ordre aux différents arrangements. Il
n’y
a rien d’absolu dans l’ordre fourni par les valeurs de z(ou parle
carré moyen relatif aux traite-ments);
nous pouvons, parexemple,
avoir considéré comme critère la différence entre laplus grande
et laplus petite
moyenne de traitements.En
conséquence,
le test de-répartition
au hasard estindépendant
detoute
hypothèse
concernant la distribution desrésidus,
mais il n’est pasunique,
ainsiqu’on
leprétend quelquefois.
Des
considérationsgénérales
nous conduisent à supposer que les pro- babilités données par le test derépartition
au hasard se conformeront très exactement à celles données par le test z, pourvu que le nombre desparcelles
ne soit pas troppetit
et que la distribution des résidus àpartir
des moyennes de blocs ne soit pas
trop éloignée
de la distribution normale. Une desprincipales
causes de désaccord ne réside pas dans lemanqué
denormalité,
maisprovient
du fait que les valeurs de z données par la distribution au hasard onttendance
à êtregroupées.
Les(6 ! !)3
valeurs
ci-dessus,
parexemple,
nepeuvent
pas êtreregardées
comme unéchantillon au
hasard
de(6
valeursprélevées
dans une distribution continue.Quelques comparaisons
basées sur des observationsnumériques
effec- ,tives ont montré un bon accord et
elles
ont étéprises comme justifica-
tion de
l’emploi
du test z sous condition d’une non-normalité modérée.Cependant,
d’autres auteurs ont établi que dans des circonstances seI03
présentant
assezcommunément,
parexemple, ,dans
unepetite expé- rience
avec des récoltesparcellaires
dont les résidus peuvent être consi- dérés comme n’étant pas un échantillontrop Improbable
d’unepopula-
tion
normale,
le test derépartition
au hasard ne s’accorde pas étroite-ment avec le test z et ces auteurs ont même
suggéré qu’une
correctiondevrait
être faite à ce dernier test.’ ’
A mon
avis,
ceci est une erreur due au manque de connaissance du faitqu’il peut fréquemment
y avoirplus
d’un test raisonnable de’signi-
fication pour un ensemble donné d’observations. Divers tests peuvent .
être en désaccord
notoire,
bienqu’ils
soient d’accord en moyenne pourun
grand
nombre de groupesd’observations.
Dans de telles circons- tances, il n’est pas admissible de choisir le testqui donne,
parexemple,
la
plus grande signification.
Le test àemployer
doit être choisidevance,
et l’on doit se soumettre à son
verdict, qu’il
soit favorable ou non.En
plus
de sacommodité,
onpeut
montrer que le test z basé sur la distribution normale est leplus efficace,
si les résidus sont réellement distribués normalement. Il peut, parconséquent,
êtrejustifié
sur cesbases.
D’ailleurs,
le test z n’est pas utilisé engénéral,
pour des observations tropéloignées
de la distributionnormale, puisque,
dans lapratique,
ilest
d’usage
de transformer les observationsqui
sont vraimentéloignées
de la distribution normale en données
approximativement normales,
par diversestransformations (racine carrée, logarithme
ou transformation ’angulaire).
Estimation de l’erreur quand il y a des effets dus au traitements. -
L’emploi
de tests designification
n’est pas leseul,
ni mêmegénéra-
lement le
principal objet
d’uneexpérience, puisque
l’on saitfréquemment
avant de faire
l’expérience,
que les traitementsproduiront
un certaineffet. En
général,
on a besoin d’estimations de la.grandeur
des diffé-rences entre les
traitements,
ainsi que de l’estimation des erreursauxquelles
ces différences sontsujettes..
Une
analyse
ordinaire de la variance est basée surl’hypothèse
que les résidus associés aux différents traitementspeuvent
êtreregardés
commeayant la même variance.
L’analyse
a aussi l’effet de grouper ensemble les estimations d’erreurs déduites desrépétitions
des diverstraitements,
mais ce genre de
groupement
n’est pas nécessairementapproprié
siI04
quelques-uns
des traitements ont des effetsbeaucoup plus importants
que certains
autres.
Par
exemple,
si les traitements A et B ont pour effet unesuppression complète
de larécolte,
et si nous nous proposonsd’estimer
les erreursdes
comparaisons
deC, D, E, F,
les traitements. A et B doivent être entièrement retirés del’anàlyse
de la variance. Cecipeut
être fait sim6plement
dans uneexpérience relative
à des blocsrépartis
auhasard,
mais dans des
plans d’expérience plus compliqués,
telsqu’un
carrélatin, l’orthogonalité
auradisparu
etl’analyse demande,
par consé-quent,
à être modifiée.Cependant,
dans des cas moinsextrêmes,
ladifficulté
peut
souvent être surmontée parl’emploi
d’une transformationappropriée.
’.
~
..
En ~dehors de cet inconvénient
qui
seprésentera
seulement si leseffets des traitements sont
importants,
larépartition
auhasard,
si elleest d’un
type approprié, garantit
que l’estimation del’erreur,
àpartir
detoutes les
observations,
estappropriée
pour toutes lescomparaisons.
Enparticulier,
dans uneexpérience
de blocs avecrépartition
auhasard, n’importe quelle paire
de traitements a les mêmes chancesd’occuper n’importe quelle paire
deparcelles
dans l’unquelconque
des blocs. Siles traitements ne
produisént
aucuneffet,
la moyenne des carrés des différences den’Importe quelle paire
de traitements pour tous lesarrangements possibles
sera,après
avoir étémultipliée
par unmultipli-
cateur
approprié, égale
à la moyenne des carrés moyens relatifs à l’erreur. En d’autres termes, l’estimation de l’erreurpeut
être valable-ment utilisée pour la
comparaison
den’importe quelle paire
de "traitements.
Refus
d’arrangements
non satisfaisants. - Larépartition au
hasardnous assure
qu’aucun
traitement n’estspécialement
favorisépuisque chaque
traitement a uneégale probabilité
de tomber surchaque parcelle.
En
conséquence,
les estimations des effets destraitements
ne sont pasviciées,
en ce sens quelorsqu’il n’y
a pas d’effets detraitements,
lavaleur moyenne des
estimations
de ceseffets,
àpartir
de tous les schémaspossibles
derépartition
auhasard,
sera nulle.Cependant,
dans unarrangement
particulier quelconque,
il peut arriver que-certains
traite-ments se trouvent mieux
placés
que d’autres.Ainsi,
dansl’arrangement
I05
de la
figure
1, des traitements tels que B et E peuvent êtredésavantages
par
rapport
aux traitements C etD,
si les bords del’expérience
onttendance à avoir des récoltes
plus
faibles. ..Dans une
longue
suited’expériences semblables,
les effets de cetteespèce disparaîtront
en moyenne, mais ceci nerègle
pas la difficulté. A lavérité,
des arrangementsplus
défavorables que ceux obtenus dans lafigure
1peuvent, occasionnellement,
seproduire
par hasard.Ainsi,
il ya une chance sur 216
qu’un
traitementparticulier
seplace
auxquatre coins,
et la même chance pourqu’un
des traitements seplace
aux’
quatre parcelles
du centre. Je pense que lepraticien
se rendcompte
que ni l’un ni l’autre de cesarrangements,
n’est un bon arrangement.Cependant
si de telsarrangements
sontrejetés lorsque
larépartition
.au hasard y
conduit,
lapropriété
d’avoir une estimation correcte de l’erreur cesse d’exister. Aussilongtemps
quel’expérimentateur réussit
àrejeter
les arrangements les moinsprécis,
il obtiendra des résultatsqui,
en moyenne, seront
plus précis
que la moyennegénérale
relative à tousles arrangements
au hasard,
maisil les jugera
moinsprécis,
non seule-ment
qu’ils
le sont enréalité,
maisencore
moinsprécis
que lamoyenne
de tous les arrangements au hasard. ,
"
Dans certains
types
deplans,
les types lesplus
défavorables d’arran-gements peuvent être
exclus, cependant qu’il
estpossible
de conserver ’une estimation correcte de l’erreur. Ceci se trouve réalisé au moyen de
ce que
j’ai appelé
leprincipe
de ’laréparitition
au hasard restreint.Cette méthode consiste à déterminer un
sous-groupe d’arrangements
pour
lequel
lapropriété
d’une estimation correcte de l’erreur est réaliséeet à choisir au hasard un arrangement de ce sous-groupe. Je donnerai
un
exemple
del’application
de ceprincipe
dans ma seconde conférence.Arrangements
systématiques.
- Laposition
extrême àlaquelle
conduit le
rejet d’arrangements
considérés commeimprécis
est l’abandondu
principe
de larépartition
auhasard, remplacé
par le choix dequelque
arrangementparticulier, lequel,
en raison de sespropriétés d’équilibre
ou desymétrie, apparaît
àl’expérimentateur
commeétant capable
de donner descomparaisons particulièrement précises.
Un telarrangement
s’appelle
un arrangementsystématique.
Un
exemple classique d’arrangement systématique
est constitué parI06
les carrés Knut Vik ou carrés de la marche du
cavalier ( fig. 2 ) qui
sontdes carrés latins
particuliers
àcinq lignes
etcinq
colonnes :. Fig. 2. - Carrés Knut Vik.
’
/
Des carrés latins
particulièrement-
défavorables sont les carrés dia-gonaux
3) :
,Fig. 3. - Les carrés diagonaux.
Tedin a testé ces
quatre
carrés sur 91 1 groupes de récoltes provenantd’expériences
d’uniformité. Il a trouvéqu’en
moyenne les carrés Knut Vik montraient ungain apparent
deprécision
d’environ g% ,
par rapport à la moyenne de tous les arrangements au hasard et que le~carrés
diagonaux
montraient uneperte
à peuprès
du mêmeordre,
bienque, comme on
pouvait
le supposer, lesprécisions
relatives montraientune variation considérable d’une
expérience
à l’autre.En
plus
de laperte
de tests designification
et d’estimations d’erreurspleinement valables,
les arrangementssystématiques
ont d’autres défautsqui,
souvent, ne sont passoupçonnés.
Les variationspériodiques
dansla fertilité et la concurrence entre les traitements ou variétés peuvent
toutes les deux être cause de
complication. Ainsi,
parexemple,
dans lafigure
2, si le haut ducarré
est orienté vers leNord,
la variété Aportera
ombre sur la variété G dansquatre parcelles
surcinq.
Si A est unevariété de
grande taille,
il pourra enrésulter,
pour la variétéC,
undésavantage appréciable.
Il est évident que des carrés latins obtenus
.occasionnellement,
parrépartition
auhasard,
peuvent être tels que la variété Aporte
ombre surune même variété dans toutes les
parcelles,
mais cette situation estquelque
peuexceptionnelle.
’
I07
Des effets de cette
espèce
sont de nature à êtreparticulièrement
ennuyeux
puisqu’ils peuvent
donner un résultatparaissant
hautementsignificatif,
maisqui
est entièrement artificiel. Unexemple
a récemment .attiré mon attention dans une
expérimentation portant
sur desplantes
de serre à
Rothamsted, expérience
danslaquelle
les traitementsA, B, C, D, E,
Freprésentaient
desquantités
croissantes d’unengrais
chi-mique qui,
enpetites quantités,
stimulait lacroissance,
mais étaittoxique
engrandes quantités. Chaque répétition
étaitarrangée
dansl’ordre de A
à~F,
de telle sorte que A étaittoujours placé
à la suite de F(ou
à la fin d’unrang).
Enconséquence
B étaitplus ombragé
que A dans toutes lesrépétitions. L’analyse statistique indiquait
que l’effet de B étaitsigniiicativement.
moindre que celui de A ou deC,
etl’expérimen-
tateur
qui
étudiait laquestion pensait qu’une
intéressante découverte avait été faite. Si un arrangement au hasard avait été utilisé(comme
ille fut dans les
expériences suivantes),
la rivalité entreplantes
n’auraitpas été entièrement
éliminée,
mais ses effets auraient été distribués surl’ensemble de tous les traitements. L’effet
général
aurait étéd’augmenter quelque
peu les différences entretraitements,
de manièreapproximati-
vement
proportionnelle
à leur valeur absolue. En dehors de cettetendance à surestimer les véritables différences entre
traitements, l’unique
effet de larivalité,
dans un arrangement auhasard,
estd’aug-
menter
l’erreur,
mais les tests designification
des différences entretraitements ne sont pas faussés.
Dans de nombreux arrangements
systématiques,
on peutenvisager
diverses méthodes d’estimation de
l’erreur,
aucune d’elles n’étantpleinement valable,
mais toutes étantplausibles.
Ceci conduit à desdiscussions
fatigantes
et sansprofit
sur les méthodesd’analyse.
’Un casclassique
est fourni par la méthode des bandes d’un semoir double enagriculture,
méthodequi fut,
à une certaineépoque,
trèspopulaire
pourcomparer deux variétés. Elle consiste dans
l’arrangement
deparcelles
.(ou bandes)
Chaque
bande a unelargeur égale
à la moitié de celle du semoir et .chaque paire
AB ou . BA est semée à un parcours aller ou retour dusemoir, qui
estpartagé
en deuxmoitiés,
une pourchaque
variété. Deux méthodes ont été recommandées pour l’estimation del’erreur,
la pre- mière étant basée sur la variation des différencesA - B,
calculées dansI08
chaque paire
de bandes A B ou BA.
d’un semoirdouble,
la secondeétant basée su.r la variation des différences
A - B,
calculées àpartir
des sandwiches A B B A. A
première
vue, la dernière estimationapparaît
comme devant être la meilleurepuisqu’elle
élimine les effets d’une variation cont-inue de fertilité dans l’estimation del’erreur,
ainsique dans la
comparaison
entrevariétés,
donnée parl’arrangement.
Cependant,
iln’y
a aucunejustification
réelle pour traiter les bandescontiguës
d’un semoir double de la même variété commeindépendantes.
Sauf le cas de défauts
possibles
dans une moitié dusemoir,
défautsqui
affecteront
toujours
la mêmevariété, l’arrangement
estpratiquement équivalent
à unarrangement
de bandes alternées desemoir
’A, B, A, B, A, B....
En
conséquence,
la deuxième méthode est, enfait,
de nature àconduire à, sous-estimer l’erreur en raison du fait que l’on
néglige
lacorrélation des bandes
contiguës,
d’un semoirdouble,
de l’une desvariétés. On
peut,
envérité,
se demanderpourquoi l’expérimentateur complique lui-même l’expérience
enpartageant
le semoir en deux moitiéset en moissonnant
séparément
les bandes d’un semoir doublecontiguës
et ensemencées avec une même variété.
L’autre alternative évidente relative à ce
type d’arrangement systéma- tique
estl’emploi
depaires
de bandes A B ou B A auhasard,
ou desandwichs A -B B A ou B A A B au hasard. Dans le dernier cas ;
chaque
sandwich est considéré cornme une unité dans l’estimation de l’erreur.Restrictions donnant lieu à une estimation viciée de l’erreur. - A
première
vue, onpeut
penser quen’importe quel type
deplan,
donnant°
lieu à une solution basée sur la méthode des moindres carrés et pour
lequel
une estimation de l’erreur est obtenuesimplement
parl’analyse
de la
variance,
peut êtreemployé.
Il n’en estcependant’
pasainsi,
carde nombreux
plans qui
se conforment à ces conditions sont telsqu’aucun procédé
derépartition
au hasard nepeut
donner lieu à uneestimation correcte de l’erreur. Un
exemple simple
est fourni par leplan
suivant(fig. 4)
.Il
s’agit
d’un carré latinà 4 rangées et 4 colonnes,
danslequel
estimposée
la restrictionsupplémentaire
que chacun des4
traitementsfigure
dans chacun des blocs constitués parles 4 quartiers
du carré. DesI09
’
plans
semblables peuvent êtreaisément
construits pour des carrés latins de diversesgrandeurs.
Une estimation de l’erreurpeut
être obtenueFig. 4. - Carré 4x4 avec une rèstriction additionnelle relative à la subdivision en blocs.
simplement
par laméthode.
del’analyse
de lavariance, puisque
ledegré
de
liberté
des blocsreprésenté
par’ v
. ,
. -
est
orthogonal,
relativement auxrangées ,
colonnes ettraitements,
et lesdeux autres
degrés
de liberté desblocs,
c’est-à-direI+II-III-IV
et I-II+III-IV
sont
respectivement équivalents
auxdegrés
de liberté desrangées
et descolonnes.
. Il y a 12
X 4.’.
1 carrés latinspossibles qui
satisfont à cette restriction.~
Parmi
eux, 4 x z{ !
’.carrés,
dont l’un d’eux est montré dans lafigure 4,
sont d’une
espèce
pourlaquelle
lacomparaison
des traitements peut êtrepartagée
en deuxtypes
a etb,
ainsi que le montre lafigure 5 :
.Fig. 5. - Contrastes dans un carré 4 x 4 .
avec une restriction additionnelle relative aux blocs.
Dans ce cas,
l’analyse
de lavariance
peut être subdivisée ainsi que lemontre la table 3
ci-après :
’
Table 3. - Analyse de la variance dans un carré 4 X 4
~ avec une restriction additionnelle relative aux blocs. ’
Avec des récoltes
données, l’espérance mathématique
du carré moyendes traitements dans
(a)
estégale
à. celle du carré moyen de l’erreur dans(a)
et celle du carré moyen relatif aux traitements dans(b)
estégale
à celle du carré moyen de l’erreur dans(b).
Dansune analyse
. ordinaire de la
variance,
les erreurs relatives à(a)
et( b)
sontgroupées
ensemble et les traitements relatifs à
(a)
et(b)
sont aussigroupés
ensemble.
Puisque
les deuxcomposantes
entrent dans desproportions
différentes dans les traitements et dans
l’erreur, l’espérance
mathéma-tique
du carré moyen de l’erreur dans cet ensemble ne sera paségale
àcelle du carré moyen relatif aux traitements
pris
dans leur ensemble.Dans les 8 x
4 !
1 modèlespossibles
restants, la subdivision ne peut pas êtreréalisée,
de la même manièresimple,
mais lesespérances
mathé-matiques
des sommes de carrés relatives aux traitements et à l’erreur .sont les mêmes. Ainsi : l’estimation de l’erreur se trouve faussée. Le fait que cette déformation de l’erreur n’est
pas,
enpratique,
de nature _à être sans
importance
se voit si nous reconnaissonsque
le carré moyen’ de
Ferreur
dans(a)
est de nature à être, enmoyenne,
notoirementplus grand
que celui de l’erreur dutype (b ), puisque
les erreurs du type(a) proviennent
des contrastes desparcelles qui
sont effectivement deux fois aussigrandes
que celles dutype ( b ).
De nombreux
arrangements semblables
sontsujets
aux mêmes types dedéfauts, mais,
en certains cas, il estpossible
d’utiliser des arrange-ments où les sommes de carrés relatifs à l’erreur et aux traitements
peuvent
être subdivisées comme dansl’analyse ci-dessus,
de manière à fournir une estimation correcte de l’erreur.Evidemment,
ceci neIII
donnera pas un test z
correct.pour
les traitements considérés dans leur ensemble.Réduction de l’erreur par
l’emploi
.d’informationssupplémentaires.
- Pour ceuxqui
sont accoutumés aux solutions fournies par la méthode des moindrescarrés,
ilapparaît qu’en plus
des constantesajustées
pourreprésenter
les blocs dans uneexpérience
de hlocs avecrépartition
auhasard,
ou enplus
des constantesajustées
pourreprésenter
lesrangées
et les colonnes dans une
expérience
en carrélatin,
d’autres constantespeuvent être
introduites,
parexemple
pourreprésenter
une variation de fertilité au traversde l’expérience.
Si une variationmarquée existe,
il ’est clair que l’on
peut espérer
quel’ajustement
d’une telle constanteconduira à des estimations
plus précises
des effets des traitements.Incidemment, lorsque
l’examen des résultatsindique qu’il
y a une,importante
variation de fertilité ou une autreirrégularité
de fertilitésimplement définie, qui
n’est pas éliminée par leplan d’expérience,
onpeut avoir recours à
l’ajustement
de constantes additionnelles.Cepen- dant,
engénérale
ceci est àdéconseiller,
à la fois en raison dusupplé-
ment de travail
qui
en résulte dans les calculs et aussi parce que lesconstantes choisies pour
l’ajustement
seront naturellement cellesqui
réduisent l’erreur
apparente.
Il peut en résulter une sous-estimationimportante
des véritables erreurs. Il y a aussi lapossibilité
que lesrésultats
soient déformés en choisissant des constantesqui
donnentlieu à des estimations
paraissant
lesplus acceptables
à d’autreségards.
L/ajustement
de résultatsexpérimentaux
parl’usage
derégression
basée sur une information
supplémentaire,
telle que lepoids
initial ’d’animaux étudiés dans des
expériences
decomparaisons
derégimes
alimentaires, est, au point
de vueformel, analogue
àrajustement
d’une ,constante pour une variation de
fertilité,
l’un ou l’autre de cesproblèmes peut
être traité par uneanalyse
de covariance.Cependant,
pourvu que la variablesupplémentaire
ne soit pas affectée par lestraitements,
cette formed’ajustement
est uneprocédure plus légitime,
parce que leplan d’ajustement précède l’expérience;
en .fait,
dans lesexpériences
decomparaisons
denourritures,
c’est lacovariance même
qui
résout leproblème
de savoir si c’est lepoids
final