R EVUE DE STATISTIQUE APPLIQUÉE
J EAN L ESAVRE
Régression linéaire et plans barycentrés dans les dispositifs expérimentaux utilisés en agronomie
Revue de statistique appliquée, tome 13, n
o1 (1965), p. 95-118
<
http://www.numdam.org/item?id=RSA_1965__13_1_95_0>
© Société française de statistique, 1965, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
95
RÉGRESSION LINÉAIRE ET PLANS BARYCENTRÉS
DANS LES DISPOSITIFS EXPÉRIMENTAUX UTILISÉS EN AGRONOMIE(1)
Jean LESAVRE
Ingénieur
àla
Directiondes Recherches de la Compagnie de
SAINT-GOBAINLorsque
l’homme désire connaîtrequelque
secret de la nature, la méthodequ’il
lui fautemployer
esttoujours
du mêmetype :
faire desexpériences
pourvoir,
pour savoir. Maisqui
ditexpériences
dit en mêmetemps
mesures, et presquetoujours répétition
de ces mesures : on enarrive fatalement au
dépouillement rationnel,
leplus
efficacepossible
des résultats, c’est-à-dire à la
statistique mathématique.
Cette
statistique appliquée apparait
donc aupremier
abord commeune recette à
posteriori
pour tirer le meilleurparti
des chiffres que l’ona pu
glaner
dans le vastechamp
despossibles. Mais,
assezvite,
le statisticienqui
sepenche
sur les donnéesnumériques
obtenues par les agronomes va faire ses remarques, sesobjections,
et finalement vadonner ses
conseils,
àpriori
cettefois,
sur lafaçon d’engager
unenouvelle
expérience.
En
effet, remarquant
tant les échecs que les réussites de certainstypes
deplans,
le statisticien en viendra àpréférer
les uns et à éliminer les autres. Ilpeut
aussi raisonner dans l’abstrait et chercher le meilleurplan possible
concernant uneexpérimentation
que souhaite fairel’agro-
nome. Dans cette recherche
théorique
il y a lieu des’épargner
touttravail inutile
puisqu’il
existe toute une littérature sur cesplans
d’ex-périences. Depuis
trois ouquatre
decennies eneffet,
à la suite de R.FISHER,
s’estdéveloppée,
dans les paysanglo-saxons
surtout, touteune école autour de ces
questions
deplanification
àpriori
desexpériences.
Nous n’avons pas
l’espoir d’ajouter grand’chose
à ces savants travaux.CRITIQUE
DE LA METHODE DES BLOCSPourtant,
devant nos insuccèsrépétés,
peu à peu s’est faitjour
une idée
qui
semble manquerquelque
peu d’orthodoxie en la matière.Nous avions à
dépouiller
de nombreux essais basés sur la méthode des blocs. Engénéral,
les agronomesavaient,
d’euxmêmes, pris
lapré-
cuation de tirer au sort la
place
dechaque
traitementà l’intérieur
dechaque
bloc. On sait en outrequ’il
y a autant derépétitions
que deblocs ,
que l’onpeut également placer
des bordures autour desblocs,
etc .---
(1) Conférence présentée aux journées d’études et de discussion des anciens sta-
giaires des Centres de Formation
Statistiques - juin
1963Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
96
Mais le
statisticien,
de soncôté, prendra
bien soin de ne pasperdre
devue
l’hypothèse
fondamentale surlaquelle
repose cetype
deplan :
lesblocs
peuvent
être de fertilitédifférente,
mais à l’intérieur dechaque
bloc, le terrain esthomogène.
Laplupart
dutemps,
cette méthode desblocs,
avecrépartition
au hasard destraitements,
nous a conduit à unéchec. Bien entendu
l’homogénéité
du terrain devait êtresuspectée.
C’étaitquelquefois
le cas, mais leshétérogénéités extraordinaires,
dutype signalé
par E.A. MITSCHERLICH[1],
sont vraiment rares. Plus souvent les choses n’étaient pas si nettes et il noussemblait que nous
avions affaireà une
hétérogénéité légère
etprogressive
d’un bout à l’autre duchamp d’expérience.
Nous doutions donc de la validité de la méthode de larépartition
au hasard des traitements sur desparcelles
variant de leur côté d’unefaçon régulière, faible,
mais non aléatoire. Maintenant le doute a faitplace
à la certitude. Voicipourquoi :
Supposons quatre
traitements :T, A, B,
C - peuimporte
en effetque T
représente
un témoin - que l’on varépéter
4fois,
donc en 4 blocs.Représentons
un certainprofil
de fertilité duterrain, compatible
avec
l’hypothèse
de la méthode desblocs,
enportant
en abscisse une distancerepérant
laposition
sur leterrain,
et en ordonnée unegrandeur
mesurant arbitrairement la fertilité.
Fig.
1Il est bien vrai que si le
champ
a ceprofil
de fertilité(figure 1),
la méthode des blocs et sa méthode corollaire de
tirage
au sort estparfaite.
Mais il faut être un pur"théoriticien"(1)
pour sefigurer
quel’agronome
pourra rencontrer ne sera-cequ’une
fois dans sacarrière,
un
champ ayant
ceprofil
en marchesd’escalier,
ou que lepiquetage
duchamp peut
venirjustement
côincider avec les discontinuités de la fertilité.Nous savons tous que la nature a horreur du vide
(jusqu’à
76 cm demercure, dira
plus précisément Pascal),
nous savonsqu’elle
a, de mêmemanière,
horreur des discontinuités - c’est à dessein que nous choisissonsun raisonnement
analogique
aussi peuconvaincant,
car nous savons bienqu’il
y a des discontinuités dans la nature, et, enparticulier,
en agro- nomie - maisjamais
ces discontinuités n’auront larégularité
souhaitable pourpouvoir
installer undispositif
basé sur la méthode des blocs . Revenons sur notreexemple (nous
l’avons tiré d’unguide
àl’usage
des
agronomes),
et faisonsl’hypothèse
d’une fertilitérégulièrement
dé-croissante de la
gauche
à la droite.---
(1)
Traduction libre et un tantinetpéjorative
de l’allemand"THEORITIKER".
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
97
Fig.2
Cette
hypothèse
est évidemmentcritiquable,
et nous savons bienqu’elle
estimparfaite,
mais elle a le mérite d’êtrevraisemblable,
etnous avons au cours de notre brève carrière
(environ
4ans)
rencontrépas mal de tels
champs
où la fertilité varie defaçon régulière (ou
peu s’enfaut).
Que
vaut la méthode de larépartition
au hasard avec cettehypo-
thèse de
régularité
dugradient
de fertilité ? Il est aisé de montrer sur notreexemple qu’elle
conduit à descatastrophes. Supposons
queT, A, B,
et C soient des traitementsidentiques,
le rendement est fonction li- néaire du rang(ici,
de 1 à16).
Ilimporte
peu que cette fonction soit croissante oudécroissante,
du momentqu’elle
est linéaire. Le rendement total pourchaque
traitement devient une fonctionsimple,
en fait unesomme
algébrique,
des rangsoccupés
par le traitement dans ledispositif.
On voit donc ici que, la fonction étant
décroissante,
on aavantagé
B et
T, qu’on peut
croire le meilleur rendement. De même on apénalisé
lourdement A que l’on
peut
croire de rendement inférieur. Seul C est estimé à sajuste valeur,
parce que 34 est bien136/4.
On en arrive àla
conception
deplans
que nousappelons "barycentrés". Ici,
34 est en effet une moyenne, unbarycentre -
ou,mieux,
unebarysomme
des rangs deparcelles.
Pour que l’estimation du traitement soit sansbiais ,
il faut et il suffit(dans
cettehypothèse linéaire)
que lebarycentre
dechaque
traitement soit au centre du terrain : rang =8,
5qui
est bien34/4 .
EMPLOI DU CARRE LATIN
Le carré latin
possède justement
cettepropriété
debarycentrage [2].
On la
néglige
un peu auprofit
d’autrespropriétés remarquables
dansl’ordre de la combinatoire ou de la
décomposition
en carrés de formeslinéaires,
mais à nos yeux cebarycentrage
total des carrés latins(lignes
etcolonnes)
estfondamental, physiquement
etagronomiquement parlant.
Cette remarque est bien dans laligne
de S. C. SALMON[3]
Kevue de Statistique Appliquée 1965 - Vol. XIII - N 1
98
qui
lui aussi cherche à étendre aux autres essaisagronomiques
desarrangements systématiques
dutype
carré latin.Reprenons
notreexemple
et essayons de former un carrélatin,
en
portant
le 1er bloc sur uneligne,
le second sur laligne
dudessous ,
etc. on obtient :Tableau I Tableau II
Nous voyons que C est correctement
disposé,
onn’y
touchera pas.Mais si l’on veut
respecter
la 1èreligne (ler bloc),
on est conduit autableau II
qui
est un carré latin - lespetites
lettresreprésentent
desparcelles qui
ontchangé d’affectation,
lesmajuscules représentent
desparcelles qui
ontgardé
le même traitement(9
sur 16 tout demême).
Ilne reste
plus qu’à déployer
le carré latin de ce tableau II.Remarquez qu’on peut
aussi bien ledéployer
parlignes
ou par colonnes :1/
parlignes :
1/
par colonnes :On pourra s’assurer que ce
dispositif jouit
de la mêmepropriété
de
barycentrage
que leprécédent.
Onpeut
aussi le voirsimplement :
dans les deux. T et A sont
inchangés,
tandis que B et Cpermutent .
Ce carré latindéployé
selon leslignes
et selon les colonnes a eneffet une
propriété supplémentaire : chaque
moitié dudispositif (gauche
ou
droite)
est elle mêmebarycentrée.
Avec une telledisposition
onpeut
faireface,
comme nous venons de levoir,
à ungradient
de fertilité constant donnant une variation linéairesystématique
d’un bout à l’autre duchamp,
mais onpeut
aussi s’accomoder d’un certaingradient
pourla
partie
droite duterrain,
et d’ungradient opposé
pour lapartie gauche . (Voir figure
n°3).
Revue de Statistique Appliquée 1965 - Vol. XIII - N" 1
99
Si nous supposons une fertilité de 1 à
8, puis
de 8 à 1 dans la secondepartie (à droite) :
T est fonction de :
(1 + 8) + (6 + 3) =
2 x 9 = 18A "
:(3+6)+(8+1)=
2 x 9 = 18B "
:(4+5)+(7+2)=
2 x 9 = 18C "
:(2+7)+(5+4)=
2 x 9 = 18La moyenne de fertilité est :
4,
5 x 4 =18 ;
bien entenduCe
dispositif
est évidemmentprécieux puisqu’il peut
donner uneréponse
sans biaissystématique
à deschamps présentent
desprofils
defertilité bien différents. Il est clair que seuls certains carrés latins - de côté
pair - peuvent
convenir pour des schémas de fertilité aussi variés . Onpeut
encore pousser un peuplus loin,
enemployant
larépétition
par
symétries
successives d’un bloc de basepris
comme motif.Ici,
il n’estplus question
de carrés latins. Voir parexemple
lafigure
n° 4 .Fig. 4
Revue de Statistique Appliquée 1965 - Vol. XIII - N° 1
100
Ce
dispositif
de lafigure
4 fait lui aussi face à 2types
de schémade fertilité.
1/ gradient
de fertilité constantoù T est fonction de :
(1
+8)
+(
9 +16) =
34A " :
(3
+6)
+(11
+14) =
34B " :
(4
+5)
+(12
+13) =
34C " :
(2
+7)
+(10
+15) =
34 =8, 5
x 42/ gradient
de fertilitéprésentant
leprofil
de lafigure
n° 4 :où T est fonction de :
(5
+5)
+(4
+4) =
2 x 9 = 18A " :
(7
+7)
+(2
+2) =
2 x 9 = 18B " :
(8
+8)
+(1
+1) =
2 x 9 = 18C " :
(6
+6)
+(3
+3) =
2 x 9 = 18 =4, 5
x 4On voit clairement
qu’il
ne faut pas allertrop
loin dans lapratique
car tout le
dispositif
repose au fond sur unehypothèse
concernant la fertilité. On auraavantage
à choisir undispositif capable
de faire face àplusieurs hypothèses,
mais leplus simple possible (profils
desfigures
n° 2 et n° 3 par
exemple).
Ledispositif s’adaptent
bien auprofil
de lafigure
n° 4 ne doit êtreadopté qu’au
seul cas où des travauxpréliminaires
ont pu établir que tel est bien le
profil
de fertilité duchamp d’expérience .
Mais ce
qui
est encoreplus remarquable,
c’est que ces diverseshypothèses
sur la fertilité du terrain ne sont pasexclusives,
et toute combinaison linéaire des troishypothèses possibles peut
êtreacceptée
par ledispositif
décrit à lafigure
n° 3(carré
latindéployé,
et doublementbarycentré).
Ces troishypothèses
sont :1/
schéma de fertilité de lafigure 1,
c’est-à-dire blocshomogènes
et distincts - nous
rappelons
que nous tenons cettehypothèse
pour trèsimprobable.
2/
schéma de fertilité de lafigure 2,
c’est-à-dire uncertain gradient
de fertilité d’un bout à l’autre du terrain.
3/
schéma de fertilité de lafigure 3,
c’est-à-dire deuxgradients opposés
dans lesparties gauche
et droite du terrain.Nous donnons à la
figure
5 unexemple
d’un schéma de fertilité ré-pondant
ensemble à ces troishypothèses.
Cetexemple
est ainsi construit :Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
101
Dans leplan
doublementbarycentré :
T est fonction de : 8
+9,5+7,5+10
=17, 5
+17, 5 =
35A " : 9
+8,5+4,5+13 =17,5+17,5=35
B "
: 9,5 + 8
+ 6+11,5=17,5+17,5=35
C "
: 8,5 + 9
+ 9 +8,5=17,5+17,5=35
Dans le
plan
tiré au hasard(celui
de lafigure 1) :
T =
17,0
+16, 0 = 33, 0
Affaibli A =18, 5
+22, 0 = 40, 5
Nettementavantagé
B =
17,0
+14, 5 = 31, 5 Désavantagé
C =
17,5
+17, 5 = 35, 0
Correct Là encore, le seul traitement C sera estimé correctement.Tout ceci pourra
surprendre,
mais nous n’avons absolument rien inventé.Nous avons du reste retrouvé chez
plusieurs
auteurs cette idéedu
barycentrage,
et, pour cefaire, l’emploi
du carré latindéployé.
Cochranet Cox
[4] l’emploient précisément
enagronomie.
Youdenl’emploie
dansun cas bien différent
[5] :
ils’agit
de déterminer la valeur de 5 lots de munitions sur ununique
canon de 16 inches. Etant donné cequ’il
saitde l’usure d’une bouche à
feu,
Youdenpréfère
àl’arrangement
au hasardun ordre de mise à feu
systématique.
Comme ces auteurs, nous avons fait usage deplans barycentrés,
excluantpratiquement
lesplans
ran-domisés,
nous les avons utilisés souvent, et nous avons cherché à enconnaître les limites et les
possibilités
exactes. Enfait,
à laréflexion,
on
s’aperçoit qu’on
utilise par cette méthode antialéatoire latechnique
de la
régression
linéaire combinée àl’analyse
de la variance.Youden,
bienentendu,
ne manque pas de faire remarquerqu’on peut
encore travailler efficacement sur un carré latinincomplet, amputé
d’une
ligne
ou d’une colonne. Dans ce cas le nombre derépétitions
estdonc inférieur d’une unité au nombre des traitements : ce
seraient,
parexemple,
5 lots de 4 obus à essayer sur le canon de 16 inches . Au lieu dedéployer
un carrélatin,
onpourrait déployer
un carré latinincomplet
ou un"Youden square".
Là lebarycentrage
n’estplus total,
Revue de Statistique Appliquée 1965 - Vol. XIII - N° 1
102
c’est sans
grande importance,
étant donnéqu’on
pourradépouiller
lecarré latin
incomplet
reconstitué selon la méthodehabituelle, partant
de la remarque combinatoire que toutes lespaires
de traitements seprésentent
un même nombre de fois. Parexemple,
onpourrait partir
du carré latin
incomplet
suivant :Tableau III
En
fait, pratiquement
enagronomie,
nous n’avonsguère planifié
de carré latin
incomplet :
il nous suffit dedépouiller
comme tels descarrés latins
incomplets
que l’on doitamputer
d’uneligne
ou d’unecolonne à la suite de mésaventures diverses :
dégâts
des oiseaux, ombred’une
haie,
etc. De toutesfaçons,
dans notreoptique
debarycentrage,
le carré latin
incomplet,
n’est paspleinement valable,
pour nous ce n’est doncqu’un pis-aller.
EMPLOI DE CARRES LATINS EMMELES
Mais un autre cas où la
technique
dubarycentrage peut apporter plus
de certitude dans les résultats est le cas desplans
à 2 n traitements et nrépétitions (n supérieur
à2).
La méthode est
toujours
la même, à base de carré latindéployé .
Mais cette fois-ci on utilisera deux carrés latins
(n
xn) emmêlés,
de tellefaçon
que lebarycentrage
soit correct. Ilpeut
êtreparfait
dans lecas où n est
pair,
il n’estqu’approché
si le nombre n derépétitions
est
impair. Traitons,
à titred’exemple,
le cas où il y a 8 traitements et 4répétitions.
Onpart
d’un carré latin 4 x 4. Rienn’empêche
de leprendre magique,
il n’en sera queplus "symétrique".
On ditqu’un
carrélatin est
magique
si l’onpeut
ledécomposer
en des blocs(comprenant
tousles
traitements)
autres que leslignes
et les colonnes. Parexemple ,
au tableau
IV,
onpeut
diviser aussi le carré latin en 4quadrants
com-prenant
bien les traitements :1, 2, 3,
4 ou5, 6, 7,
8Tableau IV
Carré latin
magique orthogonal
au suivantCarré latin
magique orthogonal
auprécédent
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
103
Parmi les deux carrés latins
orthogonaux
à[A],
rienn’empêche
dechoisir celui
qui
estégalement magique,
soit :[B].
On dit que deux carrés latins sont mutuellementorthogonaux
si, on lessuperposant,
à tout trai-tement de l’un sont associés tous les traitements de
l’autre,
une fois etune seule, bien entendu.
On verra que 1 de
[A]
est effectivement associé à5,
à6,
à 7 et à 8 de[B].
Demême,
8 de[B]
est associé à4,
à3,
à1, et à 2
de[A].
On pourra le vérifier pour les autres traitements.
Emmêlons maintenant ces deux carrés latins de
façon
à conserver unaxe de
symétrie
central. On obtient le tableau V.Tableau
V
Bien
entendu,
cettedisposition
n’est pasunique,
ni nonplus
lafaçon
dedévelopper
en uneligne unique.
Onpeut préconiser
ledévelop- pement
suivant :Bloc A Bloc B Bloc C Bloc D
On vérifiera que pour les 8 traitements la somme des rangs des 4 blocs est : 66. Et, en effet
66/4 = 16, 5 =
abscisse dubarycentre.
Rien ne
paraît s’opposer
à une extension de la méthodechaque
foisque le nombre de traitements sera
multiple
du nombre desrépétitions .
Le
barycentrage ne
pourra pastoujours
êtreparfait,
mais il existetoujours
un
optimum
facile à établir par la méthode des carrés latins emmêlés . On auratoujours avantage
à choisir des carrés latinsorthogonaux,
àcause des
paires régulièrement
formées et éventuellementmagiques,
caron
peut
alors retirer de la résiduelle une interaction due au terrain(dans
notreexemple :
interaction des 4quadrants,
2lignes,
2colonnes ,
ledegré
de liberté de cette interaction est(2 - 1) (2 - 1)
= 1.En
fait,
nous n’avons pasemployé
concrètement cette méthode. Maison voit ici se
préciser
une idéesous-jacente
à notre travail. Nouscherchons à établir des
plans "magiques",
c’est-à-dire desplans
ana-lysables statistiquement
deplusieurs façons
différentes. L’un de cesdépouillements
donnera sans doute satisfaction àl’agronome,
tandis que les autres modes le laisseront dans l’incertitude. A ce moment,l’agro-
nome
pourra
tout de mêmeconclure,
mais sanstrop perdre
de vue que letype
dedépouillement qui
lui a donné satisfactioncorrespond
à certaineshypothèses
àpriori.
Si au contraire on arrivait à des résultats contradictoires
(nous
nel’avons
jamais
constaté dans lapratique)
on serait amené aurejet
del’ensemble des données
numériques,
ou tout au moins à l’amère consta- tation que l’on obtientn’importe quoi
selon leshypothèses
àpriori,
cequi peut
se concevoir, mais enfait,
nous ne nous sommesjamais
trouvédans ce cas là.
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
104
Reprenons
notreexemple
du tableauV,
et voyons lespossibilités d’analyse
offertes par ceplan (8
x 4 =32)
On trouve :
1/
4 blocs : leslignes I, II, III,
et IV2/
4 blocs : les 4 groupes de 2 colonnescontigues -
c’est du resteainsi que nous l’avons
développé
enligne.
3/
4 blocs : les 4quadrants.
4/
enfin et surtout : 2 carrés latins(4
x4) qui
serontcomparables,
non pour des raisons de
mathématiques,
mais à cause de leur emmêlement concret sur le terrain. Et il y a toutes chances que ce soit ce dernierdépouillement
en carrés latinsqui
donne satisfaction.Il est à
peine
besoin desouligner,
dans cetteoptique
utilisant tousles
recoupements
et astucespossibles,
que les"tireurs
ausort"
se vouentau contraire à une
hypothèse unique,
et par dessus le marché à la limite de l’invraisemblance.Si nous avons bien
compris
leurmentalité,
nouspourrions
la ré-sumer ainsi : le
plan employé risque
de ne pas donner à tous les trai- tements des chanceségales,
il faut donc quel’opérateur
segarde
defixer lui-même la
place
des traitements dans ledispositif,
carplus
oumoins consciemment, d’une
part
il connaît sonchamp,
d’autrepart
il souhaite prouver lesavantages
de tel ou tel traitement.L’opérateur
nese fiant pas à lui-même aura donc recours au
hasard,
en oubliant bien entendu que le hasard ne secharge d’opérer
uneéquipartition
raison-nable que
si
le nombre detirages
est extrêmementélevé.
Tout le monde connaît la loi desgrands nombres,
mais bien peu savent que la conver- gence enprobabilité
est assez lente, il suffit de serappeler
lesexpé-
riences de Weldon sur le
jet
de dés : les rétablissements àl’équilibre
sont rares. Or, que faisons-nous avec le
barycentrage,
sinon d’établircet
équilibre
dès ledépart,
àpriori
pour ainsi dire ?CAS PARTICULIER DE 7 TRAITEMENTS
En
général
les agronomes hésitent à utiliser des carréslatins 7 x 7,
car, à
juste titre,
ils les trouvent bien onéreux. Youden a découvert desplans plus économiques - "Youden squares" 7
x3,
et 7 x 4 - quenous utilisons. Mais nous avons de notre côté découvert
(ou
crudécouvrir)
des
plans barycentrés 7
x 3 et 7 x 4qui
nousparaissent équivalents
sinonsupérieurs
aux"Youden squares" correspondants.
Les tableaux VI et VII donnent deux solutionspossibles
à ceproblème
d’économie desrépétitions.
La
propriété
fondamentale des carrés latinsincomplets (7
x3), chaque couple
de traitements nefigure qu’une
seulefois - par exemple 1, 2
dans le bloc II. Dans le carré latinincomplet (7
x4), chaque couple
de traitements
figure
deux fois - parexemple 1, 2
dans les blocs III et IV . On vérifiera que, dans le 7 x3,
la somme des rangs esttoujours égale
à 12 -qu’elle
estégale
à 16 dans le 7 x 4. Rienn’empêche
d’emmêler
physiquement
sur le terrain des 7 x 3 ou 7 x 4"Youden squares"
ou
barycentrés,
on a alors une méthode vraimentéconomique
pour traiter d’un seul coup 14 traitements parexemple
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
105
Tableau VITableau VII
Bien entendu cela ne saute pas aux yeux que les
plans
du tableau VII sontbarycentrés, mais,
pour peuqu’on
lesregarde,
leursystématique apparaîtra
clairement et ne manquera pas d’horrifier lespartisans
dutirage
au sort. Nous devons bien avouer que nous allons leur concéderquelque
chose.UTILITE DU TIRAGE AU SORT
A nous entendre on
pourrait
croire que nous devons abandonner touttirage
au sort ? Nous n’avonspourtant jamais professé
uneopinion
aussi extrême.
Et,
dans la vie courante, il nous arrive de tirer au sort pourprendre
une décision, mêmeimportante.
Cela fait sourire, mais iln’y
a pas dequoi.
Si vraiment on ne sait pasquoi faire,
iln’y
aaucune folie à
prendre
une décision àpile
ou face. Dans notre cas, commençons par affecter les traitements auxparcelles
de lafaçon
laplus systématique possible,
et si nousn’y
arrivons pasparfaitement,
alorstirons au sort, ou utilisons une table de nombre au hasard.
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
106
Prenons
justement
notreplan 7 x 4 barycentré.
Nous avons faittout le
possible
pour donner aux 7 traitements le mêmebarycentre.
Maisil reste bien clair que le traitement 1 a une
disposition originale qu’on
ne retrouve pour aucun autre.
Expérience
faite nous conseillons del’employer
commetémoin,
si témoin il y a - Les traitements 3 et 6 sontdisposés symétriquement
autour de laligne médiane,
6 aux ex-trémités,
3 dans lapartie plus
centrale sauf sur laligne
centrale -Les traitements
2, 4,
5 et7,
de laligne
centrale, sontdisposés
defaçons analogues.
On auraavantage
à choisir pour(3)
et(6)
deux trai-tements dont on soupçonne
l’équivalence,
mais l’affectation finale des traitements(3) (6)
et surtout(2) (4) (5) (7)
nepeut
se résoudre que partirage
au sort.Reprenons l’exemple
de nos carrés latins[A]
et[B]
du tableau IV.Il y a
équipartition rigoureuse
pour les 4quadrants,
du fait que les carrés[A]
et[B]
sontmagiques.
Il y a
plus
encore : le carré[A] possède
unesymétrie
de rotation :en effet une rotation d’un
quart
de tourremplace
le traitement 1 par le traitement2, puis
2 par3, puis
3 par4, puis
4 par 1 et ainsi de suite . Lasymétrie
est ici sicomplète qu’on peut
hésiter : untirage
au sortn’est pas vraiment nécessaire. Il
peut
être utilecependant,
car il existe d’autres facteurs que leterrain,
parexemple :
les ventsdominants , l’exposition
ausoleil,
etc.Par contre, le carré
[B] possède
unesymétrie
de rotationqui
n’estplus
que binaire : en effet unquart
de tour autour de centre du carrélatin, échange
bien 5 et8,
maisn’échange plus
6 et 7. 6 et 7 sont toute- fois(comme
5 et8) symétriques
parrapport
aux axes etdiagonales
ducarré latin.
Bref,
on doitdistinguer
deuxtypes
deplaces : (5
et8)
ou(6
et7)
et l’onpeut
passer d’un groupe à l’autre par aucuneopération géométrique simple.
On devra donc ici tirer au sort car ces deux groupesne
jouent
pas le même rôle.Enfin se
précise
donc lerôle,
réel mais mineur, dutirage
au sort, c’est un pur rôle d’affectation dans le cas du carré[A],
c’est unrôle un peu
plus
actif dans le cas du carré[B].
Mais c’est à notre avisun tort grave que de vouloir tracer le
dispositif
à coups de dés - ou de table de nombres au hasard - il nousparaît infiniment plus
rationnel etplus
habile de bâtir unplan hypercomplexe, barycentré
etsymétrisé
au maximum
qu’on
pourradépouiller
demultiples façons,
c’est-à-dire aufond suivant
plusieurs types d’hypothèses.
Ce
plan,
pourcomplexe qu’il soit,
aura sans doute encorequelques imperfections
de détail : on pourra essayer non pas de lespallier,
c’est
impossible,
mais par untirage
au sort, de rendre le biais ob-jectivement
aléatoire si l’on craint une tendance(aussi subjective qu’inconsciente)
à solliciter les chiffres dans un sens déterminé. Onn’a pas manqué
de nousobjecter
que l’utilisation de cesplans magiques
était un véritable tour de passe-passe et que notre honnêteté
scientifique
était
plutôt
celle du charlatan. Je suisprêt
à concéderqu’elle
aquelque
chose du
prestidigitateur.
Maisje
voudraissouligner
enpassant
deuxétats
d’esprit qui
rendent ledialogue
bien difficile entre les"tireurs
ausort" et
les"systématiques",
sij’ose
dire. Lespremiers
attendent del’expérience agronomique
un décision : on se met d’accord sur un pro- tocole(comportant tirage
au sort ounon),
on l’exécute, et l’ondépouille
le
plan
selon deshypothèses
et méthodes convenues d’avance. Iln’y
aRevue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
107
dans ce cas
qu’un
résultatpossible -
parexemple l’engrais
A est su-périeur
àl’engrais
B - dans l’absolu - du moins, on le croit. Les seconds sont des chercheursqui espèrent
tirer del’expérience
agrono-mique
unrenseignement :
ils ne veulent doncperdre
aucun élément d’in- formation et faire face à l’avance à toutes sortesd’hypothèses -
parexemple, l’engrais
A estsupérieur
àl’engrais
Bsi
la fertilité duchamp
varie
régulièrement
d’un bord à l’autre - donc connaissance toute relativeplus apte
à orienter une nouvelleexpérience qu’à justifier
une décisiondéfinitive. -
Nous allons essayer de montrer par une voie différente le bien fondé de notre
façon
de faire : choix d’unplan barycentré,
suivi d’untirage
au sortuniquement
pour l’affectation des traitements aux divers groupes deparcelles.
EMPLOI DE LA REGRESSION DANS L’ANALYSE DE LA VARIANCE Nous
parlions
à l’instant de ne pasperdre
d’information dans ledépouillement
des résultats.L’analyse
de la variancepeut
être conduite deplusieurs façons.
On agénéralement
l’habitude de conduire le dé-pouillement
des essaisagronomiques
comme si les facteurs(blocs)
étaientsimplement qualificatifs.
Ceci nousparait
insuffisant et il serait bon dene pas
perdre
de vue que les blocs se suivent sur le terrain etqu’ils
forment un
dispositif
continu. Ces niveaux du facteur(lignes
oucolonnes)
du
champ
sont donc à traiter comme des niveauxparfaitement quantifiés - on
sera évidemrnent
obligé
de se contenter d’uneapproximation
discontinue d’une variable au fondcontinue, qui
est l’abscisse ou l’ordonnée duchamp.
Pour lasimplicité
des calculs on fera choix d’abscisses etd’ordonnées,
enquelque
sorteréduites,
et lesplus simples possibles :
0,1, 2,
etc. Cette distinction fondamentale entre facteursqualitatifs
etquantitatifs
est bien connue. On la trouve, parexemple,
dans O. L. DA- VIES[6] ~ on
la retrouve chez d’autres auteurs, parexemple,
Victor CHEW[7], qui applique
cettetechnique
à la forcerequise
pourséparer
desconnexions
électriques
sous différentsangles.
Uneanalyse
de varianceclassique,
en considérant les niveaux du facteurangle
de traction commequalitatifs,
laisse croire que,jusqu’à 6°,
la force moyenne de traction n’est passignificativement
influencée parl’angle -
cequi
est biendouteux,
d’autantplus qu’une analyse
derégression
de la force surl’angle indique
clairement que cette force croit
régulièrement
avecl’angle
etqu’un ajustement
linéaire convient. Dans le cas concret del’agronomie
lesvariables de
position
serontéquidistantes
et on pourra faire un usage constant de la méthode dedécomposition
en effetslinéaires, quadratiques ,
etc. par les
polynômes orthogonaux
deTchebycheff-Fisher.
Ces méthodesne sont
guère compliquées,
mais nous avons voulu les rendre encoreplus simples,
sipossible.
Actuellement dansl’analyse
de variance clas-sique
on faitl’hypothèse
de blocshomogènes,
pour ne pas dire d’un terrainhomogène.
Nous considérons au contraire les résultats agrono-miques, portés
sur la verticale des centres dechaque parcelle,
commeformant un nuage de
points.
Par cet ensemble depoints,
nous faisonspasser un
plan
derégression passant
au mieux par tous lespoints,
etce n’est
qu’après
avoir retiré cet effetlinéaire,
attribué auchamp,
quenous faisons une
analyse
de variance -qui
seragénéralement
bienplus
fine et bien
plus
décisive quel’analyse globale classique.
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
108
Mais il y a, pour ce
faire,
une condition : ceplan
derégression
doit être bien
caractéristique
du terrain et ne doit pasdépendre
destraitements et de leur
disposition.
On voit bien que si les traitements donnant un haut rendement sontgroupés
à un bout duchamp,
si les trai-tements à faible rendement sont
groupés
àl’opposé
despremiers -
etla
répartition
au hasardpeut
conduire à un teldispositif -
leplan
derégression
n’a aucunesignification
réelle pour le terrain et laisserait même croire que tous les traitements sontéquivalents.
Il faut donc ré-partir judicieusement
les traitements sur lesparcelles,
et ilsuffit,
pour obtenir unplan
derégression
bien correct, que les traitements soientbarycentrés.
En effet si tous les traitements ont bien mêmebarycentre ,
celui du
terrain,
aucun traitement ne viendra peser sur leplan
de ré-gression,
et aucun effet linéaire(des lignes
ou descolonnes)
nepeut provenir
des traitements. S’il y en a un, nous sommes donc bienobligés
de l’attribuer au terrain. Voilà donc l’essentiel de
l’avantage
duplan barycentré
sur leplan
randomisé : on a par cetteméthode, séparé
uneffet terrain
(linéaire)
des effets d’ordresupérieur qui,
eux,peuvent
être dus soit auxtraitements,
soit au terrain. Nous repoussons ainsi un peuplus
loin l’incertitudequi plane toujours
sur les essaisagronomiques
oùl’on
risque
souvent de confondre l’effet traitements et l’effet terrain . Bien sûr on pourraobjecter
que si l’effet terrain estquadratique,
par
exemple,
au lieu d’êtrelinéaire,
leplan barycentré
ne pourra quenous induire en erreur, et nous faire attribuer aux traitements ce
qui
est dû en fait au terrain. C’est un
risque
à courir, mais ledanger
d’unelourde erreur est néanmoins très faible. En effet nous saurons que l’effet linéaire est très
petit, puisque
nous le calculons, et notre attention sera alertée. Mais en fait cela se passeplus simplement,
etl’expérience
nousa montré que l’effet linéaire était
dominant,
et c’est même cequi
nousa
aiguillé
vers cesplans barycentrés,
siéloignés
desplans
randomisés . Onpourrait espérer
trouver desplans
éliminant les effets linéaires etquadratiques
dûs auterrain,
en fait nos recherches, assez limitées du reste, nous onttoujours
ramené au carrélatin, dispositif
anti-hasard s’il enfut,
maisparfaitement
bien admis pour leschamps d’expériences agronomiques.
Pour finir nous allons donner unexemple
détaillé de 7 x 4barycentré.
EXEMPLE
Plan 7 x 4
barycentré
et sondépouillement statistique.
Ils’agit du plan
dont le schéma est donné au tableau VII.Les résultats sont les suivants : Tableau VIII
Revue de Statistique Appliquée 1965 - Vol. XIII - N’ 1
109
Il
s’agit
d’une cultured’orge -
laparcelle
est de2,16
ares -les résultats sont en
kg -
unelégère
modification des chiffresoriginaux
nous a
permis
de les rendre tousmultiples
de0,28 (pure simplification
de
calcul).
DdL La somme des carrés
générale
est :791,0560
27Le carré de l’effet linéaire des
lignes
est :152, 3168
1Le carré de l’effet linéaire des colonnes est :
47,7478
1 La somme des carrés restante est :589,99M
25L’ajustement
linéaire pour leslignes
est le suivant :Valeurs
expérimentales : 44,45 - 45,22 - 45,36 - 52,78 - 50,12- 51,66-49,49
Valeurs
ajustées : 44,93 -46,10-47,27 -48,44 -49,61- 50,78-51,95
Pour les colonnesl’ajustement
linéaire est le suivant :Valeurs
expérimentales : 45,92 - 49,04 - 48,96 - 49,84
Valeursajustées : 46, 688 - 47,856 - 49, 024 - 50, 192
On
peut
établir facilement le tableau del’ajustement
linéaire sachant que la valeur laplus
faible(en
haut et àgauche)
est :43, 178.
Le sautpar
ligne
est : +1, 170
et le saut par colonnes est : +1, 168.
On obtient le tableau IX.
Tableau IX
On pourra vérifier que la somme des carrés des valeurs du tableau IX
(B)
est bien :589, 9914
pour DdL = 25.On
procède
alors à latransposition
habituelle à la méthode desblocs,
ou l’on faitapparaître
les traitements et où l’on conserve les colonnes. On obtient le tableau X.On remarquera, et ceci est bien normal, que les colonnes moyennes des traitements : tableaux X
(A)
et(B)
sontrigoureusement équivalentes ,
à une translation de
48,44 près
c’estjustement
la moyennegénérale .
Ces deux tableaux ont donc la même somme de carrés en ce
qui regarde
les traitements. Il est donc
parfaitement
inutile de faire tous ces calculs et d’établir tous ces tableaux : seuls sont utiles les 2 tableauxqu’on
considère habituellement : tableau VIII
(B)
et tableautransposé
X(A).
Nous ne les avons faits ici
qu’à
titred’exemple
et dejustification
concrète de la méthode.
Revue de Statistique Appliquée 1965 - Vol. XIII - N 1