R EVUE DE STATISTIQUE APPLIQUÉE
J EAN L ESAVRE
Régression quadratique dans les dispositifs expérimentaux utilisés en agronomie
Revue de statistique appliquée, tome 16, n
o3 (1968), p. 75-97
<
http://www.numdam.org/item?id=RSA_1968__16_3_75_0>
© Société française de statistique, 1968, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
75
RÉGRESSION QUADRATIQUE DANS LES DISPOSITIFS EXPÉRIMENTAUX
UTILISÉS EN AGRONOMIE
par Jean LESAVRE Ingénieur de Recherches
àl’UVEX
Compagnie de Saint-Gobain Chalon-sur-Saône
Il y a une dizaine d’années nous travaillions en collaboration avec
les agronomes du
Groupe
Saint-Gobain. Cettecollaboration,
saison- nière etépisodique, qui
a laissé chacun sur son terrain :l’agronome
surses
champs d’expérience,
et le statisticien sur les chiffres que le pre- mier voulait bien luisoumettre,
nous avaitdéjà permis quelques
fruc-tueuses réflexions. Et comme les
mathématiques
couvrent le vaste do-maine des
sciences,
il s’est trouvé que des méthodes mises aupoint
pour
l’agronomie
se sont révéléesapplicables
au domaine verrier.De ce
dialogue
entrespécialistes
sont nés lesplans d’expérience barycentrés -[1]-
Unecritique
de la méthode desblocs,
et la constata- tion de l’existencefréquente
d’un effet linéaire dû très certainement auterrain et non aux
traitements,
nous ontconduit,
dans cette étude pu- bliée en1965,
à la mise aupoint de plans
aussi peu aléatoires quepossible, puisqu’ils
sontbarycentrés -
niplus
ni moins que les carrés latins.Or,
chosecurieuse,
si les carrés latins sont admis par tous, onpréfère
assezgénéralement,
dès que ledispositif perd
sa structurecarrée,
se confier au hasardplutôt qu’à
lasystématique
d’unerègle,
or le
barycentrage
n’estqu’un
reflet atténué de la"latinité"
des carréslatins, puisque
danschaque
colonne et danschaque ligne
on trouve unefois et une seule
chaque
traitement. Cetype
de combinatoireimpose
comme
conséquence
lebarycentrage,
mais laréciproque
n’est pas vraie Sur cettequerelle
des"tireurs
ausort"
etdes "systématiques",
segreffe
uneplainte
desexpérimentateurs : "vos analyses
de variance nesont pas assez
fines,
il nous faudrait unajustement plus
étroit auxchiffres souvent si
péniblement collectés" ; bref, n’y
a t-il pas moyen de diminuer cetécart-type
résiduelqui
est l’étalon de mesure de cesdifférences, qui
nousparaissent,
à nous, bien suffisammentsignifica- tives,
et que vous trouvez, vous,statisticiens,
si peu souventsignifica- tives,
à votre niveau deprobabilité
de 5%" ?
Le
statisticien,
ouplutôt
lemathématicien,
varépondre : "Vous
n’êtes pas satisfaits de
l’ajustement linéaire,
eh bien I passons à l’échelleau-dessus,
c’est-à-dire tentons sur vos chiffres unajustement quadra- tique".
Ce n’est pasqu’en passant
du 1er au seconddegré
on ait trouvé là une formulemagique,
c’estsimplement
que dans l’ordre descompli-
cations c’est la
plus simple qui
seprésente
à nous :après
leplan
ho-rizontal,
sij’ose dire,
c’est-à-direhypothèse
du terrainhomogène
et randomisationtotale,
nous trouvons leplan
depente quelconque
et larégression linéaire,
c’est-à-direhypothèse
d’ungradient
de fertilité cons-tant,
puis aujourd’hui
laquadrique
et donc larégression quadratique,
c’est-Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
76
à-dire une
hypothèse
assez difficile àpréciser
pour leprofane,
maisqui
assimile la surface des rendements duchamp
à une surface du se-cond
degré.
Ces deux dernières
hypothèses,
de linéarité et dequadraticité ,
nous inclineront à faire choix de
plans barycentrés,
dont nous savonsqu’ils existent,
et même deplans barycentrés qui
seraient aussi qua-dratiquement orthogonaux.
Ces derniers vocablesdésignent
une réalitéassez claire pour nous, mais il est infiniment peu
probable
que de telsplans
existent. Lebarycentrage
al’avantage
de nous mettre à l’abri desvariations linéaires rencontrées dans le
champ :
les américains -[2] -
diraient que lebarycentrage permet
d’obtenir unplan "robuste"
contreles effets linéaires. Nous doutons que des
plans puissent
être totalement robustes contre des effetsquadratiques.
Cette méthode de la
régression quadratique,
surlaquelle
nous fon-dons les
plus grands espoirs,
arrive à son heure pourremplacer
l’ana-lyse
de varianceclassique, qui
demande unplan
trèsstrict,
mais peu de calcul dans ledépouillement
des résultats. Cette nouvelleapplication
d’une méthode par ailleurs bien
classique
se contentera d’unplan
assezquelconque,
maisexigera
des calculs absolument inabordables au pauvre calculateurmanuel,
même armé d’une machine de bureau. Une calcula- triceélectronique
estindispensable :
songezqu’il
faudra inverser unematrice, symétrique
sansdoute,
mais d’ordre 10 au minimum. Bien sûr l’astucemathématique rejoindra
le sensagronomique
pour essayer de rendre cette matrice aussi facile à inverser quepossible,
c’est-à-dire à ladiagonaliser
au maximum.Voyons
cela d’un peuplus près.
PRINCIPE DE LA REGRESSION
QUADRATIQUE
Nous supposons que le
champ
estrapporté
à deux axes Ox etOy.
Pour
simplifier,
nous supposerons que lesparcelles
limitées par des droitesparallèles
aux axes ont un rendement uniforme. Nous nous ren-dons bien
compte
de lafragilité
de cettehypothèse,
mais il faut bien s’en contenter. Sinon on serait amené à considérer le rendement d’uneparcelle
commel’intégrale
d’une certainesurface,
cequi
n’est pasimpos-
sible avec le calculélectronique,
mais laissons cettecomplication
pour l’instant.Chaque
centre deparcelle
sera caractérisé par 3paramètres :
1/
le traitement de cetteparcelle,
2/
sonabscisse, 3/
sonordonnée,
et un
résultat,
parexemple
lepoids
récolté dans laparcelle.
Bien
entendu,
toutes lesparcelles
sontd’égale superficie.
Mais c’est une facilitéqu’on
sedonne,
cela n’est pasindispensable.
Si lesparcelles
étaientlégèrement inégales,
ilsuffirait,
parexemple,
de di-viser le
poids
récolté par la surface de laparcelle,
donc de ramenerau
m2,
ou à l’are. Il ne faudrait pas, biensûr,
que cetteinégalité
soittrop importante,
car on introduirait de nouvelles causesd’hétérogénéité.
Bien
entendu,
il sera admis que l’ensemble desparcelles
formentun
champ rectangulaire,
limité par desparallèles
aux axes Ox etOy.
Mais là encore c’est une facilité
qu’on
sedonne,
lechamp
pourra avoirRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
77
une forme
quelconque,
sous la réserve que ses limites restent des seg- ments de droiteparallèles
aux Ox etOy.
Il sera encore admis que les traitements sont en nombres
égaux,
mais ce n’est pas
nécessaire,
lesrépétitions
d’un même traitementpourront
être différentes d’un traitement à l’autre.Bref,
avant même depréciser
cequ’est
larégression quadratique ,
nous voyons que toutes les contraintes usuelles
qui pèsent
si lourdementsur les essais
agronomiques
sontdéjà
considérablementassouplies,
pra-tiquement
anéanties. Ce sont donc desavantages
indirects offerts par cette méthode derégression,
ou si l’onanalyse
mieux lachose,
cesavantages
sont en fin decompte procurés
par lespossibilités
extraordi-naires du calcul
électronique.
Il faut tout de suite remarquer que lasimple régression
linéaire offriraitdéjà
à peuprès
les mêmesavantages,
maisqu’en fait,
elle n’est pas encore entrée dans lapratique
courante .Espérons
que nous n’allons tout de même pastrop
loin et que la méthode de larégression linéaire,
et mieux encore celle de larégression
qua-dratique,
ferontpartie
trèsprochainement
de l’arsenal des méthodes cou-rantes de
dépouillement
de résultatsagronomiques.
Choix de la formule
quadratique
àajuster
En effet un choix est
nécessaire,
ilcorrespond
à diverseshypo-
thèses
qu’on peut
faire sur lecomportement
de nos traitements. Dansun
premier temps,
nous allons fairel’hypothèse
que lestraitements,
et le témoin s’il y alieu, réagissent
de la mêmefaçon
au terrain : les traitements auront bien sûr des différences entredeux,
mais le terrain les marquera tous de la mêmefaçon,
et iln’y
auraqu’une
seule for- mulequadratique
pour tous les traitements. Nousajusterons
donc uneformule du
type :
Ce résidu sera
gaussien,
de moyenne nulle et on cherchera à en minimiser la varianceEn
pratique
cette formuled’ajustement
se révèle assez peu fruc-tueuse,
et l’on se voit contraint deprendre
certainesprécautions :
1/ x et y
seront des variablescentrées, équidistantes
de l’unité - c’est-à-direqu’on préfère
travailler sur des unitésréduites,
ou norma-lisées, plutôt
que sur deslongueurs
oulargeurs
enmètres,
ou décamètres parexemple.
Ainsi si(x)
est à 3niveaux,
ona : -1,0
et + 1si
(y)
est à 4niveaux,
on a :-3/2, -1/2, +1/2
et+3/2
Si le
plan
n’est pasclassique,
ou si certaines données d’unplan
clas-sique
sontmanquantes,
on ne cherchera pas à centrerparfaitement
lesvariables
(x)
et(y),
on se contentera d’uncentrage approximatif,
maison conservera
soigneusement l’équidistance
de1, 0.
2/
x2 ety2, représentent
les carrés de variables réduites etgéné-
ralement centrées. Là encore on
préfère
travailler sur des variables centrées ; visiblementx2
ety2,
des carréstoujours positifs
ne sont pas centrés. On utilisera undécalage
pouropérer
cecentrage :
cette mé- thode estclassique,
c’est celle despolynômes orthogonaux
deTchebycheff-
Fisher. La formule
qu’on
va chercher àajuster
sera dutype :
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
78
x et y sont des variables centrées et normalisées.
03B12 dépend
du nombre de colonnes duplan
etp2 dépend
du nombre delignes
duplan.
Ils sontparfaitement
connus et fixés dès que leplan
est fixé. La formuledépend
donc de 5paramètres
Comme on doit déterminer en mêmetemps
ntraitements,
il faut donc que les essais soient assez nombreux pourpermettre
la détermination de(n
+5) quantités.
Ce seragénéralement
le cas. Nous voyons tout de suite une restriction : nous excluonsimplicitement
tous lesplans qui
necomporteraient
que 2lignes
ou 2colonnes,
car alors on sera dans l’im-possibilité
de calculer uneffet "carré" ;
dans ce cas nosparamètres (c)
ou(d)
nepourraient
être quenuls,
et d’aucune utilité dansl’ajuste-
ment. Bref nous commençons avec un
plan comportant
au minimum 9 essais : 3lignes
et 3colonnes ;
s’il y a, parexemple,
3 traitementsrépétés
3fois,
la solution estpossible puisque :
3 + 5 =8,
mais la résiduelle n’auraqu’un
seuldegré
deliberté,
cequi
est peu.Dans un deuxième
temps
nous voudrions ne faire aucunehypothèse
sur les réactions traitements - terrain.
Chaque traitement,
éventuelle- ment letémoin,
seraitreprésenté
par une certaine formulequadra- tique particulière.
On aurait donc n formules :Nous voyons donc que cela fait 6
paramètres
par traitements : il faudrait donc au moins 6répétitions
par traitements. Nul doute que les agronomes ne trouvent leprocédé beaucoup trop
coûteux. Onpeut
cepen- dant fairequelque
chose dans cette voie. Du fait que desrépétitions inégales
sont maintenantpossibles,
sanscomplication supplémentaire ,
on
peut répéter
le témoin mettons une dizaine defois,
etajuster
uneformule
quadratique
pour le témoin. Les traitementsrépétés
un nombretrop
faible defois, pourront
êtregroupés
en blocsd’importance
suffi-sante pour
ajuster
une formulequadratique.
Onpeut espérer
alors com-parer ces diverses formules
quadratiques,
et fixer un peu les réactions traitements -terrain.Dans le but de ne pas
trop
alourdir notre texte nous ne donneronsqu’un exemple
derégression quadratique.
Il sera traité in extenso, etnous
espérons
ainsi êtredispensé
de faire la théoriegénérale,
tout endonnant des indications
pratiques
bien suffisantes pourqu’on puisse
enfaire
l’application
à des cas nouveaux. Enfait,
cetexemple
ne sera que faiblementconvaincant,
mais nous ne pouvonsqu’insister
sur la sou-plesse
de cetterégression quadratique, qui peut
s’affranchir en fait de toutes les contraintesclassiques
d’uneplanification
d’essaisagronomiques, répartition
enblocs, régularité
duplan,
etc... On pourra eneffet,
aveccette
méthode, envisager
une randomisationtotale,
si chère à tantd’agro-
nomes et de
statisticiens,
au détriment toutefois de larigueur
dansl’analyse
de variance.Bref,
la nouvelle contrainte sur leplan d’expériences
seralégère
et assez subtile : il
faudrait,
et ce n’est même pasnécessaire,
rendreaussi
diagonale
quepossible
une certaine matricequ’on
a la nécessitéd’inverser.
Par contre même si finalement nousallons, après régres-
sion
quadratique,
aboutir à uneanalyse
de variance encore assez voisine de celle que nous avons l’habitude defaire,
il n’estplus possible,
de fairedes
calculs "à
laplume".
Sil’agronome
utilisaitdéjà
le calcul électro-nique
à cause du volume de sescalculs,
il lui est maintenantindispen-
sable à cause de la difficulté
intrinsèque
dudépouillement
duplan
leplus
élémentaire.Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
79 EXEMPLE DE REGRESSION
QUADRATIQUE
C’est
l’exemple déjà précédemment analysé
dans l’article de laRevue de
Statistique Appliquée -
1965 - Vol. XIII - N° 1 - à la page 108 Ils’agit
d’une cultured’orge -
laparcelle
est de2, 16
ares.- les résultats
(tableau B) sont
enKg -
unelégère
modification des chiffresoriginaux
nous apermis. de
les rendre tousmultiples
de0,28 (pure simplification
decalcul)
- le
plan (tableau A)
est un 7 x 4barycentré,
faisant interve- nir un témoin T et sixtraitements, qui
sont desengrais.
- le tableau N nous fournit une numérotation des essais pour
qu’on puisse s’y
retrouver.les abscisses des
quatre
colonnessont : - 1, 5, - 0,
5, +0, 5, + 1, 5
et(x2 - 1, 25)
donne :+ 1,0, - 1,0, - 1,0, + 1, 0
De même les ordonnées sont :- 3, - 2, - 1, 0 + 1,
+2,
+ 3et
(y2 - 4, 00)
donne : +5, 0, - 3, - 4, - 3, 0,
+ 5On a maintenant la
possibilité
d’établir la matriceX
et le vecteur colonneY (ici
ce seraitplutôt Z
ouB).
Cette matrice
X
estclassique
dans lesproblèmes
derégression.
Elle
comporte
28lignes,
c’est-à-dire autant que de résultats - 7 colonnes pour les traitements + 5 colonnes pour larégression quadratique,
soit12 colonnes au total. Nous pensons
qu’il
est tout de même utile de la donner in extenso.(Voir
page80).
Elle se compose de deux
parties :
la lèrepartie, composée
de 7colonnes,
est relative aux traitements.Elle comporte
des 1 et des 0 - pourplus
desimplicité
les 0 ne sont pasfigurés -
la 2èmepartie
estformée des abscisses et ordonnées de leurs carrés recentrés par déca-
lage,
et de leurproduit (xy)
termed’interaction.
L’étape
suivante du calcul consiste à établir la matrice des mo-ments : c’est le
produit
de la matriceX
par satransposée X’,
soit(X’X).
Ici cette matrice est d’ordre12,
elle estsymétrique (voir
page81).
Cette matrice n’est pas exactement la matrice des moments cen- trésclassique.
Mais elle secomporte
et seprésente
exactement de la même manière. En effet les traitements sontreprésentés
par des 1(pré- sence)
ou des 0(absence),
cette variable du genre booléen n’est pas cen-trée,
c’est évident. Mais du faitqu’une parcelle
nepeut
contenir à la foisplusieurs traitements,
leproduit
de deux vecteurs"traitements"
sera
toujours
nul. Ou si l’on veut le 1 est exclusif etimpose
des 0 dans tout le reste de laligne,
pour les autres traitements.Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
80 Matrice X
Somme des carrés de tous les termes du vecteur colonne Z =
66.491,1968
terme correctif = 65.700,1408 Somme
générale
des carrés =791,0560
pour : 27
Degrés
de Liberté Total = 1.356,32Moyenne = 48,44
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
81 Matrice
(X’X)
Donc cette matrice
X’X
sedécompose
en une 1èrematrice, diago- nale,
necomportant
que des 4 dans ladiagonale (4
est en effet le nombre constant desrépétitions
dechaque traitement) -
en une 2ème matricele
plus
souventdiagonale ;
si leplan
estrectangulaire
etcomplet,
cette matrice estdiagonale ;
ici ellecomporte
les termes35, 112, 28,
336et 140 et des zéros
partout
ailleurs - et enfin en deux matrices rec-tangles (t, 5) (5, t) symétriques,
dont les termes serontgénéralement
différents de 0. Ici la matrice s’abaisse à l’ordre 9. En effet du fait que nous avons des blocs de 7 traitements : les
colonnes,
l’effet linéaire(x)
et l’effet carré(x2 - 1,25)
sont bienorthogonaux
aux traitements.Un certain effet
cubique
le serait aussi : nous le laissons se fondre dans larésiduelle.
Du fait dubarycentrage
l’effet linéaire(y)
estaussi orthogonal
aux traitements. Voilà donc le faibleavantage apporté
par lebarycentrage.
Au
point
de vue ducalcul,
on nepeut
même pas dire que la mé- thode des blocs avec traitementsbarycentrés apporte grand’chose :
detoutes
façons
la matrice(X’X)
esttrop
difficile à inverser à laplume,
et il faut passer au calcul
électronique.
Par contre aupoint
de vue con-ception
duplan
et réalisation concrète del’essai,
il ne nousparaît
pas indifférent de savoirqu’ici
un effet linéairequelconque
selon les(x)
etles
(y)
etqu’un
effet carré selon les(x)
n’ont aucune influence sur la détermination des traitements(et réciproquement).
Cetteorthogonalité
des traitements et des
propriétés
du terrain est tout de mêmeprécieuse , puisque
les uns n’ont pas lapossibilité
de biaiser les autres ; mais onvoit bien
qu’elle
n’est pas nécessaire. C’est un pur soucid’élégance
etde clarté
qui
nous faitpréférer
cesplans équilibrés
etbarycentrés
àdes
plans
randomisés.Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
82
Supposons
maintenant que nous fassions encore unplan 7
x 4 = 28parcelles,
que nous utilisions une randomisationtotale,
et que nous ayons la malchance de devoirnégliger
le résultat(certainement)
aberrant oumanquant
d’uneparcelle,
que devient la matrice( X’X ) ?
La lère sous-matrice
considérée,
celle des 7 traitements conser- vera sa structurediagonale,
mais l’un des 4 de ladiagonale
sera rem-placé
par un3,
pour larépétition manquante
d’un destraitements.
La 2èmesous-matrice,
celle del’ajustement quadratique,
ne seraplus
dia-gonale
du fait de laparcelle manquante.
Les deux matricesrectangles (7,5) (5,7)
necomporteront pratiquement plus
de terme nul. On auradonc une matrice que nous ne pouvons pas nous
empêcher
de trouverquelque
peucafouilleuse,
mais dont effectivement l’inversion ne va pasprésenter
de difficultésparticulières,
sauf malchance extraordinaire due à une randomisation partrop singulière.
Enfin dernière
question
sur cette matrice(X’X), peut-on espérer
rendre les matrices(t, 5) (5, t) identiquement
nulles ? Autrementdit, peut-on espérer
trouver desplans,
desdispositions
sur leterrain,
tels les traitements soientorthogonaux
aux effetslinéaires,
aux effetsquadra- tiques
et auproduit
des deux effets linéaires ?Les
plans
en carréslatins,
du fait des blocs rencontrés tant dans leslignes
que dans lescolonnes, répondent
bienpartiellement
à laquestion :
les traitements y sont bienorthogonaux
aux effets linéaireset aux effets
quadratiques proprement dits,
mais leurpoint
faible estbien connu : ils ne rendent pas
compte
d’une interactionpossible
entreles facteurs
ligne
et colonne. Maiscompte
tenu de cette remarque onpeut
tenter undépouillement beaucoup plus
fin des carrés latins.DEPOUILLEMENT AFFINE DES CARRES LATINS
Là encore nous ne chercherons pas à faire la théorie dans le cas
général,
mais nous allons donner in extenso unexemple
de carrés la-tins,
cequi permettra
à la. fois de saisir la méthode etd’appliquer
cettenouvelle méthode à des cas
particuliers.
Le carré latin considéré n’est pas un carré latin
agronomique.
Ils’agit
d’essais de fluorescence X sur uneplaque
de verre, mais l’ana-logie
est évidente entre lechamp
et laplaque
de verre, entre les coupscomptés
et les récoltes faites sur lesparcelles.
C’est un carré latin4 x
4 = 16,
dutype bidiagonal,
où les traitements(T, A, B, C)
sonten fait des
températures
d’essai. Tdésignant
un véritabletémoin,
comme dans les essaisagronomiques.
Lanumérotation,
ledispositif
et les ré-sultats sont donnés dans les 3 tableaux suivants :
(P) (Q)
et(R).
Estimation des traitements :
Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
83
Les
abscisses : x sontcomptées positivement
degauche
à droiteet sont fixées aux valeurs conventionnelles : -
1, 5, -
0,5,
+0,
5,+ 1, 5.
Les ordonnées : y sont
comptées positivement
du haut vers le baset sont fixées aux mêmes valeurs
conventionnelles, équidistantes
de l’u- nité.Pour les traitements on les supposera
toujours rangés
dans le même ordre :T, A, B, C,
cequi permettra
de calculer un effetlinéaire ,
un effet
quadratique,
un effetcubique ;
l’ensemble des 3 effetsrepré-
sentera la variabilité
"traitements", globalement
nousdésignons
les traitements par la lettre : z. Nous avonsdistingué
les effetslinéaires, quadratiques,
etcubiques
par la méthodeclassique
despolynômes
ortho- gonaux deTchebycheff-Fischer,
3.Dans cette
optique
la matriceX (voir
page84),
habituellement con-sidérée pour l’établissement de la
régression comporte
16lignes :
les16 éléments du carré latin - et 10 colonnes : une colonne de
1, 0 (pour
le calcul de la
moyenne),
trois colonnes pour les effets abscisses et ordonnées du carré latin soient :et’
L : Linéaire
Q : Quadratique
C :
Cubique
De même les effets traitements sont au nombre de trois :
Le vecteur colonne
Y rappelle
les donnéesnumériques déjà
four-nies sous la forme d’un tableau carré
(4
x4) (tableau R).
Nous avonsrangé
ces colonnes dans un ordre insolitequi s’expliquera
de lui-mêmeun peu
plus
loin. La 11ème colonne contient leproduit (x linéaire)
par(y linéaire) ;
elle estignorée
dans ledépouillement classique.
La 12èmecolonne est
justement
le vecteurY,
les résultatsnumériques
àanalyser.
Puis on établit la matrice des moments
centrés,
ou desproduits croisés,
enmultipliant
la matriceX
par satransposée X’.
De même on calcule le vecteur colonneX’Y.
Cette matrice estsymétrique
et d’ordre 10. Il faut calculer la matrice inverse : ici du fait duplan
en carré la-tin et des
orthogonalités qu’on rencontre,
la matrice estdiagonale,
doncdirectement inversible en
prenant
l’inverse dechaque terme,
cequi
esttout de même
simple.
On obtient donc enmultipliant
la matrice inverse par le vecteurX’Y
tous lesrenseignements
souhaitables :La moyenne :
puis :
Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
84
Matrice
X (Corrélation)
Matrice des moments centrés
X’ X
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
VECTEUR
85
De même on
peut
fairel’analyse
de variancecorrespondant
à cetterégression :
ici elle estparticulièrement simple
et la matrice descarrés ,
ou des
variances,
se réduit aux termes de ladiagonale principale.
Lasomme des
carrés,
relative au vecteurY
serépartit
entre un termedominant,
dû à la moyenne, souventappelé
termecorrectif,
entre 3 x 3 = 9termes
(abscisses, ordonnées, traitements) (linéaire, quadratique,
et cu-bique)
et un résiduqu’on
obtient par différence. Ici onpeut
même le chiffrer directement et facilement en considérant les deux carréslatins , orthogonaux
au carré latinconsidéré,
et formant la famillecomplète
des carrés latins
orthogonaux (ici
4 x 4bidiagonal).
Les termes non
figurés
sont nuls.Somme des carrés terme correctif
4.194,6875
14.871,6875
40.842,1875
1er carré latin
orthogonal
2ème carré latin
orthogonal
On pourra vérifier que le 1er terme est
égal
à la somme des 12autres. L’ennui de cette méthode est
l’escamotage
de nos traitementsT. A. B. C,
dont nous n’avons pas d’estimation directe. On les rétablira parapplication
de la formule derégression trouvée,
et on pourra con- trôler l’exactitude de cette formule enappliquant
la méthodeclassique
de
dépouillement
des carrés latins. Ainsi parexemple,
nous pouvons calculer la valeur deT,
enremarquant
que le traitement Témoin esttoujours
lepremier
dans laséquence T, A,
B, C. Ses valeursrepères
sont donc :
- 1, 5 pour l’effet linéaire
( zL )
+ 1, 0
pour l’effetquadratique (zQ)
et - 0, 3 pour l’effet
cubique (zC)
Il ne reste
plus qu’à multiplier
ces valeurs par les coefficients derégression correspondant, qu’on
a calculés ci-dessus.Donc T =
610,3125 - 1,5 (+37, 875)
+ 1,0(- 10,9375) -
0,3(+37,7083. )
=moyenne
zL
zQ zcRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
86
soit T = 531, 25
qui
estégal à
la déterminationclassique : 1/4 [542, 0
+538,0
+529,0
+516,0].
Pour éviter toute
ambiguïté,
nous donnons les valeursrepères
con-cernant les 4 traitements.
Effet Linéaire Effet
Quadratique
EffetCubique
Ces valeurs étaient
déjà
données dans la matriceX
de la page 84 . On y reconnait les coefficientspermettant l’ajustement
despolynômes orthogonaux
deTchebycheff,
à celaprès qu’on
a divisé les coefficients entiers habituels par le coefficientgénéralement appelé 03BB, qui
apréci-
sément pour fonction de nous faire travailler sur des nombres
entiers ,
ce
qui
est commode en calcul à laplume,
très utile pour laprécision
des
calculs,
maiscomplique
l’estimation des carrésemportés
par larégression.
Mais
l’avantage
de ce calculartificiel,
et un peuplus compliqué ,
des traitements tient dans ce fait
qu’on peut maintenant,
sans aucunedifficulté,
introduire dans la formuled’ajustement
un terme croisé en[xy],
bref un termed’interaction, qui
ne saurait être totalement ortho-gonal
à tous les autres termesdéjà
considérés. La matrice(page 84),
aux 16
lignes, comporte
une nouvellecolonne,
lallème,
formée par leproduit
des variables fictives(xL
xyL ).
La matriceX’X
des moments centrés est d’ordre 11(page 84)
mais heureusement ons’aperçoit qu’elle
s’abaisse à l’ordre 3. En
effet,
à cause duplan
en carrélatin,
la matriceX’X
est une matricediagonale,
en cequi regarde
des dixpremières
colonnes : moyenne, effetslignes,
effets colonnes et effets traitements seronttoujours orthogonaux
pour un carré latin. Il nous reste à examiner comment se situe le vecteur nouveau(xL yL) :
il estorthogonal
à la moyenne, et aux effetslignes
et colonnes duplan,
maisil n’a aucune raison d’être
orthogonal
aux effets traitements.Ici,
il setrouve fortuitement que l’effet
(xL yL)
et l’effetquadratique
des traite- ments(z )
sont aussiorthogonaux,
c’estpourquoi
nous l’avonsplacé
entête des effets traitements. Seuls restent donc
plus
ou moins en inter-dépendance
3 effets[zL] [zC] et [xL yL].
Nors avons donc une matrice irré - ductible d’ordre 3 seulement(au
lieu de11).
Pour cette matrice
partielle
et son vecteurcorrespondant X’Y
onapplique
la méthodegénérale d’inversion, puis
demultiplication
pour obtenir les coefficients de larégression.
Matrice directe irréductible Vecteur
X’Y
Coefficients de
régression
Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
Matrice inverse
87
Nous pouvons
donc, grâce
à cette nouvellerégression qui
com-porte
le terme nonorthogonal
en(xL YL)
rétablir les valeurs de nos trai- tementsT, A,
B etC,
en utilisant les valeursrepères déjà signalées .
En ce
qui
concerne le termed’interaction,
et en serapportant
au ta- bleau matriciel de la page84,
on voit que T est caractérisé par :Ainsi pour T
l’application
de la nouvelle formule derégression
donne :T =
610,3125 - 1,5 (46,9875)
+1,0 (-10,9375) - 0,3 (34,33... )
+1, 25 (10, 125)
=
531,25
soit :On retrouve les estimations connues des
traitements,
et c’est heu-reux. Mais nous avons
cependant
fait un pas en avant, car maintenantnous pouvons dissocier dans les traitements ce
qui
revient aux traite-ments
proprement
dits et cequi
revient à l’interactionlignes-colonnes
du terrain. Bien sûr le
découpage
estquelque
peu arbitraire et pourra être discuté par les utilisateurspuisqu’il n’y
a pasorthogonalité.
Mais l’estimation affinée des traitements :est la meilleure
possible
dans cettehypothèse
dujeu
d’une interactionlignes -colonnes.
L’analyse
de variance afférente à cetterégression particulière
vaperdre beaucoup
de sasimplicité classique. Pourtant,
dans uneoptique matricielle,
l’établissement des divers carrés reste assez facile : il suffit de penser que l’on a à faire le carré d’une formelinéaire,
onaura donc la somme des carrés de tous les éléments
composants plus
deux fois la somme de tous les
produits
deux à deux. Matriciellement cette élévation au carré est obtenue par unemultiplication
mettant enjeu
un vecteur
ligne,
une matrice decoefficients,
et le même vecteur dis-posé
en colonne.Le vecteur
ligne (ou colonne)
est le vecteur des coefficients derégression rangés
dans leur ordrelogique -
allant ici de la moyennegénérale
à l’interaction(xL YL).
Revue de Statistique Appliquée, 1968 - vol. XV I - N’ 3
88
La matrice des coefficients est
symétrique,
et elle nous estdéjà _ bien connue,
c’est la matrice des moments centrésX’X.
Lerésultat
comporte
une seuleligne (ou colonne)
mais cetteprésentation,
d’unsca-
laire en
quelque
sorte, est sans intérêt.Respectons plutôt
la matriceX’X
descoefficients, multiplions chaque
élément dechaque ligne
par l’é- lémentcorrespondant
du vecteur des coefficients de larégression
et re- commençons la mêmeopération
par colonne en suivant bien entendu l’ordrelogique.
Ainsichaque
terme de ladiagonale principale
est bienmultiplié
par le carré d’un coefficient de
régression,
et les termes nondiagonaux
vont par
paires
en raison de lasymétrie
de la matrice des moments centrés devenue ici matrice des coefficients de la formequadratique.
Ona
donc,
par cetteméthode,
un tableauimagé
des carrésemportés
parchaque
terme derégression.
Si le termediagonal
de la matriceX’ X
est le seul non nul de saligne (ou
de sacolonne)
on retombe bien sur laméthode ordinaire de
décomposition
de la somme de carrésgénérale
ensomme de carrés de formes linéaires
orthogonales.
Cela secomplique
là où les formes linéaires ne sont
plus orthogonales.
Nous fractionnons donc le travail en deuxparties :
a - pour les
comparaisons orthogonales,
nous retrouvons les va-leurs
déjà
mentionnées ci-dessus :Somme des carrés :
6.025.021,000
0 16T.C. z0 :
5.959.701, 562
5 1Effets colonnes
x
:4. 194,
6875 3Effets
lignes 3LQc
:14.871,
6875 3Effet traitement
za
:1.914,
0625 1d’où un reste à
expliquer : 44.339,000
0pourD.d.L. =
8b - pour les
comparaisons
nonorthogonales,
on a le schéma sui- vant :La somme de ces neuf termes est
égale
à :39.748,250
0 D’où un résidu de :4. 590, 75
pour D, d, L. - 5Il y a un ennui
qui
saute aux yeux : ce sont les carrésnégatifs
etil y en aura
automatiquement chaque
foisqu’on
réussira àaugmenter
le contraste, ici c’est essentiellement l’effet linéaire traitementsqui
estaugmenté,
et comme la somme des carrés est constante, il faut bien que s’introduisentquelque part
des termesnégatifs.
Bref,
à laréflexion,
personne ne devrait trouverchoquante
l’exis-tance de ces carrés
négatifs,
car ce ne sont pas de vrais carrés mais desproduits croisés, qui
s’introduisentautomatiquement
dans l’élévationau carré d’une forme
linéaire,
où les coefficients sont soitpositifs,
soitnégatifs. Pourquoi
seraient-ils tous de mêmesigne ?
Dans le
dépouillement classique
la variance résiduelle est :5.410,875/6 = 901,8125
avecD.d.L. =
6Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
Dans le
dépouillement quadratique
la variance résiduelle est :4.590,75/5 = 918,15
avec D.d.L. = 5C’est
généralement
ainsi que sepassent
les choses : la variance résiduellen’est
pas abaisséenotablement,
et deplus,
onperd
undegré
de liberté.
Néanmoins,
le test F de Fisher Snedecor est sensiblementplus
net avec ledépouillement quadratique.
Ici l’effet total traitements
était,
pour le carré latinclassique : 40.842,1875 = 28. 690, 3125
+1. 914, 0625
+10.237,8125
D’où F =45, 29
pourF0 (table) = 4, 76
Pour le
dépouillement quadratique
54.557,765.625 = 44. 156, 503125
+1914, 0625
+8.487,2000
D’où F =59,
42 pourF (table) = 5,
41Le résultat n’est pas différent par l’une ou l’autre des deux mé-
thoses,
mais il n’est pas difficiled’imaginer
que la méthode del’ajus-
tement
quadratique
sera ordinairement laplus
sensible.AUTRE PRESENTATION DU MEME DEPOUILLEMENT DES CARRES LATINS
Nous pouvons donner ici une autre forme au
dépouillement
des ré-sultats par la méthode de
l’ajustement quadratique :
nous reprenons la méthodeindiquée plus
haut où les traitements sontrepérés
dans la ma-trice
X
par des 1 pour laprésence
et des 0 pourl’absence.
Voir page 90.La matrice des moments
X ’X qui
enrésulte,
voir page90,
est d’ordre11,
exactement la même chose que dans lepremier
cas. Mais la matrice irréductiblequ’il
va falloir inverser s’élève à l’ordre 5(au
lieu de
3),
cequi
est un peuplus compliqué.
Nous donnons les éléments du calcul : Matrice - Vecteur - Matrice inverse - Coefficient de
régression -
Etude détaillée des carrésemportés
par larégression.
Somme des carrés de la diagonale : 6.014.259, 328. 125 + 2. 562, 890. 625 = 6. 016. 822, 218. 750 Somme des carrés non diagonaux : 2 x -7.729.171.875 = -15.458,343.750 Somme des carrés du tableau = 6. 001, 363, 875. 000
Terme correctif =5.959.701,562.500
Somme des carrés : traitements + interaction = 41.662,312.500
90
Matrice
X ( Corrélation)
Matrice
X’ X
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3 Les termes non figurés sont nuls
Vecteur Vecteur
91
On remarquera que la somme des carrés des traitements + interac- tion est :
41.662,312.500
etqu’elle
est bienégale
à :39.748,250 :
somme des 9 termes de la matrice(3 3)
de la page 861. 914, 062. 500 :
somme des carrés relative à l’effetquadratique
des traitements
qui
se trouve êtreorthogonal
à l’interaction.De même on remarquera que la somme des carrés à affecter aux
traitements
corrigés
est :6.014.259,328.125 -
T. C. =54.557,765.625,
chiffre connu.Cette troisième méthode est donc
rigoureusement équivalente
à laprécédente :
elle al’avantage
de fournir directement les valeursajus-
tées des traitements. Mais il faut bien remarquer que les
"traitements"
ne sont pas
des "comparaisons orthogonales"
au sensstatistique précis
de ce
terme,
comme le sont les colonnes 2 à 11 de la matrice de la page 84 - En effet ce ne sont même pas descomparaisons :
la sommedes termes n’est pas nulle. Ils sont
pourtant orthogonaux
entre eux.EXEMPLE DE REGRESSION
QUADRATIQUE (Suite)
Revenons donc à
l’exemple
introduitplus haut,
à la page 79. Mal-gré
certainesprécautions prises (barycentrage) qui permettent
une esti- mation nonbiaisée,
ouindépendante,
des effets linéaires en x et y - et de l’effetquadratique
en x -, nous sommes dans le casgénéral
où lestraitements et les effets dus au terrain sont en
interdépendance.
La ma-trice
(X 1 X)
ici d’ordre 12 s’abaisse du fait del’orthogonalité
à l’ordre9. C’est une matrice
symétrique
dutype biflèche,
où l’on rencontre destermes dominants dans la
diagonale principale
et dans deux colonnesseulement ;
onpeut rejeter
ces deux colonnes à l’extrêmedroite,
d’où ladésignation
de matrice flèche et même biflèche.L’ennui est que l’inverse de cette matrice est une matrice
pleine
où aucun coefficient n’a de raison d’être nul. Nous avons donc à mani-
puler
une matrice(9
x 9 =81), symétrique
biensûr,
et à lamultiplier
par le vecteur colonne
X’Z ,
pour obtenir les coefficients de larégression quadratique (oui, quadratique
en cequi
concerne le terrain - mais enfait linéaire en ce
qui
concerne le programme decalcul,
car les calcu- lateursnumériques
ne connaissent quecelle-ci,
etjouent
sur les va-riables d’entrée pour avoir des
régressions
autres quelinéaires).
Nous ne pensons pas utile de donner la matrice inverse
(X’X!’
1hélas si foisonnante. Nous nous contentons de donner le vecteur colonne
X ’Z ,
les coefficientscorrespondants
de larégression.
Les 28 termes non-ortho. :
-55, 310. 824
Somme des carrés résiduelle :
137,686.507
pour 16 D. d. L.Somme des carrés totale :
66.491, 196.800
pour 28 D.d.L.Du fait de la
non-orthogonalité
de lamajeure partie
de nos trai-tements et effets
terrain, l’analyse
de variance aperdu
sa belle sim-plicité :
nous ne voyons pas d’autre moyen que de la donner in extensoRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3