R EVUE DE STATISTIQUE APPLIQUÉE
A. V ESSEREAU
L’analyse de la variance est-elle toujours la meilleure méthode ?
Revue de statistique appliquée, tome 36, n
o2 (1988), p. 37-52
<http://www.numdam.org/item?id=RSA_1988__36_2_37_0>
© Société française de statistique, 1988, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
37
L’ANALYSE DE LA VARIANCE
EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ?
A. VESSEREAU Rev. Statistique
Appliquée,
1988, XXXVI1. Les
hypothèses
del’analyse
de la variance.1.1.
L’hypothèse
de normalité.1.2.
L’hypothèse
d’additivité.2.
Analyse
nonparamétrique
de la méthoded’appariement.
2.1. Le test des
signes.
2.2. Un
exemple emprunté
à R.A. FISHER.3.
Analyse
nonparamétrique
de la méthode des blocs.3.1. Le test de FRIEDMAN.
3.2. Deux
exemples.
3.2.1. Un
exemple
enexpérimentation agronomique.
3.2.2. Un
exemple imaginé (donc imaginable).
4. Un test non
prévu
dansl’analyse
de la variance.4.1. Le test de
Page.
4.2.
Exemple.
5. Pour conclure.
Bibliographie.
Table Annexe A - Valeurs
critiques
de lastatistique 1>
de FRIEDMAN.Table Annexe B - Valeurs
critiques
de lastatistique
P dePage.
L’analyse
de lavariance (’)
est l’un des instruments de routinequ’affection-
nent, sans
trop
souvent se soucier de leuradéquation, beaucoup
de ceuxqui appliquent
les méthodesstatistiques
àl’interprétation
de résultatsexpérimentaux.
Après
avoirrappelé
que, même dans les situations lesplus simples, l’analyse
dela variance
présuppose
deshypothèses généralement invérifiables,
nous montre-rons que, dans certains cas, on peut s’affranchir de toute
hypothèse
en faisantappel
à des tests nonparamétriques («
free distributiontests »).
Nous aborderons à cet
égard
deuxanalyses
trèsclassiques :
- la « méthode
d’appariement » :
un seul facteur contrôlé(«
traitement»)
à 2 variantes et nrépétitions.
(1) Traduction littérale de « analysis of variance »
(ANOVA);
il eut étépréférable
de dire «
analyse
de la variabilité ».38 A. VESSEREA U
-
l’analyse
d’unplan
factoriel : deuxfacteurs,
dont leplus
souvent l’un est un« traitement » à m variantes et l’autre un « facteur bloc » à n
répétitions
contrôlées.
Nous décrirons ensuite un test non
paramétrique
moins connu,qui
convientà une situation non
prévue
dansl’analyse
de la varianceclassique.
Certes,
cette noten’apporte
rien d’autre que dedéjà
connu. Si elle aquelque mérite,
c’est de rassembler dans un texte court un certain nombre de méthodeséparses
dans une abondantelittérature,
en suivant les idées directrices résumées dans l’Introduction à « Nonparametric
Statistical Methods » de M. HOLLAN- DER et D.A. WOLFE[1],
que nousreproduisons ci-après :
1.
Nonparametric
methodsrequire
fewassumptions
about theunderlying populations
from which the data are obtained. Inparticular, nonparametric procedures forgo
the traditionalassumption
that theunderlying populations
arenormal.
2.
Nonparametric techniques
are often(although
notalways)
easier toapply
than their normal
theory
counterparts.3.
Nonparametric procedures
are oftenquite
easy to understand.4.
Nonparametric procedures
areapplicable
in situations where the normaltheory procedures
cannot be utilized. Forexample,
many of theprocedures require
not the actualmagnitudes
of theobservations,
butrather,
their ranks.5.
Although
at first mostnonparametric procedures
seem to sacrifice toomuch of the basic information in the
samples,
theoreticalinvestigations
haveshown that this is not the case. More often than not, the
nonparametric procedures
areonly slightly
less efficient than their normaltheory competitors
when the
underlying populations
are normal(the
home court of normaltheory methods),
andthey
can bemiddly
andwildly
more efficient than these compe- titors when theunderlying populations
are not normal.1. Les
hypothèses
del’analyse
de la variance1.1.
L’hypothèse de
normalitéDans la méthode des
blocs,
que nousprendrons
commeexemple
de deuxfacteurs en combinaisons
factorielles,
ainsi que dans touteanalyse
de lavariance, l’interprétation statistique
utilise la « loi de F »(Snedecor);
dans la méthoded’appariement,
cette loi devient la loi det2 (carré
de la variable deStudent).
Aussibien t que F sont des variables dérivées de la variable normale réduite. Les tests
classiques
del’analyse
de la variance admettent doncimplicitement l’hypothèse
de normalité de ce
qu’il
est convenud’appeler
1’« erreurexpérimentale
».On ne s’est pas fait
faute,
au cours des dernièresannées,
de brocarder lanaïveté des statisticiens
qui
feraient de la loi deLaplace-Gauss
un article de foi.Non sans raison sans
doute,
mais selon nous avec excès : les statisticiens«
classiques » (de
l’écoleFISHER-NEYMAN-PEARSON)
se sontdepuis long-
temps, et àjuste titre, préoccupés
de la robustesse des testsqu’ils préconisent.
39 L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ? Les méthodes non
paramétriques, qui
n’utilisent que despropriétés
combinatoi- res, constituent une autreréplique
des anciens aux modernes.1.2.
L’hypothèse
d’additivitéDans
l’analyse
de la variance à effets fixes - la seule que nous considé-rons - les variantes de l’un des
facteurs, appelé
conventionnellement « traite-ment », sont
représentées
par mparamètres Si (m
= 2 dans la méthoded’appa- riement) ;
l’autre facteur(généralement
facteur« bloc »)
comporte n modalitésreprésentées
par nparamètres Pj.
Le modèle
théorique auquel
onajuste
les résultatsexpérimentaux,
est unmodèle additif :
où Eij est
aléatoire,
distribué suivant une loi normale de variance0-2 (variance
del’erreur
expérimentale).
En
plus
de la normalité des E, ce modèle admetqu’il n’y
a pas d’interaction entre « effet traitement » et « effet bloc ». Cette deuxièmehypothèse paraît
raisonnable
lorsque
les traitements d’une part, les blocs d’autre part, ne sont pas tropdifférents;
mais « pas trop » reste vague.Si,
enfait,
il y ainteraction,
celle-cise trouve incluse
(« confondue »)
dans le terme résiduel del’équation d’analyse
de la variance où
Xij
estremplacé
par la valeur observée xij et lesparamètres 8; , Pj,
par leurs estimations8; , pj.
Une interaction éventuelle nepourrait
être miseen évidence
qu’en procédant
à une ouplusieurs répétition(s)
del’expérience.
Maisrépétitions
dansquelles
conditions : aussiidentiques
quepossible,
un peudifférentes, largement
différentes ?On
achoppe
ici sur leproblème (qui
n’est pas propre àl’analyse classique,
il existe aussi bien dans les méthodes non
paramétriques)
de l’extension du résultat d’uneexpérience unique
à un univers de résultatspotentiels.
Problèmequi
se pose dès lorsqu’on
a l’ambition d’inférer duparticulier
auplus général.
2.
Analyse
nonparamétrique
de la méthoded’appariement
2. 1. Le test des
signes
On fait abstraction des valeurs
numériques (xi, y¡)
obtenues pour les traitements(X,Y)
dans les npaires,
et l’on se borne à compter les nombres n+et n - de différences xi - yi
positives
etnégatives (n +
+ n - -n);
on supposera dans cequi
suitqu’il n’y
a pasd’ex-aequo
xi = y; : s’il y en a très peu leplus simple
est desupprimer
lespaires correspondantes,
s’il y en abeaucoup,
mieuxvaut renoncer à
interpréter
les résultats.L’hypothèse
testée(« hypothèse nulle »)
est que dans chacune des npaires,
+ et -
apparaissent
avec la mêmeprobabilité
p = 1 /2(n parties
depile
ouface).
Dans un test
bilatéral,
cettehypothèse
estrejetée
auprofit
de l’alternative X =1= Ysi,
en posant n+ = max(n+, n_),
n+ estsignificativement supérieur
à n/2.40 A. VESSEREA U
Dans un test unilatéral où l’alternative est X >
Y, l’hypothèse
nulle estrejetée si,
pour le traitementX,
le nombre n+ de différences xi - Yipositives
estsignificativement supérieur
à n/2. Asignificativement
est associé unrisque
d’erreur a dont la valeur est choisie à l’avance.
Dans les deux cas
(bilatéral
etunilatéral)
la valeurcritique
de n+ s’obtient àpartir
d’une table desprobabilités
cumulées de la loi binomiale(p
=1/2, n),
ou à l’aide d’un calculateur de bureau. La loi binomiale étant
discontinue,
on ne peut satisfaire exactement à la valeur achoisie;
on convientgénéralement
deprendre
pour valeurcritique
laplus petite
des valeurs n+ telle que lerisque
réela’ soit au
plus égal
à a.Lorsque
n estpetit,
a’ peut être nettement inférieur àa - cet inconvénient existe dans tous les tests non
paramétriques
basés sur desstatistiques
d’ordre.La méthode
d’appariement
est utilisée enparticulier
dans les tests orga-noleptiques (saveur, odeur, couleur ...)
où toute mesure estgénéralement impossi-
ble. Les n membres d’un
jury (experts qualifiés
ou non suivantl’objectif poursuivi)
sont invités à comparer deuxproduits
et àexprimer
leurpréférence (test
bilatéral depréférence)
ou à reconnaître un ordreprédéterminé (test
unilatéral
d’identification).
2.2. Un
exemple emprunté
à R.A. FisherMalgré
sonancienneté,
et unstyle parfois
assezésotérique,
« Statistical methods for research workers »[2]
reste un ouvrage de référence que l’on atoujours
intérêt à consulter.L’exemple
porte sur lacomparaison
de deux somnifèresX,Y
administrés à 10sujets.
Pour chacun de ceux-ci on a mesuré le nombre d’heures additionnel de sommeil obtenu par rapport à leur durée moyenne de sommeil naturel.Les résultats ont été les suivants :
TABLEAU 1
41 L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ?
Le test bilatéral
classique
des résultatsappariés (colonne
z dutableau) donne,
pour le t de Student à 9degrés
deliberté,
la valeur4,06, comprise
entreles valeurs
3,250
pour a =0,005
et4,297
pour a =0,001.
La conclusion est que Y est trèssignificativement plus
actif que X.Si l’on
applique
le test dessignes,
lesujet
5 poseproblème,
et l’on décide del’ignorer.
On a alors 9signes
+ sur 9comparaisons,
cequi correspond,
dansle test bilatéral
(p
=0,5,
n =9)
à laprobabilité
1 /256 =0,0039 :
la conclusion est donc la même.Toutefois,
si l’on yregarde
deplus près,
le test par la variable t est, commeon devait
s’y
attendre et comme l’écritFISHER,
« more sensitive »(nous
dirionsaujourd’hui
«plus puissant
», aurisque
dedéplaire
àFISHER).
Naturellement,
le test par lessignes
nedispense
pas de calculer la différence des moyennesy -
x =1,58,
estimation dusupplément
moyen d’heures de sommeil obtenulorsqu’on
substitue à X le somnifère Y.3.
Analyse
nonparamétrique
de laméthode
des blocs3.1. Le test de Friedman
Comme dans la méthode
d’appariement,
on fait abstraction des valeursnumériques obtenues ;
à l’intérieur dechaque
bloc on attribue aux traitements des rangs de classement de 1 à m, suivant les valeurs croissantes(ou décroissantes)
des résultats. On obtient ainsi un tableau tel que le
suivant,
où lenumérotage
desblocs et des traitements sert
simplement
à les identifier.TABLEAU II
La moyenne des
R;
étant R = n m +1,
il estlogique
deprendre
comme2
mesure de l’accord entre les n classements la
quantité :
42 A. VESSER EA U
Si,
à l’intérieur dechaque bloc,
les rangs sont purementaléatoires,
les totauxRi
se groupentplus
ou moins étroitement autour du rang moyen R =n m +
1(si
R est un nombreentier),
ou autour den m + 1 + 1 (si
m estpair
et nimpair).
La valeur minimale de S est, suivant l’un ou l’autre cas :
A
l’opposé si,
dans tous lesblocs,
les rangs sontconcordants,
les totauxR;
sont, dans un ordre
quelconque
n,2n, ...
mn. On a alors :d’où l’on déduit la valeur maximale de S
La
statistique
deFriedman,
que nousdésignerons
par(D,
se déduit de S par la relation :Ses valeurs minimale et maximale sont :
Par
exemple,
pour m =4,
on a les valeurs du tableau ci-dessous :Le nombre de tableaux distincts contenant dans leurs n
lignes
les m !permutations
des entiers de 1 à m est(m !)n-l,
nombreimpressionnant
dès que(m , n)
ne sont pas troppetits (près
de 200 millions pour m =4,
n =7).
Maisnaturellement,
le nombre de valeurs distinctes de S ou C estbeaucoup plus petit (85
dansl’exemple précédent).
Pour m =
3,
n = 2[1] 15
et m =4,
n = 2[1]
8 lesfréquences
etfréquences
cumulées de la distribution de C sont données en détail dans « Owen-Handbook of Statistical Tables »
(3).
L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE Í 43
Lorsque (n , m)
sont suffisammentélevés,
la distribution(discontinue)
de Ctend à se confondre avec la distribution
(continue) des
à y = m - 1degrés
deliberté;
cetteapproximation
estacceptable
dès que n > 15 si m =3,
n > 8 sim =
4,
n > 5 si m =5,
etquelque
soit n si m > 5.Dans le test de
Friedman, l’hypothése
nulle est que les rangsfigurant
danschacun des n blocs sont n
permutations
aléatoires des mpremiers
nombresentiers. Pour un
risque
auplus égal
à une valeur afixée,
cettehypothèse
estrejetée
auprofit
de l’alternative « rangsglobalement
concordants »(ou
« corréla-tion
significative
entre lesrangs »)
si la valeur obtenue pour lastatistique
deFriedman est au moins
égale
au fractileI>l-a (m , n).
Pour les
risques
usuels a =0,05 (a’ 0,05)
et a =0,01 (a’ 0,01),
lesvaleurs
critiques C
sont données dans la Table Afigurant
en annexe de cette note(pour
m =5,
les valeurs sontempruntés
à(1)).
Le cas m = 2 nefigure
pas dans laTable,
car il se ramène auxcomparaisons
parpaires
en test bilatéral(alors
que le test de Friedman estunilatéral ).
On voit facilementqu’entre
la valeurcritique
n+ du test
d’appariement
et la valeurcritique (D
du test de Friedman on a la relation :Comme la méthode
d’appariement,
la « méthode des m classements selon Friedman » est utilisée dans les testsorganoleptiques
où n «sujets »
sont invitésà classer m «
produits »
dans l’ordre de leurspréférences. Mais,
là encore, rienn’empêche
del’appliquer
à la « méthode des blocs », etplus généralement
àl’analyse
d’unplan
factoriel à deux facteurs contrôlésA,
B : pour tester A onnumérote les résultats de 1 à m pour
chaque
modalité deB,
pour tester B on les numérote de 1 à n pourchaque
modalité de A.3.2. Deux
exemples
3.2.1. Un
exemple
enexpérimentation agronomique
Cet
exemple
estemprunté
à[4] : comparaison
en 4 blocs(n
=4)
desrendements de 27 variétés
(m
=27) d’orges
debrasserie,
à la station d’améliora- tion desplantes
de Clermont-Ferrand. Dans cequi
suit :- les noms,
parfois compliqués,
des variétés ont étéremplacés
par les 26 lettres del’alphabet romain, complétées
par la lettre Q.- l’affectation des lettres aux variétés a été choisie de
façon
que, dansl’analyse
par le test de
Friedman,
les totaux de rangR,
soient en ordre non décroissant de la variété A à la variété Q.-
lorsque,
pour deuxvariétés,
les rendements ont étéidentiques
dans un mêmebloc
(cas exceptionnels),
on leur a attribué arbitrairement des rangs consécu- tifs.Compte
tenu de cesréaménagements,
les tableaux III et IVci-après donnent,
d’unepart
les rendementsobtenus,
d’autre part les rangs de classement de 1 à 27 danschaque
bloc(1 correspond
au rendement leplus élevé,
27 aurendement le
plus faible).
44 A. VESSEREA U
Note : Le lecteur devra
prendre garde
que, pour des raisons d’ordretypographi-
que, et contrairement à la
présentation
desprécédents
tableaux de cette note, les traitements(variétés) correspondent
ici auxlignes
destableaux,
et lesrépétitions (blocs)
aux colonnes.Utilisant les totaux
R, figurant
dans la dernière colonne du tableau IV on a :Pour m = 27 on est très
largement
dans le cas où la loi de 03A6 est assimilable à la loide X2
à 26degrés
deliberté;
les valeurscritiques
sont, pour a =0,01 : 45,6,
et pour a =
0,001 : 56,4. (65,2 correspond
à unrisque
de l’ordre de10-9).
On peut donc conclure avecquasi
certitudequ’il
existe des différences de rendement entre les 27 variétés.TABLEAU III
(Rendements )
45
L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE Í
TABLEAU IV
( Classements )
TABLEAU V
46 A. VESSER EA U
L’analyse
de la varianceclassique, beaucoup plus laborieuse,
est résumée dans le tableau V :Le rapport
s2 - 6,35
est trèssupérieur
à la valeur2,6 qui,
dans la loi de FSE
(y, = 26,
Y2 =78), correspond
à unrisque
de l’ordre de0,0005.
La conclusion est donc la même que dansl’analyse
nonparamétrique.
Dans
[4]
la conclusion finale est que le « classement vraisemblable » des variétés est le suivant :Rendements les
plus
élevés : B A C D Rendements lesplus
faibles : V W X Y Z Qles 17 autres variétés étant « intermédiaires ». On aboutit à un classement
quasi-identique
en se basant sur les totaux de rangRi;
seul D se trouve déclassédans le groupe intermédiaire.
Le tableau
d’analyse
de la variance faitapparaître -
subsidiairement - des différences hautementsignificatives
entre les blocs.On obtiendrait la même conclusion en
appliquant
le test de Friedman à untableau déduit du tableau
III,
où les blocs recevraient les rangs de 1 à 4 pour chacune des 27 variétés.3.2.2. Un
exemple imaginé (donc imaginable)
La
présentation
est la même que dans les tableaux III et IV : pour 5 traitements(lignes)
et 4 blocs(colonnes)
donnéesnumériques
dans le tableauVI,
rangs des traitements de 1 à 5 à l’intérieur de
chaque
bloc dans le tableau VII.Appliquant
le test de Friedman on a :valeur
significative
aurisque
a =0,05 (la
valeurcritique
est8,8).
L’analyse
de la varianceclassique
est résumée dans le tableau VIII :s2 - 2,72
est nettement inférieur à la valeurcritique 3,26
de la variable F pourSE
les
degrés
de liberté(y, = 4,
Y2 =12)
et a =0,05.
Contrairement au test deFriedman,
et bien que moyennes et totaux de rang soient en étroitecorrélation,
l’analyse classique
ne révèle pas de différencessignificatives
entre les traitements.47 L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ?
TABLEAU VI
(Valeurs numériques)
TABLEAU VII
(Classements)
TABLEAU VIII
48 A. VESSER EA U
4. Un test non
prévu
dans l’ANALYSE de la VARIANCEL’analyse
de la varianceclassique
ne retient contrel’hypothèse
nulle que l’alternative « existence d’un ordre »(non précisé)
entre les modalités du facteur traitement. Si ces modalités sont mesurables sur une échellecontinue,
ce n’estqu’après
avoirrejeté l’hypothèse
nullequ’on
peutajuster
les moyennes de traitement à un modèle derégression,
linéaire leplus
souvent.Lorsqu’il
existe un ordrepréfixé
des modalités du « traitement » - que cet ordre résulte d’un facteurobjectif,
mesurable ourepérable,
ou d’uneexpérience acquise
-, le test décritci-après («
test dePage ») permet,
soit de confirmer cetordre,
ou bien de conclure que, dans les conditionsexpérimentales
que l’on afixées,
il n’a pas étésignificativement
reconnu.4.1. Le test de
Page
Les résultats ordonnés de 1 à m dans
chaque
bloc(répétition)
sont inscritsdans un tableau
analogue
au tableauII,
avec la seule différence que les colonnes sont elles-mêmes ordonnées selon l’ordrepréfixé :
R1, R2... Ri ... Rm désignant
commeprécédemment
les totaux decolonnes,
la
statistique
dePage
est : mLa valeur maximale de P est obtenue
lorsque
tous les classementsreprodui-
sent exactement l’ordre fixé :
Ri =
ni. D’où :A
l’opposé,
la valeur minimalecorrespond
au cas où tous les classementsreproduisent
l’ordre inverse :Un calcul élémentaire donne :
La valeur « neutre » de P
(ou
« valeur d’indifférence») correspondrait
aucas où tous les
R,
seraientégaux
au rang moyen R =n 2
cequi
nepeut
avoir lieu que si R est un nombre
entier;
on obtient alors :L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ? 49 Dans le cas contraire
(m pair,
nimpair),
les « valeurs d’indifférence » sontcomprises (limites incluses)
entrePl]
etPI2 définies,
comme le montreégalement
un calcul élémentaire par :
dont la moyenne
arithmétique
estPl
donné par(10-a).
Par
exemple :
Comme dans le test de
Friedman, l’hypothèse
nulle est que, danschaque bloc,
les rangs de 1 à m sont aléatoires. Pour unrisque
adonné,
cettehypothèse
est
rejetée
auprofit
del’hypothèse
alternative « l’ordre fixé a étéglobalement
confirmé », si la valeur obtenue pour P est au moins
égale
au fractilePI-a
de ladistribution de P pour le
couple (m, n) :
le test est évidemment unilatéral.Plus
précisément, l’hypothèse
alternativeacceptée
est que, dans la suited’inégalités T1 T2... Ti... Tm,
l’une au moins desinégalités
est stricte.Pour les
risques
a =0,05
et a =0,01
et les valeurs lesplus
courantes de(m , n)
les valeurscritiques
de P sont données dans la table annexeB, empruntée
à
[1].
La distribution de P étantdiscontinue,
lerisque
réel a’ est auplus égal
à a.Sous
l’hypothèse nulle, lorsque
n est suffisammentgrand,
etquelque
soit nsi m >
8,
la distribution de P devientpratiquement continue,
assimilable à unedistribution normale de moyenne nm
m + 1
etécart-type
ce
qui
permet d’effectuer le test pour toute valeur donnée a durisque.
Dans la Table annexe B ne
figurent
pas les valeurscritiques
pour m = 2.Ce cas
correspond
au test unilatérald’appariement :
entre la valeurcritique
n+de ce test et la valeur
critique
de P on a la relation évidente P = n + n+.50 A. VESSEREA U
4.2.
Exemple
Il est
emprunté
à[5]
etreproduit
dans[1].
On se propose de vérifier que la résistance à la rupture de fils de coton varie en sens inverse de la teneur en potasse du milieu de culture des cotonniers. Pour m = 5 taux de potasse(en
unitésanglaises lb/acre)
ondispose
de n = 5 résultats(répétitions);
ceux-ci ne sont pas des « mesures » mais des «repères
»,l’appareil
servant àéprouver
la résistanceétant « calibrated in
arbitrary
units ».Le tableau
ci-après
donne les résistances ainsirepérées
et danschaque ligne,
entre
parenthèses,
les rangs de 1 à 5 selon l’ordre croissant des résistances.P = 5 +
[5
x2]
+[9
x3]
+[14
x4]
+[12
x5] =
158La Table annexe B montre que cette valeur est
significative
aurisque
a =
0,05 (la
valeurcritique
est155).
On peut donc conclure avec une bonnesécurité,
que la résistance des fils est fonction décroissante de la teneur en potasse.TABLEAU IX
5. Pour conclure
Le titre de cette note
posait
uneinterrogation : l’analyse
de la varianceest-elle
toujours
la meilleure méthode ? Laréponse
doit être nuancée.Tout
d’abord,
on ne doit pasappliquer
cette méthodelorsqu’elle
estinapplicable (exemple
de4.2.).
Celaparaît
uneévidence;
mais n’arrive-t-il pasqu’on
demande à un statisticiend’interpréter
des résultats sans luiindiquer où, quand
et comment ils ont été obtenus ? Il est vraiqu’un
statisticiendigne
de cenom doit
exiger
cesinformations;
disonsplus
nettementqu’il
doit collaborer àl’organisation
del’expérience.
En second
lieu,
il est inutiled’entreprendre
des calculs ennuyeuxlorsque
l’évidence crève les yeux. E. PEARSON aimait à dire -
peut-être
l’a-t-il écrit -qu’avant
tout calcul ilconvenait, chaque
fois que cela étaitpossible,
de faire unou
plusieurs graphiques
afin de situer visiblement les résultats.Alternativement,
leur classementpréalable d’après
desstatistiques
d’ordre peut, si l’on n’a pas besoin d’uneanalyse
trèsfine,
suffire à faire éclater une évidence. Dansl’exemple
donné en
3.2.7,
la dernière colonne des Tableaux III et IV montre clairement que les variétés A et B sont, sinon lesmeilleures,
tout au moinsparmi
les meilleures et que c’est l’inverse pour Q - et somme toute, le classement par les totaux de rang ne diffèreguère
du classement par les valeurs moyennes.51 L’ANALYSE DE LA VARIANCE EST-ELLE TOUJOURS LA MEILLEURE MÉTHODE ?
L’analyse
de la variance est certes à conseillerlorsque
toutes lesprécautions expérimentales
ont étéprises
pour que leshypothèses
surlesquelles
elle repose ont toute chance d’être suffisamment satisfaites. Si l’on a des doutessérieux,
les méthodes nonparamétriques
constituent un recours apparemmentinattaquable.
Bibliographie
[1] M. HOLLANDER et D.A. WOLFE. - Non parametric Statistical Methods. John Wiley
& Sons. 1972.
[2] R.A. FISHER. 2014 Statistical Methods
for
research Workers Oliver and Boyd. London1954 (2e édition).
[3] D.B. OWEN. - Handbook of Statistical Tables. Pergamon Press. London 1962.
[4] A. VESSEREAU. - Méthodes statistiques en
biologie
et en agronomie. J.B. Baillière.Ceresta - Tec et Doc-Lavoisier
(réédition
1988).[5] W.G. COCHRAN et G. COX. -
Experimental
Designs. John Wiley & Sons. 1957(2e
édition).
ANNEXE
TABLE A Valeurs
critiques
de la
Statistique C
de Friedman* Les valeurs « étoilées » résultent de
l’approximation
de loi de C par la loi dex2
à(m - 1) degrés
deliberté;
cetteapproximation s’applique quelque
soit nlorsque
m > 5.52 A. VESSEREA U TABLE B
Valeurs
critiques
de laStatistique
P dePage
Note : Pour les valeurs (n,m) supérieures à celles figurant dans la Table, les valeurs critiques s’obtiennent par les formules suivantes :
(valeurs arrondies aux entiers immédiatement supérieurs).
Dans la Table les valeurs « étoilées » ont été calculées par ces formules.