R EVUE DE STATISTIQUE APPLIQUÉE
J. B ERNIER
Les méthodes statistiques de comparaison de deux séries de valeurs voisines
Revue de statistique appliquée, tome 12, n
o2 (1964), p. 15-25
<
http://www.numdam.org/item?id=RSA_1964__12_2_15_0>
© Société française de statistique, 1964, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LES MÉTHODES STATISTIQUES DE COMPARAISON DE DEUX SÉRIES DE VALEURS VOISINES
J. BERNIER
Centre
de Recherches
etd’Essais de Chatou (E.D.F.)
La
comparaison
constitue un des instruments fondamentaux de toute démarchescientifique.
Dans le domaine del’Hydrométéorologie
notam-ment elle intervient de
façon
constante.- Etude de
l’homogénéité
des conditions d’occurence d’un cer-tain
phénomène
entre deuxpériodes
de relevés de débits ou deprécipi-
tations à une même station.
-
Comparaison
des débits observés à deux stations dejaugeages voisines,
situées ou non sur le même cours d’eau.-
Confrontation,
en vue d’une étude derégime,
des débits ob- servés à deuxépoques
différentes de l’année.- Etude des écarts observés sur des
précipitations
recueilliessur un même bassin dans des conditions
opératoires différentes ,
parexemple
avec et sans inséminationpréalable
des nuages par l’iodure d’ar-gent.
Pour résoudre ces divers
problèmes
decomparaison
dont l’inven- taireprécédent
ne donne d’ailleurs pas une listeexhaustive,
on sait bien maintenant que la seuleprise
encompte
sansprécautions
de moyennesempiriques
calculées sur deux séries degrandeurs
voisines ne suffit pas.Il
importe
de considérer les fluctuations aléatoires des observations et, pour en mesurerl’incidence,
de les décrire par un modèleprobabi-
liste
adéquat.
I - LA NOTION DE MODELE
Soient deux séries d’observations d’un certain
phénomène hydromé- téorologique :
Xi.
x 21
... X nYI, Y2’."’."". y P
16
Pour fixer les idées nous supposerons que les x et y sont des hau- teurs de
précipitations
recueillies sur un certain bassin.Définir un
modèle,
c’est admettre un certain nombred’hypothèses
concernant les lois de
probabilités
des variables aléatoires dont les ob- servations constituent des échantillons et c’estreprésenter
ceshypothèses
sous une certaine forme
mathématique.
La considération àpriori
d’un telmodèle est absolument nécessaire. Cette nécessité ne
répond
pas seu- lement à un souci derigueur mathématique
dontl’hydrologue
ou le mé-téorologue
n’auraient que faire. C’est aussi la seulefaçon d’apprécier
la
portée
et les limites des méthodes decomparaison compte
tenu des écartsqui
existenttoujours
entre leshypothèses
de base et la réalité.Pour l’avoir oublié certaines personnes ont accordé
parfois
une confianceexagérée
etdangereuse
à des calculsstatistiques
dont laprécision
ma-thématique peut
être fallacieuse.Les observations d’une
part,
le modèle c’est-à-dire les lois deprobabilités
duphénomène
d’autrepart,
constituent unepartie
des données de base duproblème
decomparaison.
Pour achever de décrire celui-ci ilimporte
d’enpréciser
lesobjectifs.
Ilpeut s’agir uniquement
de sa-voir si les deux échantillons sont issus de la même variable aléatoire
-problème
du testd’homogénéité-
ou d’estimer les différences si elles existent effectivement-problème
d’estimation-. Danschaque
cas il arrivefréquemment
que desconséquences économiques
découlent des résultatsde la
comparaison.
La considération àpriori
des élémentséconomiques
conditionne alors le choix de la méthode de
comparaison.
Nous y revien- dronsplus
loin.L’inventaire
complet
de cesproblèmes
nécessiterait desdévelop- pements qui
nepourraient
êtreprésentés
dans les limites duprésent
ex-posé.
Nous traiterons seulement le cas des tests del’homogénéité
dedeux séries entre
lesquelles
n’existent aucunedépendance.
Il n’est pas douteux que c’est là une restriction importante pour certainesapplications hvdrologiques (comparaison
des débits moyens de deux mois voisins parexemple).
Mais ils’agit
ici dedégager quelques principes généraux
del’examen de certains tests
d’homogénéité.
Enfin pour
simplifier l’exposé plus complètement
encore, nous nous bornerons à ne considérer que des échantillons de taillesidentiques,
soit :n = p.
II - TESTS
PARAMETRIQUES
et NONPARAMETRIQUES
Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2
Considérons une fonction
F* (x) qui
croit par sautsd’amplitude
cons-tante
égale
à1
pour
chaque
valeur de l’échantillon des x.F*(x)
donnen
ainsi la
fréquence
des observations inférieures àchaque
valeur de l’échan-tillon, fréquence qui
estime laprobabilité
d’obtenir une observation infé- rieure à cette valeur. Cet"histogramme
defréquences"
constitue doncune estimation de la fonction de
répartition F(x)
de la variable aléatoirex. Une fonction semblable
G* (y) peut
être construite pour estimer la fonc- tion derépartition G(y)
des y.L’hypothèse d’homogénéité
mise àl’épreuve
des observations s’ex-prime
ici par :Il semble assez intuitif
qu’un
testpossible peut
être construit àpartir
d’une certaine distance entre les deuxhistogrammes
defréquences, soit,
parexemple :
On sera conduit à
rejeter l’hypothèse
si cette distance esttrop grande.
Mais les fluctuationsd’échantillonnage
sont telles que les histo- grammespeuvent
être différents alors même que les lois F et G sontidentiques.
Dans ce cas, ilimporte
donc deprendre
encompte
la loi deprobabilité
deDn,
calculée dans le cadre del’hypothèse d’homogénéité.
Cette
loi,
déterminée pour lesgrandes
valeurs de n par lesmathéma-
..ticiens russes
Kolmogoroff
etSmirnoff, permet
le calcul d’un seuilda correspondant
à uneprobabilité
afaible,
tel que :La
technique
du test consiste àrejeter l’hypothèse d’homogénéité
si :Supposons
maintenant que les lois deprobabilités
desprécipitations
sont
gaussiennes
et que leurs variances sontidentiques
etégales
à 6 .Nous admettons ainsi que la seule
hétérogéneité possible
réside dans unedifférence des
espérances mathématiques
que nous supposons deplus
nepouvoir
être quepositive
en faveur de la distribution des y.Avec ces
hypothèses
la mailleure mesure de distance pour détecterl’hétérogénéité
éventuelle est la différence des moyennesempiriques.
Dansce
qui précède l’adjectif
meilleur a un sens bienprécis
que nousexplici-
terons
plus
loin.L’hypothèse d’homogénéité
est doncrejetée
si :( .)
(* ) La différence des moyennes est ici normée par une estimation de son écart type sur les variances
empiriques sf
ets~ des
deux échantillons.18
Le seuil de
signification oa, est
calculé de telle sorte que, en sup-posant l’homogénéité,
on ait :La loi de
probabilité
def1n se
rattache à la loi dite de Student. Si n estgrand
la loide g,
est voisine de la distribution de Gauss de moyenne nulle et de varianceégale
à 1.Chacun des deux tests ci-dessus est
caractéristique
des deuxgrandes
classes de méthodes
statistiques
decomparaison :
d’unepart
les mé- thodesparamétriques
pourlesquelles
ilimporte
de caractériser defaçon précise
les lois deprobabilités
des observations -c’est le cas du test surles moyennes-, d’autre
part
les méthodes nonparamétriques qui
ne de-mandent que le minimum
d’hypothèses
concernant la forme des lois deprobabilité ;
c’est le cas du test deKolmogoroff
Smirnoff pourlequel
laseule continuité des fonctions de
répartition
est nécessaire.III - PUISSANCE ET ROBUSTESSE DES TESTS
Eu
égard
à la nature aléatoire desphénomènes étudiés,
les conclu- sions que nous pouvons tirer des testspeuvent
nous amener à commettre certaines erreurs.- D’une
part
onpeut rejeter l’hypothèse d’homogénéité
alorsqu’elle
est vraie. Il résulte duprincipe
même de la construction des tests que lafréquence
de cette erreur estprécisément égale
à laprobabilité
adu seuil de
signification.
Le choix d’une valeur faible pour apermet
ainsi de limiter cette erreur dite depremière espèce.
- Mais d’autre
part
onpeut
commettre l’erreurinverse,
dite tle secondeespèce,
à savoir :accepter l’hypothèse d’homogénéité
des deuxséries alors
qu’elles
sonthétérogènes.
Pour un test donné onpeut
cal- culer lafréquence
de cetype
d’erreur en fonction du seuil designifi-
cation oc choisi à
priori
et de la forme del’hétérogénéité
éventuelle. Lapuissance
du test définie par1-(3
donne laprobabilité
derejeter l’hypo-
thèse
d’homogénéité
alorsqu’elle
est effectivement fausse. C’est donc une mesure dupouvoir
de détection du test.Avec les
hypothèses
de normalité des observations etd’hétérogénéi-
té éventuelle
portant
sur lesespérances mathématiques seules,
onpeut
démontrer que le test basé sur les différences de moyennespossède
unepuissance
maximale.Le tableau ci-dessous donne la
puissance
de ce test obtenue pour diverses valeurs de n et diverses valeurs de la différenceéventuelle Il
des
espérances mathématiques exprimée
enpourcentage
de l’écarttype
a,et pour un
risque
depremière espèce égal
à 5%.
Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2
TABLEAU 1
Ce tableau illustre deux des
propriétés importantes
de lapuissance,
- la croissance de la puissance
lorsque
la taille des échan- tillonsaugmente.
- la croissance de la
puissance
avec la distance éventuelle entre les lois deprobabilités
des deux échantillons.Aucune méthode propre à calculer avec assez d’exactitude la
puis-
sance du test
Kdlmogoroff
Smirnoff n’est actuellement connue. Mais dans le cadre deshypothèses
de normalitédéveloppées plus haut,
lapuissance
de ce test est certainement inférieure à celle du test sur les moyennespuisque
celui-cipossède
unepuissance
maximale. Il semblerait mêmequ’elle
soit assez nettement inférieure. Etant donné que les distributionsempiriques proches
de la loi normale se rencontrent assezfréquemment
on
pourrait
penser que le test sur les moyennesprésente
une utilité pra-tique plus grande
que le test deKolmogoroff
Smirnoff.Cependant
unmodèle,
aussiprécis soit-il,
neprétend
pasrepré-
senter exactement la vraie loi du
phénomène.
Il existetoujours
une dis- tanceplus
ou moinsgrande
entre la réalité et ce modèle et le test seraplus
ou moins robuste selon laplus
ou moinsgrande
sensibilité de sesrésultats à une déviation des
hypothèses
de base.Par construction le test de
Kolmogoroff
Smirnoff est très robustepuisqu’il
ne demande aucunehypothèse précise,
autre que la continuité des distributionsthéoriques.
Parcontre,
la robustesse du test sur les moyennes reste à prouver. Cette robustessepeut
d’ailleursprendre plu-
sieurs
aspects :
- Le
risque
depremière espèce
apeut
varier si la loi de pre- babilité réelle des observations n’est pas cellequi
a servi à construirele test.
- La
puissance 1-~ peut
varier sil’hétérogénéité
éventuellen’est pas celle
qui
a étéprise
encompte
dans la construction du test.Or on
peut
montrer, tout au moins pour degrands échantilions,
que lerisque
a est peu sensible à un écart entre la loi réelle et la loi nor-male.
Par contre la
puissance
est très sensible à une déviation del’hy-
pothèse d’hétérogénéité
éventuelleportant uniquement
sur lesespérances
mathématiques.
Si en fait l’écart entre des distributions des x et des y20
est
imputable
aux seulesvariances,
il est d’ailleurs clair que la diffé-rence des moyennes est un très mauvais test
d’homogénéité. Quelle
que soit la déviation et sigrande
soitelle,
lapuissance
est dans ce cas pra-tiquement
constante etégale
aurisque
a.Il existe un test
d’égalité
des variances des deux échantillons et basé sur lerapport
des variancesempiriques
des deux échantillons :Cependant
la robustesse(sous
sonpremier aspect)
de ce test esttrès faible et si la loi réelle
présente
des écarts même faibles à la loinQrmale,
lerisque
depremière espèce
a réelpeut-être
très différent de la valeur choisie. On nepeut
doncplus
contrôler lesrisques
d’erreurs.Dans ces
circonstances,
il n’est pas douteux que le test de Kolmo-goroff
Smirnoffplus
robusteprésente
desavantages
certainsmalgré
sapuissance plus
faible.On voit donc par les considérations
précédentes
que le choix d’un testd’homogénéité
ne doit pas être basé sur desrègles
absolues tellesqu’on pourrait
les trouver dans un manuel mais il doit surtout résulter d’une connaissancepratique
des conditions d’occurence duphénomène
étu-dié. Ce choix résultera
toujours
d’uncompromis
entre la robustesse et lapuissance qui
seprésentent
en fait comme deuxobjectifs
contradic-toires.
IV - ACCROISSEMENT DE PUISSANCE ET ECONOMIE d’OBSERVATIONS Prenons
l’exemple
desopérations
d’inséminations de nuages desti- nés à accroitre lesprécipitations.
Il y a tout lieu de penser que les aug-mentations,
si ellesexistent,
sont relativement faibles.L’important
est donc d’utiliser aes testsayant
unepuissance
suffi-sante pour
permettre
la détection de tels écarts sansqu’il
soit néces-saire pour cela de
prendre
encompte
des échantillons de tailleprohi-
bitive.
Il
existe
un moyen propre àaugmenter
defaçon
sensible lapuis-
sance des tests : c’est l’utilisation de variables témoins comme la hau- teur des
précipitations
mesurés sur une zone"témoin" conjointement
auxhauteurs de
précipitations
inséminées et non inséminées par l’iodure d’ar-gent
et relevées sur la zone"cible".
Dans ces circonstances les testspossibles sont,
dans leurprincipe, équivalents
à unecomparaison
entreles écarts des hauteurs de
précipitation
de la cible à leurs moyennesliées,
conditionnées par lesprécipitations
observées sur le témoin. Lapuissance
des tests est alors d’autant meilleure que la corrélation cible- témoin estplus grande.
Revue de Statistique Appliquée. 1964 - Vol. XII N’ 2
Pour
préciser
cela nous remarquerons que, dans le cadre d’un test donné et pour un seuil afixé,
il existe une taille n de l’échantillon per- mettant d’atteindre unepuissance
fixée. Si on se fixe unrisque p
d’er-reur de seconde
espèce,
de deux tests leplus puissant
demandera moins d’observations que l’autre. Onpeut
montrer que le nombre d’observa- tions nécessaires pour atteindre unepuissance quelconque
estproportion-
nel à
1-p2 ( p
étant le coefficient de corrélation entre les hauteurs depré- cipitations
de la cible et dutémoin).
Le tableau ci-dessous donne l’économie
(en %
du nombre d’obser-vations)
obtenue pour différents coefficients de corrélation parrapport
aucas ou p est nul
(absence
detémoin).
TABLEAU II
V - LE CONTROLE DES
RISQUES
d’ERREURSL’intérêt des tests
statistiques
est de controler lesrisques
d’erreurd’interprétation
des résultats d’uneexpérimentation.
Mais encore faut-ilque les
prémisses,
surlesquels
repose le modèleprobabiliste qui
per- met lecontrôle,
soient vérifiés. Le contrôle desopérations
depluie
pro-voquée
repose sur lacomparaison
de deux séries d’observateurs soumisesou non au traitement
préalable
de l’insémination par l’iodured’argent.
Ilest donc nécessaire d’être assuré que les différences
significatives
éven-tuelles sont
imputables
au traitement effectué. De nombreux contrôles ont été effectués encomparant
des hauteurs deprécipitation (période d’expé- rience)
aux hauteurs deprécipitations
relevées au cours d’unepériode
antérieure dite
période historique.
Or il est apparuqu’une
telle compa- raisonpeut
mettre en évidence desaugmentations significatives
depréci- pitations
dues à une combinaison de facteursn’ayant
rien de commun avecl’insémination des nuages
(implantation,
mode de relevés despluviographes,
choix des
épisodes pluvieux
soumis àl’insémination, types
detemps
fa- vorables à lapluviosité
sur lacible,
défavorable sur le témoinetc... ).
La randomination
permet
de tourner cette difficulté. Les unités d’ob- servations éventuelles(situations météorologiques favorables)
définies etdécelées à
priori
par uneprévision météorologiques
sont soumises ou nonau traitement insémination selon le résultat d’un
tirage
au sort auxiliaire.Par ce
procédé
on n’élimine pas les facteurspertubateurs
mais on leurfait
jouer
des rôlessymétriques
sur les observations inséminées et noninséminées de sorte
qu’ils
n’interviennentplus
pour fausser la compa- raison.22
VI - LES INCIDENCES
ECONOMIQUES
des CONCLUSIONS TIREES des TESTS de COMPARAISON.Pour fixer les idées nous nous
plaçons
maintenant dans le cadre deshypothèses
servant de base au test sur les moyennes ; nous suppo-sons notamment que l’effet des inséminations
porte
sur uneaugmentation
des
espérances mathématiques
c’est-à-dire des moyennes réelles desprécipitations,
si tant est que la notion de vraie moyenne ait un sens .Compte
tenu, d’unepart
du bénéficeescompté
d’uneaugmentation
éventuelle des
précipitations,
d’autrepart
du montant des investissements destinés à l’installation de réseaux degénérateurs
de fumées d’iodured’argent,
il existe un seuil de rentabilité m pourl’accroissement 4.
Le
problème
de lacomparaison
revient donc à choisir entre les deuxhypothèses :
-
H.: (~m auquel
cas on n’investit pas dans l’installation desgénérateurs.
-
Hl: 4 > m auquel
cas l’installation desgénérateurs
est entre-prise.
On obtient ainsi une
partition
en deux classes de l’ensemble des va-leurs du
paramètre
Il. Poursimplifier l’exposé
nous admettrons quechaque
classepeut
êtrereprésentée
par une valeurunique
et que le pro- blème revient à confronter les deuxhypothèses.
Ho: Il
=Il 0
Hl: 4 =
[Il> ~l.Nous voudrions
souligner qu’une
tellesimplification
ne retire rienau réalisme du modèle construit. Il est bien évident
qu’eu égard
à l’im-précision
des élémentséconomiques
entrant enjeu
la détermination d’un seuil de rentabilité mprécis
estlargement théorique.
Enpratique
onconçoit qu’il puisse
exister une zone d’indifférence pour les décisions àprendre,
zonequi correspond
ici aux valeursde Il comprises
entreIlo et
.
Nous supposons de
plus
que ~o= 0Dans ces conditions à
chaque
décisionprise,
onpeut
associer uncoût fonction de
l’augmentation
réelle desprécipitations.
La situation est résumée defaçon simplifiée
dans le tableau des coûts ci-dessous :TABLEAU III
Revue de Statistique Appliquée, 1964 - Vol. XII - N’ 2
La donnée de ce tableau
conjointement
à l’ensemble desdécisions,
l’ensemble des observations et l’ensemble des lois de
probabilités qui
lesrégissent
achève ladescription
des éléments formels de la théorie des fonctions de décisionstatistique
de Waldqui
a étéexposée
dans uneautre communication.
Revenons au test sur les moyennes ; on
accepte Hl
si :Dans la
terminologie
de Wald ce test est la fonction de décision.Le choix de la limite k
qui, précédemment,
a résulté d’unrisque
d’erreurde
première espèce
a fixé àpriori, peut
maintenant être basé sur des considérationséconomiques.
A k fixé
correspond
une valeur de a et une valeurde j3
fixes. Dansces conditions la fonction de
risque, qui représent l’espérance
des coûtsencourus, s’écrit :
Au sens
économique
le meilleur test est celuiqui
minimise la fonc- tion derisque
r. Or cette fonctiondépend de 4
inconnu àpriori.
Pourtourner la difficulté le
principe
deBayes peut
être utiliséqui
repose sur le choix deprobabilités
àpriori
pour les deuxhypothèses :
parexemple
p pour
Ho
et 1 - p pourHl .
Onpeut
alors calculer un coût moyen : parexemple
p pour H et1-p
pourHl.
Onpeut
alors calculer un coût moyen :Le meilleur test sera celui pour
lequel
r est minimum.Un calcul
simple
montre que la condition nécessaire et suffisante pour cela est :Cette formule est instructive car elle met en évidence le rôle im-
portant joué
par lesprobabilités
àpriori
dans le choix du seuil designi-
fication
qui
est une fonction croissante de p.L’intérêt essentiel de la théorie de Wald est de fournir un cadre formel pour
représenter
lesproblèmes pratiques
de décision mieuxadap-
té que la théorie
classique
basée sur le choix àpriori
de laprobabilité
adu
risque
depremier espèce.
L’arbitraire du choix de a est en faitreporté
sur le choix des
probabilités
àpriori.
C’est ainsi que dans leproblème
ducontrôle des
opérations
depluie provoquée,
les résultats obtenus ont très24
souvent reflétés les
opinions
àpriori
de leurs auteurs. Uneanalyse
baséesur la théorie de Wald les aurait certainement enclains à
plus
de pru- dence dans leurs conclusions. Dans l’état actuel deschoses,
ilapparaît
que si l’efficacité de l’iodure
d’argent
a été décelé enlaboratoire,
lesphysiciens
del’atmosphère
sont loin d’avoir donné des preuves de son action dans la Nature. Le contrôlestatistique
doit donc être basé sur uneprobabilité
àpriori
1 - p assezprudente
tellequ’aucune
conclusion en fa-veur de l’efficacité ne
peut présentement
être avancée.VII - CONCLUSIONS
Les considérations
développées
dans cetexposé
et que nous avonsprésentées
à l’occasion duproblème
du contrôle desopérations
depluie provoquée
sonttransposables
à toutproblème
decomparaison statistique.
Par suite de leur
présentation
et du matérielmathématique
mis en oeuvreles méthodes
statistiques
bénéficient souvent dupréjugé
derigueur qui s’attache,
avecraison,
à tout raisonnementmathématique.
Larigueur
esten fait relative au calcul
précis
desrisques d’erreurs,
dans le cadre d’un modèleprobabiliste
retenu. Ellepermet
de contrôler ces erreurs et d’é- clairer le choix des décisons àprendre.
Elle nepermet
pas d’éliminerces erreurs. Bien que faisant constamment
appel
auxmathématiques, la statistique
n’estqu’une
scienceappliquée.
Il
importe
donc de tenircompte
à tout instant de la distance entre la réalité et les modèlesplus
ou moinsschématiques
que propose le cal- cul desprobabilités.
DISCUSSION
(Président : M.MORLAT)
M. le Président remercie M. Bernier de son exposé.
M.
Sneyers
demande s’il existe une mesure chiffrée de la robustesse d’un test.M. Bernier répond que cette robustesse est assez difficile à chiffrer parce
qu’elle
peut prendre des aspects très divers selon l’é-cart entre la loi exacte des phénomènes (si tant est que cette expression ait un sens) et les modèles que lron utilise. On pourrait essayer de chiffrer, par exemple, une certaine mesure des variations des risques a etp,
mais rien n’a encore été fait dans ce domaine.M. Le Président confirme que la considération de la robustesse d’un test est assez récente,
malgré
son importance que M.Sneyers
a eu raison de sou-ligner.
On adéjà,
dans un test, l’occasion, dès le départ, de plonger le modèle probabilisteenvisagé
dans une famille pluslarge ;
ensuite, pour mesurer la ro-bustesse, il faut
généraliser
le modèle initial d’une autrefaçon,
moyennant quoion peut certainement donner une réponse satisfaisante à la question de M.
Sneyers .
Mais M. Morlat ne connaît pas de littérature sur la
question.
Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2
M.
Ferry
seréjouit
de l’introduction de la notion de robustesse, car cela répond aux observationsqu’il
a faites à la séance du matin même sur la nécessité de ne pas oublier que le modèlemathématique
n’a pas de valeur absolue et n’est utilisablequ’à
l’intérieur d’un domaine limité. Il est donc très important dans lapratique,
de savoir dans quelle mesure leshypothèses
de base risquent de con- duire à des conclusions erronées lorsque la réalité se déforme par rapport à ceshypothèses : jusqu’ici,
c’est simplementl’intelligence
des utilisateurs qui pouvait remédier au caractère trop absolue de la théorie.M. Le Président dit à M. Ferry
qu’il
a raison d’insister surl’importance
de cette
préoccupation.
M. Bernier
souligne
un deuxième aspect de la robustesse des tests : Jafaçon
dont varie la puissance en fonction d’une déviation des hypothèses portantsur le modèle
représentant
les écarts possibles entre les deux séries.M. Ferry estime que ce second point est très important aussi parce que, dans la réalité, il est souvent peu vraisemblable
qu’une
moyenne soit modifiéesans influence sur la dispersion ; si l’on prend
l’exemple
de l’insémination arti- ficielle des nuages, il y a degrandes
raisons de penser que, s’il y a action, celle-ci se produit par l’intermédiaire d’un coefficient multiplicateur aléatoire qui vient donc augmenter la dispersion du phénomène naturel. Admettre que les inséminations viennent ajouter automatiquement unequantité
constante auphéno-
mène naturel ne peut constituer une
hypothèse
satisfaisante.Mlle Ulmo dit que les études relatives à la robustesse des tests, n’ont pas commencé si récemment que cela,
puisqu’elles
sont poursuivies aux Etats-Unis et enAngleterre
depuis une dizaine d’annéesdéjà,
notamment par C 0 X en ce quiconcerne les tests
classiques :
test de Student Fisher, test F de comparaison de deux variances, test de Bartlett, test de comparaison de n > 2 variances, ana-lyse des résultats d’un plan
d’expérience.
Pour faire de telles études, il faut for- muler les hypothèses par lesquelles on remplace leshypothèses
habituellement faites ; on traduitgénéralement
le résultat obtenu avec la nouvelle hypothèse par la modification que subit le risque de première espèce a par rapport à sa valeur nominale. Il ne semble pas que l’on ait fait d’études sur la modification de la fonction puissance dans son ensemble.M. Larras demande si les méthodes proposées pour le choix entre décisions tiennent compte des probabilités, différentes pour chacune, d’octroi de crédits
correspondants.
M. Bernier dit que cela reviendrait à prendre, pour
espérances
mathéma-tiques,
des coûts affectés de probabilités au lieu des coûts fixesqui
entrent dansles schémas
classiques.
M. Le Président ajoute que c’est là un autre problème, qui n’intervient pas seulement dans les décisions des statisticiens, mais aussi dans les décisions con-
jointes que doivent prendre les statisticiens et les clients des statisticiens. Mais
sur le plan des principes, on n’a aucune difficulté à formuler ce problème.
M. Ferry remarque que ce problème consisterait à se rapprocher d’un mo- dèle de recherche