Réflexions sur les modèles statistiques de décision

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

J. B ^ONITZER

Réflexions sur les modèles statistiques de décision

Revue de statistique appliquée, tome 32, n

^o

1 (1984), p. 9-37

<http://www.numdam.org/item?id=RSA_1984__32_1_9_0>

L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.

sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’utilisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

(2)

9

REFLEXIONS SUR LES MODELES STATISTIQUES DE DECISION

J. BONITZER

TABLE DES MATIERES

I. Introduction

II. Les

étapes logiques

^duraisonnement

statistique

III. L’estimation

ponctuelle

III.1.

L’échantillonnage

^aléatoire

111.2. Ce

qu’apporte,

^et^ceque

n’apporte

pas, l’estimation

ponctuelle

IV. L’estimation par intervalle de confiance

V. La théorie

classique

^des^tests^{de NEYMAN}^et^PEARSON

V.1. Le test d’une

hypothèse simple

^contre^une

contre-hypothèse simple

V.2. Extension de la théorie

V.3. Ce

qu’apporte,

^et^ceque

n’apporte

pas, la théorie des tests VI. La théorie

statistique

^des^décisions^{de WALD}

VI.1. Les

concepts

^{de base} VI.2.

L’espace

^des^décisions

VI.3. Le coût des décisions et le

"principe

de RAMSAY"

VI.4. Le coût de

l’expérimentation

VI.5. L’information

préalable

VII. Modèles

statistiques

^de^décision^et^recherche

scientifique

VII.1.

Hypothèse scientifique

^et^actesde recherche

VII.2. Connaissance non formalisée et connaissance rationnelle

Bibliographie

I. INTRODUCTION

Problèmes-carrefours où confluent des intérêts

multiples (intellectuels,

mais aussi matériels :

financiers, économiques, technologiques, ^sociaux, politiques),

les

problèmes

^de^décision^sont

explicitement posés

^en^tantque tels

depuis

^unpeu

plus

^{de trois}^siècles.^Monâmbition^n’estpas d’en faire îciûnethéorie

exhaustive,

mais

plutôt

^une

analyse

^en

profondeur

^sur

quelques points,

^dont^la

compréhension peut

^influer^surl’attitude à

prendre

^{dans des}^cas

d’applications pratiques,

^en^met-

tant

spécialement

^l’accent^surle rôle de la

statistique -

^étant

entendu,

^et^c’est

même un

point

^sur

lequel j’insisterai fortement,

_{que la}

statistique

^n’est

qu’un

^des

moyens de

réponse

^{à la}

disposition

^des

praticiens

^enmal de décision

(surévaluer

son rôle est un écueil à

éviter).

Revue de Statistique Appliquée, 1984, ^vol.XXXII, n° ¹

Mots-Clés :

Décision, Statistique,

^Modèles.

(3)

La

technique mathématique

^des

statistiques

^à^mettre^{en oeuvre}pour leurs

applications

^ne

présente

pas de difficulté

(je

^ne

parle

pas, faut-il le

souligner?

de la théorie en

statistique mathématique).

^Au

contraire,

^la

signification pratique

des

opérations

de caractère

statistique

^est^très

difficile

^à

comprendre.

^Il^en^résulte

que la mise ^{en oeuvre}des

statistiques

^revêt

beaucoup trop

^souvent^un^caractère formel et

mécanique, qu’elle

^consiste^à"faire un

test",

"faire une

estimation",

"faire une

analyse

^de

régression",

"faire une

analyse

de données" sans se deman- der

pourquoi,

ⁿⁱ^à

quoi

^elles^servent.

Les réflexions

qui

^vont^être

exposées

^dans^cet^article^ne^serontdonc pas destinées à proposer ^surdes

points précis

^un

progrès

^des

techniques statistiques,

mais à attirer l’attention des

praticiens

^sur^des

questions qu’ils

^ont^intérêt^à^se

poser, ^et^surles

conséquences

^concrètes^et

pratiques qu’elles peuvent

^avoir.

Je toucherai inévitablement ^audébat bien connu

qui

^oppose

"subjectivistes"

et

"fréquentistes". L’objet

^de^ce^débat^estintéressant en soi

(bien qu’il

^ait^un^peu

tendance à ^tourneren

rond).

Mais d’une

part, je

^me^refuse^àconsidérer

qu’il

^faille

nécessairement adhérer à l’une ^oul’autre de ces deux

thèses(1) (je

les récuse l’une et l’autre _{pour des}raisons

différentes) :

^d’autre

part je soulignerai,

^aussi^souvent

que ^ce^sera

nécessaire,

que le débat a avant tout à mes yeux ^une

portée pratique ;

et que, ^surdes

points importants,

^{on ne}^se

comporte

pas

pratiquement

^de^la^même

façon

selon les

réponses qu’on

^fait^aux

questions d’"interprétation"

du raisonnement

statistique.

Afin _quecet

exposé

^ne^se

perde

pas dans

l’abstraction, je

discuterai

d’ailleurs,

non seulement des

problèmes généraux

^{de la}

décision,

^maisaussi de situations

particulières,

tirées de ma propre

expérience

^de

praticien,

^àpropos

desquelles

^des

questions

^délicates^se

posent.

Je commencerai par ^unpassage ^{en revue}des

étapes

du raisonnement statis-

tique classique,

^décrites^et

analysées

^dans^un^ordre

logique,

caractérisé _parune

description

^de

plus

^en

plus

détaillée de la "situation décisionnelle" concernée

(cet

ordre n’est pas

identique

^à^l’ordre

historique

^del’introduction des différentes

techniques, qui

^s’estfaite d’ailleurs par morceaux avec des

changements

de perspec- tive au cours de ses

étapes successives).

A

l’exception

de la Théorie

statistique

^des

décisions,

^il

s’agira

^de

techniques

suffisamment connues de ^tousles

praticiens

pour que leur

description

^{n’entraîne}

pas de difficultés de lecture. En ce

qui

^concerne^la^Théorie

statistique

^des

décisions,

des

explications

^un^peu

plus techniques

^serontinévitables. Elles sont

indispensables,

en outre, pour faire

comprendre

^la

complication fondamentale,

"incontournable"

(pour employer

^un^terme^{à la}

mode),

^des

problèmes

^de

décision, quand

^on^veut^en

approfondir

^la

compréhension.

Il. LES ETAPES

LOGIQUES

DU RAISONNEMENT

STATISTIQUE

L’orsqu’un ingénieur

^affronte^un

problème pratique,

^il^ne

peut jamais

^{le faire}

en tenant

compte

^de^tous^ses^détails.^Ily ^{en a}

qu’il

^considère^commedes données

sur

lesquelles

^il^est^sans

action ;

^souvent^comme^des^données

globales,

^{dans les-}

(1) ^Pasplus

qu’à

la bizarre position "logiciste" qu’on y ajoute parfois (cf. t 11 p. ⁵²⁶ ouvr.).

(4)

11

quelles

^on

intègre

^des

quantités

^de

caractéristiques

secondaires

qu’il n’y

^apas lieu de détailler. Il en est d’autre au contraire que l’on considère ^comme

significatifs ;

ceux en fonction

desquels

^on

prendra

^desdécisions. Nous admettrons que le ^terme de "hasard" se réfère à un certain

type

^de

phénomènes (que

^nousessayerons de

caractériser).

^Les

phénomènes

^du

hasard,

^ou

aléatoires,

^nefont pas

exception

à la

règle :

^ondoit choisir les

caractéristiques qu’on intègrera

^{dans leur}

représen-

tation. Le vrai

problème

^est

toujours

^de^savoir^ce

qu’on

^considère^comme^des

données

"ultimes", globales,

^non

analysables,

^et^ce

qu’au

^contraire^ondoit consi- dérer comme

significatif,

et soumettre à

l’analyse.

^Le

progrés

^{de la}connaissance revient

toujours

^à

intégrer

^dans

l’analyse

^une

partie

^de^ce

qui

^en^était^autrefois

exclu. Nous allons voir que les

étapes (logiquement)

successives du raisonnement

statistiques,

^à^{savoir :}

- l’estimation

ponctuelle ;

- l’estimation par intervalle de

confiance ;

- le test

statistique "classique",

^{au sens}^{de NEYMAN}^et

^{PEARSON ;}

- le choix des

stratégies

^de

décision,

^{au sens}de la Théorie

Statistiques

^{des Déci-}

sions de WALD

ont en effet _pour

caractéristiques d’intégrer

successivement dans le

champ

^du^rai-

sonnement des éléments que les

étapes précédentes

^traitent^commedes données

"ultime s" .

Mais nous verrons aussi que ^ces

étapes

successives

correspondent

^à

chaque

fois à un

éclairage

^nouveau^du

problème général

^{de la}

décision,

^etque la dernière

implique

^un^véritablebouleversement dans la

compréhension

d’ensemble des pro- blèmes

décisionnels,

^{dont il}^{ne me}^semblepas

qu’il

^ait^été

toujours

perçu dans ^sa vraie dimension.

III. L’ESTIMATION PONCTUELLE

m.l.

L’échantillonnage

^aléatoire

Toute

opération statistique

^commencepar le choix des

objets

^sur

lesquels

on va chiffrer les

caractéristiques.

Îlênêst

^ainsi,

pour commencer, de l’estimation

ponctuelle,

^mais^ce

qui

^{va en}^être^dit^concerne^aussi^bien^toutesles formes

plus

élaborées du raisonnement

statistique.

L’estimation

ponctuelle

^se

présente

^{comme une}forme de la mesure

(au

^sens

métrologique

^du^terme

(2 )).

^{Mais c’en}^est^uneforme très

particulière,

^du^faitque la

caractéristique

^estimée^n’est

jamais

directement celle

qui

intéresse le

spécialiste concerné,

^mais^une

caractéristique transformée

par

l’opération d’échantillonnage

aléatoire. A la

caractéristique

directement intéressante est ainsi substituée une autre

caractéristique, qui

^lui^ressemble^{fort -}^et

qui même, espère-t-on,

^lui^est

égale -

à savoir un

paramètre

^issud’une distribution de

probabilité.

(2) ^Le^terme^de^mesureââussiûnesignification

mathématique

abstraite, qu’il importe d’autant plus ^dedistinguer ^de^{son sens}

métrologique

que la Théorie

mathématique

de la Mesure est la base de toute la Théorie contemporaine ^desProbabilités. Lorsque j’emploierai (très ^rare- ment) le terme "mesure" dans son sens

mathématique,

^{ce sera}toujours ^dansl’expression

"Théorie

mathématique

^{de la}mesure".

Revue de Statistique Appliquée, 1984, vol. XXXII, n° 1

(5)

Premier

exemple

Nous supposons

qu’un ingénieur

^{des Mines}^veut^savoir

quelle

^estla richesse d’un filon en un certain

métal, (pour

^éclairer^une^décision

d’exploitation).

^Nous

supposons ^en^outreque ^cefilon est entièrement

délimité,

^etque ^sonvolume est V

(connu).

^Ce

qui

^intéresse

l’ingénieur,

^{c’est la}^teneurtotale du

filon,

^soit

V6 ;

^ou

encore sa teneur moyenne 8. Il est

patent qu’elle n’a

^riend’aléatoire.

Pour la mesurer par ^uneestimation

ponctuelle,

^cet

ingénieur peut procéder ainsi ( 3) :

il divise idéalement le filon en N

petits

^morceaux

disjoints

^de^même

volume,

êtîl^tireâu^sortⁿ^de^ces

petits

^morceaux

(ou "prises"), qui

^seront

analysés.

Soit

xi X2 xi

^les^teneurs

respectives

^en^{métal des}

prises. L’ingénieur prendra

pour estimateur de la teneur

moyenne 8

^lamoyenne

arithmétique

^X⁼^-.

n

On

peut

^faire^à^ce

sujet

deux remarques :

1)

^Dans

l’échantillonnagre aléatoire,

le hasard est

complètement exogène

par

rapport

^au

problème pratique posé.

^Il

peut

^êtreintroduit par

l’usage

^{de tables}

de nombres au hasard

(dont l’origine

^se

perd

^{dans les}^méandres^{de leur}

génération),

par ^unprogramme

informatique

^de

génération

^{de suites}

"pseudo-aléatoires" (4)

par

un

dispositif mécanique

^{ad hoc}

(tel

que le

quartage,

^oules boules de la loterie

nationale),

^{ou encore}par des simulations des

types

^les

plus ^divers,

^comme^celles

qui

^sont^mises^{en oeuvre}par les

organismes

^de

sondages.

2) Quoi qu’il

^ensoit, ^la^{mesure se}^fait^en^deux

temps :

- d’abord on passe de 0 à

8’, espérance mathématique

^de

X,

par l’échantil-

lonnage aléatoire ;

il faut

espérer

que celui-ci ^estbon

(mais

^l’est-il

jamais

^absolu-

ment

?) ;

sinon, il introduit une erreur

systématique,

^ou

biais ;

- ensuite on passe

de (J’

à

X ;

^on

peut dire,

^en^remontant^la

chaîne,

que ^X

est pris

^pour^mesure

de (J’ ;

^et

donc, indirectement, de 8 ; quand

^onpasse

de (J’

à

X,

^ils’intorduit ^uneerreur

aléatoire ;

^{dans les}^cas

(possibles)

^où

l’espérance

^mathé-

matique

de l’estimateur n’est pas exactement

égale

^au

paramètre qu’on

^{veut esti-}

mer, il

peut

s’introduire ^unsecond biais.

Deuxième

exemple

Un

ingénieur chargé

^deconstruire un

pont

^en^béton

précontraint reçoit

un lot de fils d’acier de

précontrainte.

^Il^veut^encaractériser la

qualité.

La différence avec le

premier exemple

^tient^à^ceque les

caractéristiques qui

intéressent

pratiquement l’ingénieur

^{ne se}^résumentpas à ^une

simple

^moyepne.

En

fait,

^il^a^besoinde connaître

plus

^ou^moins^unedistribution des caractéris-

tiques

du fil dans le

lot,

^et^cettedistribution ressemble

plus

^ou^moins^à^une^distri-

bution de

probabilités.

^On

peut

donc avoir

l’illusion,

^faisant^une

estimation,

^de travailler directement sur un

objet

aléatoire. On

peut

d’ailleurs discuter si cet

objet

(3) Naturellement, ^la

procédure

^réelle^estbeaucoup plus complexe ^et

raffinée,

^et^tient compte des connaissances qu’on ^a^surla formation et la structure des filons ; elle est ici outran- cièrement

simplifiée

pour les besoins de

l’exposé.

(4) La distinction de ce qui ^est"essentiellement" aléatoire et de ce qui ^est"pseudo- aléatoire" renvoie à des

problèmes mathématiques

^de^trèshaut niveau. Pour la

compréhension

des situations décisionnelles, ^{elle n’a}^aucuneimportance.

(6)

13 est vraiment

aléatoire,

^ou^seulementapparemment. ^C’est^une

question

^de

point

de

vue(s). ^Quoi qu’il

^en

^soit, l’opération d’échantillonnage

aléatoire à

laquelle l’ingénieur

^{va se}^livrer^sur^le^lot^va

engendrer

^une^autredistribution de

probabi- lité,

^dont^onsouhaitera naturellement

qu’elle

^soitdans des relations

précises

^avec

la distribution des

caractéristiques

^{dans le}

lot,

^de^sorteque

puisse

^être

interprété

clairement la passage de celle-ci à

celle-là (6 ).

Un second passage ^seraeffectué ensuite, de la distribution de

probabilité

^issue^de

l’échantillonnage

^auxestimateurs

qui

^aurontpour fonction de la

représenter

pour les besoins

pratiques :

moyennes, variances, fractiles ^et^valeurs

extrêmes, étendues,

^etc.

Ce

qu’il

^faut

retenir,

^c’estque

l’échantillonnage

^aléatoire

implique

^une^modé-

lisation, (qui

^consiste^en^la

représentation

^d’un

objet

^par^unedistribution de

proba- bilité) ; c’est-à-dire,

^en

fait,

^les

premiers

linéaments de

l’expression

^d’un

point

^de

vue

pratique

^dans^toute

opération

relevant de la

statistique (point

^essentiel^sur

lequel je

reviendrai

longuement

^dans^la

suite).

^Ily ^ades _usagesrelativement élaborés de la

statistique

^{où le}^recours^{à des}^modèles^estévident. C’est le cas des

analyses

de

plans d’expériences (modèles linéaires),

^des

statistiques

de processus

(modèles

de BOX et

JENKINS,

^ou

autres),

^etc.^Dansl’estimation

ponctuelle

^d’un

paramètre numérique unique,

^il^se^{réduit à}^sipeu de chose

(la représentation

d’une caracté-

ristique originelle, quelle

que soit ^sanature, par ^un

paramètre

^issu^d’uneloi de pro-

babilité) qu’il

^endevient presque invisible.

La modélisation est un moyen de connaissance d’une extrême

généralité ;

elle n’est pas

particulière

^{à la}

statistique.

^La

première caractéristique

^de

celle-ci,

bien au-delà de l’estimation

ponctuelle,

^est^de^recourirà des modèles formés par des distributions de

probabilité.

^C’est^ainsi

qu’en

^Théorie

Statistique

^des

Décisions,

on sera amené à considérer un espace dont les éléments ^sontdes distributions de

probabilité,

^et

qu’on appelle

conventiennellement

"espace

des états de la nature".

Il doit être évident

qu’il

^fautconsidérer

qu’il s’agit

^{là d’une}

appellation contractée ;

cet espace ^est^enfait celui des "modèles des états de la nature".

La

statistique présente

ênôutreûne^seconde

caractéristique.

Dans les _usagesdirects du Calcul des

Probabilités,

^{on a}^affaire^à^un

phéno-

mène aléatoire

qu’on représente

par ^unedistribution de

probabilité (c’est-à-dire

un

objet mathématique

^non

aléatoire).

^{Dans les}^usages

statistiques

^{du Calcul}

des

Probabilités,

^{on a}^affaire^à^unedistribution de

probabilité, qu’on représente

par ^unevariable

(ou

^un^vecteur,^{ou un}

processus)

aléatoire. Les

problèmes

^de

statistiques

^serattachent ainsi à la vaste classe des

problèmes

^inverses.

Mais,

^comme les distributions de

probabilité

^sont^de

simples objets mathématiques, qu’on

^ne

rencontre pas à l’état natif dans les

phénomènes naturels,

^on^est^bien

obligé

^{de les}

fabriquer

ad hoc. C’est la fonction de

l’échantillonnage

aléatoire. Dans toute

application

^{de la}

Statistique,

^ily ^anécessairement au moins trois

types d’objets :

des

"objets

^{de la}

nature",

des modèles

probabilistes

^de^ces

objets,

^etdes valeurs observées de variables aléatoires.

(5) ^Sur

l’importance

^du

"point

^devue", ^voirplus ^loin(§ VI.2). ^Si^on^seplace ^dupoint

de vue de la technique de fabrication du fil, ^il^sepeut que l’ensemble des

caractéristiques

^de

celui-ci soit à considérer comme une occurrence d’un _processusergodique, c’est-à-dire comme une distribution non aléatoire reproduisant ^en^{un sens}

précis

^unedistribution aléatoire.

(6) Une situation comparable existe dans toutes les applications

démographiques

^de

la Statistique, ^où^l’on^étudiela distribution de

caractéristiques

(âge, taille, poids, etc.) ^dans

une population. ^Cettedistribution ne doit pas être confondue ^aveccelle de l’échantillon, ^extrait

de la population par ^unacte aléatoire ^ou

pseudo-aléatoire,

^surlequel ^on^{fait des}mesures ou des observations.

(7)

111.2. Ce

qu’apporte,

^et^ceque

n’apporte

pas, l’estimation

ponctuelle.

Nous avons vu que l’estimation

ponctuelle

^fournit^une^mesure

approchée

d’un

paramètre (ou

d’un ensemble de

paramètres)

d’un modèle. Elle

peut

ênôutre fournir un indicateur de l’erreur commise - mais non pas ûneborne

supérieure -

sous la forme d’une

variance,

^d’une^variance

estimée,

^ou^d’une^étendue^de^l’échan-

tillon. L’indicateur

variance,

notamment,

permet

de comparer divers estimateurs d’un même

paramètre,

^et^de^choisir^le

plus précis (le plus "efficace").

D’autre

part,

l’estimation

ponctuelle

^{ne se}

prête

pas à ^satraduction en

consignes

^d’action

(Elle

^favorise^mêmel’illusion

qu’on peut

faire des

Statistiques

"à toutes

fins",

sans aucune idée des

applications qu’on

^en

tirera).

L’estimation par intervalle de confiance va avoir pour

objet

de remédier au

premier défaut,

^le^test

statistique, jusqu’à

^un^certain

point,

^au^second.

IV. L’ESTIMATION PAR INTERVALLE DE CONFIANCE

L’estimation par intervalle de confiance est directement

inspirée

de la concep- tion élémentaire de l’erreur

physique

^de^mesure.

l’exemple

^le

plus simple,

^celui

de l’estimation de la moyenne d’une variable normale de variance connue, est parfaitement

représentatif.

Soit X ⁼

(X 1, X2 ... Xn )

^unéchantillon de n variables normales

indépen- dantes,

^{de même}

distribution,

de moyenne ^m

(inconnue)

^et^de^variance

a2 (connue).

^{Soit X}

i

Pour toute

probabilité

^e,^on

peut

^définir^un^nombre

n

_ _

positif te

tel que l’intervalle

(X - tel,

^X⁺

teo)

^contienne^la^moyenne^m^{avec une}

probabilité

¹^-^e.^Autrement

dit,

^X^est^une^mesure

approchée

^de^m,^{avec une}

erreur dont

teu

^est^une^borne

supérieure,

^avec^la

probabilité

¹^-^e.

On voit bien ce

qu’apporte

l’estimation _parintervalle de confiance par rap-

port

^àl’estimation

ponctuelle :

^des

précisions

^sur^l’ordre^de

grandeur

de l’erreur

commise, qui permettent

^desraisonnements

informels,

véritables

embryons

^dé

raisonnements décisionnels : par

exemple,

^on

peut

^testerla validité d’un modèle

qui

^affecte^{à la}moyenne ^m^unevaleur

mo

^Si

mo

^esthors de l’intervalle de con-

fiance

calculé,

^{on sera}^enclin^à

rejeter l’hypothèse.

Mais on voit en même

temps

^les

questions qu’elle

^soulève.

D’abord,

^{celle de}

l’interprétation

^du

concept

^de

probabilité, qui

^a^fait^couler des flots d’encre dans des batailles

épiques

^entre

"subjectivistes"

^et

"fréquentistes".

Pour un

"subjectiviste",

^comme

SAVAGE,

^la

probabilité

^{e a}^la

signification

d’une évaluation

personnelle (subjective)

^du

"degré

de croyance rationnelle"

(selon

une formule due à

Keynes)

dans la réalisation de l’évènement

auquel

^elle

s’applique (en l’occurrence,

^cet^évènement^{est :}"l’intervalle de confiance ne contient pas la moyenne

réelle") (7).

^Pour^un

"fréquentiste",

^comme^von

MISES,

^elle^est^la (7) ^Lathèse de SAVAGE est que l’évaluation

"personnelle"

^des

probabilités

^combine

une évaluation initiale, purement originelle ^et^ultime(sans ^fondementrationnel, pur produit

de la "croyance") ^etl’information fournie par l’observation. Elle revient en fait à supprimer ^le concept ^de

probabilité,

pour le remplacer par celui d’estimateur bayésien ^{de la}

probabilité,

jugé

^seul

opérationnel.

(8)

15 limite de la

fréquence

^deréalisation de l’évènement dans une suite aléatoire infini d’estimations

répétées.

J’indique

^dèsmaintenant

(et je préciserai plus

^loin

pourquoi)

^{que le}

point

de vue

subjectiviste

^me

paraît

devoir être fermement

rejeté -

^{bien que}^son^attrait

soit

explicable,

^et^que^certaines^idées

qu’on

lui rattache soient validables dans ^une autre

approche - ;

^maisque les

réponses "fréquentistes",

^bien

qu’inspirées

^d’idées

plus saines,

^etfinalement

plus intelligibles,

^restententachées de faiblesses

qui

^ne

leur

permettent

pas de convaincre. La faiblesse du

"fréquentisme"

^tient^d’abord

à ce

qu’il

^a^de^commun^avec^le

"subjectivisme",

^à^savoir^une^excessivefocalisation

sur le seul

concept

^de

probabilité

^d’un^évènement

particulier.

^LaThéorie moderne des Probabilités ne raisonne

plus

^ainsi.^Ses

objets

^sondes espaces ^oudes distributions de

probabilité,

^oùl’on associe de

façon

indissoluble les

probabilités

^à^un

ensemble d’évènements

(une

^tribu

d’évènements),

^dont^on^ne

peut

^sans

dommage

méconnaître la

signification,

^comme^on^le^verra

plus loin ($ ).

Quoi qu’il

^en

^soit,

l’estimation par intervalle de confiance _poseune autre

question, apparemment plus mineure,

^mais^dont^les

conséquences

^vont^se^montrer

à très

longue portée : Pourquoi,

^dans

le cas

illustratif

choisi, prendre

^un^intervalle

symétrique

par

rapport

à l’estimateur X ?

Pourquoi

pas ^une

demi-droite,

^{à droite}

ou à

gauche, -

ce

qu’on fait, d’ailleurs,

dans d’autres cas - ? Ou

même, n’importe quel

intervalle

(X - _{tl a ,}

^X⁺

t2 a),

pour peu seulement

qu’il

y ait ^une

probabi-

lité 1 ^-e

qu’il

^contiennela moyenne m ?

C’est d’abord ^une

réponse

^à^cette

question

que la Théorie

classique

^des^tests

va nous proposer. Mais ^sa

réponse

^{va se}^trouver^être^en^même

temps

^l’amorce

(seulement l’amorce)

d’une très

importante

^évolution.

V. LA THEORIE

CLASSIQUE

^DES^TESTSDE NEYMAN ET PEARSON

V. 1. Le test d’une

hypothèse simple

^contre^une

contre-hypothèse simple.

NEYMAN et

PEARSON,

^vers

1930,

démontrent un théorème

qui apporte

une

réponse

^{à la}

question

^duchoix de l’intervalle de

confiance, parmi

^tous^ceux

de même

risque.

On a vu que l’estimation _parintervalle de confiance se

prêtait plus

^ou^moins

à des

applications

décisionnelles en

permettant

^le^cas^échéant^de

rejeter

^une

hypo- thèse,

ou, dans le cas

contraire,

de lui maintenir

(ou peut

^être^de

consolider)

^son

statut

d’hypothèse envisageable.

Le théorème de NEYMAN et PEARSON va

plus loin,

^en

opposant

^{l’une à} l’autre deux

hypothèses respectivement appelées l’hypothèse

^et ^la ^contre-

(8) Historiquement, ^le

fréquentisme

^a^buté^{sur un}obstacle instructif : la difficulté très grande qu’il y ^aà définir formellement la notion de suite aléatoire (la définition n’est _pas

unique, îly âplusieurs façons possibles, pour une suite, ^d’êtrealéatoire ; êtîly faut des mathé- matiques d’un niveau très avancé). De sorte que l’ambition de ^vonMISES de déduire de cette notion une axiomatique ^desProbabilités aisément intelligible ^s’esttrouvée ruinée. Cela dit,

la tentative de von MISES n’a _paspeu contribué à lancer un courant de recherches mathéma- tiques fécondes. Moralité : il est illusoire de vouloir fonder une axiomatique ^sur^des

présup- posés

philosophiques ; ^uneaxiomatique, ^c’est^une

synthèse

^de^travauxscientifiques. ^{Mais les} idées philosophiques peuvent

suggérer

^deschamps de recherches.

(9)

hypothèse.

Nous allons

indiquer

^soncontenu et voir sa mise ^{en oeuvre}

d’après

^un

exemple

illustratif.

Nous

imaginons

^un

ingénieur chargé

^de

réceptionner

^un^{lot de}^ciment^pour

construire un ouvrage délicat. Il a besoin d’un très bon

ciment,

^bien^défini.

Or,

c’est un

ingénieur

^très

expérimenté

^et,

d’après l’aspect

^du

produit livré,

^il^a^l’im-

pression

que c’est un autre ciment

qu’on

^lui^a

^livré,

lui aussi bien

défini,

^mais

impropre

^à

l’usage qu’il

^veut^en^faire.^Il^sait

qu’on peut

^les

distinguer

par ^{une ana-}

lyse chimique

^facile^et^assez

précise portant, disons,

^sur^lasilice soluble

(dans

l’acide

chlorhydrique dilué).

^Le

premier

^doit^avoir^une^teneur

() 0’

^et^{le second}

91.

¹

Pour faire le test, ^{on va}échantillonner le ciment

(correctement,

^nous^le

supposons),

et

analyser

ⁿ

petites prises,

êtônôbtiendraûnensemble de n résultats

d’essai,

X ⁼

(X1, X2

^...

Xn ) qu’on peut

considérer ^commedes variables aléatoires indé-

pendantes

^en

probabilité,

^{de même}

distribution,

dont la moyenne ^est

80

^si^le

ciment est le bon

ciment,

^et

81

^sic’est le mauvais. Nous admettons en

plus

que la distribution des

Xi

^est

^normale,

^ce

^qui

^est

^plausible

^s’il

^s’agit

d’erreurs de mesures

expérimentales.

L’ingénieur

^doit^ici

prendre

^unedécision :

accepter

^la

livraison,

^ou^la

refuser ;

ou, en d’autres termes, il doit choisir entre deux

hypothèses : l’hypothèse Ho

que 0 ⁼

80

^et

l’hypothèse Hl

^{que 0}⁼

91.

La théorie nous dit

qu’il peut

^le^faire

en fonction de la valeur de la variable aléatoire X ⁼

- ,

^etselon que ^cette

n

_

valeur sera ou non ^dans^un^certainsous-ensemble A des valeurs

possibles

^{de X.}

Par

exemple,

^si

X

est dans

A,

^on

acceptera

^la

livraison,

^et^onla refusera dans le

cas contraire. A sera

appelé

^ensemble

d’acceptation

^de

l’hypothèse Ho*

Plus

précisément,

le théorème de NEYMAN et PEARSON nous

permet

de déterminer une classe d’ensembles

d’acceptations possibles,

tels que

A, qui jouissent

^d’une

propriété optimale

que ^nousallons énoncer maintenant :

De toutes

façons,

^du^faitdu caractère aléatoire de la _mesure,il subsiste

toujours

^une

possibilité

^de^se

tromper ;

^nous

appelons

^a

(ou risque

^de

première espèce)

^la

probabilité

^de^refuser^lafourniture alors

qu’elle

^est

bonne ; et (j (ou risque

de seconde

espèce)

^la

probabilité

^de

l’accepter

^alors

qu’elle

^est^mauvaise.

Remarquons

que l’ensemble

d’acceptation A,

dont le choix fait

partie

^de

la

procédure

^de

décision,

est exactement un intervalle de confiance ^auniveau de confiance 1 ^-

et (9).

^Pour^a

donné,

nous avons une infinité de choix

possible.

Le théorème de NEYMAN et PEARSON nous dit alors comment choisir celui

qui

rend minimum le

risque

^de^seconde

^espèce.

^En

l’occurrence,

ce sera une demi-

droite,

^{de la}^forme

(X a) (10 )

^si

80 81 ;

^ou

(X

>

a)

^{dans le}^cas^contraire.

Ce que

je

^viens^de

décrire,

^c’est

l’embryon

^dela théorie

classique

^des^{tests ;}

ce

qu’on appelle

^le^test^d’une

hypothèse simple

^contre^une

hypothèse simple.

^Il

appelle déjà

des commentaires très instructifs.

(9) ^{A ceci}

près

que, ^au

départ,

^cen’est même pas forcément un intervalle ; ^cepeut ^être n’importe quel sous-ensemble (plus

précisément,

n’importe quel sous-ensemble mesurable, c’est-à-dire auquel ônpeut âttribuerûne

probabilité).

Pratiquement ^{ce sera}^en

général

ûn intervalle, ôuûnensemble fini d’intervalles.

(10) ^Nous^neraffinons pas : ^enparticulier ^{nous ne}^demandonspas si cette demi-droite est ouverte ou fermée.

(10)

17

1) C’est

^la

présence

^d’une

contre-hypothèse

déterminés

Hl ⁽⁸

⁼

81)

^en

face

^de

l’hypothèse

^testée

Ho ^{(8 =} 00) ^{qui fixe}

^{le choix}de l’ensemble

d’accep-

tation

(qui

^est^en^même

temps

intervalle de confiance de

l’hypothèse Ho ) ^parmi

tous ceux

qui

^réalisent^le

risque

^de

première espèce supposé

donné. Une des lacunes de la théorie de l’estimation par intervalle de confiance est donc comblée.

2)

^{Au niveau}

embryonnaire qui

^vient^d’être

décrit,

la théorie des tests pos- sède une

caractéristique qu’elle

^va^{tendre à}

perdre

^dans^ses

développements

^ulté-

rieurs,

^et

qui

^sera

récupérée

dans la théorie

statistique

des décision : les deux

hypothèses

^sonttraitées de

façon globalement symétrique.

^Même^sile théorème de NEYMAN et PEARSON

privilégie

^le

risque

^de

première espèce

^a,pour fixer ensuite la valeur du

risque

de seconde

espèce 0,

^il^est

parfaitement applicable

^à

l’envers,

^et^donnele même résultat. En

fait,

^ilexiste trois

paramètres,

^les

risques

a et

0,

^et

l’effectif

d’échantillon _n,

parmi lesquels

^deux

peuvent

^êtrechoisis libre- ment ; ^letroisième en découle.

Cette

symétrie

^est^uncaractère intéressant. Elle

signifie

que, ^sil’on

rejette l’hypothèse Ho’

^on

^peut

donner à la décision de

rejet

^un^contenu

positif:

^celui

de

l’adoption

^de

l’hypothèse Hl. (et

^nonpas le ^contenu

purement négatif

^du

rejet

^de

Ho)’

^Autrement

^dit,

^la

^porte

^est

^déjà

entr’ouverte à la considération d’une

multiplicité

^{de choix}

possibles ;

^il^ne

s’agira plus d’accepter

^ou^de^refuser^une

hypo-

thèse

privilégiée,

^maisde choisir

parmi plusieurs hypothèses possibles.

3)

L’élaboration des relations

qui

définissent un test

statistique peut

^conduire à les

interpréter

^commedes relations entre un

"signal"

^et^un"bruit de fond".

Par

exemple,

^siles variables aléatoires

observées, qui

^sont^lescoordonnées de

l’échantillon,

^sontdes variables

normales,

^de^variance

a 2

^etde moyenne

80

ou

81,

^selon^que

l’hypothèse

^réalisée^est

Ho

^et

Hl,

^{on aura}

(où

^h

(a, j3)

^est^une^fonctiondécroissante de a et

j3).

Si nous nous donnons les trois

paramètres

^a,

^j3

^{et n,}^nous^voyonsque ^nous

ne pourrons obtenir que les

risques

^soientinférieurs ou au

plus égaux

^à^a^et

j3

que ^si

81 - 80

^est

^supérieur

^{ou au}

^plus ^égal

^ausecond membre de

(1).

^Nous^ne

pouvons donc discriminer deux

hypothèses

que ^sileur

distance 10 1 - 801 ¹

^est

supérieure

^à^unnombre fixé par les

risques,

^la^variance

os

^etl’effectif d’échantil- lon. On

peut

^dire^encoreque ^cesdeux derniers

paramètres

caractérisent ^un"bruit de

fond",

^etque la distance ^entreles deux

hypothèses

^est^un

"signal" qui

^ne

peut

être

détecté,

compte ^tenudes

risques

^a^et

0,

que s’il ^est^assez

grand.

N.B. : Les notions de

"signal"

^etde "bruit de fond" sont donc relatives à des

risques

^donnés.

4)

^Nous^n’avonsencore aucun moyen de déterminer "rationnellement"

ces

risques.

Lorsqu’il s’agit d’applications

à des contrôles de

qualité,

^{dans le}^{cadre de}

procédures normalisées(ou réglementées autrement),

^les

risques

^a

et {3

^sont

parfois spécifiés,

^et

l’ingénieur

n’a pas à ^se

préoccuper spécialement

^{de la}

façon

^{dont ils}

ont été choisis. En

fait,

ils résultent d’un usage

empirique, qui

^a^montré

qu’ils

étaient d’un bon ordre de

grandeur.

Mais,

^{dans des}

applications

^moins

standardisées, (et d’ailleurs,

^aussi

bien,

_pour

spécifier

^les^normes^et

règlements),

il faut bien

s’interroger

^sur^la

façon

^{de fixer}

Revue de Statistique Appliquée, 1984, ^vol.XXXII, n° 1

(11)

les

risques.

^Les

praticiens

^saventintuitivement que ^ceux-cidoivent tenir

compte :

- du coût de décisions

erronées ;

- de l’information

préalable disponible

^surles vraisemblances des

hypothèses

^du

test.

Ils doivent être d’autant

plus petits

que le coût des ^erreurs^est

plus

^élevé

et que les

hypothèses

^sont

plus

vraisemblables.

Sont ainsi soulevées deux

questions :

^{celle du}^coûtdes décision

erronées,

et celle de la vraisemblance des

hypothèses ;

^mais^il^est^évident

qu’elles

^ne^sont

pas

explicitement posées

par la théorie

classique

d’une manière

qui

permette de progresser ^versleur solution.

V.2. Extensions de la théorie

La théorie du test d’une

hypothèse simple

^contre^une

hypothèse simple

^ne

s’applique qu’à

^des^cas^tellement

particuliers qu’il

^est

impossible

^d’en^rester^là.

On a donc cherché à

l’étendre,

^mais^sans^{arriver à}^une^théorievéritablement _syn-

thétique (ce qui n’empêche qu’au

passage, ^on

arrivait,

dans le cadre de ^cettethéorie

quelque

peu

difforme,

à des résultats fondamentaux

importants(11 )). (D’une part,

on a cherché à traiter le

concept d’hypothèses composite,

c’est-à-dire

posant l’ap- partenance

^du

paramètre

^{testé à}^un

^ensemble, plutôt

que

simplement

^son

égalité

à une valeur.On a introduit pour cela le

concept, techniquement utile,

^de

fonction

de

puissance (ou ^celui, équivalent,

^{de courbe}

d’efficacité).

D’autre

part,

^{on a}cherché dans certains cas

(par exemple

pour les tech-

niques

^de

plans d’expériences)

^àconstruire des tests

d’hypothèses multiples,

^c’est-

à-dire

permettant

de considérer

plus

^{de deux}

hypothèses. Cependant,

^en

règle géné- rale,

^il^ne

s’agit

pas, pour l’utilisateur du test, de choisir entre différentes

hypo-

thèses exclusives les unes des autres, mais de démolir ^une

hypothèse composite

par morceaux, inclus les uns dans les autres. Par

exemple,

^une

analyse

^de

régression portera

^sur,

disons,

⁴

paramètres,

^dont^on^voudra^tester

l’égalité

^à⁰

(ce qui signi-

fiera

qu’ils

^sont^sans^effet^surla valeur de la variable

dépendante).

^Un^test

global

montre que

l’hypothèse

^doit^être

globalement rejetée ;

^{mais cela}

n’empêche

pas que

peut-être

certains de ces

paramètres

^sont

égaux

^à

zéro,

tandis que d’autres

en diffèrent. Un test

d’hypothèse multiple (tel

que les ^testsS de SCHEFFE ou

T de

TUKEY) permet

de décider

(avec

^un

risque d’erreur) lesquels peuvent

^être considérés comme

nuls,

^et

lesquels

^non.

Remarque

Dans ses

développements,

^laThéorie des Tests a

systématiquement

^{tendu à}

estomper

^la

symétrie

^de

l’hypothèse

^et^{de la}

contre-hypothèse, qui

caractérisait le test d’une

hypothèse simple

^contre^une

hypothèse simple,

pour

privilégier

^l’une

des

hypothèses.

Il faut bien voir que les deux

schémas,

^le

symétrique

^et^le

dissymétrique, correspondent

^au^moins^en

première analyse

^àdes visées

pratiques

différentes.

Même si les deux

objectifs

^secombinent le

plus

souvent, ^il^est

important

^de

distinguer

^celui

qui

^vise

l’acquisition

de connaissances de celui

qui

^vise^{le choix} d’un acte de

portée pratique parmi

^unensemble d’actes

possibles

^connues^d’avance.

(11) ^Telsque ^ceuxconcernant, par exemple, ^leconcept ^de"résumé exhaustif".

Réflexions sur les modèles statistiques de décision

R EVUE DE STATISTIQUE APPLIQUÉE

J. B ONITZER