• Aucun résultat trouvé

Statistique et théorie de la décision

N/A
N/A
Protected

Academic year: 2022

Partager "Statistique et théorie de la décision"

Copied!
10
0
0

Texte intégral

(1)

R EVUE DE STATISTIQUE APPLIQUÉE

G. M ORLAT

Statistique et théorie de la décision

Revue de statistique appliquée, tome 12, n

o

2 (1964), p. 5-13

<

http://www.numdam.org/item?id=RSA_1964__12_2_5_0

>

© Société française de statistique, 1964, tous droits réservés.

L’accès aux archives de la revue « Revue de statistique appliquée » (

http://www.

sfds.asso.fr/publicat/rsa.htm

) implique l’accord avec les conditions générales d’uti- lisation (

http://www.numdam.org/conditions

). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

5

STATISTIQUE ET THÉORIE DE LA DÉCISION

G. MORLAT Ingénieur

à

l’E.D.F.

Dans l’ensemble de cette session sur la

statistique, à côté d’exposés,

dont vous avez entendu un certain nombre ce ma - tin et dont d’autres vous seront

présentés

cet

après - midi

et

demain

matin, exposés portant

sur des

pro~rès

dans les

appl ica-

tions

à t’h~droto~ie

et

à l’hydraulique

des

techniques

statis -

t i ques,

il est apparu

i ntéressant à

Y. GIBRAT de

fai re

une

place

tK7Mes, ~ est opparM ~teresso~ta~.G’7M~yde m’a demandé de

o ~o

~et/ïodo~o~te stattstK/Me

e~

ge~eraZ

et ~ ~’a de/~a~de de

faire

le

point (bien partiellement,

car il n’est pas

possible

de

fai re

un

exposé exhaut i f

sur

l’évolution

de la

méthode)

des

idées fondamentales

de la

statistique.

Je pense, en

effet,

que

c’est

utile parce

qu’ il n’y

a

probablement

pas

beaucoup d’exemples

de

disciplines

dont les

acceptions

dans les diverses

techniques

soient aussi diverses que le sont les diverses

acceptions

de la

statistique.

L’expansion considérable

de la

statistique,

au cours des

dernières

dix ou

quinze années, expansion qui

a

fai t

connaître

à

ces

méthodes

les

succès

que vous savez dans les domaines et les

techniques

les

plus variés,

a

peut-être

un peu

fait

oublier

des

efforts

de

réflexion portant

sur les bases

logiques,

sur la

théorie même,

induction

statistique

comme on

dit, c’est-à-dir e

les

principes

de raisonnement

qui

sont

à

la

base

des

méthodes statistiques,

et il est sans doute

utile, même

pour des

prati- ciens, d’être

tenus au courant de ces travaux.

Même si les

statisticiens, qui

sont gens

raisonnables,

s’en

plaignent rarement,

la

statistique

est une

discipline

bien mal

nommée,

et de ce

fait, parfois

mal renommée. Combien de nos

contemporains pensent

en-

core, avec un personnage de

Labiche,

que le métier du statisticien con- siste à

compter

le nombre de

sexagénaires qui

traversent le Pont Neuf

un dimanche

après-midi.

Il est bien vrai que le rôle de la

statistique,

il y a un siècle ou

deux,

c’était de

compter

les choses.

"Science,

dit

Littré, qui

a pour but de faire connaître

l’étendue,

la

population,

les ressources

agricoles

et industrielles d’un Etat... Les éco-

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

(3)

6

nomistes ont créé un mot pour

désigner

la science de cette

partie

de l’économie

politique

-les dénombrements- et

l’appellent statistique".

Cette vocation de

compter

les

choses,

dont on

pouvait

se gausser

au siècle

dernier,

a revêtu

quelque noblesse, depuis qu’on

a reconnu

combien elle est essentielle à la bonne marche des

systèmes économiques,

et donc des sociétés humaines.

D’ailleurs,

si les Incas

prenaient

très au

sérieux,

avec

raison,

ceux de leurs fonctionnaires

qui

étaient

chargés

de

faire des noeuds sur des ficelles de couleurs

diverses,

tenant ainsi à

jour

les

statistiques

vitales de leur Etat -comment nos

contemporains

n’auraient-ils pas de la considération pour des hommes

qui disposent

maintenant de machines à calculer

électroniques, puissantes

et

coûteuses, qui

savent avec une bonne

précision

de

quoi

sont faites la

population

et

la

production

de leur pays et

qui peuvent fournir,

sur

demande,

au gou-

vernement,

des chiffres pour éclairer ses décisions ?

Nous devons donc constater que la

statistique,

au sens de

Littré,

a connu au cours des dernières décennies une

promotion considérable,

et

cela suffirait à en faire une

discipline

pour l’honnête homme. Mais en même

temps

le terme de

statistique

a

progressivement désigné

un do-

maine d’activité intellectuelle infiniment

plus vaste,

et c’est de cette évo- lution là que

je

veux

parler.

La

première phrase

d’un traité élémentaire de

statistique, publié

il y a

quelques

années aux

Etats-Unis,

est celle-ci :

"La statistique

est

un ensemble de méthodes pour

prendre

des décisions raisonnables en

pré-

sence

d’incertitudes".

Comme toutes les décisions humaines sont

prises

en face

d’incertitudes,

cette modeste

phrase indique

donc que la statis-

tique,

c’est la méthode pour

prendre

des décisions. Nous voici assez loin de la science des dénombrements. Par

quel

chemin la

statistique

-sans

changer

son

étiquette,

ce en

quoi

elle a

peut

être eu

tort, puisque

c’est

source de

malentendus,

mais il est

trop

tard de toute

façon

pour y reve- nir- par

quel

chemin a-t-elle pu passer des dénombrements à la théorie des Décisions ? C’est ce que nous nous proposons ici de mettre en lu-

mière,

en

retraçant

sommairement les

étapes

par

lesquelles

la méthode

statistique

a

progressé ;

nous n’aurons

guère

le souci de

respecter

l’ordre

historique

de cette

évolution,

mais seulement de montrer comment

s’enchainent,

d’une manière toute

naturelle,

les diverses

conceptions

de

la

statistique qui

vont de la

"comptabilité

des

choses"

à la

logique

des

décisions.

Les

premières étapes

sont les mieux connues. Pour rendre com-

modes les

dénombrements,

et pour

présenter

leurs résultats sous forme succincte et

maniable,

on a l’habitude de calculer des moyennes et des écarts moyens, d’établir des

polygones

de

fréquence,

ou des

histogrammes,

des

fibrogrammes,

des courbes d’observations

classées,

et

quelques

autres

représentations

commodes. La manière d’établir des tableaux à double entrée -ou

davantage-

les

graphiques représentant

les variations d’un

phé-

Revue de Statistique Appfiquée. 1964 - Vol. XII - N’ 2

(4)

7

nomène selon les valeurs d’un

autre,

le

concept

de

régression,

et le cal-

cul des courbes de

régression

par la méthode des moindres

carrés,

la

définition et le mode de calcul des divers indices de liaison entre des séries

d’observations,

tels le coefficient de

corrélation,

le carré moyen de

contingence,

et

beaucoup

d’autres -tout cela fait

partie

de la statis-

tique descriptive ;

c’est l’art et la méthode pour

manier ;

décrire et ré-

sumer des observations nombreuses. Mais

lorsqu’il s’agit d’interpréter- lorsqu’on

se

demande,

par

exemple,

si deux séries d’observations

peuvent

être

regardées

comme

homogènes - ou

si tel

phénomène dépend

de tel autre- les recettes de la

statistique descriptive

ne nous

permettent guère

de fonder des raisonnements solides. Il

faut,

pour de telles inter-

prétations,

faire

appel

à des

modèles,

et les modèles convenables sont fournis par le calcul des

probabilités.

Est-ce suffisant ? Le calcul des

probabilités,

au sens strict nous

apprend

par

exemple

comment on

peut tirer,

d’un modèle

probabiliste donné,

la loi de

probabilité

de la moyenne d’une série d’observations.

Cela éclaire

grandement

la

situation,

mais le statisticien

voudrait,

con-

naissant des

observations,

et

ayant quelque

idée sur les modèles con-

venables, préciser

ces modèles ou les mettre à

l’épreuve :

il veut in-

duire et non pas déduire. Voilà

pourquoi

le calcul des

probabilités

n’est

pas

suffisant,

et

pourquoi

il a fallu élaborer une discipline

nouvelle

étroitement fondée sur le calcul des

probabilités,

mais

parfaitement

ori-

ginale cependant,

par les

problèmes qu’elle aborde,

et par son

objet pré- cis, qui

est de formaliser

l’induction,

et de fournir le modèle de ce que l’observation nous

apprend

des modèles. Cette nouvelle

discipline

a con-

tinué à

s’appeler statistique

-ou pour être

plus précis,

on la dénomme

statistique mathématique.

.

On convient

généralement

de considérer que la

première pierre

de

la

statistique mathématique

fut

posée

par Karl

Pearson,

avec son célèbre mémoire de 1900 dans le

Philosophical Magazine :

"On the criterion that

a

given system

of deviations from the

probable

in the case of a corre- lated

system

of variables is such that it can be

reasonably supposed

to have

arisen from random

sampling".

En

réalité,

le

problème

de l’induction

statistique

avait été bien vu

depuis

fort

longtemps,

et le Révérend Thomas

Bayes

avait écrit un mémoire,

publié après

sa mort, en 1764 dans les Phi-

losophical

Transactions

-"An

essay towards

solving

a

problem

in the doc-

trine of

chances"-

où il

proposait

une solution

générale

à ce

problème.

Mais la

"formule

de

Bayes"

-dont

C ondorc et, Laplace

et

beaucoup

d’autres

usèrent et abusèrent

parfois- pouvait paraître

bien arbitraire. Au début de ce siècle il semblait souhaitable d’établir la

statistique mathématique

comme une

discipline indépendante

d’éléments

subjectifs

ou

arbitraires,

comme les

probabilités

a

priori

de

Bayes

-et il est assez

plaisant

de

constater que c’est en

s’assignant

un tel

but,

que nous savons

aujourd’hui

littéralement

insensé,

que de

grands

statisticiens tels que Karl

Pearson,

Sir Ronald A.

Fisher, Jerzy Neyman (pour

ne citer que les noms les

plus justement célèbres)

ont pu en effet échafauder les

principaux

cha-

pitres

de la

statistique mathématique,

et donner à cette science une im-

pulsion

telle

qu’elle

a connu, au cours des dernières

décennies,

d’im-

menses succès

théoriques

et

pratiques,

et

qu’elle

est devenue

indispen-

sable dans la

plupart

des domaines d’activités

scientifiques.

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

(5)

8

Mais les différents problèmes de la statistique mathématique-esti- mation des

paramètres,

tests

d’hypothèses, analyse

de la

variance, plans d’expériences, statistiques d’ordre,

etc.

-pouvaient apparaître

comme une collection de problèmes ayant certes en commun ce trait fondamental d’im-

pliquer

une

induction,

des observations au

modèle,

mais pour le reste assez différents entre eux, et presque

hétéroclites,

en ce

qui

concerne leurs formalisations

respectives.

Il a fallu attendre l’oeuvre d’Abraham Wald pour voir se réaliser l’unité de la

statistique mathématique,

sous

la forme de la Théorie des Fonctions de Décision

statistiques,

dont les

divers

chapitres

que nous avons énumérés à l’instant

apparaissent

comme

des cas

particuliers.

C’est une

étape

un peu moins

généralement

connue, et nous nous y arrêterons un

instant,

pour décrire d’une

façon

sommaire

la Théorie

proposée

par Wald. L’intérêt est double à nos yeux : montrer l’unité des

problèmes

de la

statistique mathématique

et mettre en lumière la nécessité de fondements

logiques

que l’on ne

peut

trouver que dans

une autre

théorie,

dont nous dirons

quelques

mots in fine.

Un

problème

statistique comporte les éléments formels suivants : L’ensemble des

observations, X,

est l’ensemble de tous les

"points"

x

qui

constituent tous les résultats d’observations

possibles

a

priori,

pour le

phénomène

étudié.

Naturellement,

x

peut

être un

nombre,

un vecteur,

une fonction du

temps,

ou tout autre élément que l’on voudra.

Les diverses lois de

probabilité prises

en

considération, F,

forment

un ensemble Q. Ce sont des distributions de

probabilité

sur

X,

et elles

peuvent

être en nombre

fini,

ou bien former une famille

paramétrique,

ou être définies de

quelque

autre

façon.

Le statisticien

doit,

au vu des

observations, prendre

une décision.

Les décisions

possibles

d forment un ensemble D. Dans certains cas, on

peut

être amené à

prendre

en considération le

tirage

au sort entre

plu-

sieurs

décisions,

avec des

probabilités

choisies au

mieux :

cela

signifie qu’on prend

en considération l’ensemble

D

des distributions de

probabi-

lité sur D. Du

point

de vue

qui

nous occupe

ici,

cela constitue un détail

technique,

dont nous ne nous encombrerons

guère

par la suite.

Le

problème posé

est de choisir une décision d

chaque

fois

qu’on disposera

d’observations x, c’est-à-dire de choisir une manière de faire

correspondre

un d à tout x ; en d’autres

termes,

nous devons

envisager

les

applications

de X dans D. Une telle

application, Õ,

constitue ce que Wald

appelle

une fonction de

décision,

et nous noterons A l’ensemble des fonctions de décision 6 .

Maintenant,

en vertu de

quelles

considérations

peut-on

être amené à

choisir,

une fonction de décision

plutôt qu’une

autre ? Si l’on

prend

une décision

d,

alors que la loi

qui représente

le mieux le

phénomène

étudié -ce que nous

appellerons

conventionnellement la

"vraie"

loi- est

F,

alors on encourt certains

avantages

et certains

désagréments. Admettons,

avec

Wald,

que ces

conséquences peuvent

être

représentées

valablement par un

nombre,

que nous

appellerons

la

"perte",

ce nombre est donc une

fonction de F et de

d,

que nous

représenterons

par

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

(6)

9

W

(F , d) (fonction

de

perte)

Dans certains

problèmes

de contrôle des

fabrications,

ce

concept peut

être rattaché à une

perte

au sens

ordinaire,

chiffrée en

argent (ce

sera

quelque

chose comme

l’espérance

des divers coûts actualisées ré- sultant d’une décision de

rejet

ou

d’acceptation

d’un lot de

fabrication).

Mais dans la

plupart

des

problèmes statistiques,

il faut admettre que la fonction de

perte représente, forfaitairement,

des inconvénients de toute nature ; on verra

plus

loin

qu’il

suffit de lui attribuer des formes extrê- mement

simples

pour retrouver et dans une certaine mesure

justifier

les

techniques classiques

de la

statistique.

On doit

choisir,

avons-nous

dit,

non pas une

décision,

mais une

fonction de décision : la fonction de

perte

n’est

qu’un intermédiaire,

et l’on attachera à toute fonction de décision Ô

l’espérance

de la

perte

cor-

respondante,

ce que nous écrivons :

et que nous

appellerons.

en

reprenant toujours

la

terminologie

de

Wald,

fonction de

risque.

Le sens de ce nouveau

concept peut

être rendu

plus explicite :

à une distribution de

probabilité

F sur

X,

la fonction de déci-

sion, qui

est une

application

de X dans

D,

associe une distribution de

probabilité

sur

D,

et en

conséquence également

une distribution de pro- babilité pour W : d’où la

possibilité

d’en calculer

l’espérance, qu’exprime

bien la formule ci-dessus.

La considération de la fonction de

risque, permet-elle

de choisir

une

règle

de décision ? Ce sera vrai dans des cas

exceptionnels

où il existera une fonction de décision Ô rendant minimum le

risque quel

que soit F. Mais en

général,

on

peut

s’attendre à ce que la

règle

de déci-

sion, qui

minimise le

risque dépende

de F. Avant de

signaler

comment

on

peut

surmonter cette

difficulté,

illustrons les notions que nous venons

d’introduire,

en examinant

quelques problèmes statistiques classiques .

On connaft le

problème

de l’estimation d’un

paramètre :

la famille

Q des lois de

probabilité

est par

exemple

une famille à un

paramètre, F (x, e)

et on veut,

d’après

des

observations, assigner

une valeur appro-

ximative à 8. C’est bien un cas

particulier

des

problèmes

que nous ve-

nons de décrire. Une décision est constituée par la valeur t

qu’on

attri-

buera au

paramètre,

une

règle

de décision n’est pas autre chose

qu’une

fonction t

(x) -

c’est ce

qu’on appelle

en

statistique mathématique

un es-

timateur.

Supposons

que la fonction de

perte

admise soit

proportionnelle

au

carré de l’écart entre la valeur vraie du

paramètre

et sa valeur esti- mée :

Alors la fonction de

risque

sera, dans le cas d’un estimateur sans biais :

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

(7)

10

Minimiser la fonction de

risque,

c’est donc ici rechercher les estima- teurs de variance minimum : on voit comment on pourra

justifier

la mé-

thode du maximum de vraisemblance et

quelques

autres méthodes clas-

siques

d’estimation.

Considérons maintenant un

problème

de test -et pour

simplifier l’exposé,

nous admettrons

qu’on

s’intéresse exclusivement à des modèles entièrement déterminés : on veut tester une

hypothèse simple F,

contre

une alternative

simple,

G. L’ensemble X étant au reste

quelconque,

Qest

formé des deux lois F et G. L’ensemble des décisions

possibles comporte

aussi deux

éléments,

à savoir :

dl:

conserver

l’hypothèse

F

d2: rejeter l’hypothèse

F

Dès

lors,

une fonction de décision est

simplement

une

partition

de

X en deux sous-ensembles -ou encore c’est la donnée d’une

région

cri-

tique,

ou

région

de

rejet.

Prenons pour fonction de

perte

la fonction

représentée

par le ta- bleau ci-dessous :

Autrement

dit,

la

perte

est nulle

quand

on

prend

une décision cor-

recte, égale

à l’unité

quand

on commet une erreur. On calcule sans

peine

la fonction de

risque, qui

vaut a pour F

et j3

pour

G,

a

désignant

le seuil

de

signification

du

test, et (3

la

probabilité

d’erreur de seconde

espèce.

encore, nous retrouvons tout naturellement des notions

classiques.

Dans

l’exemple

de l’estimation - et du moins pour la

plupart

des

formes de lois de

probabilité d’usage

courant - l’estimateur de variance

minimum,

ou l’estimateur de

Fisher,

ne

dépend

pas de la valeur du pa- ramètre que l’on cherche à estimer : nous sommes dans ce cas

privi- légié

où il existe une fonction de décision uniformément meilleure que toutes les autres- cette

proposition

étant vraie sans restriction

lorsqu’il

existe un estimateur

exhaustif,

et n’étant vraie

qu’asymptotiquement

dans

d’autres cas.

Nous constatons

qu’il

en va tout différemment dans

l’exemple

des

tests : même dans les cas les

plus simples,

il faut choisir un compro- mis entre les deux

risques

d’erreurs a

et P :

: on sait bien

qu’il

n’existe

pas de test

qui

rende à la fois a

et P

aussi

petits

que

possible.

Revue d. Statistique Appliquée. 1964 - Vol. XII - N’ 2

(8)

11

C’est la difficulté

déjà signalée plus

haut : la fonction de

risque

dé-

pend

des deux

arguments

F et Õ. Il faut décider d’un

principe

de choix.

Wald a

suggéré qu’on pourrait

trancher cette ultime difficulté en

adoptant

le

principe

du minimax : la fonction de décision retenue serait celle

qui

réalise la condition :

mins

maxF x

(F, Õ)

C’est une

règle

de

prudence extrême,

et

l’analogie

formelle entre

les

problèmes

de la

statistique

et ceux de la Théorie des Jeux à deux

joueurs

a pu rendre cette

règle

fort séduisante. Mais il convient de noter que la

justification

du minimax dans la Théorie des Jeux réside essen- tiellement en

ceci,

que le minimax conduit à un

point d’équilibre :

si l’un

des

joueurs

s’écarte de la

stratégie optimale,

il sera

pénalisé

Dans les

problèmes statistiques,

l’un des

joueurs

est le

statisticien,

l’autre est la

"nature", qui

est censée choisir la loi de

probabilité

F inconnue. On ne

peut guère

considérer sérieusement que les intérêts de la nature sont op-

posés

à ceux du

stàtisticien

-et le minimax

perd

de ce fait toute

espèce

de

justification.

Wald a étudié par ailleurs une

catégorie

de fonctions de décision dont il a montré

l’importance :

ce sont les fonctions de décision de

Bayes,

c’est-à-dire celles

qui

réalisent une condition du

type

min~ EE r (F, o)

E étant une distribution de

probabilité

sur

l’ensemble Q

des lois de pro- babilité F

(~

est

appelée

habituellement "distribution de

probabilité

a

prio- ri").

Wald a montré que, dans des cas très

généraux,

les fonctions de décision de

Bayes

sont les seules fonctions de décision admissibles -c’est- à-dire telles

qu’il

n’existe aucune autre fonction de décision dont le

risque

serait

plus

faible pour tout F. Aux yeux de

Wald,

il

s’agit

là d’une pro-

priété purement

formelle et la distribution de

probabilité

à

priori

n’est

qu’un

élément formel

intermédiaire, permettant

de sélectionner une classe de fonctions de décision intéressante : c’est que la

statistique

était encore fortement

tournée,

il y a une dizaine

d’années,

vers la recherche de

prin- cipes objectifs.

Aujourd’hui,

un nombre croissant de statisticiens admettent que la recherche d’un

principe

de choix

objectif

est vaine. Les

problèmes

de

décisions

statistiques

dont nous venons

d’esquisser

sommairement les con-

tours,

entrent dans la

catégorie

des

problèmes

de décision en face d’in-

certitudes,

et la Théorie Générale des Décisions nous

apprend

que des choix cohérents -ou rationnels- la définition

précise

de ces

adjectifs peut

être traduite dans des

postulats

aussi convaincants

qu’on peut

le souhaiter -de tels choix sont nécessairement ceux que l’on commettrait en maxi- misant

l’espérance

d’une fonction d’utilité des

conséquences-

ou, ce

qui

revient au

même,

en minimisant

l’espérance

d’une fonction de

perte

con- venablement choisie.

L’espérance

doit être

prise

par

rapport

à une dis-

tribution de

probabilité

traduisant tous les éléments d’incertitude sur les-

quels

n’influe pas la décision du statisticien -et en

particulier

des pro- babilités doivent être affectées aux éléments de l’ensemble Q des modèles.

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

(9)

12

C’est dire que la seule

façon

de donner un fondement

logique

solide

à la

statistique,

semble bien être de considérer que les distributions a

priori ~

doivent

représenter

un certain

degré

de

connaissance,

ou de con-

fiance, préalable,

à

l’égard

des diverses lois F.

Cela,

c’est en

quelque

sorte le droit le

plus général.

Dans la pra-

tique

faut-il recommander de traduire

toujours

les connaissances a

priori

par une distribution de

probabilité,

et considérer que tous les efforts de la

statistique classique

-celle

qu’on appelait

moderne il y a dix ans-

doivent être

passés

par

pertes

et

profits ?

Certains n’hésitent pas à l’af- firmer.

Personnellement,

nous admettons sans réserve que la Théorie Gé- nérale des

Décisions,

ou encore Théorie de la

Probabilité-Utilité,

cons-

titue le seul modèle

logique

valable. Mais le choix effectif des

probabi-

lités a

priori

éveille dans

beaucoup

de situations

pratiques

des

scrupules

trop vifs pour

qu’on puisse

penser

qu’ils

sont dénués de fondement. Il convient de

juger

en connaissance de cause, et dans

chaque

cas

particu- lier, quels

inconvénients

pèsent

le

plus lourd,

de ceux d’un choix hasar- deux des

probabilités

a

priori,

et de ceux d’une

règle

de choix conven-

tionnelle, permettant

de s’en passer.

Heureusement,

dans les

problèmes

les

plus

courants de la

statistique,

on peut reconnaître que ce dilemne est facilement tranché. Nous avons eu l’occasion de constater que le pro- blème de l’estimation des

paramètres

donne

lieu,

sous certaines condi-

tions,

à une

règle

de décision

optimale

évidente. On

peut montrer,

d’autre

part,

que dans

beaucoup

de

problèmes

de

tests,

des

hypothèses

très

géné-

ralement raisonnables concernant à la fois les

probabilités

a

priori

des

diverses

hypothèses

et les coûts des diverses erreurs,

permettent

de

jus-

tifier les méthodes

classiques

-en montrant que la

règle, optimale,

au

sens de la Théorie des

Décisions,

s’écarte assez peu de la convention

courante, qui

consiste à choisir des tests

ayant

un niveau de

signification

faible. Bien

entendu,

cette

propriété

n’est nullement

générale,

c’est une

des raisons pour

lesquelles,

il nous semble nécessaire que les

Ingénieurs,

de même que les autres utilisateurs

possibles

de la

statistique,

soient

informés des

rapports

entre les

techniques statistiques

et la Théorie de la

Décision ;

nous avons

essayé,

d’une

façon beaucoup trop

succincte sans

doute,

d’en donner seulement les

grandes lignes.

Peut-être e-at-il été bon

d’esquisser

avec

plus

de

précision

le contenu de la Théorie Générale des

Décisions ;

mais ceci est une autre histoire...

NOTE

BIBLIOGRAPHIQUE

A. Wald - Statistical Decision Functions.

Wiley,

1950.

J. L. SAVAGE - The Foundations of

Statistics. Wiley,

1954.

Concernant la Théorie Générale des

Décisions,

on pourra consulter :

Revue de Statistique Appliquée. 1964 - Vol. XII - N’, 2

(10)

13

La Décision -

Colloques

Internationaux du

CNRS,

1961.

R.D. LUCE et H. RAIFFA - Games and Decisions.

Wiley,

1957.

G. MORLAT - Des Poids et des Choix.

Mathématiques

et Sciences Hu- maines

n° 3,

ou Bulletin

S.E.D.E.I.S., Futuribles,

26.

DISCUSSION (Président :

M.

MORLAT)

M.

Ferry signale

une difficulté

supplémentaire

à

laquelle

M. Morlat ne

semble pas avoir fait allusion : l’arbitraire du choix de la fonction de perte. Par exemple, dans les problèmes les plus courants d’estimation où l’on minimise une somme d’écarts, on choisit la somme des carrés de préférence à la somme des valeurs absolues parce que cela présente des facilités

mathématiques,

mais on peut se demander si la

première

méthode peut être

logiquement

considérée comme

supérieure à la deuxième.

M. Morlat fait remarquer

qu’une

présentation

générale

de la théorie des fonctions de décision

statistique

permet de recouvrir les divers cas. Il a cité , dans son exposé,

uniquement l’exemple

des techniques d’estimation

classiques.

Mais

il est bien d’accord sur la

suggestion

de M. Ferry : il peut y avoir intérêt, dans certains cas, à remplacer la fonction de perte (t -

9)2

par

quelque

autre fonction ;

si on adopte par exemple pour fonction de perte la

quantité

Prob ( t - e

c),

on

retrouvera comme méthode d’estimation la méthode que Pittman avait présentée

en 1935 ou 1937 sous le nom de "closest

estimate".

On peut aussi bien, en choi- sissant d’autres fonctions de perte, retrouver, et

justifier

dans une certaine

mesure, des méthodes d’estimation assez diverses.

La remarque de M. Ferry vient à point pour

souligner

que, dans certains problèmes, on pourra avoir intérêt à s’écarter des solutions

classiques.

Revue de Statistique Appliquée. 1964 - Vol. XII - N’ 2

Références

Documents relatifs

- Les résultats classiques du calcul des probabilités sur la mesurabilité, les temps d’arrêt, les martingales et la désintégration, per- mettent d’obtenir

adapté à la situation (r t P) et pour le complexe équivalent&#34;^' adapté à la situation (r, z P 0 )- Cette assimilation est couramment admise par les auteurs qui se sont

Les résultats qu'on peut espérer de cette science ont paru tellement avantageux que dans le pays où elle est le plus cultivée, c'est-à-dire en Allemagne, il y a dans chaque

Les connaissances acquises concernent l’estimation des paramètres, les tests statistiques (validité du modèle, e¤et des variables explicatives), la prévision et la sélection

Pour une caract´ eristique ω de la loi d´ efinie par sa fonction de r´ epartition F (en bref nous dirons la loi F) son esti- mateur du maximum de vraisemblance ω est obtenu par

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

L’ensemble des programmes corrects dans un langage de programmation tel que Pascal ou C est donc également un sous- ensemble particulier de toutes les séquences finies que l’on

Contrairement à la justification que donne Keynes des 'esprits animaux', et en dépit de l’observation d’Ellsberg mentionnée plus haut, l'approche d'Akerlof et Shiller (2009) en