R EVUE DE STATISTIQUE APPLIQUÉE
J. M OTHES
Principes fondamentaux de la méthode statistique et applications industrielles (suite)
Revue de statistique appliquée, tome 3, n
o2 (1955), p. 13-26
<
http://www.numdam.org/item?id=RSA_1955__3_2_13_0>
© Société française de statistique, 1955, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
PRINCIPES FONDAMENTAUX DE LA MÉTHODE STATISTIQUE ET APPLICATIONS INDUSTRIELLES (Suite)
par
J.
MOTHESAncien
Élève
del’École Polytechnique,
Ingénieur
auDépartement
Commercial du Gaz de FranceCHAPITRE IV
ESTIMATION DE LA QUALITÉ D’UN PRODUIT
CHAPITRE IV
ESTIMATION DE LA QUALITÉ D’UN PRODUIT
Des indications fournies au
chapitre 3,
il ressortqu’une
desphases
fonda-mentales de
l’analyse statistique
consiste à passer d’une distribution observée à la distributionthéorique susceptible
de luicorrespondre.
Celafait,
rien nes’oppose
en effet à ce que l’on considère la distribution observée comme le résultat d’unéchantillonnage opéré
dans lapopulation hypothétique
infinie distribuée con-formément à la loi de
probabilité
choisie comme modèle deréférence.
On est alors à même de raisonner sur un modèlemathématique
bien défini et d’entirer,
en sens inverse, des conclusions d’ordre
pratique.
Les distributions usuelles les
plus fréquemment
rencontrées enpratique pré-
senten~ l’intérêt d’être entièrement définies par
un petit
nombre deparamètres.
La distribution normale est, par
exemple,
entièrement d’SlÛe par sa moyenne et sonécart-type,
la distribution de Poisson par sa moyenne. Pour passer d’une distribution observée à une distributionthéorique,
on est doncobligatoirement amené,
une fois choisi letype
de la distributionthéorique
deréférence,
à estimerles valeurs des
paramètres qui
définissent entièrement cette distributionthéorique
à
partir
des données constituant la distribution observée. Lesproblèmes
d’esti-mation
présentent
de ce fait un caractère fondamental surlequel
ilparait
inutiled’insister
davantage.
On se propose de
décrire,
au cours des pagesqui
vont suivre, lesprincipes
de l’estimation
statistique. Auparavant,
il n’est pas sans intérêtd’analyser
ceque
représente
le raccordement d’une distribution observée à une distributionthéorique
dupoint
de vue des notions mêmes de"qualité"
et"d’homogénéité"
d’une fabrication.
IV. 1. - NOTIONS DE
QUALITÉ
ETD’HOMOGÉNÉITÉ
D’UNE FABRICATION Le raccordement d’unedistribution
observée à une distributionthéorique
estautorisé par la loi des
grands
nombres.Ayant observé,
parexemple,
des résultats de fabrication distribués commeen IV-1, on
conçoit
la distributionthéorique correspondante
comme lesystème
Fig. IV. 1.
16
limite des
fréquences qui
seraient observées dansl’hypothèse
où le processus defabrication, (à l’origine
decelle-ci),
seraitcapable
deproduire
une infinité depièces
"dans des conditions de marcheidentiques
aux conditions existantes lors de la fabrication du lot examiné". Raisonnant de la sorte, on constate que la distributionthéorique
de référence résume entièrement , dupoint
de vue de lapropriété examinée,
l’influence -sur lafabrication-
dujeu
de l’ensemble des facteurs deproduction
mis en oeuvre pour réalisation de cette fabrication. Celaétant,
cette distribution est trèsétroitement
liée à la notion même de" qualité"
du
produit fabriqué.
Qu’est-ce,
eneffet,
que laqualité
d’unproduit
donné? C’est évidemment unensemble de conditions
imposées
à une ouplusieurs
despropriétés
duproduit
enquestion.
Parconséquent,
pourjuger
de laqualité
d’unefabrication,
troisopé-
rations sont nécessaires ’ *
a) Déterminer
lespropriétés à
retenir comme "critères dequalité", b) Imposer (éventuellement)
des conditions à cespropriétés,
c) Comparer
les résultats effectifs de la fabrication -dupoint
de vue despropriétés
retenues- aux conditionsimposées à
ces dernières.Dès
l’abord,
il saute aux yeux quel~opération (c) implique
la connaissance de la(ou des)
distributionthéorique
de référence relative à la(ou aux) propriété
examinée
(dans
la fabricationprise
enconsidération).
Par
ailleurs,
lesopérations (a)
et(b) n’échappent
pas aussicomplètement qu’on peut
le croire àpremière
vue au domaine de laStatistique.
Si
l’opération (c)
estpratiquement
résolue une fois connue la distributionthéorique
de référence de lapropriété
étudiée dans la fabricationexaminée,
encore faut-il être en mesure de définir effectivement cette distributionthéorique
àpartir
de la distribution des résultats des essaisopérés
enpratique.
Cette dis-tribution
théorique
est d’un usage d’autantplus
commodequ’elle
estsusceptible
d’être résumée par un très
petit
nombre de valeurscaractéristiques.
Dans ces
conditions, si,
au stade del’opération (a),
on a le choix entre deuxcritères de
qualité équivalents
mais dont l’unconduit,
enfabrication,
à une dis- tributionthéorique plus
commode à manier quel’autre,
on atoujours
intérêt àretenir celui-là.,
Au stade de
l’opération (b),
il est d’autrepart
souvent utile de se demandersi les conditions
imposées
aux critères dequalité pris
en considération sont abso- lumentimpératives.
On constate souvent que ces conditions sontfixées,
sanstenir
compte
despossibilités pratiques
defabrication,
àdes niveaux neprésentant,
du
pointde
vue des usagers, aucun caractère de stricte nécessité. Dans la mesureou les méthodes
statistiques permettent
de définir lespossibilités techniques
defabrication,
ilpeut
être utile de tenircompte
de leursenseignements :
c’est cequi
a été fait enAngleterre
dans l’Industrie des MatièresPlastiques
Toutes ces remarques sont aisées à clarifier à l’aide de
quelques petits
schémas.Considérons
d’abord,
pour unproduit donné,
deux critères dequalité
C1 et c2 ,équivalents,
mais dont l’un estdistribué,
dans les fabrications réaliséesen
pratique,
conformément à lafigure
IV-2C1
etl’autre,
conformément à lafigure
IV-2C2 (distribution normale).
Fig. IV. 2. C~ .
Fig. IV. 2.C2.
Dans
l’hypothèse ou, techniquement,
les deux critères dequalité
c. et c2 sontéquivalents,
il est évidentqu’on
a intérêt(opération a)
à retenir C2 , la distributionthéorique
normale étantsimple (elle
est entièrement définie par deuxcaractéristiques
sa moyenne et sonécart-type)
et bien connue.Cette évidence devient
flagrante si,
au stade del’opération (b),
des conditionstechniques impératives impliquent,
pour que la fabrication soit"bonne",
que les valeurs de cs tombent entre deuxlimites
et(/)2.
Il est en effet très aisé de définir laposition
de la distributionthéorique
normale parrapport
à l’intervalle01
etr/J2.
Dupoint
de vuepratique,
lesconsignes
de fabrication à donner pourenregistrer
un minimum derebuts,
sont par ailleurs lesplus simples possibles :
il suffit de
régler
la fabrication au centre de l’intervalle01 07 (Fig. IV-3).
Fig. IV. 3
Avec une distribution
dissymétrique
comme celle de CI -l’aurait-onparfai- tementdéfinie-
ces deuxquestions seraient, évidemment, beaucoup plus
difficilesà trafter.
La
prise
encompte
de la distributionthéorique
de référence d’une fabricationpermet également
une meilleurecompréhension
de la notiond’homogénéité
En
pratique
industrielle on a l’habitude de lier cette notion à celle de"plus
ou moins
grande dispersion"
des résultats de fabrication. Enprésence
de deuxfabrications
analogues F1
etF2
.(Figure IV-4)
et constatant que ladispersion
desrésultats issus de
F1
est inférieure à ladispersion
des résultats issus deF2,
on
dira,
parexemple,
que la fabricationFI
est moinshomogène
que la fabricationF2 .
Or, cetteconception
entraxe bien desdifficultés,
dèsqu’on
veut définir lanotion
d’homogénéité
autrement que sous forme relative. A lalimite,
eneffet,
une "fabrication
homogène" (du point
de vue d’unepropriété donnée)
nepourrait
être
qu’une
fabrication dont tous les individus seraientidentiques,
fabricationinenvisageable
enpratique.
Fig. IV. 4
Il
paraît beaucoup plus
commode de relier la notiond’homogénéité
d’unefabrication à la notion de stabilité des conditions de marche du processus de
production
àl’origine
de la fabricationconsidérée.
Revenant aux fabricationsFt
et
F2 , imaginons
queF1
etF2
soient deux lots d’un mêmeproduit, fabriqués
par18
le même processus, en deux intervalles de
temps
successifs. Nous dirons que’FI
esthomogène
car le faitd’avoir caractérisé la distributionthéorique
de réfé-rence revient indirectement à caractériser des conditions de fabrication stables.
De
façon analogue,
nous dironségalement
queF2
esthomogène.
La différence entre
F1 et F2
prouve toutefois que, d’une fabrication àl’autre,
il y a eu modification des conditions de fabrication. Dans ces
conditions,
nous dirons que lemélange
deF
etF2
esthétérogène.
IV. 2. -
RÉSULTATS
FONDAMENTAUX DE LATHÉORIE
DE
L’ÉCHANTILLONNAGE
L-e
problème
de l’estimationstatistique,
tel que nous l’avonsdéfini,
consiste à passer des données constituantla
distribution observée enpratique
aux valeursdes
paramètres qui
définissent la distributionthéorique
de référence de la fabri- cationexaminée,
cela en considérant la distributionpratique
comme le résultat d’unéchantillonnage opéré
au sein de lapopulation (hypothétique)
infinie de réfé-rence.
Pour résoudre ce
problème,
au moins dans les casclassiques,
il est néces-saire de connaître les
propriétés
des échantillons extraits depopulations
distri-buées conformément aux lois
théoriques
lesplus
couramment rencontrées en pra-tique,
c’est-à-dire les résultats fondamentaux de la théorie del’échantillonnage.
Tous les résultats de cette théorie
reposent
sur unehypothèse
TRES IMPOR-TANTE,
à savoir que les échantillons extraits de lapopulation
le sont "AU HA- SARD". C’estpourquoi
nous reviendronsici,
enpremier lieu,
sur cette notion"d’Echantillonnage
au hasard"déjà
abordée auChapitre
II.Echantillonner au
hasard,
c’est -avons-nous dit- effectuer lesprélèvements
de
façon
telle que tous les éléments de lapopulation
aient, avant chacun destirages,
autant de chances les uns que les autres d’êtreprélevés.
Dans lapratique,
cela
n’équivaut
absolument pas à"prélever n’importe
comment" : il est, au contraire,parfois
difficile derespecter rigoureusement
cetterègle
dujeu pourtant impérative.
Dans certains cas, le
problème
neprésente
pas de graves difficultés.Ayant,
par
exemple,
à faire desprélèvements
dans une caisse contenant depetites
compo- santesmétalliques,
onpeut
admettre si le contenu de la caisse est tout entier àportée
de la main-qutÓn respecte
suffisamment le hasard dèsqu’on
s’astreintà
prélever
un peupartout après brassage,
lespièces
destinées à constituer l’échantillon.Dans d’autres cas,
un peu plus compliqués,
onpeut
encoreimaginer
desplans d’échantillonnage susceptibles, bienque
trèssimples,
de donner satisfaction.Soit,
parexemple,
àprocéder
sur des tubes de verre de1,5
mètre delong, â
desmesures de diamètres. Il suffit de diviser une
règle
de1, 5m
en 100 intervalles numérotés de 1 à 100 et dedisposer
d’un sac de billeségalement
numérotées de 1 à 100.Ayant
alors à effectuer -disons- 5 mesures surun tube,
on tirera 5 numéros dans le sac et, une foissuperposé
le tube à larègle graduée,
on mesurerales 5 diamètres des zones du tube en
regard
des numéroscorrespondants
de larègle.
Onpeut
évidemment se demander s’il ne suffirait pas, dans ce cas y de laisser toute latitude àl’opérateur
d’effectuer les mesures à saguise,
unpeu,partout.
Enfait,
toutes lesexpériences
faites à cesujet
montrent que de telles mesures, effectuées sansprécaution,
ne sont nullementréparties
au hasard.Dans certaine cas,
enfin,
il fautenvisager
desplans d’échantillonnage beaucoup plus compliqués.
De telsplans impliquent l’usage
de tables dites de "nombres auhasard". La
technique
consiste à numéroter de 1 à N les éléments constituant lapopulation. Ayant
alors décidé deprélever
un échantillon de néléments,
on litnnombres dans la table et on
prélève
effectivement les n élémentsportant
les numéroscorrespondants.
Dans la Revue de
Statistique Appliquée (Vol II,
n"4,
page188)
est décrit unmatériel de démonstration
d’assemblages
dontl’usage implique
certainespré-
cautions en vue de
respecter
lesrègles
du hasard. A titreanecdotique
son cas mérite d’être examiné.Ce matériel a pour
objet
de montrer que les tolérances àadopter
surlalongueur
d’un ensemble depièces
mises bout à bout n’est pas la somme des tolé-rances fixées sur chacune des
pièces.
Les éléments de base de
l’appareillage
de démonstration sontquatre popula-
tions de
pièces métalliques. Chaque population comprend
despièces
delongueurs variables,
la distribution du nombre depièces
en fonction deslongueurs
étantnormale
(Fig. IV-5),
et leprincipe
de la démonstration consiste àprélever
auhasard une
pièce
danschaque population,
à mettre lesquatre pièces ainsi prélevées
bout à bout dans un bati
spécial,
cela fait à constater que lalongueur
totale des séries dequatre pièces
ainsi constituées varie dans uninte.rvalle beaucoup
moinslarge
que l’intervalle obtenu par addition despièces
lesplus petites
d’unepart
et lesplus longues
d’autrepart
desquatre populations.
Pour
respecter
larègle
dujeu théorique
deprélèvements
au hasard dechaque pièce
dans lapopulation
àlaquelle
elleappartient,
onpeut imaginer
leprocédé
très
simple
consistant à mettrechaque population
dans un sacpuis
à tirer unepièce
du sacaprès brassage.
Enfait,
on constateexpérimentalement
que cette méthode est très mauvaise.L’opérateur
sent à la main lalongueur
despièces métalliques
et,inconsciemment,
a tendance à ne saisir que lespièces
nitrop
courtes ni
trop longues.
Pour
respecter
lesrègles
du"hasard",
on a été amené à passer par l’inter- médiaire dequatre populations
debilles, chaque
billecorrespondant
à unepièce
etportant,
enguise
denuméro,
lalongueur
de lapièce
dont elle estl’image.
Lesprélèvements portent
ainsi sur des séries dequatre billes,
étant entenduqu’on
introduit dans le bâti les
pièces qui
leurcorrespondent.
Après
ces remarques extrêmementimportantes
sur les conditionspratiques
de
l’échantillonnage
auhasard,
ilparait
suffisant d’énumérer lesprincipaux
ré-sultats de la théorie de
l’échantillonnage susceptibles
d’être utilisés dans la suitede cet ouvrage. Ces résultats sont les suivants :
, a) Population distribuée
defaçon quelconque
Les moyennes m’ des échantillons extraits au hasard d’une
population quel-
conque de moyenne m et
d’écart-type
C se distribuent suivant une loi demoyenne
m et
d’écârt-type C1 / ~n
De
plus,
cette loi tendrapidement
vers la loi normalelorsque l’importance M
del’échantilloa
augmente.
Graphiquement,
ce résultat est schématisé sur lafigure
IV-6.b) Population distribuée de façon
normale-1)
Les moyennes m’ des échantillons extraits au hasard d’unepopulation
nor-male de moyenne m et
d’écart-type
a sont elles-même distribuées suivant une loi normale de moyenne m et d’écarttype 0 / ~n
et celaquelle
que soitl’importance
del’échantillon
Graphiquement,
le résultat est schématisé sur lafigure
IV-7.2)
Les distributionsdes Variances
desécarts-types
et des étendues des échantillons extraits auhasardd’unepopulation normale
sontparfaitement
connues.D’expressions
relativementcompliquées,
on les a "tabulées" pour les mettre sousune forme commode à utiliser en
pratique.
Dans la Revue deStatistique Appliquée
(Vol
II, n"3,
page127) figure,
parexemple,
la "fonctionde distribution" de la20 Fil. IV. 5.
§ 0
-lu
~-
c
Ci-~
~
.0
~
’1.!2
Qt-:
oc
~
~0
&
tri
~
22
loi des étendues
(rapportées
àl’écart-type)
pour des échantillons de taille n variant de 2 à 12 unités(1).
..c) Population
dont les éléments sontdistingués
en cc convenables et«défectueux"
La
proportion
de déchetsprésentée
par des échantillonsextraits
au hasard d’unepopulation
dont les éléments sontdistingués
en Il convenable s" et "défectueux"est distribuée suivant une loi binomiale dont une Íormet1imite est la loi de Poisson.
Les deux distributions ont été étudiées au cours du
Chapitre
II.IV. 3. - LES
TECHNIQUES
D’ESTIMATIONExaminant,
au début duchapitre III,
la nature des raisonnementsstatistiques,
on a
longuement
insisté surl’introduction,
dans lesraisonnements, de
cequ’il estconvenud’appelerles "connaissancesapriori".
On aindiqué,
à cette occasionrqu’il
étaitpréférable
de se passer de telles connaissanceslorsqu’elles
ne repo- saient pas sur des élémentsd’appréciation objectifs. ’
Cela
posé,
ondispose
de deuxcatégories
detechniques d’estimation
selonqu’on
utilise ou non des données apriori.
Nousdésignerons les premières
sousle vocable de
"techniques
aprioristes",
les secondes sous le nom’ de"techniques
d’estimation par estimateurs".
a)
Lestechniques à prioristes
Elles
reposent
sur un théorème célèbre -le théorème deBayes- évoqué,
sansle
citer,
J au cours de la section III.2.Ce théorème
peut
s’énoncer de lafaçon
suivante :"Si l’on sait
qu’un
événement B s’estproduit
et si l’on sait que cet événement.ne
peut
êtreprovoqué
que par un certain nombre de causesAt A2
...Am
dont onconnaît les
probabilités
apriori,
lesprobabilités
d’ inte rvention de s causesAI A 2
...
Am, compte-tenu
de l’arrivée effective de l’événement B, s’écrivent:en
désignant
par ’ °- PrB
(A; ) ’
Laprobabilité, ayant
observé l’évènementB,
que cet événement ait étéprovoqué
par la causeAi :
-
Pr~’ (B) ’
Laprobabilité
de l’événement Blorsque
la causeA;
se manifeste;(1)
La notion de "fonction de répartition d’une distribution" ou plus simplement de "fonction de distribution" a été fournie à la section II.1. De la fonction, on passe immédiatement à. la loi propreme nt dite.- Pr
(Ai )
L~aprobabilité
apriori
de la causeAi ;
m
et
par ~
Pr(Ai) -
·PrA~ (B)
la somme :i =1
Pour ne pas entrer dans le détail
mathématique
del’application
de ce thèorèmequi
déborderait le cadre de cetexposé sommaire,
on se contentera de concrétiser les formulesqui précèdent
sur unexemple simple (et
d’ailleursartificiel).
Imaginons qu’à
laréception
d’un lot depièces mécaniques,
onreçoive
unelettre du fournisseur
indiquant
-.1" - Qu’il a livré un second lot du même
type
à un autre client :2 ° - Que ces deux
lots,
detype analogue, comprenaient respectivement 2%
et
4%
de déchets(d’après
les vérifications à100% opérées
chezlui);
3° - Qu’il ne sait malheureusement
plus
surlequel
de ses deux clients a étédirigé
le lot le meilleur.et demandons-nous comment déterminer si le lot
réceptionné
est, ou non, celuiqui comprend
le s2 %
de rebuts.Il faut commencer par
prélever
un échantillon dans le lot examiné. Admettonsqu’on prélève
250pièces et qu’on détecte
8 rebutsparmi
les 250pièces
c’est l’évè-nement
(B).
D’autrepart,
les causespossibles
de cet événement sont, soit le fait d’avoir affaire au lot à2%
de rebuts(A1 ),
soit le fait d’avoir affaire au lot à4%
de rebuts
(A2).
Cela
posé, appliquons
le théorème deBayes.
D’après
la lettre du fournisseur on a évidemment autant de chances de setrouver en
présence
du lot à2%
de déchets que de se trouver enprésence
du lot à4%
de déchets. Lesprobabilités
àpriori
de ce s de ux éventualités s ont donc re s -pectivement :
En second
lieu,
dansl’hypothèse
ou l’on se trouve enprésence
du lot à2%
de
rebuts,
laprobabilité
de trouver 8 rebuts dans un échantillon de 250pièces
s’écrit
d’après
la loi de Poisson(cf.
Table n"5;
np = 5; k =8).
et de
façon analogue
si l’on se trouve enprésence
d’un lot à4%
de déchets(cf.
table n"
5,
np =10 k = 8)
-
par
conséquent
On constate donc que,
compte
tenu despropriétés
de l’échantillon extrait dulot,
laprobabilité
d’avoir affaire au lot à4%
de rebuts estplus grande
que laprobabilité
d’avoir affaire au lot à2%
de rebuts.’Il est donc
logique
deretenir4%
comme estimation de laproportion
de rebutsprésentées
par le lot.b)
Lestechniques
d’estimation par estimateurLorsqu’on
nedispose
pas de connaissances apriori dignes
de confiance, il estplus
rationnel d’utiliser lestechniques
d’estimation par estimateur.24
On
désigne
sous le terme dendmateur une fonctionparticulière
des réaultatsde
l’échantillon,
fonction douée de certainespropriétés sur lesquelles
onva revenir.Soit un échantillon de taille n. Cet échantillon conduit à n observations xI x2... Xi ... xn
par
conséquent
toute fonctionf
(xi
1 x2 ...x
de ces résultats
prend
une certaine valeur.Si l’on recommence
l’échantillonnage,
la fonction fprend,
danschaque
cas, une nouvelle valeur -du fait des fluctuationsd’échantillonnage- mais,
connaissant la distribution des x dans lapopulation,
on sait déterminer la distribution des valeurspossibles
de f. C’estainsi,
parexemple,
que la distribution depour des échantillons extraits d’une distribution normale de moyenne m et d’écart-
type
a est elle-même une distribution normale de moyenne m etd’écart -type
0/ .¡n (cf.
sectionIV-2).
Cela
étant,
on dit que la fonctionf(x~ x2... , .xn) des
résultats del’échantillon est un estimateur d’une
caractéristique
c donnée de lapopulation lorsque
la moyenne etl’écart-type
de la distribution de f tendentrespectivement
vers c et o pour des échantillons
d’importance
n croissant indéfiniment.De
façon plus imagée,
f est un estimateur de c si la distribution de f sedéforme
lorsque
n croit, commeindiqué
sur lafigure
IV.8(passage
de(1)
en(2).
Fig. IV. 8.
Lorsque
la moyenne de la distribution de f estégale a
cquel
que soit n(figure
IV.
9)
1 on dit que f est un estimateur sansbiais ,
Fig. IV. 9.
Le
problème
de l’estimation par estimateurrevient,
on levoit,
à trouverune fonction f
répondant
aux conditionsprécitées. Et, parmi
toutes les fonctionspossibles,
la meilleure est évidemment celle pourlaquelle
le passage de(1)
en(2)
est leplus rapide.
A titre
indicatif,
onpeut
remarquer des maintenantqu’ un
estimateur de la moyenne d’unepopulation
distribuée defaçon quelconque
n’est autre que la moyenne de l’échantillonprélevé
dans cettepopulation.
On a en effetsignalé
en IV. 2 que ladistribution de m’ tend dans ce cas, pour n
croissant,
vers une distribution nor-male
- de moyenne m .
Lorsque
lapopulation
initiale estnormale,
cet estimateur devient un estimateursana
biais ,
les moyennes m’ étant distribuées normalement etayant
m pour moyennequel
que soit n.Signalons
encore que, y pour unepopulation
distribuéenormalement,
la variance de l’échantillon n’est pas un estimateur sans biais de la variance de cettepopula-
tion.
L’estimateur
sans biais s’écrit en effet :Dans le tableau suivant
figurent quelques
estimationsclassiques.
On noteraque les estimations des
caractéristiques
considérées sontdésignées,
comme lescaractéristiques elles-mêmes,
avec,toutefois,
unecaractéristique
enexposant.
Bienqu’elle
soit assez délicate àsaisir,
on ne saurait ici passer sous silence la notion d’intervalle de confiance d’une estimation.Pour
l’expliciter aisément,
il est commode de raisonnergraphiquement.
Soit n
l’importance
de l’échantillon et f l’estimateur de lacaractéristique
cexaminée,
f étant distribué conformément au schéma IV. 10.Fig.IV.10.
Par définition de l’estimateur
f,
la moyenne de l’easemble de s vale ur spossi-
bles de f tend ou est
égale)
à c mais, enpratique,
la valeur de f effectivementobtenue,
résultat d’un seuléchantillonnage,
n’est pas forcémentégale
ou trèsvoisine de c.
Tout ce que
l’on peut dire,
connaissant la distribution def,
c’est que le f obte-26
nu, pour un seuil de
probabilité
120130( donné(section III. 3),
tombe entre les deuxlimites
correspondantes :
A ce
stade,
nous constatons que nous avons, par définition :dans la
proportion
1- ex des cas. Or,chaque
fois que nous avonscela,
nous avonsAinsi l’intervalle
[_(~ 2013 h 2 ) , ( f + hl fl
recouvre la vraie valeur c de la caracté .ristique
examinée dans laproportion
1- oc des cas. Cet intervalle estappelé
l’intervalle de confiance
( au
seuil deprobabilité 1 - ot)
On remarquera - c’est très
important - qu’onne
dit pas que c a laprobabilité
1-oc de se trouver dans l’intervalle de confiance. On dit que l’intervalle de confiance recouvre la valeur c dans le
proportion
1-oc des cas. On nepeut logi-
quement, eneffet,
lie r uneprobabilité
à c. Sans doute la valeur c est-elle inconnuemais,
elle n’en existe pas moins defaçon parfaitement
définie : elle n’est donc pasune variable aléatoire.
C’est exactement le contraire de ce
qui
se passe dans lestechniques
d’estima-tion a
priori.
Celles-ciconsidèrent,
eneffet,
c comme une variable aléatoire etmettent d’ailleurs en
jeu
sa loi deprobabilité (ce
sont les Pr(A~ )~
IV. 4. - CONCLUSIONS D’ORDRE
PRATIQUE
Les résultats
qui précèdent
n’ont pas faitl’objet
dedéveloppements
mathé-matiques.
De telsdéveloppements
nousauraient,
eneffet,
conduit assez loin.Dans le cadre de cette
brochure,
il nous a parubeaucoup plus important
deparler
de l’estimation
statistique
en termes -disons-philosophiques.
C’est dans la mesure ou l’on commence à saisir la différence de nature existant entre lestechniques
à
prioristes
et lestechniques
par estimateur que l’on commence à devenir sta- tisticien.Des indications
précédentes,
un certain nombre de conclusions d’ordrepratique
doivent être tirées.
Il est,
enpremier
lieu trèsclairque laprécision
d’une estimation est d’autantmeilleure,
c’est-à-dire que l’intervalle de confiance est d’autantréduit,
quel’importance
de l’échantillon estgrande.
L’étendue de l’intervalle de confiance est, eneffet,
liée àla dispersion de
la distribution des f. Or, pardéfinition,
cettedispersion
diminuequand
naugmente. Mais,
du même coup, il devient aussi très clairque,dans
le cadre desprélèvements (exhaustifs
ou assimilables à desprélè,
vemente
exhaustifs) qui
sont à la base de lathéorie,l’importance
de lapopulation
initiale n’a rien à voir à l’affaire.
’
On voit encore, dans bien des
entreprises
décider del’importance
duprélè-
vement en fonction de la taille du lot examiné. Dans
la plupart
des cas, c’est unnon-sens.
Il y a
d’autre part
lieu de noter que la décisiond’appliquer
lesrègles
d’esti-mation par intervalle de confiance
revient,
une fois le seuil 1- occhoisi,
àaccepter
de se
tromper,
en moyenne, dans laproportion
oc des cas. C’est eneffet,
pardéfinition,
dans cetteproportion
oc des cas que l’intervalle de confiance4e
recouvre 1pas la vraie valeur c cherchée.
Il devient alors évident que, la détermination du seuil de
probabilité -
consi-déré comme