M
M. T ABET
L’estimation
Mathématiques et sciences humaines, tome 5 (1964), p. 23-26
<http://www.numdam.org/item?id=MSH_1964__5__23_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1964, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
L’ESTIMATION
M. TAPET
1 -
ESTIMATION PONCTUÉLLE
Supposons
quel’on
tire un échantillon(xi - x2, ... ,1 xn) d’une population
dontla distribution a une forme
mathématique
connu.e, mais fait intervenir unparamètre
inconnu 9 . L’échantillon doit nous
permettre
de calculer un nombre que l’on pourraprendre
pour la valeur dee,
ce seral’estimation
t(x1’
...,xn)
de e. Or lesvaleurs xi , ..., xn sont les valeurs
prises
par une variablealéatoire
X. Il est bien entendu que l’estimation t est une fonction des valeursxi , x2,
..., Y xn;comme celles-ci sont aléatoires de loi de
probabilité
connue, y il convient donc de considérer l’estimation t comme la valeurprise
par une certaine variable aléa-toire T. ,
La variable aléatoire T est
appelée
unestimateur,
ses valeurs t sont des estimations.Plus
précisément,
l’estimateur constitue larègle qui
associe auparamètre
eà estimer une fonction
d’éléments
observables doncaléatoires,
issus de lapopula-
tion et en nombre fini:
.T X2,
... ,Xn) .
Les réalisations(x1’ x2,
..., Yxn) don-
n ent la
valeur t (xi , x2,
..., yxn) qui
estl’estimation ponctuelle
de8 ,
ponc- tuelle parcequ’elle
associe uneunique
valeur connue >t,
à une valeur inconnue 9.On notera que souvent estimation
prend
le sens d’estimateurlorsqu’il n’y
a.pas de
risque d’interprétation
erronée.Par
exemple,
y on estimera la moyenne(inconnue) 9
d’une v.a. X de fonction derépartition
F(x) (de
forme connue: parexemple, Laplace-Gauss
d’écarttype unité)
i t j. ’
thm’
j... X-1 + x2 + ... + Xn ..par
11 estimateur: "moyenne arithmètiqûe
xi + x2 + ’ ° ° + xn des n valeurs’
n
Xi
Yx2,
..., xn trouvées dans l’échantillon".L’estimateur est
cetterègle et,
xi , x2l
..., xn étant des réalisationsparticulières
de v. a.X2,
...,Xn
y ... ,,....,.
(toutes
de loiF(x) ) , c’est
la v.a. dont la loi deprobabilité
se déduit de
celle, F,
y de X.(De façon analogue
larègle qui
a u associe la valeurf(u)
=u2
est la fonctionf,
les valeursqu’elle prend sont
les nombresu2).
Le
problème
est non pas de trouver desestimations,
y mais des estimateurs. Ce-pendant, lé
faitqu’un
estimateur soit une variable aléatoiresignifie
que l’on nepeut pré4ire
les estimations dans un casparticulier,
maisseulement
à lalongue,
yen moyenne~ Il est donc évident
qu’un
estimateurqui
donne dans un seul casparti-
culier une ,valeur t
très
différente de e nesaurait être rejeté.
Pour quel’es-
timateur T ~ i convienne il suffit que sa distribution ne soit pastrop dispersée
au-tour de 9 :
D’après
cequi précéde
on voitqu’un
estimateur n’est définiqu’assez
vague- ment. Pour choisirparmi
tous les estimateurspossibles
on leurimposera
des condi- tions.Il -
QUALITES
D’UNESTIMATEUR
1 )
Un estimateur T sans distorsion ou sans biais est tel que E(T)
x e .Par
exemple,
si 0 estl’espérance mathématique
ou moyennethéorique
d’une va-riable aléatoire
X, l’estimateur
T ="2013
vérifieE(T)
= =E (X)
= e.n n
2)
Un estimateur Tconvergent
est tel que laprobabilité
pour que les valeurs de T soientéloignées
de e devient arbitrairementpetite lorsque
la taille n del’échantillon augmente.
Autrementdit,
les valeurs de T sonttrès proches
dee,
sauf dans uneproportion négligeable
de cas:E
et q étant rendus aussipetits
quel’on
désire enprenant
n suffisammentgrand.
Pratiquement
ceci revient à dire quelorsque
T a unevariance,
celle-ci doit tendre vers 0lorsque
la taille n de l’échantillon tendvers"’Ï’’ infini (T
estd’autant
plus
concentré autour de 0 que l’échantillon estplus grand),.
aussi
petit
quesoit q , dès
que n est assezgrand.
Par
exemple
pourT == 2013 X
ndès
que n est assezgrand,
aussipetit
quesoit .
Si parUn estimateur est absolument correct s’il est à la fois sans biais et
convergent.
3)
Un estimateur absolument correct T sera d’autantplus
efficace que sa va- rianceV(T)
seraplus petite:
celasignifie
en effet queplus
la variance est pe- titeplus
l’ estimateur T estcon’centré
autour de sonespérance
e . Il faut noter que s’il existe unbiais,
la notiond’efficacité
doit êtreprécisée.
On montre que, y dans certaines
conditions,
il- existe un estimateur absolument correctT ~
de variance minimum: ilest
dit’efficace.T* est,
y en un certain sens yle "meilleur" des
estimateurs possibles.
Untel estimateur,
de variance minimumexiste en
particulier
pour la loi deLaplace-Gauss,
la loi dePoisson,
la loi bino- mi al e.4)
Un estima,teur T est exhaustif s’il résume toute l’information contenue dans l’échantillonx1’ x2,
..., Yxn et
relative auparamètre
à estimer.1Il - F’ONCTION DE Y RA 1 8 EM BL A N C E
Soit
x1, x2,
...,xn
un échantillon tiré d’unepopulation
dont la distribu-tion a une densité f. La fonction de vraisemblance est par définition
On estimera alors e par la valeur
ê qui
rend L(x, 9 ),
ou sonlogarithme
maximum.
Si l’ intervalle de variation de 0 ne
dépend
pas de la valeur 8, l’estimationÔ vérifie, lorsque
estdérivable par’rapport à
6 :Donc on
prendra ê
defaçon à vérifier l’équation précédente.
Si par
contre,
l’intervalle de variation de edépend
de la valeur e à esti-mer, on ne
peut plus appliquer cette
méthode.Par
exemple:
soità
estimer sur un échantillon de n valeurs lalongueur
a del’intervalle
( 0 ,
ya)
d’une distribution uniforme. On a f(x)
dx ==dx
a
."
On devrait donc estimer a
par 0,
cequi
est absurde. Dans ce casparticulier d’ailleurs,
onpeut
estimer a en utilisant laplus grande valeur
de l’échantillon :â
(max xj) .
~Remarque: parfois
on cherche un estimateur linéaire.étant inconnus.
On détermine alors les
ai
par les conditionsI V -
ESTIMATION
PARINTERVALLE
Au lieu d’estimer la valeur
d’un paramètre
e par un nombreunique t,
on se pro- pose de trouver un intervalleI,
tel que I contienne 0 avec uneprobabilité
1 - a donnée d’avance:P .(I
contiente)
= 1 - aSoit donc T un estimateur de 9,
prenant
la valeur t pour l’échantillonxi ,
y x2, ... xn,Pour une valeur
00
de 8 onpeut
déterminer deux nombresY1
etY2 dépendants
de Oxo et a tels que:
Lorsqu’on considère
toutes les valeurspossibles
de6 ,
y lespoints y 1
et y 2correspondant
à chacune de ces valeurs décrivent deux courbes(cf. fig.).
Ainsi
on a défini pourchaque
valeur de e unintervalle (Y1, Y2)
danslequel la
variablealéatoire
T a uneprobabilité
1 - a de se trouver et parcomplémenta-
rité une
probabilité
a d’être en dehors.La réalisation t de l’estimateur T
étant
apparue, onpeut
effectuer unepartition
sur l’ensembledes valeurspossibles
de o endistinguant
les valeurs de e : .1)
pourlesquelles
tappartient à
l’intervalle(Y1 , Y2)e
2)
pourlesquelles
tn’appartient
pasà
l’intervalle(Y1’ y)
On voit que
graphiquement
cela revientà
tracer l’horizontalepassant
par tqui
coupe les courbes dey,
etY 2 en c2 et c1
d’où les valeurs ete 1 constituant
les bornes de l’intervalle I.,
L’intervalle
(81 " e 2)
constitue l’intervalle de confiance duparamètre
0.La
probabilité
que cetintervalle
recouvrela
vraie valeur8 ,
y certaine mais non connue, est 1 - a. Lesbornes E) 1
ete 2
sont détenninées par la réalisation t d"une variable aléatoire T : elles sont donc aléatoires en ce sensqu’elles
procèdent
de T.BIBLIOGRAPHIE
KENDALL: The advanced
theory
of statisticsLondres - Griffin
CRAMER: Mathematical Methods of Statistics Princeton