Estimateur - Probabilit´es et statistique pour le CAPES

a [a, b]” ?

2. test d’hypothèse : étant donné un sous-ensemble H₀ de Θ, il s’agit de décider si θ ap-partient ou non à H₀; on dit que l’on teste l’hypothèseH₀ contre l’hypothèse contraire H1.

6.3 Estimateur

Soit (X1,· · · , Xn) un ´echantillon de taille n de loi µ_θ. On note Pθ la loi jointe du vecteur (X₁,· · · , X_n) et x= (x₁,· · · , x_n),x∈ X, une observation.

Définition. Soitf une fonction définie sur Θ à valeurs réelles. Unestimateur def(θ) est une variable aléatoireTn(X1, . . . , Xn) à valeurs dansf(Θ), utilisée pour estimerf(θ). Unestimateur ponctuel est la valeur de cet estimateur en un point ω.

Cette définition est assez générale et ne précise que peu le choix d’un estimateur pour f(θ). Il est souhaitable qu’il ait les propriétés supplémentaires suivantes : consistance, absence de biais (voir définitions ci-dessous), minimisation de l’erreur moyenne. À noter que le fait d’être sans biais n’est pas essentiel, car il arrive que respecter cette contrainte entraˆıne la perte d’autres propriétés importantes. Il est également utile que l’estimateur suive une loi connue.

D´efinition. Un estimateur Tn(X1, . . . , Xn) de f(θ) estconsistent ou convergent s’il converge en probabilit´e versf(θ) :

∀θ∈Θ,∀ε >0, lim

n→+∞Pθ[|T_n(X1,· · ·, Xn)−f(θ)|> ε] = 0.

Remarque. Cette notion n’est pas explicitement au programme. Néanmoins, il n’est pas inutile de la mentionner car elle permet de mieux comprendre certains théorèmes étudiés.

Définition. Si l’estimateur Tn(X1, . . . , Xn) de f(θ) est intégrable, sonbiais est défini par :

∀θ∈Θ, Eθ[T_n(X₁,· · ·, X_n)]−f(θ).

On dit queTn(X1, . . . , Xn) est un estimateursans biais si,

∀θ∈Θ, Eθ[T_n(X₁,· · ·, X_n)] =f(θ).

Remarque. La notion de biais d’un estimateur apparaˆıt dans les programmes de BTS. Elle ne peut être exigible d’un élève, mais doit par contre être connue du professeur...

Exemple. Soit (X1,· · ·, Xn) un ´echantillon de taille nde loi µ_θ. Notonsm etσ² la moyenne et la variance commune de l’´echantillon.

1. Moyenne empirique. On souhaite estimer m =Eθ(X₁). Un estimateur naturel est la moyenne empirique, not´eeM_n ou ¯X, d´efinie par :

Mn= ¯X= 1 n

k=1

Xk.

La moyenne empirique observ´ee, ¹_n

k=1

x_k, est un estimateur ponctuel de la moyenne de l’´echantillon (rappel : x_k=X_k(ω)).

Exercice. Montrer que la moyenne empirique est un estimateur sans biais et consistent de la moyenne m.

2. Variance empirique. On souhaite estimerσ² =Eθ[(X₁−Eθ(X₁))²].

◦ Si la moyennem =Eθ(X₁) de l’´echantillon est connue. Alors un estimateur naturel estVn d´efini par :

V_n= 1 n

k=1

(X_k−m)². La valeur observ´ee _n¹

k=1

(x_k −m)² est un estimateur ponctuel de la variance de l’´echantillon.

Exercice. Montrer qu’il s’agit d’un estimateur sans biais de la variance de l’´echantillon.

◦ Si la moyenne de l’échantillon est inconnue. Un estimateur naturel est la variance empirique, notéeS_n², et définie par :

S_n² = 1 n−1

k=1

(X_k−M_n)².

Alors_n−1¹

k=1

x_k−(¹_n

i=1

x_i) 2

est un estimateur ponctuel de la variance de l’´echantillon.

Propriété 13. La variable aléatoire S_n² = _n−1¹

k=1

(X_k−Mn)² est un estimateur sans biais de la variance de l’´echantillon.

Démonstration. Comme les variables aléatoiresX₁,· · · , X_n sont identiquement distribuées :

Comme les variables aléatoires sont indépendantes et identiquement distribuées, E(XiXj) = sans biais de la variance de l’échantillon.

Exercice 6.1. Pour tout nombre r´eel θ, on d´efinit l’applicationp_θ surRpar : pθ(x) =

(0 si x < θ e^−(x−θ) si x≥θ.

1. Montrer que, pour tout nombre réel θ, l’application p_θ est une densité de probabilité surR.

2. Soit X₀ une variable aléatoire de densitép_θ. Montrer queX₀ admet un moment d’ordre deux, et expliciter son espérance et sa variance.

3. D´eterminer la fonction de r´epartitionF₀ de X₀.

(b) Montrer queM_n−1 et U_n−_n¹ sont des estimateurs sans biais de θ.

Solution 6.1.

1. L’application pθ est positive et continue sauf au point θ. Il reste donc `a montrer que l’int´egraleR

Rp_θ(x)dx=R+∞

θ e^−(x−θ)dx existe et vaut 1.

L’application x 7→ e^−(x−θ) est continue sur R, donc localement int´egrable sur [θ,+∞[.

Montrons la convergence de l’int´egrale au moyen d’un changement de variable : posons y = x−θ qui est monotone et de classe C¹ sur R, alors e^−(x−θ)dx = e^−ydy et ainsi R+∞

θ e^−(x−θ)dxest de mˆeme nature queR+∞

0 e^−ydy. Nous reconnaissons l’intégrale surR de la densité d’une loi exponentielle de paramètre 1. Nous avions démontré dans l’exer-cice 6 que cette intégrale est convergente et vaut 1. Nous concluons donc que l’intégrale R

Rp_θ(x)dx est convergente et vaut 1. L’applicationp_θ est donc bien une densit´e de pro-babilit´e sur R.

2. Montrons que la variable aléatoire X0 admet un moment d’ordre deux, c’est-à-dire que l’intégraleR

Rx²p_θ(x)dx=R+∞

θ x²e^−(x−θ)dx existe.

L’applicationx7→x²e^−(x−θ)est continue surRdonc localement int´egrable. Montrons la convergence de cette int´egrale au moyen d’un changement de variables : posonsy= (x−θ) qui est monotone et de classeC¹ sur R, alors :

x²e^−(x−θ)dx= (y+θ)²e^−ydy= (y²e^−y+ 2θye^−y+θ²e^−y)dy.

Ainsi R

Rx²p_θ(x)dx est de mˆeme nature que R+∞

0 (y²e^−y + 2θ y e^−y +θ²e^−y)dy. Nous avions montré dans l’exercice 6 qu’une variable aléatoire exponentielle Y de paramètre 1 admet des moments de tout ordre et nous avions calculé :E(Y) = 1,E(Y²) = 2. Nous concluons donc que l’intégraleR

Rx²p_θ(x)dxest convergente et que : E(X₀²) =

x²p_θ(x)dx=E(Y²) + 2θE(Y) +θ² = 2 + 2θ+θ²= 1 + (1 +θ)². Comme la variable al´eatoire X0 admet un moment d’ordre 2, elle admet ´egalement un moment d’ordre 1. Au moyen du changement de variablesy =x−θ, nous obtenons :

E(X₀) = Z

x p_θ(x)dx= Z +∞

x e^−(x−θ)dx

= Z +∞

(y+θ)e^−ydy=E(Y) +θ= 1 +θ.

Ceci nous permet de calculer la variance de X0 :

Var(X₀) =E(X₀²)−E(X₀)² = 1 + (1 +θ)²−(1 +θ)²= 1.

3. Soit t∈R. Par d´efinition :F0(t) = R_t

−∞p_θ(x)dx. Supposons t < θ, alors F0(t) = 0, car p_θ(x) = 0 six < θ. Supposonst≥θ :

F0(t) = Z t

e^−(x−θ)dx= Z t−θ

e^−ydy=

−e^−yt−θ

0 = 1−e^−(t−θ). Ainsi, pour tout r´eelt,F₀(t) = (1−e^−(t−θ))I[θ,∞[(t).

On peut aussi remarquer que X0 a la même loi que Y +θ, où Y suit une loi expo-nentielle de paramètre 1. Cela permet d’utiliser les résultats déjà démontrés pour la loi exponentielle.

4. (a) Soit t∈R, alors :

P[Un> t] =P[min(X1,· · ·, Xn)> t]

=P[{X₁> t} ∩ · · · ∩ {X_n> t}]

=P[X₁ > t]· · ·P[X_n> t],

puisque les v.a. X₁,· · ·, X_n sont ind´ependantes

=P[X₀ > t]ⁿ, puisqu’elles ont mˆeme loi que X₀

= [1−F0(t)]ⁿ.

Soit G₀ la fonction de répartition deU_n. Alors, d’après ce qui précède et la question 3 : G₀(t) = 1−P[U_n> t] = 1−[1−F₀(t)]ⁿ=

(0 sit < θ 1−e^−n(t−θ) sit≥θ.

L’applicationG0est continue en tout point deRet dérivable en tout point sauf enθ. On en déduit queU_n admet une densité, que l’on notera q_θ, et que, par exemple :

q_θ(t) =G⁰₀(t) =

(0 sit < θ ne^−n(t−θ) sit≥θ,

autrement dit, pour tout r´eel t, on peut choisirq_θ(t) =ne^−n(t−θ)I[θ,+∞[(t).

(b) En utilisant la linéarité de l’espérance et le fait que les variables aléatoiresX1,· · · , Xn

ont toutes mˆeme loi queX0, nous obtenons : E[M_n] = 1

i=1

E[X_i] =E[X₀] =θ+ 1.

AinsiE[Mn−1] =θet on conclut que Mn−1 est un estimateur sans biais de θ.

Montrons queUnadmet une espérance, c’est-à-dire que l’intégraleR

Rt qθ(t)dt=R+∞

θ n t e^−n(t−θ)dt est convergente. L’applicationt7→n t e^−n(t−θ)est continue surRdonc localement int´egrable sur [θ,+∞[. Montrons la convergence au moyen du changement de variabley =t−θqui est monotone et de classe C¹ surR, alors :

nte^−n(t−θ)dt= (y·ne^−ny+θ·ne^−ny)dy.

Ainsi R

Rt q_θ(t)dt est de mˆeme nature que R+∞

0 (y·ne^−ny +θ·ne^−ny)dy. Nous avions montré dans l’exercice 6 qu’une variable aléatoire Y_n de loi exponentielle de paramètre n admet un moment d’ordre 1 et nous avions calculé E(Y_n) = _n¹. Nous concluons que l’intégraleR

Rq_θ(t)dt est convergente et que : E[Un] =

qθ(t)dt=E(Yn) +θ= 1 n +θ.

AinsiE

Un−_n¹

=θ etUn− ¹_n est donc un estimateur sans biais deθ.

Remarque. On ne peut se contenter des estimations ponctuelles de la moyenne et de la variance de notre échantillon, même si ces estimations sont obtenues à partir d’estimateurs sans biais de ces paramètres. En effet, nous n’avons aucune indication sur la fa¸con dont ces valeurs s’écartent des “vraies” moyenne et variance de l’échantillon. Voir paragraphe 6.5.

Dans le document Probabilit´es et statistique pour le CAPES (Page 118-123)