• Aucun résultat trouvé

Construction d’un intervalle de confiance pour la moyenne

Dans le document Probabilit´es et statistique pour le CAPES (Page 128-132)

6.5 Intervalles de confiance

6.5.2 Construction d’un intervalle de confiance pour la moyenne

20

n , alors que celui construit surMnest de longueur plus grande, 2 q20

n, pour un mˆeme niveau de confiance. On pr´ef´erera donc celui construit `a partir de Un.

6.5.2 Construction d’un intervalle de confiance pour la moyenne

Soit (X1,· · · , Xn) un ´echantillon de taillenet de loiµθ. SoitPθ la loi jointe du vecteur al´eatoire (X1,· · · , Xn). On suppose que la variable al´eatoire X1 admet une esp´erance et on note m l’esp´erance commune `a X1,· · ·, Xn.

On consid`ere la moyenne empirique Mn = n1

n

P

k=1

Xk comme estimateur de la moyennem et on fixe un niveauα∈]0,1[. Nous allons chercher, quand cela est possible, un intervalle de confiance au niveau α pourm de la forme : nous cherchonsCα telle que :

∀θ∈Θ,Pθ(|Mn−m|< Cα)≥α. (6.1) Afin de continuer, nous avons besoin d’informations suppl´ementaires sur la loi de l’´echantillon ou sur sa taille.

est un intervalle de confiance pour m au niveau α.

D´emonstration. D’apr`es l’´equation (6.1), nous cherchonsCα tel que :

∀θ∈Θ, Pθ(|Mn−m|< Cα)≥α.

Dans ce cas Θ =R,θ=m. Or, sousPθ, la variable al´eatoire √

nMnσ−m suit une loi gaussienne centr´ee r´eduite. Notons N une variable al´eatoire de loi N(0,1). Alors,

Pθ(|Mn−m|< Cα) =Pθ

d’o`u il suffit de choisirCα tel que :

Comme la fonction de r´epartition Π de la loi normale est bijective de R dans ]0,1[, on peut d´efinir Π−1(1+α2 ). De la stricte croissance de Π, on d´eduit que Π−1(1+α2 )>Π−1(12) = 0. Ainsi, il suffit de choisir Cα= σnΠ−1 α+12

.

Remarque. Il s’agit d’un cas particulier de la m´ethode suivante, dite de la fonction pivotale.

On suppose l’existence d’une applicationg :X ×R→Rtelle que, si on noteX= (X1, . . . , Xn) : 1. pour toutθ∈Θ, g(X, f(θ)) suit une loi de densit´e p, ind´ependante deθ;

2. pour toutx∈ X, l’applicationy∈R7→g(x, y) est continue strictement monotone.

Siaetb sont deux nombres r´eels tels queα =Rb

Grˆace `a la deuxi`eme condition, il existe des applications r´eellesA etB d´efinies surX telles que {g(X, f(θ))∈]a, b[}soit ´egal `a{f(θ)∈]A(X), B(X)[}. Il s’ensuit que la famille ( ]A(x);B(x)[;x∈ X) est un intervalle de confiance pour f(θ) au niveau α. Dans le cas de l’´echantillon gaussien de variance connue, l’applicationg :Rn×Rd´efinie parg(x, y) = σ1n deux conditions (avecf(θ) =θ), etp est la densit´e de la gaussienne centr´ee r´eduite.

Exercice 6.3. D’apr`es Phan-Rowenczyk.

On mod´elise la dur´ee de vie d’ampoules ´electriques par une loi normale de moyenneminconnue et d’´ecart-type σ= 100.

1. On effectue une observation de la dur´ee de vie surn= 50 lampes. D´eterminer un intervalle de confiance pour la moyennem au niveau 0,95.

2. Quelle doit ˆetre la taille de l’´echantillon pour que la longueur de l’intervalle de confiance soit inf´erieure `a 20 heures ? est un intervalle de confiance pour θau niveau 0,95.

2. La longueur de l’intervalle de confiance (exprim´ee en heures) est :

est un intervalle de confiance pour m au niveau α.

D´emonstration. La d´emonstration de la proposition pr´ec´edente repose sur le fait que l’on connaˆıt la loi de la variable al´eatoire√

nMnσ−m sous Pθ. Ici, on ne connaˆıt pas la varianceσ. Il est donc naturel de construire une r´egion critique `a partir de la variable al´eatoire√

nMnS−m

n et de chercher une constantecα telle que :

∀θ∈Θ, Pθ

(Xk−Mn)2 est la variance empirique. Notons Tn−1 une variable al´eatoire de loi de Student `a n−1 degr´es de libert´e. Alors,

• Echantillon de taille´ n, n >30, de variance connue

Proposition 6.5. Soit (X1, . . . , Xn) un ´echantillon de taille n, n > 30, de loi µθ admettant un moment d’ordre 2. On suppose la variance de l’´echantillon connue et on la note σ2. Soit α∈]0,1[. Alors,

est un intervalle de confiance pour θ au niveau (environ) ´egal `a α.

D´emonstration. La d´emonstration est analogue `a celle faite dans le cas de l’´echantillon gaus-sien. Notonsm la moyenne inconnue de l’´echantillon. Sous ces hypoth`eses, on peut appliquer le th´eor`eme central limite et approcher (n est grand) √

nMnσ−m par une variable al´eatoire gaus-sienne de moyenne 0 et variance 1.

Remarque. Il s’agit ici d’une approximation : la probabilit´e que m appartienne `a l’intervalle

•Echantillon de taille´ n de Bernoulli de moyenne inconnue lorsque la loi binomiale est approchable par une loi normale

Proposition 6.6. Soit(X1, . . . , Xn) un ´echantillon de taillende loi de Bernoulli de param`etre inconnu θ. On suppose que les param`etresnet θsont tels que la variableSn=

Pn k=1

Xk de loi bi-nomiale est approchable par une loi normale (classiquement,n≥10, etnθetn(1−θ) d´epassent quelques unit´es). Soitα ∈]0,1[, alors

#1

est un intervalle de confiance pour la moyenne θ de l’´echantillon au niveau (environ) ´egal `a α.

D´emonstration. D’apr`es l’´equation (6.1), nous cherchonsCα tel que :

∀θ∈Θ, Pθ(|Mn−m|< Cα)≥α.

Comme n ≥ 10 et que nθ et n(1−θ) d´epassent quelques unit´es, on est dans les conditions d’application du th´eor`eme central limite. On en d´eduit :

Pθ

Ainsi, si on poseCα= 21nΠ−1 α+12

Remarque. On a vu que, sous les hypoth`eses ci-dessus permettant d’approcher ( on ne dit pas “approximer”, ce verbe n’existe pas en fran¸cais !) la loi binomiale par la loi de Gauss, Pθ

On pourrait donc avoir envie de consid´erer des intervalles de confiance de la forme

#

en rempla¸cant le param`etre inconnu θ. On trouve dans les livres deux types d’intervalles de confiance assez curieux :

1. on remplaceθ par l’estimateur ponctuel de la moyenne d’un ´echantillon de Bernoulli, `a savoir par ¯x= n1

n

P

k=1

xk; l’intervalle de confiance propos´e devient :

I(x1, . . . , xn) =

2. on remplace θ(1−θ) qui est la variance de l’´echantillon de Bernoulli, par l’estimateur ponctuelle de la variance lorsque la moyenne est inconnue, `a savoir pars2 = n−11

n comment cette probabilit´e peut ˆetre ´egale `aαsans outils plus sophistiqu´es... Prudence, prudence donc, avant d’´ecrire n’importe quoi...

Ce type de r´esultats peuvent ˆetre d´emontr´es, mais font appel `a des notions plus compliqu´ees.

Pour en savoir plus, on pourra par exemple lire le cours de l’ENSTA de Jean-Fran¸cois Delmas, chapitre V.7, th. V.29 (th´eor`eme de Slutsky).

Dans le document Probabilit´es et statistique pour le CAPES (Page 128-132)