• Aucun résultat trouvé

ESIEA4èmeAnnée01-03-2012 FrédéricBertrand L’estimationparintervalles

N/A
N/A
Protected

Academic year: 2022

Partager "ESIEA4èmeAnnée01-03-2012 FrédéricBertrand L’estimationparintervalles"

Copied!
22
0
0

Texte intégral

(1)

L’estimation par intervalles

Frédéric Bertrand 1

1

IRMA, Université de Strasbourg Strasbourg, France

ESIEA 4ème Année 01-03-2012

(2)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

Ce chapitre s’appuie essentiellement sur trois livres :

1

Le livre de Pascal Ardilly, administrateur de l’INSEE,

« Les techniques de sondage », Éditions Technip, 2006.

2

Le livre de Jean-Jacques Droesbeke, professeur à l’Université Libre de Bruxelles,

« Éléments de statistiques »,

Université de Bruxelles, Ellipses, 2001.

3

Le livre de Gilbert Saporta, professeur au CNAM à Paris

« Probabilités, Analyse de données et Statistique »,

Éditions Technip, 2006.

(3)

Sommaire

1 Introduction

2 Principe

3 Estimation de la moyenne µ d’une variable gaussienne

4 Estimation de la variance d’une variable gaussienne

5 Estimation d’une proportion

(4)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

Il est souvent plus réaliste et plus intéressant de fournir un renseignement du type

a < θ < b plutôt que d’écrire sèchement

θ b n = c.

Définition

Fournir un tel intervalle ]a; b[ s’appelle donner une estimation

par intervalle de confiance de θ ou une estimation ensembliste

de θ.

(5)

Sommaire

1 Introduction

2 Principe

3 Estimation de la moyenne µ d’une variable gaussienne

4 Estimation de la variance d’une variable gaussienne

5 Estimation d’une proportion

(6)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La méthode des intervalles de confiance est la suivante : Soit θ b n un estimateur de θ dont nous connaîssons la loi de probabilité pour chaque valeur de θ.

Définition

Étant donné une valeur θ 0 de θ, nous déterminons un intervalle de probabilité de niveau 1 − α pour b θ n , c’est-à-dire deux bornes θ 1 et θ 2 telles que

P h

θ 1 < θ b n < θ 2 |θ = θ 0 i

= 1 − α.

(7)

Remarque

Ces bornes dépendent évidemment de θ 0 .

Remarque

Nous choisissons dans la plupart des cas un intervalle à risque

symétrique α/2 et α/2.

(8)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

Nous adoptons la règle de décision suivante.

Soit θ b n (x 1 , . . . , x n ) = θ b n (obs) la valeur observée de θ b n : si b θ n (obs) ∈]θ 1 ; θ 2 [, nous conservons θ 0 comme valeur possible du paramètre θ ;

si b θ n (obs) 6∈]θ 1 ; θ 2 [, nous éliminons θ 0 .

Nous répétons cette opération pour toutes les valeurs de θ.

Définition

]a; b[ est qualifié d’un intervalle de confiance de niveau (1 − α) (coefficient de confiance).

Remarque

]a; b[ est un intervalle aléatoire car il dépend de θ b n (obs).

(9)

]a, b[ s’obtient par : (

a = θ −1 2 ( θ b n (obs)) b = θ −1 1 (b θ n (obs)) .

Remarque

Si nous augmentons 1 − α, nous augmentons la longueur de l’intervalle de probabilité.

Remarque

Si n augmente, comme θ b n est supposé convergent, Var h θ b n

i

diminue donc ]θ 1 ; θ 2 [ diminue.

(10)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La varianceσ2de la populationUest connue La varianceσ2de la populationUest inconnue

Sommaire

1 Introduction

2 Principe

3 Estimation de la moyenne µ d’une variable gaussienne

4 Estimation de la variance d’une variable gaussienne

5 Estimation d’une proportion

(11)

b µ n est le meilleur estimateur de µ et µ b n suit une loi N

µ; σ 2 n

.

Définition

L’intervalle de probabilité de µ b n à 1 − α est : µ − u 1−α/2 σ

√ n < µ b n < µ + u 1−α/2 σ

√ n ,

où u p est le quantile d’ordre p pour la loi gaussienne centrée et

réduite.

(12)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La varianceσ2de la populationUest connue La varianceσ2de la populationUest inconnue

Définition

L’intervalle de confiance de µ b n à 1 − α est :

µ b n (x 1 , . . . , x n ) − u 1−α/2 σ

√ n < µ < b µ n (x 1 , . . . , x n ) + u 1−α/2 σ

√ n ,

où u 1−α/2 = 1, 96 si 1 − α = 0, 95.

(13)

Nous utilisons le fait que T n−1 = √

n − 1 µ b n − µ S n

suit une loi de Student à (n − 1) degrés de liberté.

Définition

L’intervalle de probabilité pour T n−1 à 1 − α est :

−t n−1;1−α/2 < √

n − 1 µ b n − µ S n

< t n−1;1−α/2 ,

où t n−1;1−α/2 est le quantile d’ordre 1 − α/2 pour la loi de

Student à (n − 1) degrés de liberté.

(14)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La varianceσ2de la populationUest connue La varianceσ2de la populationUest inconnue

Définition

L’intervalle de confiance pour µ à 1 − α est :

b µ n (obs)−t n−1;1−α/2 S n (obs)

√ n − 1 < µ < µ b n (obs)+t n−1;1−α/2 S n (obs)

√ n − 1 ,

ou bien

b µ n (obs)−t n−1;1−α/2 S n,c (obs)

√ n < µ < µ b n (obs)+t n−1;1−α/2 S n,c (obs)

√ n ·

Le théorème de la limite centrée a pour conséquence que les

intervalles précédents sont valables pour estimer µ d’une loi

quelconque lorsque la taille n de l’échantillon est assez grande.

(15)

Sommaire

1 Introduction

2 Principe

3 Estimation de la moyenne µ d’une variable gaussienne

4 Estimation de la variance d’une variable gaussienne

5 Estimation d’une proportion

(16)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La moyenne de la population est connue La moyenneµde la populationUest inconnue

Nous utilisons le fait que

1

S n ∗2 = 1 n

n

X

i=1

(X i − µ) 2 est le meilleur estimateur de la variance σ 2 lorsque la moyenne µ est connue,

2

nS n ∗2

σ 2 suit une loi du khi-deux à n degrés de liberté comme

la somme de n carrés de loi N (0; 1) indépendantes.

(17)

Définition

k 1 et k 2 sont les bornes de l’intervalle de probabilité d’une loi χ 2 (n) si :

P

k 1 < n S n ∗2 σ 2 < k 2

= 1 − α.

Définition

L’intervalle de confiance pour σ 2 à 1 − α est : n S ∗2 n (x 1 , . . . , x n )

k 2 < σ 2 < n S n ∗2 (x 1 , . . . , x n )

k 1 ·

(18)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

La moyenne de la population est connue La moyenneµde la populationUest inconnue

Nous utilisons le fait que

1

S n 2 = 1 n

n

X

i=1

(X i − µ b n ) 2 ,

2

nS n 2

σ 2 suit une loi du khi-deux à (n − 1) degrés de liberté

comme la somme de (n − 1) carrés de loi N (0; 1)

indépendantes.

(19)

Définition

l 1 et l 2 sont les bornes de l’intervalle de probabilité d’un χ 2 (n − 1) si :

P

l 1 < nS n 2 σ 2 < l 2

= 1 − α.

Définition

L’intervalle de confiance pour σ 2 est alors : nS n 2 (x 1 , . . . , x n )

l 2 < σ 2 < nS n 2 (x 1 , . . . , x n )

l 1 ·

(20)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

Sommaire

1 Introduction

2 Principe

3 Estimation de la moyenne µ d’une variable gaussienne

4 Estimation de la variance d’une variable gaussienne

5 Estimation d’une proportion

(21)

Étant donné une population INFINIE (ou finie si le tirage s’effectue avec remise) où une proportion π A des individus possède un certain caractère A, il s’agit de trouver un intervalle de confiance pour π A à partir de π b n,A , proportion trouvée dans un échantillon de taille n.

Nous savons que n b π n,A suit une loi binomiale B(n; π A ).

Deux cas alors se présentent :

1

Si n est petit nous utiliserons les tables de la loi binomiale.

2

Si n est grand nous savons que π b

n,A

suit une loi gaussienne de paramètres π

A

et π

A

(1 − π

A

)

n ·

(22)

Introduction Principe Estimation de la moyenneµd’une variable gaussienne Estimation de la variance d’une variable gaussienne Estimation d’une proportion

Définition

L’intervalle de probabilité symétrique « approché » est :

π A − u 1−α/2

r π A (1 − π A )

n < b π n,A < π A + u 1−α/2

r π A (1 − π A )

n ·

Définition

L’intervalle de confiance « approché » est alors :

π b n,A (obs) − u 1−α/2 r

b π n,A (obs)(1 − π b n,A (obs))

n < π A

< π b n,A (obs) + u 1−α/2 r

b π n,A (obs)(1 − π b n,A (obs))

n .

Références

Documents relatifs

La composition botanique de mélanges simples peut être déterminée par la SPIR, mais un des problèmes pour son application dans la pratique est de disposer d’une

Optique géométrique : insuffisante pour décrire l’effet d’une lentille sur un laser.. Laser à semi-conducteurs (diodes laser) : faible coût, monomodes, accordables sur

Soit X un vecteur gaussien de matrice de covariance C et d’espérance m. Espérance conditionnelle pour un vecteur gaussien... Le paramètre ρ désigne la corrélation entre les ventes

Pour calculer une moyenne d’une variable statistique, il était sous-entendu qu’elle était quantitative.... Pour calculer une moyenne d’une variable statistique, il

On peut dans le cas d’une variable statistique ordinale attribuer un nombre à chacune des modalités et ensuite faire une moyenne.. Regardons que faire avec des variables

Lorsque nous calculerons cette erreur dans le cas d’un tirage aléatoire sans remise, la taille N de la population U interviendra !.. Maintenant que nous disposons du matériel

Variables aléatoires réelles Variables aléatoires discrètes Principales lois de probabilité discrètes Variables aléatoires absolument continues Loi normale de paramètres µ et σ

Étude de l’estimateur d’une moyenne Étude de l’estimateur d’une variance Étude de l’estimateur corrigé de la variance Retour à l’étude de l’estimateur de la variance