• Aucun résultat trouvé

II. Intervalle de fluctuation. Echantillonnage

N/A
N/A
Protected

Academic year: 2022

Partager "II. Intervalle de fluctuation. Echantillonnage"

Copied!
2
0
0

Texte intégral

(1)

Echantillonnage et estimation

Dans cette fiche,

• Xn désigne une variable aléatoire suivant une loi binomialeB(n, p)oùn∈N etp∈]0, 1[.

• Fn = Xn

n est la variable aléatoire fréquence associée àXn.

• Zn= Xn−np

pnp(1−p) est la variable centrée et réduite associée à la variableXn.

I. Rappels.

1) Théorème de Moivre-Laplace.Pour tous réelsaetbtels quea < b

n→+∞lim P(a6Zn6b) = Zb

a

√1 2πet

2 2 dt.

ou aussi

n→+∞lim P p+a

pp(1−p)

√n 6Fn6p+b

pp(1−p)

√n

!

= Zb

a

√1 2πet

2 2 dt.

2) Intervalle associé à une probabilité pour N(0, 1)

Théorème.SoitXune variable aléatoire régie par la loi normale centrée réduiteN (0, 1).

Pour tout réelα∈]0, 1[, il existe un réel strictement positifuα et un seul tel que P(−uα 6X6uα) =1−α.

On doit connaître en particulieru0,05 =1, 96et u0,01 =2, 58à 10−2 près par défaut.

3) Conséquences.Si on combine les résultats précédents, on obtient le résultat suivant :

Pour tout entier naturel non nul n, on considère une variable aléatoireXn qui suit une loi binomialeB(n, p)puis on considère la variable aléatoire fréquence Fn= Xn

n . Alors :

n→+∞lim P p−uα

pp(1−p)

√n 6Fn 6p+uα

pp(1−p)

√n

!

=1−α,

et en particulier,

n→+∞lim P p−1, 96

pp(1−p)

√n 6Fn6p+1, 96

pp(1−p)

√n

!

>0, 95.

II. Intervalle de fluctuation. Echantillonnage

Dans ce paragraphe, on étudie un caractèreCd’une population et on suppose que ce caractère apparaît dans la population avec une probabilitép. On extrait un échantillon et on veut avoir une idée de la fréquence f d’apparition du caractère dans l’échantillon. La variable aléatoire qui à un échantillon de taillenassocie la fréquence fd’apparition du caractèreC dans l’échantillon est la variableFn.

Situation où on utilise un intervalle de fluctuation :

Quand on connait la probabilitép(ou quand on fait une hypothèse sur la valeur dep) et que l’on veut estimer la fréquencef.

A - Intervalle de fluctuation

1) L’intervalle de la classe de terminale.

L’intervalle In =

"

p−uα

pp(1−p)

√n , p+uα

pp(1−p)

√n

#

est appeléintervalle de fluctuation asymptotique au seuil1−α:

n→+∞lim P(Fn ∈In) = lim

n→+∞P p−uα

pp(1−p)

√n 6Fn 6p+uα

pp(1−p)

√n

!

=1−α.

c Jean-Louis Rouget, 2012. Tous droits réservés. 1 http ://www.maths-france.fr

(2)

En particulier, l’intervalleJn =

"

p−1, 96

pp(1−p)

√n , p+1, 96

pp(1−p)

√n

#

est unintervalle de fluctuation asymptotique au seuil0, 95:

n→+∞lim P(Fn∈Jn) = lim

n→+∞P p−1, 96

pp(1−p)

√n 6Fn 6p+1, 96

pp(1−p)

√n

!

>0, 95.

Conséquence.Pourngrand, la probabilité de l’événement «p−1, 96

pp(1−p)

√n 6Fn6p+1, 96

pp(1−p)

√n » vaut envirion0, 95. Dans la pratique, on fait cette approximation quandn>30,np>5,n(1−p)>5: sous ces conditions, la fréquencef a environ95% de chances (mais pas au moins95% de chances) d’être dans l’intervalleJn.

Théorème.Pour toutp∈]0, 1[, il existen0∈N tel que pour toutn>n0,P p−1, 96

pp(1−p)

√n 6Fn6p+1, 96

pp(1−p)

√n

!

>0, 95.

2) L’intervalle de la classe de seconde.

Théorème.Pour tout réelp∈]0, 1[et tout entier naturel non nuln, ’intervalle

p− 1

√n, p+ 1

√n

contient l’intervalle

"

p−1, 96

pp(1−p)

√n 6Fn 6p+1, 96

pp(1−p)

√n

# .

Théorème.Pour toutp∈]0, 1[, il existen0∈N tel que pour toutn>n0,P

p− 1

√n 6Fn6p+ 1

√n

>0, 95.

Théorème.Pour toutn>30, np>5 etn(1−p)>5,P

p− 1

√n 6Fn 6p+ 1

√n

vaut environ0, 95.

B - Prise de décision

On cherche à savoir si la probabilitépd’apparition du caractèreCdans la population est égale à un certain nombre p0ou pas à partir d’un échantillon de taillen. On fait donc l’hypothèse quep=p0.

• On vérifie d’abord quen>30, np0>5et n(1−p0)>5.

• On calcule l’intervalleI=

"

p0−1, 96

pp0(1−p0)

√n , p0+1, 96

pp0(1−p0)

√n

# .

• On détermine la fréquencefdu caractèreCdans l’échantillon.

• Sif /∈I, on rejette l’hypothèsep=p0 au risque de se tromper d’au plus5%. Si f∈I, on ne peut pas rejeter l’hypothèsep=p0.

III. Intervalle de confiance.

Situation où on utilise un intervalle de confiance :

Quand on connait la fréquencefet que l’on veut estimer la probabilitép.

On rappelle que pourngrand,P

Fn

p− 1

√n, p+ 1

√n

>0, 95. Puisque

p− 1

√n 6Fn6p+ 1

√n ⇔Fn− 1

√n 6p6Fn+ 1

√n : Théorème.

Pour tout réelp∈]0, 1[, il existe un entiern0∈N tel que pour toutn>n0,P

p∈

Fn− 1

√n, Fn+ 1

√n

>0, 95.

Si on choisit explicitement un échantillon et que le caractère étudié apparaît dans cet échantillon avec une fréquence f, l’intervalle

f− 1

√n, f+ 1

√n

est une réalisation de l’intervalle aléatoire

Fn− 1

√n, Fn+ 1

√n

. Quandnest grand, dans au moins95% des choix d’échantillon, on aurap∈

f− 1

√n, f+ 1

√n

.

On dit que l’intervalle

f− 1

√n, f+ 1

√n

est un intervalle de confiance depau niveau de confiance0, 95(pourn grand). Dans la pratique, on utilise ce résultat quandn>30,nf>5 etn(1−f)>5.

c Jean-Louis Rouget, 2012. Tous droits réservés. 2 http ://www.maths-france.fr

Références

Documents relatifs

Dans une population, on étudie un caractère donné présent dans cette population. La loi normale permet de déterminer intervalle de fluctuation asymptotique des fréquences au seuil

On souhaite tester l’hypothèse selon laquelle la proportion des pois jaunes est p=0,75 en mettant en place une expérience permettant d’obtenir 224 petits pois considérés comme

Dans un échantillon de 700 personnes ayant suivi cette méthode, prises au hasard avec remise, 385 ont arrêté de fumer. Pour une étude postélectorale, on effectue deux sondages,

On utilise l'histogramme pour des séries à caractère quantitatif continu ( quand chaque modalité peut être à priori n'importe quel nombre réel d'un intervalle ).. Les valeurs

Plus on réduit un risque, plus on augmente l'autre : ainsi, la décision que l'on doit prendre est un compromis adapté à la situation. A taille d'échantillon égale, si l'on diminue

Fréquences. 3 ème Méthode graphique pour déterminer la médiane : Méthode de calcul. La classe médiane est [30 ; 60] car d’après le tableau des effectifs cumulés

De même, il peut être logique de procéder dans certains cas à des sondages à probabilités inégales : par exemple si les individus sont des entreprises, il peut être utile de

Dans le cas d'une