IV. Echantillonnage 1.

(1)

IV. Echantillonnage

1. Le théorème de Moivre-Laplace a) Le théorème

Si est une suite de variables aléatoires qui suivent la loi binomiale ( , ) (la même valeur de pour toutes les variables), et qu’on pose =

( )

(autrement dit est la régularisée de ), alors pour tout couple ( , ) : ( ≤ ≤ ) tend vers Φ( ) − Φ( ) (autrement dit, converge vers la loi normale centrée réduite)

La démonstration n’est pas au programme, ce théorème est admis b) Conséquence (ROC)

Si suit ℬ( , ), alors pour tout ∈]0 ; 1[, lim

→ ∈ = 1 − où désigne l’intervalle − ⁽ ⁾

√ ; + ⁽ ⁾

√

Démonstration : avec les notations du a), par définition des nombres : lim→ (− ≤ ≤ ) = 1 −

Or − ≤ ≤ est successivement équivalent à − ≤

( )≤ , soit à

− (1 − ) ≤ − ≤ (1 − ) , maintenant on divise par :

− ⁽ ⁾ ≤ − ≤ ⁽ ⁾ . On rentre le dans les racines carrées :

− ⁽ ⁾ ≤ − ≤ ⁽ ⁾ . Reste à simplifier les fractions et à faire passer pour obtenir − ⁽ ⁾ ≤ ≤ + ⁽ ⁾ et le théorème est prouvé.

2. Intervalles de fluctuation La situation :

On effectue épreuves de Bernoulli qu’on suppose identiques et indépendantes, de probabilité de succès . On calcule la fréquence de succès .

L’intervalle de fluctuation asymptotique au risque est :

− ⁽ ⁾

√ ; + ⁽ ⁾

√

Ce que dit le théorème, c’est que, quand est « grand », appartient à cet intervalle de fluctuation avec une probabilité 1 −

Dans la pratique, comment s’en sert-on ?

On se fixe (en fait, pour nous, ce sera l’énoncé du sujet) un seuil de risque (plus ce seuil est faible, plus l’intervalle augmente)

On regarde si est assez grand : il faut vérifier ≥ 30, ≥ 5, (1 − ) ≥ 5 On calcule l’intervalle de fluctuation, et on regarde si est à l’intérieur Si c’est le cas, rien à dire

Si ce n’est pas le cas, on ne confirme pas la valeur de (mais cette valeur peut être correcte, et le problème dû à un biais dans les tirages, par exemple)

Lien avec ce qui a été vu en seconde : On sait que _, = 1,96

(2)

D’autre part, si est assez proche de , (1 − ) est proche de (par exemple, pour

= 0,7 on trouve (1 − ) = 0,21

Finalement, (1 − ) _, est proche de 1.

On obtient bien l’intervalle de seconde : −

√ , +

√

3. Intervalles de confiance

Ici, on ne connait pas la valeur de , on la recherche. On effectue des épreuves (plus de 30), on a une fréquence .

Et, avec 95% de chances de ne pas se tromper, appartient à l’intervalle

−√ , +

√

C’est l’intervalle de confiance au risque 5%

Et c’est FINI