IV. Echantillonnage
1. Le théorème de Moivre-Laplace a) Le théorème
Si est une suite de variables aléatoires qui suivent la loi binomiale ( , ) (la même valeur de pour toutes les variables), et qu’on pose =
( )
(autrement dit est la régularisée de ), alors pour tout couple ( , ) : ( ≤ ≤ ) tend vers Φ( ) − Φ( ) (autrement dit, converge vers la loi normale centrée réduite)
La démonstration n’est pas au programme, ce théorème est admis b) Conséquence (ROC)
Si suit ℬ( , ), alors pour tout ∈]0 ; 1[, lim
→ ∈ = 1 − où désigne l’intervalle − ( )
√ ; + ( )
√
Démonstration : avec les notations du a), par définition des nombres : lim→ (− ≤ ≤ ) = 1 −
Or − ≤ ≤ est successivement équivalent à − ≤
( )≤ , soit à
− (1 − ) ≤ − ≤ (1 − ) , maintenant on divise par :
− ( ) ≤ − ≤ ( ) . On rentre le dans les racines carrées :
− ( ) ≤ − ≤ ( ) . Reste à simplifier les fractions et à faire passer pour obtenir − ( ) ≤ ≤ + ( ) et le théorème est prouvé.
2. Intervalles de fluctuation La situation :
On effectue épreuves de Bernoulli qu’on suppose identiques et indépendantes, de probabilité de succès . On calcule la fréquence de succès .
L’intervalle de fluctuation asymptotique au risque est :
− ( )
√ ; + ( )
√
Ce que dit le théorème, c’est que, quand est « grand », appartient à cet intervalle de fluctuation avec une probabilité 1 −
Dans la pratique, comment s’en sert-on ?
On se fixe (en fait, pour nous, ce sera l’énoncé du sujet) un seuil de risque (plus ce seuil est faible, plus l’intervalle augmente)
On regarde si est assez grand : il faut vérifier ≥ 30, ≥ 5, (1 − ) ≥ 5 On calcule l’intervalle de fluctuation, et on regarde si est à l’intérieur Si c’est le cas, rien à dire
Si ce n’est pas le cas, on ne confirme pas la valeur de (mais cette valeur peut être correcte, et le problème dû à un biais dans les tirages, par exemple)
Lien avec ce qui a été vu en seconde : On sait que , = 1,96
D’autre part, si est assez proche de , (1 − ) est proche de (par exemple, pour
= 0,7 on trouve (1 − ) = 0,21
Finalement, (1 − ) , est proche de 1.
On obtient bien l’intervalle de seconde : −
√ , +
√
3. Intervalles de confiance
Ici, on ne connait pas la valeur de , on la recherche. On effectue des épreuves (plus de 30), on a une fréquence .
Et, avec 95% de chances de ne pas se tromper, appartient à l’intervalle
−√ , +
√
C’est l’intervalle de confiance au risque 5%
Et c’est FINI