• Aucun résultat trouvé

Chapitre XI : Fluctuation et estimation

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre XI : Fluctuation et estimation"

Copied!
5
0
0

Texte intégral

(1)

1

Chapitre XI : Fluctuation et estimation

Dans une population, un caractère est présent dans la proportion .

Cette proportion peut être connue (échantillonnage), supposée connue (prise de décision) ou encore inconnue (estimation).

On prélève dans la population au hasard et avec remise, un échantillon de taille sur lequel on observe une fréquence de ce caractère.

En pratique, la taille de l’échantillon est largement inférieure à la population entière étudiée : un tirage sans remise (plus logique pour les sondages) peut être assimilé à un tirage avec remise (indispensable pour l’utilisation de la loi binomiale).

La variable aléatoire qui, à tout échantillon de taille , associe le nombre d’individus qui possèdent le caractère étudié suit la loi binomiale de paramètres et .

I - Échantillonnage

Dans ce paragraphe, on suppose que la proportion du caractère étudié est connue.

1) Propriété de la variable aléatoire fréquence

Soit un entier naturel non nul et un réel appartenant à 0; 1.

Soit une variable aléatoire suivant la loi binomiale de paramètres et , alors la variable aléatoire =représente la fréquence de succès pour un schéma de BERNOULLI de paramètres et .

Propriété 1 :

Si la variable aléatoire suit la loi binomiale de paramètres et , alors pour tout ∈ 0; 1, on a :

lim

= 1 − , où = − !"#(1 − )

√ ; + !"#(1 − )

√ ( Remarques :

1) Le réel !" a été défini dans la propriété 8 du chapitre 10 comme étant l’unique réel positif !" tel que (−!"≤ * ≤ !") = 1 − où * ↪ ,(0; 1) et ∈ 0; 1.

2) On utilise, pour la démonstration, la variable aléatoire - définie dans le théorème de MOIVRE-LAPLACE : - =

#(1 − )= . − / #(1 − )

√ × √

=

√ × #(1 − ) −

√ × √

=

#(1 − )

2) Intervalle de fluctuation asymptotique

Définition 1 : Un intervalle de fluctuation asymptotique de la variable aléatoire au seuil 1 − est un intervalle déterminé à partir de et de et qui contient avec une probabilité d’autant plus proche de 1 − que est grand.

Conséquence : L’intervalle défini dans la propriété 1 est un intervalle de fluctuation asymptotique au seuil 1 − de la variable aléatoire fréquence .

(2)

2 Remarques :

1) Cet intervalle contient avec une probabilité d’autant plus proche de 1 − que est grand.

2) La probabilité intervenant dans cette définition n’est pas nécessairement égale à 1 − mais s’en rapproche quand la taille de l’échantillon devient de plus en plus grande : d’où l’utilisation du terme

« asymptotique ».

3) Cette approximation est valable dès que 1 ≥ 34, 15 ≥ 6 et 1(7 − 5) ≥ 6.

4) Dans le cas où = 0,05, alors 1 − = 0,95 et !" ≈ 1,96 d’après le chapitre précédent. On en déduit un intervalle de fluctuation asymptotique au seuil de 95 % :

Propriété 2 : Un intervalle de fluctuation asymptotique au seuil de 95 % de la fréquence d’un caractère dans un échantillon de taille est :

− 1,96#(1 − )

√ ; + 1,96#(1 − )

√ ( où désigne la proportion (connue) de ce caractère dans la population.

Remarque :

Une étude de la fonction = ↦ =(1 − =) sur 0; 1 montre qu’elle admet pour maximum ?

@ pour = =?A , on en déduit que (1 − ) ≤?@ et donc que #(1 − ) ≤?A

Le réel 1,96#(1 − ) peut donc être majoré par 1 et on obtient : − 1

√ ≤ − 1,96#(1 − )

√ et + 1,96#(1 − )

√ ≤ + 1

L’intervalle de fluctuation de la propriété 2 est donc inclus dans l’intervalle de fluctuation asymptotique étudié en classe de seconde et défini par :

I − 1

√; + 1

√J Exemples :

1) La proportion de droitiers dans la population est de 85 %.

Déterminer un intervalle de fluctuation asymptotique au seuil de 95 % de la fréquence des droitiers dans les échantillons de taille 400 (on arrondira les bornes à 10KL près).

2) La myopie est un trouble de la vision qui se caractérise par une perte de la netteté visuelle pour les images lointaines. En France, le nombre de personnes souffrant de ce défaut visuel est d’environ 39 %.

Lors d’un match de rugby, le joueur clermontois JAMIE CUDMORE a reçu un carton jaune pour un mauvais geste sur un joueur adverse. Déterminer un intervalle de fluctuation asymptotique de la fréquence des personnes installées en tribune « PHLIPONNEAU » (2 000 places) n’ayant pas pu voir ce mauvais geste :

a) au seuil de 80 % ; b) au seuil de 99 %.

(On arrondira les bornes à 10KL près).

(3)

3 II - Prise de décision à partir d’un échantillon

Dans ce paragraphe, la proportion du caractère étudié est supposée être égale à . 1) Prise de décision

La prise de décision consiste, à partir d’un échantillon de taille , à valider ou non l’hypothèse émise sur la valeur de la proportion (à savoir : « la proportion de ce caractère dans la population est »).

En voici la démarche :

1ère étape : on calcule la fréquence observée dans cet échantillon ;

2e étape : on détermine un intervalle de fluctuation (asymptotique ou non) de la fréquence au seuil de 95

% que l’on notera ;

3e étape : on applique la règle de décision suivante :

Règle de décision :

1) Si la fréquence observée appartient à , alors on accepte l’hypothèse émise sur la proportion . 2) Si la fréquence observée n’appartient pas à , alors on rejette l’hypothèse émise sur avec un risque de 5 % de se tromper.

Remarques :

1) On ne connaît pas le risque d’erreur lorsque l’on accepte l’hypothèse émise sur .

2) Le risque de 5 % du 2) de la règle de décision signifie que la probabilité de rejeter l’hypothèse émise sur alors qu’elle est vraie est d’environ 0,05.

2) Détermination pratique d’un intervalle de fluctuation

1er cas : Si les conditions d’approximation sont vérifiées, à savoir 1 ≥ 34, 15 ≥ 6 et 1(7 − 5) ≥ 6, alors on peut déterminer l’intervalle de fluctuation asymptotique de la fréquence au seuil de 0,95 défini dans la propriété 2.

2e cas : Si les conditions ne sont pas vérifiées (à savoir 1 < 30 ou 15 < 5 ou 1(7 − 5) < 5), alors on reprend l’intervalle déterminé en classe de première avec la loi binomiale, c’est-à-dire l’intervalle OP;QR où S est le plus petit entier tel que ( ≤ S) > 0,025 et V est le plus petit entier tel que ( ≤ V) ≥ 0,975

3) Exemples Exemple 1 :

On considère qu’une « machine à badger » à l’entrée d’une cantine scolaire fonctionne de façon

satisfaisante si le pourcentage de repas non comptabilisés est de 1 %. Sur un échantillon de 1 000 élèves ayant présenté leur carte devant la machine, 15 élèves ont déjeuné gratuitement.

a) Déterminer un intervalle de fluctuation asymptotique au seuil de 95 % de la fréquence de repas non comptabilisés dans les échantillons de taille 1 000, prélevés au hasard et avec remise.

b) Enoncer la règle de décision permettant d’accepter ou non l’hypothèse = 0,01 au seuil de risque de 5 %. Conclure.

(4)

4 Exemple 2 :

On veut construire un test qui, à la suite de contrôles antidopage sur un échantillon de 100 sportifs prélevés au hasard, permette de décider si, au seuil de confiance de 95 %, le pourcentage de sportifs susceptibles d’être contrôlés positivement est 0,04.

1) On fait l’hypothèse que le pourcentage des sportifs susceptibles d’être contrôlés positivement est 0,04.

a) Expliquer pourquoi on ne peut pas utiliser ici un intervalle de fluctuation asymptotique.

b) Soit la variable aléatoire associée au nombre de sportifs contrôlés positivement dans un

échantillon de 100 sportifs. Déterminer la loi de puis en déduire un intervalle de fluctuation au seuil de 95 % de la fréquence de sportifs contrôlés positivement dans les échantillons de taille 100.

2) Énoncer la règle de décision permettant d’accepter ou non l’hypothèse = 0,04 au seuil de confiance de 95 % sur un échantillon de 100 sportifs.

III - Estimation d’une proportion

Dans ce paragraphe, on suppose que la proportion du caractère étudié est inconnue.

Le problème de l’estimation est le problème « inverse » de l’échantillonnage : à partir de la fréquence observée sur un échantillon, comment peut-on estimer la proportion correspondante dans la population tout entière ? Ce problème se pose par exemple dans les sondages.

1) Intervalle de confiance, estimation

Définition 2 : Un intervalle de confiance pour une proportion à un niveau de confiance 1 − est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion avec une probabilité supérieure ou égale à 1 − , intervalle aléatoire déterminé à partir de la variable aléatoire fréquence qui, à tout échantillon de taille , associe la fréquence.

Remarque :

Les intervalles de confiance considérés ici sont centrés en la fréquence observée . La valeur de habituellement choisie est 0,05, le niveau de confiance est donc de 0,95.

Propriété 3 : Si la variable aléatoire suit la loi binomiale de paramètres et où ∈ 0; 1, alors, il existe un entier Y tel que, pour tout ≥ Y,

− 1

√ ≤

≤ + 1

√ > 0,95

Propriété 4 : Soit la variable aléatoire fréquence qui, à tout échantillon de taille extrait d’une population dans laquelle la proportion d’un caractère est , associe la fréquence obtenue (observée).

Alors l’intervalle O? ; +?R contient, pour assez grand, la proportion avec une probabilité au moins supérieure à 0,95.

Définition 2 : Soit la fréquence d’un caractère dans un échantillon de taille extrait d’une population dans laquelle la proportion d’un caractère est .

Alors l’intervalle O −? ; +?R est un intervalle de confiance de la proportion au niveau de confiance 95 %.

(5)

5 Remarques :

1) La proportion n’étant pas connue, il est impossible de vérifier si les conditions du 2) du paragraphe II sont respectées : on utilise alors cet intervalle dès que 1 ≥ 34, 1Z ≥ 6 et 1(7 − Z) ≥ 6.

2) Dans d’autres champs, on utilise l’intervalle [ − 1,96#(1 − )

√ ; + 1,96#(1 − )

√ \

qu’il n’est pas possible de justifier en classe de terminale.

2) Exemples

1) Estimer par intervalle une proportion inconnue

Dans une population donnée, on s’intéresse à la proportion de blonds. Dans un échantillon de taille 100 extrait de cette population, on a trouvé 22 blonds.

Déterminer un intervalle de confiance de la proportion des blonds dans la population au niveau de confiance de 0,95.

2) Déterminer une taille d’échantillon suffisante pour obtenir une estimation d’une proportion

A l’occasion d’une élection, on réalise un sondage sur un échantillon de personnes afin de connaître le pourcentage d’électeurs qui souhaitent voter pour un candidat donné.

On suppose la population suffisamment importante pour que ce sondage soit assimilé à un tirage avec remise.

Quelle doit être la taille minimale de l’échantillon afin que l’intervalle de confiance de cette proportion nous donne celle-ci à 1 % près avec une probabilité au moins égale à 95 % ?

3) Utiliser un intervalle de confiance

Deux candidats se présentent à une élection. Un sondage portant sur un échantillon de personnes (avec ≥ 30) donne 53 % des suffrages au candidat A et 47 % au candidat B.

a) Déterminer, au seuil de confiance de 95 %, un intervalle de confiance de la proportion des votants pour le candidat A et de la proportion ’ des votants pour le candidat B.

b) Combien de personnes doit-on interroger pour que l’on puisse affirmer, au niveau de confiance 0,95, que le candidat A va être élu ?

Références

Documents relatifs

 Le deuxième objectif de cette RDP est de déterminer la surface de panneaux photovoltaïques que doit comporter un satellite pour assurer son bon fonctionnement et la

Si l'on en croit Jesse Fox, auteur principal d'une étude et professeur assistante en communication à l'Université de l'Ohio, les hommes qui publient beaucoup de selfies sur

Les élèves ne disposant pour l’instant que d’informations qualitatives sur l’énergie potentielle et l’énergie cinétique d’un système, le but de

 A chaque type et chaque degré est affecté un nombre de points La méthode permet de calculer le poids du projet en points de

Ce scénario décrit les processus qui surviennent lors des interventions de maintenance précédant généralement un avis de panne pour un objet technique (vous avez également

On décompose le volume du liquide en rotation en couronnes cylindriques de rayon r, d’épaisseur dr et de hauteur z(r). Exprimer le volume dV d’une telle couronne. En supposant que

Elle est d’autant plus importante que la masse de la charge est grande et s’oppose à la mise en mouvement. Elle est caractérisée par le moment d’inertie J, qui s’exprime en

Ils sont ensuite émis sans vitesse par la source S, puis accélérés par un champ électrostatique uniforme qui règne entre S et P tel que.. U sp