Chapitre n°8 : échantillonnages et estimations
Objectifs.
O23-
Connaître un intervalle de fluctuation à au moins 95 % d'une fréquence d'un échantillon de taille n :[
p−√
1n, p+1
√
n]
lorsque la proportion p dans la population est connue. [On peut faire observer qu'en approchant la loi binomiale par la loi normale de même espérance et d'écart-type√
p(1−p)n , on est conduit à l'intervalle[ p−1,96 √ p( √ 1− n p) , p+ 1.96 √ p( 1− p)
√ n ] qui est inclus dans [
p−√
1n, p+
1
√
n]
O24- Exploiter l'intervalle
[
p−√
1n , p+ 1√
n]
pour rejeter ou non une hypothése sur une proportion [Le vocabulaire des tests (test d'hypothèse, hypothèse nulle, risque de première espèce) est hors programme]O25- Estimer une proportion inconnue par l'intervalle
[ f − √ 1 n , f + 1
√ n ]
où f est la fréquence obtenue sur un échantillon de taille n. [Cet intervalle contient la proportion dans au moins 95 % des cas pour n grand, ce qui peut être illustré par simulation][la notion de niveau de confiance ne fait pas l'objet de développements.]Rappels méthodologiques
- Les exercices sans étoile et une étoile sont obligatoires.
- Parmi les exercices deux étoiles, il faut au moins en faire un « préparation au bac ».
- une fois sur deux, le travail à la maison est à rendre sur feuille. Il sera noté selon le seul critère : les questions sont toutes traitées, avec des explications systématiquement fournies.
- En cas de travail différent par rapport aux autres élèves de la classe, fournir un papier (cf fin du polycopié).
Activité d'approche n°1 : intervalle de fluctuation
On lance un dé équilibré à 10 faces et on note le numéro de la face supérieure . 1. a) En utilisant un tableur , faire une colonne de 100 lancers d’un dé à 10 faces (=ENT( 1+10*ALEA()))
b) Afficher en cellule B1 la fréquence des lancers supérieures ou égaux à 4.
On utilisera la fonction NB.SI(A1:A100;">=4").
2/15 - Chapitre n°8 : échantillonnages et estimations
Essai 1 Essai 2 Essai 3 Essai 4 Essai 5 Essai 6 Essai 7 Essai 8 Essai 9 Essai 10
Fréquence de lancers supérieures ou égaux à 4 sur
100 lancers …... …... …... …... …... …... …... …... …... …...
d) Quelle semble être la probabilité théorique p d’obtenir une face supérieure ou égale à 4 ? …...
e) Calculer l'intervalle [p – 1
√ n ;p +
1
√ n ] où n est le nombre de lancers et p la probabilité théorique d’obtenir une face supérieure ou égale à 4.
…...
f) Combien de fois la fréquence obtenue dans le tableau 1c est-elle dans cette intervalle ? Quel pourcentage de fréquences est dans cet intervalle ?
…...
...
2. On va maintenant faire dix simulations de 1000 lancers.
a) Sélectionner la plage A1:A100 , puis la copier et la coller dans la plage A101:A1000.
b) Modifier la formule en B1.
c) Recalculer dix fois et noter les résultats, arrondis au millième :
Essai 1 Essai 2 Essai 3 Essai 4 Essai 5 Essai 6 Essai 7 Essai 8 Essai 9 Essai 10
Fréquence de lancers supérieures ou égaux à 4, sur
1000 lancers …... …... …... …... …... …... …... …... …... …...
d) Calculer l'intervalle [p – 1
√ n ;p +
1
√ n ] où n est le nombre de lancers et p la probabilité théorique d’obtenir une face supérieure ou égale à 4.
…...
e) Déterminer la proportion des fréquences comprises entre les 2 valeurs trouvées en 2d.
…...
f) « Au moins 95 % des fréquences de nos 1 000 simulations sont dans [0,7 – 0,6683;0,7316 ]». Est-ce plausible ?
…...
2/15
Cours n°1
Chapitre n°8 : Échantillonnage
I) Intervalle de fluctuation (probabilité supposée) Définition n°1 : échantillon
Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la même expérience.
Exemple n°1 :
Je lance 15 fois un dé à 6 faces. La taille de l'échantillon est alors : …...
Définition 2 : Fluctuation d'échantillonnage
Deux échantillons de même taille issus de la même expérience aléatoire ne sont la plupart du temps pas identiques. On appelle …...
…... les variations des fréquences des valeurs observées.
Exemple n°2
Je lance 15 fois un dé à 6 faces. J'obtiens une fréquence d'apparition de « 1 » de 0,18.
Je recommence l'expérience en lançant à nouveau 15 fois un dé à 6 faces.
J'obtiens cette fois une fréquence d'apparition de « 1 » de 0,15.
On a donc une variation de …... entre les deux échantillons.
4/15 - Chapitre n°8 : échantillonnages et estimations
4/15
Définition n°1 : intervalle de fluctuation
Soit une population pour laquelle on connaît (ou on suppose) la proportion p d'un caractère.
On prélève un échantillon de taille n de cette population, et on observe une fréquence f du caractère étudié, dans cet échantillon.
Alors on appelle intervalle de fluctuation au seuil de 95 % relatif aux échantillon de taille n, l'intervalle centré sur p qui a 95 % de chance de contenir f.
Propriété n°1 : intervalle de fluctuation pour des probabilités non extrêmes et un échantillon suffisamment grand
Avec les notation de la définition précédente, si : 1) np5 et n(1–p)5
2) n30,
Alors l'intervalle de fluctuation (aussi appelé intervalle de fluctuation asymptotique) est [p – 1
√ n ;p +
1
√ n ].
Si f appartient à cet intervalle, c'est que l'hypothèse faite sur la valeur de p est sans doute …..., et on a une probabilité de 95 % d'avoir raison de considérer que la valeur de p est …...
Si f n'appartient à cet intervalle, c'est que l'hypothèse faite sur la valeur de p est sans doute …..., et on a une probabilité de 95 % d'avoir raison de considérer que la valeur de p est …...
Exemple n°3 :
Dans la réserve indienne d’Aamjiwnaag, située au canada , à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons. Est ce normal ?
On conjecture que, dans cette réserve, la probabilité qu'un nouveau né soit un garçon est de 0,5.
On calcule l'intervalle de fluctuation :
…...
...
...
...
6/15 - Chapitre n°8 : échantillonnages et estimations
6/15
On constate que f = ...
... ≈ …...
…...
Donc, l'hypothèse « la probabilité qu'un nouveau né soit un garçon est de 0,5. » dans cette réserve est …..., et on a …... d'avoir raison en la
rejetant.
Donc, ce …... normal.
Exercice n°1 : Ex.1 p.206 Exercice n°2
Ex.3 p.206 Exercice n°3**
La répartition des groupes sanguins dans le monde est donnée dans le tableau ci-dessous .
Groupes O A B AB
Fréquences en %
45 40 11 4
Elle est cependant variable selon les ethnies.
1) On a testé le sang de 480 esquimaux et on a trouvé que 211 d’entre eux sont du groupe A.
a) Déterminer n, p, f.
b) Les conditions de calcul de l’intervalle de fluctuation sont-elles réunies ? c) Si oui, déterminer l’intervalle de fluctuation .
d) La proportion du groupe A chez les esquimaux est – elle conforme à la population mondiale ?
2) On a trouvé 62 esquimaux du groupe B. Que peut-on dire ? Exercice n°4
D’après l’INSEE (www.insee.fr) la proportion de 0 - 17 ans en France est de 21,95 % en 2010.
La ville de Nice compte 64 242 jeunes âgé de 17 ans ou moins parmi 343 304
habitants.
8/15 - Chapitre n°8 : échantillonnages et estimations
8/15
2) Les conditions de détermination de l’intervalle de fluctuation sont-elles réunies ?
3) Que peut-on en conclure ?
Exercice n°5
Ex.15 p.206
Exercice n°6
Ex.17 p.206
Cours n°2
II) Intervalle de confiance (probabilité inconnue)
Propriété n°2
On veut estimer la proportion p du caractère d'une population, à partir du sondage d'un échantillon de taille n. Ce sondage donne une fréquence f du caractère dans cet échantillon.
Alors, si n25 et si f0,2 et f 0,8,
la proportion p du caractère de la population a 95 % de chance d'être dans l'intervalle [f – 1
√ n ;f +
1
√ n ].
Exemple n°4
Le 4 mai 2007 soit deux jours avant le second tour des élections
présidentielles, on publie le sondage suivant réalisé auprès de 992 personnes : S . Royal : 45%
N . Sarkozy : 55%
Interpréter ce sondage.
On calcule l'intervalle de confiance pour N.Sarkozy :
…...
...
...
....
La proportion des votants en faveur de N.Sarkozy a 95 % de se trouver dans l'intervalle …...
Donc N.Sarkozy avait de grande chance d'être élu.
10/15 - Chapitre n°8 : échantillonnages et estimations
10/15
Exercice n°7
En septembre 2013 , un sondage réalisé auprès de 1 297 joueurs américains , révèle que 26 % des sondés achèteront la console SP2 à sa sortie .
1) Les conditions de validité de l’intervalle de confiance sont-elles réunies ? 2) Si oui, dans quelle fourchette peut-on estimer, avec une probabilité de 95 % , le pourcentage de joueurs américains qui feront l’acquisition d’une SP2 ?
Exercice n°8
En février 2013 , un sondage a été réalisé par téléphone sur un échantillon national représentatif de 1 000 personnes résidant en France âgées de 18 ans et plus. Cet échantillon a été constitué d’après la méthode des quotas ( sexe , âge , catégorie socioprofessionnelle) par région et taille
d’agglomération . Le sondeur donne 257 personnes n’ayant pas ou peu confiance dans les hôpitaux publics.
1) Les conditions de validité de l’intervalle de confiance sont - elles réunies ? 2) Si oui, dans quelle fourchette peut - on estimer le pourcentage de Français qui n’ont pas ou peu confiance dans les hôpitaux publics avec une probabilité de 95 % ?
Exercice n°9*
En décembre 2012 , un sondage été réalisé auprès de 1 003 personnes résidant en France , âgées de 18 ans et plus . L’échantillon a été constitué d’après la méthode des quotas ( sexe , âge , catégorie socioprofessionnelle du
répondant ) par région et taille d’agglomération. 772 personnes interrogées ont déclaré avoir déjà été confrontées à une arnaque ou une tentative d’arnaque sur Internet. Dans le même temps , 211 personnes interrogées déclarent avoir déjà été piégées sur Internet par un mail ou un site Internet leur demandant leurs coordonnées personnelles.
1 ) Estimer le pourcentage de personnes en France confrontées à une arnaque sur Internet.
2 ) Estimer le pourcentage de personnes en France ayant déjà été piégées sur internet .
Exercice n°10*
Ex.43 p.210
Exercice n°11*
12/15 - Chapitre n°8 : échantillonnages et estimations observée , donne l’intervalle de confiance au seuil 0,95.
Exercice n°12*
Programmer l'algorithme précédent sur votre calculatrice ou sur un ordinateur.
Exercice n°13*
Ex.50 p.211
Exercice n°14**
Sujet B p.218
Exercice n°15**
Sujet C p.219
Exercice n°16**
Sujet E p.219
Exercice n°17**
Sujet F p.220
Exercice n°18**
Sujet G p.220
12/15
Indices ou résultats permettant de savoir si on a juste ou faux.
Act.1 : 1)d) 0,7 Ex.1 : [0,4;0,6]
Ex.2 : a. [0,18;0,22] b. [0,16875;0,23125]
Ex.3 : 1.a. n=480;p=0,4;f= 211
480 1.b.Oui : np5 et n(1–p)5et n301.c.[0,3544;0,4456] 1.d.Oui 2.
[0,1089;0,1556] et f≈0,1292 Conforme.→
Ex.4 : 1.0,1871 2. Oui 3. [0,2178;0,2212] non conforme.→ Ex.5 : 1. accepte 2. refuse
Ex.6 : 1. [0,014;0,126] 2. Si dans l'intervalle p=0,07 accepté → 3.a. 0,028 b. Accepté.
Ex.7 : 1. Oui : n25 et f0,2 et f 0,8, 2. [0,2322;0,2878]
Ex.8 : 1. Oui : n25 et f0,2 et f 0,8, 2. [0,2253;0,2886]
Ex.9 : 1. entre 0,73811 et 0,80127 2. Entre 0,1787 et 0,2419 Ex.10 : 1.[0,79;0,99] 2. Faux.
Ex.11 :
Ex.13 : 1. I=[0,326;0,486] 2. J=[0,387;0,518] 3. intersection non vide même efficacité.→ Ex.14 à 18 : non corrigés (devoirs maisons)
14/15 - Chapitre n°8 : échantillonnages et estimations
14/15
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Rayez les lignes inutiles. Si un cours n'est pas validé, NE PAS FAIRE de travail au-delà.
Date : …...
Nom, prénom et classe :
…...
* Je veux repasser l'interrogation n°... du chap. n°...
* Je veux repasser le contrôle n°...
Travail fait en classe :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...
Travail à faire pour la prochaine fois :
- Act n° …. Cours n° :... Ex.n° : … / … / … / ...