Partie I : Intervalle de confiance au niveau 0,95 (estimation d'une proportion)
Exercice 1 : Une bouteille opaque contient des billes noires et blanches, non discernables au toucher. On ne peut pas sortir les billes de la bouteille. La seule chose qu’on peut faire est de retourner la bouteille et observer la couleur d’une bille par le goulot. Sur 250 essais on a vu 150 billes noires. Donner une fourchette d’estimation de la proportion de billes noires dans la bouteille.
Soit n=250 la taille de l'échantillon. La fréquence observée de billes noires dans l'échantillon est
fobs=150 250=
3 5
On vérifie bien que n⩾25 et 0,2⩽ fobs⩽0,8 .
L'intervalle de confiance au niveau de confiance 0,95 est IC=
[
3 5− 1
√
250; 3 5+ 1√
250]
. IC≈[0,536 ; 0,664 ] (et IC⊂[0,536 ,0 ,664 ] )La probabilité que le proportion de billes noires dans la bouteile soit comprise entre 53,6 % et 66,4 % est supérieure à 0,95.
Exercice 2 :
1. Soit n = 802 la taille de l'échantillon. Soient fH et fS les fréquences observées pour respectivement F.
Hollande et N. Sarkozy. f H=0,53 et fS=0,47 .
Les conditions d'utilisation de l'intervalle de confiance vu en cours sont réunies. Les fourchettes de sondages sont :
[fH− 1
√
n; f H+ 1√
n]≈[0,494; 0,566] [f S− 1√
n; fS+ 1√
n]≈[0,434 ;0,506]D'après l'enquête, F. Hollande a 95% de chance d'obtenir au 2nd tour entre 49,4% et 56,6% des suffrages.
D'après l'enquête, N. Sarkozy a 95% de chance d'obtenir au 2nd tour entre 43,4% et 50,6% des suffrages. 2. L'article de journal tend à donner F. Hollande gagnant. Il ne tient cependant pas compte des intervalles de
confiance qui montrent que la victoire de N. Sarkozy est, d'après le sondage de BVA, possible, les deux intervalles ayant une intersection non vide.
3. a. La marge d'erreur pour un échantillon de taille environ 800 et pour un score d'environ 50% dans le
tableau est de 3,5%.
b. La marge d'erreur dans la théorie vue en classe de 2nde est très proche de 3,5%. En effet :
1
√
802≃0,0353 soit 3,53%.Partie II : Intervalle de fluctuation au seuil de 95 % (prise de décision)
Exercice 3 :
1. a. Faisons l'hypothèse que le dé testé est équilibré.
La probabilité p d'apparition de chaque face est 0,25 car les 4 issues sont équiprobables.
b. L'échantillon est de taille n = 200 . n⩾25 et 0,2⩽ p⩽0,8 donc il est possible d'utiliser la théorie du
cours.
L'intervalle de fluctuation au seuil de 95 % est, dans l'hypothèse que le dé est équilibré : I = [ p− 1
√
n; p+1
√
n]≃[0,179 ;0,321] (on vérifie que I ⊂ [0,179 ;0,321 ] ) 2. a.Face k 1 2 3 4
Fréquences de sorties de la
face k 0,29 0,25 0,26 0,21
b. Les fréquences observées appartiennent toutes à l'intervalle de fluctuation au seuil de 95% donc on ne peut
pas réfuter l'hypothèse et on prend la décision de considérer que le dé est équilibré.
Exercice 4 : Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des États-Unis. Du milieu à la fin des années 1970, la communauté locale s’émeut d’un grand nombre de leucémies infantiles survenant dans certains quartiers de la ville. Les familles se lancent alors dans l’exploration des causes et constatent la présence de décharges et de friches industrielles ainsi que l’existence de polluants.
Dans un premier temps, les experts gouvernementaux concluent qu’il n’y a rien d’étrange. Mais les familles s’obstinent et saisissent leurs propres experts.
Les statistiques sont les suivantes :
Enfants entre 0 et 14 ans
Population de Woburn selon le recensement de 1970
Nombre de cas de leucémie infantile observés à Woburn entre 1969 et 1979
Fréquence des leucémies aux États-Unis
Filles 5779 3 0,00038
Garçons 5969 9 0,00052
Peut-on alors effectivement considérer la situation comme étrange (ce qui doit être fait officiellement avant que ne soient cherchées les raisons d'une éventuelle anomalie) ?
Principe : on fait l'hypothèse que les taux de cas de leucémie à Woburn sont conformes à la fréquence des leucémies sur l'ensemble du territoire des États-Unis.
Voici comment est simulé, dans le cadre de cette hypothèse, le prélèvement d'un échantillon de filles : 1. On prélève une fille : la probabilité qu'elle ait contracté une leucémie est de 0,00038. Si elle a contracté une leucémie, on ajoute 1 à un compteur h (qu'on aura pris soin d'initialiser à 0 avant le prélèvement de l'échantillon).
Appelons Rand() un nombre pseudo-aléatoire dans [0 ;1[ (cette fonction est présente dans les tableurs et dans les différents langages de programmation, sous différents noms).
Rand()+0,00038 est donc un nombre pseudo-aléatoire dans [0,00038 ;1,00038[ .
La partie entière (Ent) de Rand()+0,00038 est : . 0 quand Rand()+0,00038 ∈ [0,00038 ;1[ . 1 quand Rand()+0,00038 ∈ [1 ;1,00038[
L'amplitude de l'intervalle [0,00038 ;1[ est 0,00062 donc p (Ent(Rand ()+0,00038)=0)=0,00062 L'amplitude de l'intervalle [1 ;1,00038[ est 0,00038 donc p (Ent(Rand ()+0,00038)=1)=0,00038 Cette partie de l'algorithme s'écrit donc :
alea ← Ent(Rand()+0,00038) (alea prend la valeur 1 avec une probabilité 0,00038 : cela correspond à prélever une fille est à noter si elle est atteinte d'une leucémie (1) ou non (0).
h ← h + alea (On ajoute 1 au compteur si la fille est atteint d'une leucémie, et 0 sinon)
2. On répète cette opération 5 779 fois (prélèvement de 5 779 filles pour constituer un échatillon) :
h ← 0
pour j allant de 1 à 5779 faire alea ← Ent(Rand()+0,00038) h ← h + alea
finpour
Variables : N, h, alea, effectif_filles, effectif_garçons : entiers rayon, taux_filles, taux_garçons : réels
F, G : listes # F : liste des résultats des N échantillons de filles
début
Entrée : saisir N
Traitement : pour i allant de 1 à N faire
F[i] ← 0
G[i] ← 0
finpour
pour i allant de 1 à N faire
h ← 0
pour j allant de 1 à 5779 faire alea ← Ent(Rand()+0,00038)
h ← h + alea
finpour F[i] ← h/5779 h ← 0
pour j allant de 1 à 5969 faire alea ← Ent(Rand()+0,00052) h ← h + alea finpour G[i] ← h/5969 finpour rayon ← 0 taux_filles ← 0
tant que taux_filles < 0,95 faire effectif_filles ← 0
pour i allant de 1 à N faire
si 0,00038 – rayon F[i] 0,00038 + rayon alors faire effectif_filles ← effectif_filles + 1 finsi finpour taux_filles ← effectif_filles/N rayon ← rayon + 0,0000001 fintantque
Première sortie : afficher la valeur minimum de la liste F
afficher la valeur maximum de la liste F
afficher l'intervalle [0,00038 – rayon ; 0,00038 + rayon] rayon ← 0
taux_garçons ← 0
tant que taux_garçons < 0,95 faire effectif_garçons ← 0
pour i allant de 1 à N faire
si 0,00052 – rayon G[i] 0,00052 + rayon alors faire effectif_garçons ← effectif_garçons + 1 finsi finpour taux_garçons ← effectif_garçons/N rayon ← rayon + 0,0000001 fintantque
Seconde sortie : afficher la valeur minimum de la liste G
afficher la valeur maximum de la liste G afficher l'intervalle [0,5 – rayon ; 0,5 + rayon] fin
création et initialisation des listes dans lesquelles seront rangés les résultats des N échantillons de filles et de garçons.
simulation du prélèvement d'un échantillon de filles dans l'hypothèse de conformité : à la fin, h/5779 est la proportion de filles atteintes de leucémies dans cet échantillon. Cette valeur est rangée dans la liste F.
simulation du prélèvement d'un échantillon de garçons dans l'hypothèse de conformité : à la fin, h/5969 est la proportion de garçons atteints de leucémies dans cet échantillon. Cette valeur est rangée dans la liste G.
Compte parmi les N
échantillons de filles, quel est le taux d'échantillons dans lesquels la fréquence de cas de leucémie est comprise dans un intervalle
d'amplitude 2rayon, centré en 0,00038.
À chaque étape de la boucle tantque, l'amplitude de l'intervalle centré en 0,00052 est augmentée, jusqu'à ce que cet intervalle contienne 95 % des valeurs obtenues par la simulation du prélèvement de
N échantillons de 5 696
garçons.
Intervalle de fluctuation au seuil de 95 % obtenu par la simulation du prélèvement de N échantillons de 5696 garçons.
Implémentation en Python 3 :
Résultats :
D'après ces résultats, 95 % des dix mille échantillons de 5 779 filles (dans une population dans laquelle le taux de filles atteintes de leucémie est 0,00038) comporte moins de 0,000 865 3×5 779≈5 filles atteintes de leucémie ; 95 % des dix mille échantillons de 5 969 garçons (dans une population dans laquelle le taux de garçons atteints de leucémie est 0,00052) comporte moins de 0,001 040 2×5 969≈6,2 garçons atteints de leucémie.
À Woburn, en 1970, il y avait 3 cas de leucémie parmi les 5 779 filles de moins de 14 ans recensées. Il n'est donc pas possible de réfuter l'hypothèse pour ce qui concerne les filles.
Par contre, il y avait 9 cas de leucémie parmi les 5 969 garçons de moins de 14 ans recensés. On peut donc réfuter l'hypothèse avec un risque de 5 %, et considérer que le taux de leucémies chez les garçons nés entre 1956 et 1970 à Woburn est anormalement élevé.
Le taux anormalement élevé de leucémies infantiles chez les garçons à Woburn est officiellement confirmé par le Département de Santé Publique du Massachusetts en avril 1980. Les soupçons se portent alors sur la qualité de l’eau de la nappe phréatique qui, par des forages, alimente la ville. On découvre alors le syndrome du trichloréthylène. Les industriels responsables de cette pollution sont tr aduits en justice, les familles obtiendront des « réparations » financières et la dépollution des sites sera engagée. Suite à cette affaire, le discours du nouveau maire montre bien le changement d’attitude des autorités : « notre première priorité, dira-t-il, est de nous assurer d’avoir un approvisionnement en eau propre et saine ».
Exercice 5 :
1. a. Carluis, assistant du juge, fait l'hypothèse que Baugos II a procédé en toute honneteté en choisissant
effectivement les convives au hasard.
n=731 et p=0,5 . On a bien n⩾25 et 0,2⩽ p⩽0,8 donc les conditions sont réunies pour utiliser
l'intervalle IF de fluctuation au seuil de 95 %. b. IF=
[
0,5− 1√
731;0,5+ 1√
731]
0,5− 1√
731≈0,4630 à 10 −4 près par défaut. 0,5+ 1√
731≈0,5370 à 10 −4 près par excès. IF≈[0,4630 ;0,5370] c. fobs= 339 731fobs≈0,4637 à 10−4 près par défaut. fobs ∈ IF
Il n'est donc pas possible, à partir de cet intervalle de fluctuation au seuil de 95 %, de rejeter l'hypothèse que l'échantillon prélevé par le Roi est le fruit du hasard.
Carluis peut donc suggérer au jude Seconda d'acquitter le Roi.
2. a. Les parties manquantes de l'algorithmes sont : pour i allant de 1 à N faire
h ← 0
pour j allant de 1 à 731 faire
alea ← nombre pseudo-aléatoire dans {0 ; 1}
h ← h + alea
finpour L[i] ← h/731
finpour
b. La deuxième partie de l'algorithme permet d'obtenir en sortie l'intervalle de fluctuation au seuil de 95 %
obtenu grâce à cette simulation.
Voici les résultats qu'il obtient après avoir implémenter cet algorithme en Python, et mis le programme en œuvre plusieurs fois :
Au risque de planter son ordinateur, il essaie même :
La simulation opérée par le juge donne pour intervalle de fluctuation au seuil de 95 % [0,4636 ;0,5764 ] . Cet intervalle est effectivement plus précis que celui obtenu à l'aide des éléments du cours de seconde.
Il contient toujours f obs et il n'est donc toujours pas possible de rejeter l'hypothèse.
Le juge Seconda prend donc finalement la décision que le Roi est honnête et n'a pas influé sur le tirage au sort.
3. 731=17×43
731 est le produit de deux nombres premiers.
Le nombre de convives est un entier inférieur ou égal à 19 (puisqu'il n'y a que 20 places assises autour de la table, et qu'il en reste donc 19 une fois que le Roi a pris place).
Le Roi invite donc 17 personnes à chaque repas mensuel. Il le fait donc depuis 43 mois, soit 3 ans et 7 mois.
C'est la durée de son règne au moment des faits...