• Aucun résultat trouvé

corrigé

N/A
N/A
Protected

Academic year: 2021

Partager "corrigé"

Copied!
5
0
0

Texte intégral

(1)

Partie I : Intervalle de confiance au niveau 0,95 (estimation d'une proportion)

Exercice 1 : Une bouteille opaque contient des billes noires et blanches, non discernables au toucher. On ne peut pas sortir les billes de la bouteille. La seule chose qu’on peut faire est de retourner la bouteille et observer la couleur d’une bille par le goulot. Sur 250 essais on a vu 150 billes noires. Donner une fourchette d’estimation de la proportion de billes noires dans la bouteille.

Soit n=250 la taille de l'échantillon. La fréquence observée de billes noires dans l'échantillon est

fobs=150 250=

3 5

On vérifie bien que n⩾25 et 0,2⩽ fobs⩽0,8 .

L'intervalle de confiance au niveau de confiance 0,95 est IC=

[

3 5− 1

250; 3 5+ 1

250

]

. IC≈[0,536 ; 0,664 ] (et IC⊂[0,536 ,0 ,664 ] )

La probabilité que le proportion de billes noires dans la bouteile soit comprise entre 53,6 % et 66,4 % est supérieure à 0,95.

Exercice 2 :

1. Soit n = 802 la taille de l'échantillon. Soient fH et fS les fréquences observées pour respectivement F.

Hollande et N. Sarkozy. f H=0,53 et fS=0,47 .

Les conditions d'utilisation de l'intervalle de confiance vu en cours sont réunies. Les fourchettes de sondages sont :

[fH− 1

n; f H+ 1

n]≈[0,494; 0,566] [f S− 1

n; fS+ 1

n]≈[0,434 ;0,506]

D'après l'enquête, F. Hollande a 95% de chance d'obtenir au 2nd tour entre 49,4% et 56,6% des suffrages.

D'après l'enquête, N. Sarkozy a 95% de chance d'obtenir au 2nd tour entre 43,4% et 50,6% des suffrages. 2. L'article de journal tend à donner F. Hollande gagnant. Il ne tient cependant pas compte des intervalles de

confiance qui montrent que la victoire de N. Sarkozy est, d'après le sondage de BVA, possible, les deux intervalles ayant une intersection non vide.

3. a. La marge d'erreur pour un échantillon de taille environ 800 et pour un score d'environ 50% dans le

tableau est de 3,5%.

b. La marge d'erreur dans la théorie vue en classe de 2nde est très proche de 3,5%. En effet :

1

802≃0,0353 soit 3,53%.

(2)

Partie II : Intervalle de fluctuation au seuil de 95 % (prise de décision)

Exercice 3 :

1. a. Faisons l'hypothèse que le dé testé est équilibré.

La probabilité p d'apparition de chaque face est 0,25 car les 4 issues sont équiprobables.

b. L'échantillon est de taille n = 200 . n⩾25 et 0,2⩽ p⩽0,8 donc il est possible d'utiliser la théorie du

cours.

L'intervalle de fluctuation au seuil de 95 % est, dans l'hypothèse que le dé est équilibré : I = [ p− 1

n; p+

1

n]≃[0,179 ;0,321] (on vérifie que I ⊂ [0,179 ;0,321 ] ) 2. a.

Face k 1 2 3 4

Fréquences de sorties de la

face k 0,29 0,25 0,26 0,21

b. Les fréquences observées appartiennent toutes à l'intervalle de fluctuation au seuil de 95% donc on ne peut

pas réfuter l'hypothèse et on prend la décision de considérer que le dé est équilibré.

Exercice 4 : Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des États-Unis. Du milieu à la fin des années 1970, la communauté locale s’émeut d’un grand nombre de leucémies infantiles survenant dans certains quartiers de la ville. Les familles se lancent alors dans l’exploration des causes et constatent la présence de décharges et de friches industrielles ainsi que l’existence de polluants.

Dans un premier temps, les experts gouvernementaux concluent qu’il n’y a rien d’étrange. Mais les familles s’obstinent et saisissent leurs propres experts.

Les statistiques sont les suivantes :

Enfants entre 0 et 14 ans

Population de Woburn selon le recensement de 1970

Nombre de cas de leucémie infantile observés à Woburn entre 1969 et 1979

Fréquence des leucémies aux États-Unis

Filles 5779 3 0,00038

Garçons 5969 9 0,00052

Peut-on alors effectivement considérer la situation comme étrange (ce qui doit être fait officiellement avant que ne soient cherchées les raisons d'une éventuelle anomalie) ?

Principe : on fait l'hypothèse que les taux de cas de leucémie à Woburn sont conformes à la fréquence des leucémies sur l'ensemble du territoire des États-Unis.

Voici comment est simulé, dans le cadre de cette hypothèse, le prélèvement d'un échantillon de filles : 1. On prélève une fille : la probabilité qu'elle ait contracté une leucémie est de 0,00038. Si elle a contracté une leucémie, on ajoute 1 à un compteur h (qu'on aura pris soin d'initialiser à 0 avant le prélèvement de l'échantillon).

Appelons Rand() un nombre pseudo-aléatoire dans [0 ;1[ (cette fonction est présente dans les tableurs et dans les différents langages de programmation, sous différents noms).

Rand()+0,00038 est donc un nombre pseudo-aléatoire dans [0,00038 ;1,00038[ .

La partie entière (Ent) de Rand()+0,00038 est : . 0 quand Rand()+0,00038 ∈ [0,00038 ;1[ . 1 quand Rand()+0,00038 ∈ [1 ;1,00038[

L'amplitude de l'intervalle [0,00038 ;1[ est 0,00062 donc p (Ent(Rand ()+0,00038)=0)=0,00062 L'amplitude de l'intervalle [1 ;1,00038[ est 0,00038 donc p (Ent(Rand ()+0,00038)=1)=0,00038 Cette partie de l'algorithme s'écrit donc :

alea ← Ent(Rand()+0,00038) (alea prend la valeur 1 avec une probabilité 0,00038 : cela correspond à prélever une fille est à noter si elle est atteinte d'une leucémie (1) ou non (0).

h ← h + alea (On ajoute 1 au compteur si la fille est atteint d'une leucémie, et 0 sinon)

2. On répète cette opération 5 779 fois (prélèvement de 5 779 filles pour constituer un échatillon) :

h ← 0

pour j allant de 1 à 5779 faire alea ← Ent(Rand()+0,00038) h ← h + alea

finpour

(3)

Variables : N, h, alea, effectif_filles, effectif_garçons : entiers rayon, taux_filles, taux_garçons : réels

F, G : listes # F : liste des résultats des N échantillons de filles

début

Entrée : saisir N

Traitement : pour i allant de 1 à N faire

F[i] ← 0

G[i] ← 0

finpour

pour i allant de 1 à N faire

h ← 0

pour j allant de 1 à 5779 faire alea ← Ent(Rand()+0,00038)

h ← h + alea

finpour F[i] ← h/5779 h ← 0

pour j allant de 1 à 5969 faire alea ← Ent(Rand()+0,00052) h ← h + alea finpour G[i] ← h/5969 finpour rayon ← 0 taux_filles ← 0

tant que taux_filles < 0,95 faire effectif_filles ← 0

pour i allant de 1 à N faire

si 0,00038 – rayon  F[i]  0,00038 + rayon alors faire effectif_filles ← effectif_filles + 1 finsi finpour taux_filles ← effectif_filles/N rayon ← rayon + 0,0000001 fintantque

Première sortie : afficher la valeur minimum de la liste F

afficher la valeur maximum de la liste F

afficher l'intervalle [0,00038 – rayon ; 0,00038 + rayon] rayon ← 0

taux_garçons ← 0

tant que taux_garçons < 0,95 faire effectif_garçons ← 0

pour i allant de 1 à N faire

si 0,00052 – rayon  G[i]  0,00052 + rayon alors faire effectif_garçons ← effectif_garçons + 1 finsi finpour taux_garçons ← effectif_garçons/N rayon ← rayon + 0,0000001 fintantque

Seconde sortie : afficher la valeur minimum de la liste G

afficher la valeur maximum de la liste G afficher l'intervalle [0,5 – rayon ; 0,5 + rayon] fin

création et initialisation des listes dans lesquelles seront rangés les résultats des N échantillons de filles et de garçons.

simulation du prélèvement d'un échantillon de filles dans l'hypothèse de conformité : à la fin, h/5779 est la proportion de filles atteintes de leucémies dans cet échantillon. Cette valeur est rangée dans la liste F.

simulation du prélèvement d'un échantillon de garçons dans l'hypothèse de conformité : à la fin, h/5969 est la proportion de garçons atteints de leucémies dans cet échantillon. Cette valeur est rangée dans la liste G.

Compte parmi les N

échantillons de filles, quel est le taux d'échantillons dans lesquels la fréquence de cas de leucémie est comprise dans un intervalle

d'amplitude 2rayon, centré en 0,00038.

À chaque étape de la boucle tantque, l'amplitude de l'intervalle centré en 0,00052 est augmentée, jusqu'à ce que cet intervalle contienne 95 % des valeurs obtenues par la simulation du prélèvement de

N échantillons de 5 696

garçons.

Intervalle de fluctuation au seuil de 95 % obtenu par la simulation du prélèvement de N échantillons de 5696 garçons.

(4)

Implémentation en Python 3 :

Résultats :

D'après ces résultats, 95 % des dix mille échantillons de 5 779 filles (dans une population dans laquelle le taux de filles atteintes de leucémie est 0,00038) comporte moins de 0,000 865 3×5 779≈5 filles atteintes de leucémie ; 95 % des dix mille échantillons de 5 969 garçons (dans une population dans laquelle le taux de garçons atteints de leucémie est 0,00052) comporte moins de 0,001 040 2×5 969≈6,2 garçons atteints de leucémie.

À Woburn, en 1970, il y avait 3 cas de leucémie parmi les 5 779 filles de moins de 14 ans recensées. Il n'est donc pas possible de réfuter l'hypothèse pour ce qui concerne les filles.

Par contre, il y avait 9 cas de leucémie parmi les 5 969 garçons de moins de 14 ans recensés. On peut donc réfuter l'hypothèse avec un risque de 5 %, et considérer que le taux de leucémies chez les garçons nés entre 1956 et 1970 à Woburn est anormalement élevé.

Le taux anormalement élevé de leucémies infantiles chez les garçons à Woburn est officiellement confirmé par le Département de Santé Publique du Massachusetts en avril 1980. Les soupçons se portent alors sur la qualité de l’eau de la nappe phréatique qui, par des forages, alimente la ville. On découvre alors le syndrome du trichloréthylène. Les industriels responsables de cette pollution sont tr aduits en justice, les familles obtiendront des « réparations » financières et la dépollution des sites sera engagée. Suite à cette affaire, le discours du nouveau maire montre bien le changement d’attitude des autorités : « notre première priorité, dira-t-il, est de nous assurer d’avoir un approvisionnement en eau propre et saine ».

(5)

Exercice 5 :

1. a. Carluis, assistant du juge, fait l'hypothèse que Baugos II a procédé en toute honneteté en choisissant

effectivement les convives au hasard.

n=731 et p=0,5 . On a bien n⩾25 et 0,2⩽ p⩽0,8 donc les conditions sont réunies pour utiliser

l'intervalle IF de fluctuation au seuil de 95 %. b. IF=

[

0,5− 1

731;0,5+ 1

731

]

0,5− 1

731≈0,4630 à 10 −4 près par défaut. 0,5+ 1

731≈0,5370 à 10 −4 près par excès. IF≈[0,4630 ;0,5370] c. fobs= 339 731

fobs0,4637 à 10−4 près par défaut. fobs ∈ IF

Il n'est donc pas possible, à partir de cet intervalle de fluctuation au seuil de 95 %, de rejeter l'hypothèse que l'échantillon prélevé par le Roi est le fruit du hasard.

Carluis peut donc suggérer au jude Seconda d'acquitter le Roi.

2. a. Les parties manquantes de l'algorithmes sont : pour i allant de 1 à N faire

h ← 0

pour j allant de 1 à 731 faire

alea ← nombre pseudo-aléatoire dans {0 ; 1}

h ← h + alea

finpour L[i] ← h/731

finpour

b. La deuxième partie de l'algorithme permet d'obtenir en sortie l'intervalle de fluctuation au seuil de 95 %

obtenu grâce à cette simulation.

Voici les résultats qu'il obtient après avoir implémenter cet algorithme en Python, et mis le programme en œuvre plusieurs fois :

Au risque de planter son ordinateur, il essaie même :

La simulation opérée par le juge donne pour intervalle de fluctuation au seuil de 95 % [0,4636 ;0,5764 ] . Cet intervalle est effectivement plus précis que celui obtenu à l'aide des éléments du cours de seconde.

Il contient toujours f obs et il n'est donc toujours pas possible de rejeter l'hypothèse.

Le juge Seconda prend donc finalement la décision que le Roi est honnête et n'a pas influé sur le tirage au sort.

3. 731=17×43

731 est le produit de deux nombres premiers.

Le nombre de convives est un entier inférieur ou égal à 19 (puisqu'il n'y a que 20 places assises autour de la table, et qu'il en reste donc 19 une fois que le Roi a pris place).

Le Roi invite donc 17 personnes à chaque repas mensuel. Il le fait donc depuis 43 mois, soit 3 ans et 7 mois.

C'est la durée de son règne au moment des faits...

Références

Documents relatifs

- soit, à volume de ventes constant, en augmentant la marge réalisée sur chaque produit - soit, à marge unitaire constante, en augmentant le montant des ventes, c'est à dire

L’activite traditionnelle de transformation, par laquelle les dtablissements de credit remploient en partie a des Ccheances ne correspondant pas a celles des

de la prolificité des truies en agissant non plus directement sur la taille de la portée, mais sur ses 2 principales composantes : taux d’ovulation.. et survie

• Variables liées au projet migratoire : Alors que la grande majorité des nouveaux migrants souhaitent s’installer en France définitivement, les signataires du

Dans le second cas, les deux termes n'ont pas le même type d'indexation (par exemple un crédit à taux fixe est adossé à un refinancement à taux variable). Les études sur

La hausse des taux à long terme qui vient de se produire dans le monde a fait éclater les cadres des principaux modèles prévisionnels. Cela nous oblige à reprendre les méthodes

I L'objectif de la duration de Macaulay est de quantier la durée de vie moyenne de ux nanciers.. I La duration Macaulay s'exprime en années et s'interpréte comme le centre de

Il nous paraît donc important d'insister sur la réalité de cette relation qui caractérise la dépendance existant entre les résultats comptables, les valeurs nettes comptables