Page 1
Prise de décision (avec la loi binomiale)
On considère une population dans laquelle on suppose que la proportion d’un certain caractère est
p0. Pour analyser cette hypothèse, on y prélève, au hasard et avec remise, un échantillon de taille n sur lequel on observe une fréquence
fdu caractère.
On rejette l’hypothèse selon laquelle la proportion dans la population est
p0lorsque la fréquence
fobservée est trop éloignée de
p0, dans un sens ou dans l’autre.
On choisit de fixer le seuil de décision de telle sorte que la probabilité de rejeter l’hypothèse, alors qu’elle est vraie, soit inférieure à 5 %.
Lorsque la proportion dans la population vaut
p0, la variable aléatoire
Xcorrespondant au nombre de fois où le caractère est observé dans un échantillon aléatoire de taille
n, suit la loi binomiale de paramètres
B n p
; 0 . On cherche à partager l’intervalle
0;n, où X prend ses
valeurs, en trois intervalles
0;a1 ,
a b;et
b1;n de telle sorte que
Xprenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 2,5%, sans dépasser cette valeur. En tabulant les probabilités cumulées croissantes
p X
k , pour
kallant de 0 à
n, il suffit de déterminer dans le tableau le plus petit entier
atel que
p X
a
0, 025et le plus petit entier
btel que
p X
b
0, 975. La règle de prise de décision est la suivante :
si la fréquence observée
fappartient à l’intervalle
a n b n; , l’hypothèse selon laquelle la proportion est
p0dans la population n’est pas remise en question et on l’accepte,
sinon, on rejette l’hypothèse selon laquelle cette proportion vaut
p0.
Page 2
Santé
Un médecin veut savoir si, dans sa région, le pourcentage d’habitants atteints d’hypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion d’hypertendus dans la population de sa région, le médecin formule l’hypothèse p=0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n=100 habitants de la région, dont il détermine la fréquence f d’hypertendus (l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise).
Enoncer la règle de décision permettant de rejeter ou non l’hypothèse p=0,16 selon la valeur de la fréquence f d’hypertendus observée dans l’échantillon prélevé au hasard dans la population.
Politique
Monsieur Z, chef du gouvernement d’un pays lointain, affirme que 52 % des électeurs lui font confiance.
On interroge 100 électeurs au hasard (l’échantillon est prélevé au hasard et la population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise).
Sur les 100 électeurs interrogés au hasard, 43 déclarent avoir confiance en Monsieur Z. Peut- on considérer l’affirmation de Monsieur Z comme exacte ? Votre raisonnement sera justifié par la détermination d’un intervalle de fluctuation à 95%.
Discrimination
En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida est condamné à huit ans de prison. Il attaque ce jugement au motif que la désignation des jurés de ce comté est, selon lui, discriminante à l’égard des Américains d’origine mexicaine. Alors que 80 % de la population du comté est d’origine mexicaine, sur les 870 personnes convoquées pour être jurés lors des années précédentes, il n’y a eu que 339 personnes d’origine mexicaine.
Devant la Cour Suprême, un expert statisticien produit des arguments pour convaincre du bien fondé de la requête de l’accusé. En vous situant dans le rôle de cet expert, utilisez la loi binomiale pour montrer que la sous-représentation des américains d’origine mexicaine dans les jurys de ce comté est « significative ».
Une table des probabilités cumulées croissantes de la loi
B
870; 0,8 est fournie ci-après.
Page 3
Gauchers
Dans le monde, la proportion de gauchers est 12 %. Soit n le nombre d’élèves dans votre classe.
Déterminer, à l’aide de la loi binomiale, l’intervalle de fluctuation à 95 % de la fréquence des gauchers sur un échantillon aléatoire de taille n.
Votre classe est-elle « représentative » de la proportion de gauchers dans le monde ? Brigade de répression des fraudes
Une émission de télévision a relayé une étude montrant que certaines marques vendent du thé contenant une dose de pesticides dépassant les doses maximales autorisées.
Un commerçant sait que cette information va avoir un impact sur les ventes des marques incriminées. Ce commerçant achète 80% de ses boites chez un fournisseur A et 20% chez un fournisseur B.
10% des boites provenant du fournisseur A et 20% de celles provenant du fournisseur B contiennent une dose de pesticides dépassant les doses maximales autorisées.
1. Un ami du commerçant considéré lui explique qu’il n’a pas lieu de s’inquiéter et que pour 88% des boites de thé qu’il vend, la dose de pesticides ne dépasse pas les doses maximales autorisées.
Justifier ce résultat.
2. Le magasin étant réputé et le stock important, les clients achètent souvent les boites de thé par lots. Quelle est la probabilité que, sur un lot de 10 boites prélevées au hasard, au moins huit ne contiennent pas une dose de pesticides dépassant les doses maximales autorisées ?
3. A des fins publicitaires, le commerçant affiche sur ses plaquettes « 97% de notre thé est garanti sans pesticides ». Un inspecteur de la brigade de répression des fraudes souhaite étudier la validité de l’affirmation. A cette fin, il prélève 200 boites au hasard dans le stock du commerçant et en trouve 10 dont la dose de pesticides dépasse les doses maximales autorisées.
Au vu des résultats, quelle sera la réaction de l’inspecteur de la brigade de répression ?
Page 4
Homme/femme
Deux entreprises recrutent leur personnel dans un vivier comportant autant d’hommes de que de femmes. Voici la répartition entre hommes et femmes dans ces deux entreprises. Peut-on suspecter l’une des deux entreprises de ne pas respecter la parité hommes/femmes ?
Hommes Femmes Total
Ent A
57 43 100
Ent B
1350 1150 2500 Extrait d’écran d’une calculatrice
Extrait d’écran d’un tableur
Page 5
Intervalle de fluctuation (avec la loi binomiale)
Dans une certaine population la proportion d’individus présentant le caractère C est
p.
On analyse ce que l’on peut dire de la fréquence
fdu caractère C sur un échantillon de taille n prélevé de manière aléatoire dans cette population.
Si on note
Xnla variable aléatoire associant à chaque échantillon de taille n le nombre d’individus présentant le caractère C et si on note
Fnla variable aléatoire définie par
Fn Xn nqui correspond à la fréquence du caractère C dans l’échantillon, alors nous avons vu que :
Xn
suit la loi binomiale
B n p
, .
On peut donc déterminer à l’aide de la loi binomiale un intervalle de la forme
a n b n; ,
avec
aet
bdeux entiers tels que
p X
n a
0, 025et
p X
n b
0, 025.
Un tel intervalle vérifie
n a b; 0, 95 p F n n
.
Un tel intervalle est donc appelé intervalle de fluctuation au seuil de 95%.
Rappel indispensable : le théorème de Moivre-Laplace (admis)
On considère une variable aléatoire
Xnqui suit la loi binomiale
B n p
; . On note
1
n n
X np Z
np p
la variable centrée et réduite associée à la variable
Xn. Pour tous réels
aet
btels que
ab:
lim
1 222
b x
n a
n p a Z b p a Z b e dx
Autre rappel indispensable
Soit
Zest la variable aléatoire qui suit la loi normale
N
0;1de densité
2
1 2
2
x
f x e
Pour tour nombre réel
tel que
0 1il existe un unique réel positif
utel que :
1p u Z u
Rappelons que la démonstration se base sur
l’utilisation du théorème des valeurs interm.
Page 6
Remarquons les équivalences suivantes :
1
1 1
1 1
1 1
n
n
n
n
X np
I u u
np p
I u np p X np u np p
u np p X u np p
I p
n n n
p p X p p
I p u p u
n n n
Utilisons les deux rappels pour affirmer que :
Pour tout nombre réel tel que
0 1il existe un unique réel positif
utel que :
1
1
lim lim 1
1
n
n n n
p p p p
X np
p u u p p u F p u
n n
np p
Nous pouvons en déduire que :
Pour un
n« assez grand » (*) et pour un nombre réel
tel que
0 1, il existe un unique réel positif
u(défini au chapitre précédent) tel que l’approximation ci-dessous soit vérifiée :
1
1
n 1
p p p p
p p u F p u
n n
(*) en pratique, les conditions communément admises pour pratiquer ce type d’approximation sont les suivantes :
n30,
np5et
n
1p
5.
Intervalle de fluctuation asymptotique
L’intervalle
1
1
n ;
p p p p
I p u p u
n n
est un intervalle de fluctuation asymptotique de la variable aléatoire
Fn Xn n
au seuil
1, cela signifie que pour un
nassez
grand, la variable
Fnprend ses valeurs dans l’intervalle
Inavec une probabilité proche de
1.
Page 7
Théorème fondamental
On considère une variable aléatoire
Xnqui suit la loi binomiale
B n p
; et on note
Fn Xn n
. On considère
un nombre réel tel que
0 1et
ule réel tel que
p
u Z u
1 où
Zest la variable aléatoire qui suit la loi normale centrée réduite
N
0;1.
Si
1
1
n ;
p p p p
I p u p u
n n
alors
nlim p F
n In
1
.
Un troisième rappel important
Intervalle de fluctuation
Au seuil de 95% :
1
1
1,96 ; 1,96
n
p p p p
I p p
n n
Au seuil de 99% :
1
1
2,58 ; 2,58
n
p p p p
I p p
n n
Prise de décision au seuil de 5%
On cherche à savoir, au seuil de décision de 5%, si la proportion
pdu caractère C dans une population donnée vaut
p p0ou non.
On prélève un échantillon de taille
n(on fait en sorte que
n30,
np5et
n
1p
5).
La prise de décision consiste en :
Calcul de l’intervalle de fluctuation
I,
Calcul de la fréquence
fdu caractère C sur l’échantillon de taille
nprélevé,
Prise de décision : si
f Ion rejette l’hypothèse
p p0, sinon on l’accepte.
Page 8
Petits pois
Selon la théorie de Mendel, certaines cosses de petits pois devraient fournir des petits pois jaunes et verts dans des proportions respectives de 75% et 25%. On souhaite tester l’hypothèse selon laquelle la proportion des pois jaunes est p=0,75 en mettant en place une expérience permettant d’obtenir 224 petits pois considérés comme un échantillon aléatoire.
1. Sous l’hypothèse p=0,75, déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire correspondant à la fréquence des pois jaunes sur un échantillon de taille 224 (arrondir les bornes de l’intervalle au centième près).
2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,75, au seuil de 5% sur un échantillon aléatoire de taille 224.
3. L’expérience a permis d’obtenir 176 pois jaunes et 48 pois verts, que peut-on en déduire ?
Lancers de pièces
On lance 100 fois une pièce de monnaie.
1. En supposant que la pièce est équilibrée, déterminer l’intervalle de fluctuation asymptotique de la fréquence de « pile » : au seuil de 95% ? au seuil de 99% ?
2. On lance une pièce 100 fois et on obtient 38 « pile » et 62 « face ». Peut-on considérer que la pièce est équilibrée : au seuil de décision de 5% ? au seuil de décision de 1% ?
La pièce de Buffon
Dans son essai d’arithmétique morale, Buffon relate une expérience selon laquelle un enfant ayant lancé 4040 fois une pièce de monnaie, obtient 2048 fois « pile ». On peut considérer que cette expérience constitue une observation d’un échantillon de taille n=4040 dans la population de tous les lancers possibles avec la pièce de Buffon.
1. Sous l’hypothèse p=0,5 déterminer l’intervalle de fluctuation au seuil de 95% de la variable aléatoire F correspondant à la fréquence de « pile » sur un échantillon aléatoire de taille 4040.
2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,5 au seuil de 5%. Quelle conclusion peut-on tirer du nombre de « pile » obtenus par l’enfant ?
Groupes sanguins
Les centres de transfusion sanguine ont diffusé le tableau des répartitions, en France, des
principaux groupes sanguins. La proportion des groupes O+ et O- est p=0,44. Une collecte de
sang a été organisée sur le campus d’une université à laquelle ont participé 356 étudiants. On
souhaite tester l’hypothèse selon laquelle ces étudiants sont représentatifs, au seuil de 95%, de la
proportion des groupes O. L’analyse des prélèvements montre que sur les 356 donneurs, 148
appartiennent au groupe O. Quelle conclusion peut-on en tirer ?
Page 9
D’un intervalle de fluctuation asymptotique vers un intervalle de confiance
On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête.
L’échantillon est-il représentatif de la population ?
Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux informations du recensement.
Ainsi on sait que dans la population il y a 46%
d’hommes et 20% de personnes de plus de 60.
Parallèlement on peut comptabiliser le nombre d’hommes et de femmes dans l’échantillon ainsi que la répartition selon l’âge.
Homme Femme Total échantillon 200 260 460
<60ans >60ans Total échantillon 352 108 460 1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable
aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460.
2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460.
3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation
asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est
représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ?
Page 10
La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme
« représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est extrait.
Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la manière suivante : masse en kg/(taille en m)².
Intervalle de confiance d’une probabilité
La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit
d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond pas
exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris un
autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de
communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on
puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la
prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance.
Page 11
Une majoration
Montrer que pour tout
pcompris entre 0 et 1 la quantité
1,96 p
1p
est majorée par 1.
On pourra pour cela étudier les variations de la fonction
g x
x 1x
sur l’intervalle
0;1.
Deux inégalités
Montrer que pour tout
pcompris entre 0 et 1 et
nentier on a
1
11,96 p p
p p
n n
(1)
Montrer que pour tout
pcompris entre 0 et 1 et
nentier on a
1
11,96 p p
p p
n n
(2)
Une inclusion
On note
1
1
1,96 ; 1,96
n
p p p p
I p p
n n
et
Jn p 1 ;p 1n n
.
On rappelle que
Inest l’intervalle de fluctuation asymptotique au seuil de 95%. On appellera le nouvel intervalle
Jndéfini ci-dessus « intervalle de fluctuation asymptotique simplifié ».
Déduire des inégalités (1) et (2) l’inclusion de l’intervalle
Indans l’intervalle
Jn. Une conclusion
On peut « agrandir » l’intervalle de fluctuation asymptotique au seuil de 95% en majorant la quantité
1,96 p
1p par 1 pour
0 p 1. Ainsi si
Xnest une variable aléatoire qui suit la loi binomiale
B n p
, et si
Fn Xn nalors : pour tout
ptel que
0 p 1, il existe un entier
n0tel que si
nn0on puisse affirmer :
1 1
0, 95
p p Fn p
n n
Page 12
Remarquons l’équivalence suivante :
1 1 1 1
n n n
p F p F p F
n n n n
Utilisons la conclusion précédente pour affirmer que :
Si
Xnest une variable aléatoire qui suit la loi binomiale
B n p
, et si
Fn Xn nalors pour tout
ptel que
0 p 1, il existe un entier
n0tel que si
nn0 p Fn 1 p Fn 1 0,95n n
.
Proposons la définition d’un intervalle de confiance à 95% :
Soit
fla fréquence observée sur un échantillon de taille n . L’intervalle
f 1 ;f 1n n
est
un intervalle de confiance de la proportion inconnue
pau niveau de confiance de 95%.
NB : les conditions communément admises sont les suivantes :
n30,
nf 5et
n
1 f
5.
Page 13
Surpoids
Dans une certaine population, on a observé un échantillon de taille n=500 d’adolescents de 15 ans dans lequel 210 présentent un surpoids. Donner un intervalle de confiance de la proportion p d’adolescents de cette population présentant un surpoids au niveau de confiance 95%.
Poissons malades
On a observé 180 poissons malades sur 800 poissons pêchés dans une rivière. En considérant qu’il s’agit d’un échantillon aléatoire prélevé avec remise (il y a de nombreux poissons dans la rivière), donner un intervalle de confiance de la proportion de poissons malades dans la rivière au niveau de confiance de 95%.
Pièces sans défaut
On considère une grande quantité de pièces industrielles devant être livrées à une chaîne d’hypermarchés. On prélève au hasard un échantillon de 100 pièces dans cette livraison. La livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On constate que 96 pièces sont sans défaut. Déterminer un intervalle de confiance de la proportion de pièces de la livraison qui sont sans aucun défaut, avec un niveau de confiance de 95%.
Virus
On veut estimer la proportion p de personnes immunisées contre un certain virus parmi la population d’une ville. On prélève un échantillon aléatoire de 500 personnes parmi cette population. La population est suffisamment importante pour assimiler ce prélèvement à un tirage au hasard avec remise.
Après analyses, on dénombre 241 personnes immunisées contre ce virus, parmi les 500 de l’échantillon. Donner un intervalle de confiance de la proportion de personnes immunisées contre ce virus parmi la population de la ville, avec un niveau de confiance de 95%. Quelle est la taille minimale de l’échantillon qui aurait permis d’obtenir un intervalle de confiance de rayon inférieur ou égal à 0,01 ?
Une option à prendre
Une agence de voyage propose, en option supplémentaire dans un de ses circuits, la visite d’une exposition. En consultant au hasard et avec remise 60 fiches de clients parmi les 2054 clients inscrits sur la période considérée, le directeur de l’agence observe que l’option est mentionnée seulement 9 fois. Donner un intervalle de confiance à 95% de la proportion inconnue p de personnes ayant fait le choix de cette option parmi les 2054 clients.
Le directeur considère que l’information fournie par l’intervalle de confiance est trop imprécise
(longueur de l’intervalle trop grande). Il procède à un nouveau prélèvement de 60 fiches parmi les
2054. Sur l’échantillon global de taille 120 prélevé, l’option apparaît 18 fois. Quel intervalle de
confiance de 95% l’échantillon complété permet-il de fournir ?
Page 14
Sondage
Pour décider de la construction d’un grand stade, une municipalité veut sonder la population pour estimer si plus de 50% des électeurs y sont favorables. La municipalité réalise un sondage aléatoire de taille 100 et obtient 54 avis favorables. Quelle est la fréquence d’avis favorables sur ce sondage ? La municipalité peut-elle décider de la construction du stade en prétextant que plus de 50% de la population y est favorable ?
On suppose que la municipalité réalise un sondage de taille n et que la fréquence des votes favorables reste égale à 0,54. Si p est la proportion (inconnue) d’avis favorables dans la population, donner l’expression d’un intervalle de confiance de p au niveau de 95%. La municipalité ne construira ce stade que si la proportion p d’avis favorable dépasse 50%.
Déterminer à partir de quelle valeur de n la municipalité pourra prendre cette décision.
Statistiquement fondé ?
Pour comparer les cotes de popularité de trois personnalités X, Y et Z un journal a réalisé un sondage : sur 1320 personnes interrogées, 27% ont voté pour X, 38,5% ont voté pour Y et 34,5%
ont voté pour Z. Estimer par un intervalle la cote de popularité de X, de Y et de Z dans la population au niveau de confiance de 95%. Un classement peut-il être publié ? Avec ces mêmes taux, pour quelle taille du sondage un classement aurait été statistiquement fondé au niveau de confiance de 95% ?
Premier tour d’une élection présidentielle
Le 18 avril 2002, l’institut IPSOS effectue un sondage dans la population en âge de voter. On constitue un échantillon de 1000 personnes (inscrites sur les listes électorales) que l’on suppose choisies de manière aléatoire. Sur les 1000 personnes : 140 ont déclaré vouloir voter pour Jean- Marie Le Pen, 195 personnes ont déclaré vouloir voter pour Jacques Chirac, 170 ont déclaré vouloir voter pour Lionel Jospin. Quels seront les deux candidats présents au second tour ?
Pour information les résultats obtenus par ces trois candidats au premier tour de l’élection ont été les suivants : 16,9% - 19,9% - 16,2%
Intervalles disjoints
Un maraîcher achète un lot de semences de tomates pour produire ses plants de tomate. Il lui reste des semences de l'année passée, dont il doit contrôler le taux de germination pour pouvoir les utiliser avec les autres. En effet, des taux de germination trop différents provoquent des trous dans les plates-bandes de production, ce qui génère un coût de manutention plus élevé. Il lui faut donc comparer les taux de germination des semences des deux années.
Une stratégie consiste à calculer et à comparer les intervalles de confiance des taux de
germination (qui sont des proportions) des plants de l'année et de l'année précédente. Si les deux
intervalles ne se recoupent pas, on peut conclure à une différence de taux de germination entre
les semences des deux origines. Il faudra alors les semer séparément. Pour faire cette
comparaison, le maraîcher prélève, aléatoirement dans les semences de l'année, un échantillon de
200 graines qu'il met à germer. Il constate que 185 graines germent. Il prélève ensuite,
aléatoirement dans les semences de l'année précédente, un échantillon de 200 graines qu'il met à
germer. Il constate que 150 graines germent. Aidez le maraîcher à prendre une décision.
Page 15
Exercice 1
Une étude statistique a montré que la durée de vie en années X d’un disque dur DD est une variable aléatoire suivant une loi exponentielle et que la durée de vie moyenne d’un disque dur DD est de cinq ans.
1. Déterminer le paramètre de la loi exponentielle suivie par X.
2. Le disque dur DD est garanti 2 ans. Quelle proportion de disque dur, arrondie à 0,01 près, sera retournée au fournisseur pour cause de panne ?
3. Calculer
p X
3 et interpréter ce résultat.
4. Sachant qu’un disque dur DD n’est plus sous garantie, quelle est la probabilité, arrondie 0,01 près, que sa durée de vie totale dépasse 5 ans.
Exercice 2
On admet que la proportion de femmes dans la population française est égale à 51,4%. Si on considère 577 personnes françaises tirées aléatoirement avec remise, à quel intervalle appartiendra la proportion de femmes parmi ces 577 personnes avec une probabilité de 95% ?
A l’Assemblée Nationale on dénombre actuellement 155 femmes sur les 577 députés élus qui siègent dans l’hémicycle. Peut-on considérer (au seuil de 5% d’erreur) qu’il y a une sous- représentation des femmes au sein de l’Assemblée Nationale ?
Exercice 3
Lors d’un scrutin électoral, plusieurs enquêtes sont menées par différents instituts de sondages afin de prédire le futur gagnant. On suppose que chaque enquête est effectuée auprès de 1000 personnes choisies au hasard et avec remise. A l’issue de ces enquêtes, les instituts fournissent la proportion des personnes votants pour le candidat A. Le tableau suivant résume les résultats fournis par les 6 instituts de sondages.
Institut 1 Institut 2 Institut 3 Institut 4 Institut 5 Institut 6
46,9 48,0 50,2 49,1 47,2 50,6
Recopier et compléter le tableau en ajoutant un intervalle de confiance à 95% pour chaque estimation (arrondir au millième). On désire savoir si le candidat A obtiendra la majorité des votes (c'est-à-dire plus de 50%). Quel institut peut-il affirmer connaître la réponse à cette question avec un niveau de confiance de 95% ?
On suppose que les 6 enquêtes ont été effectuées de manière indépendante. Quelle est la proportion totale de votes pour le candidat A parmi les sondés de ces 6 enquêtes ? Soit p la proportion (inconnue) de personnes qui votent pour A dans la population totale. Fournir un intervalle de confiance au niveau 95% pour l’estimation de p en regroupant les 6 enquêtes.
D’après vous, le candidat A obtiendra-t-il la majorité des votes ? Justifiez.
Page 16
Exercice 4
Exercice 5
Page 17