On rejette l’hypothèse selon laquelle la proportion dans la population est

(1)

Page 1

Prise de décision (avec la loi binomiale)

On considère une population dans laquelle on suppose que la proportion d’un certain caractère est

p₀

. Pour analyser cette hypothèse, on y prélève, au hasard et avec remise, un échantillon de taille n sur lequel on observe une fréquence

f

du caractère.

On rejette l’hypothèse selon laquelle la proportion dans la population est

p₀

lorsque la fréquence

f

observée est trop éloignée de

p₀

, dans un sens ou dans l’autre.

On choisit de fixer le seuil de décision de telle sorte que la probabilité de rejeter l’hypothèse, alors qu’elle est vraie, soit inférieure à 5 %.

Lorsque la proportion dans la population vaut

p₀

, la variable aléatoire

X

correspondant au nombre de fois où le caractère est observé dans un échantillon aléatoire de taille

n

, suit la loi binomiale de paramètres

B n p



; 0

 . On cherche à partager l’intervalle  

^0;ⁿ

^{, où X} ^{prend ses}

valeurs, en trois intervalles 

^0;^a^¹

 ^,  

^{a b}^;

^et 

^b^^1;ⁿ

 de telle sorte que

X

prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 2,5%, sans dépasser cette valeur. En tabulant les probabilités cumulées croissantes

^{p X}



^^k

 ^{, pour}

^k

allant de 0 à

n

, il suffit de déterminer dans le tableau le plus petit entier

a

tel que

^{p X}



^^a



^^{0, 025}

et le plus petit entier

b

tel que

^{p X}



^^b



^^{0, 975}

. La règle de prise de décision est la suivante :



si la fréquence observée

f

appartient à l’intervalle 

^{a n b n}^;

 , l’hypothèse selon laquelle la proportion est

p₀

dans la population n’est pas remise en question et on l’accepte,



sinon, on rejette l’hypothèse selon laquelle cette proportion vaut

p₀

.

(2)

Page 2

Santé

Un médecin veut savoir si, dans sa région, le pourcentage d’habitants atteints d’hypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion d’hypertendus dans la population de sa région, le médecin formule l’hypothèse p=0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n=100 habitants de la région, dont il détermine la fréquence f d’hypertendus (l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise).

Enoncer la règle de décision permettant de rejeter ou non l’hypothèse p=0,16 selon la valeur de la fréquence f d’hypertendus observée dans l’échantillon prélevé au hasard dans la population.

Politique

Monsieur Z, chef du gouvernement d’un pays lointain, affirme que 52 % des électeurs lui font confiance.

On interroge 100 électeurs au hasard (l’échantillon est prélevé au hasard et la population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise).

Sur les 100 électeurs interrogés au hasard, 43 déclarent avoir confiance en Monsieur Z. Peut- on considérer l’affirmation de Monsieur Z comme exacte ? Votre raisonnement sera justifié par la détermination d’un intervalle de fluctuation à 95%.

Discrimination

En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida est condamné à huit ans de prison. Il attaque ce jugement au motif que la désignation des jurés de ce comté est, selon lui, discriminante à l’égard des Américains d’origine mexicaine. Alors que 80 % de la population du comté est d’origine mexicaine, sur les 870 personnes convoquées pour être jurés lors des années précédentes, il n’y a eu que 339 personnes d’origine mexicaine.

Devant la Cour Suprême, un expert statisticien produit des arguments pour convaincre du bien fondé de la requête de l’accusé. En vous situant dans le rôle de cet expert, utilisez la loi binomiale pour montrer que la sous-représentation des américains d’origine mexicaine dans les jurys de ce comté est « significative ».

Une table des probabilités cumulées croissantes de la loi

^B



^{870; 0,8}

 est fournie ci-après.

(3)

Page 3

Gauchers

Dans le monde, la proportion de gauchers est 12 %. Soit n le nombre d’élèves dans votre classe.

Déterminer, à l’aide de la loi binomiale, l’intervalle de fluctuation à 95 % de la fréquence des gauchers sur un échantillon aléatoire de taille n.

Votre classe est-elle « représentative » de la proportion de gauchers dans le monde ? Brigade de répression des fraudes

Une émission de télévision a relayé une étude montrant que certaines marques vendent du thé contenant une dose de pesticides dépassant les doses maximales autorisées.

Un commerçant sait que cette information va avoir un impact sur les ventes des marques incriminées. Ce commerçant achète 80% de ses boites chez un fournisseur A et 20% chez un fournisseur B.

10% des boites provenant du fournisseur A et 20% de celles provenant du fournisseur B contiennent une dose de pesticides dépassant les doses maximales autorisées.

1. Un ami du commerçant considéré lui explique qu’il n’a pas lieu de s’inquiéter et que pour 88% des boites de thé qu’il vend, la dose de pesticides ne dépasse pas les doses maximales autorisées.

Justifier ce résultat.

2. Le magasin étant réputé et le stock important, les clients achètent souvent les boites de thé par lots. Quelle est la probabilité que, sur un lot de 10 boites prélevées au hasard, au moins huit ne contiennent pas une dose de pesticides dépassant les doses maximales autorisées ?

3. A des fins publicitaires, le commerçant affiche sur ses plaquettes « 97% de notre thé est garanti sans pesticides ». Un inspecteur de la brigade de répression des fraudes souhaite étudier la validité de l’affirmation. A cette fin, il prélève 200 boites au hasard dans le stock du commerçant et en trouve 10 dont la dose de pesticides dépasse les doses maximales autorisées.

Au vu des résultats, quelle sera la réaction de l’inspecteur de la brigade de répression ?

(4)

Page 4

Homme/femme

Deux entreprises recrutent leur personnel dans un vivier comportant autant d’hommes de que de femmes. Voici la répartition entre hommes et femmes dans ces deux entreprises. Peut-on suspecter l’une des deux entreprises de ne pas respecter la parité hommes/femmes ?

Hommes Femmes Total

Ent A

57 43 100

Ent B

1350 1150 2500 Extrait d’écran d’une calculatrice

Extrait d’écran d’un tableur

(5)

Page 5

Intervalle de fluctuation (avec la loi binomiale)

Dans une certaine population la proportion d’individus présentant le caractère C est

p

.

On analyse ce que l’on peut dire de la fréquence

f

du caractère C sur un échantillon de taille n prélevé de manière aléatoire dans cette population.

Si on note

X_n

la variable aléatoire associant à chaque échantillon de taille n le nombre d’individus présentant le caractère C et si on note

F_n

la variable aléatoire définie par

F_n  X_n n

qui correspond à la fréquence du caractère C dans l’échantillon, alors nous avons vu que :

 X_n

suit la loi binomiale

^{B n p}



^,

 .



On peut donc déterminer à l’aide de la loi binomiale un intervalle de la forme 

^{a n b n}^;

 ^,

avec

a

et

b

deux entiers tels que

p X



n a



^{0, 025}

et

p X



n b



^{0, 025}

.



Un tel intervalle vérifie

_n a b; 0, 95 p F n n

  

  

 

.



Un tel intervalle est donc appelé intervalle de fluctuation au seuil de 95%.

Rappel indispensable : le théorème de Moivre-Laplace (admis)

On considère une variable aléatoire

X_n

qui suit la loi binomiale

^{B n p}



^;

 . On note



¹



n n

X np Z

np p

 



la variable centrée et réduite associée à la variable

X_n

. Pour tous réels

a

et

b

tels que

ab

:

^lim

   

¹ ²²

2

b x

n a

n p a Z b p a Z b e dx





      



Autre rappel indispensable

Soit

Z

est la variable aléatoire qui suit la loi normale

^N

 

^0;1

de densité  

2

1 2

2

x

f x e



 

Pour tour nombre réel



tel que

0  1

il existe un unique réel positif

u_

tel que :

 

¹

p u_  Z u_  

Rappelons que la démonstration se base sur

l’utilisation du théorème des valeurs interm.

(6)

Page 6

Remarquons les équivalences suivantes :

   

     

1

1 1

n

X np

I u u

np p

I u np p X np u np p

u np p X u np p

I p

n n n

p p X p p

I p u p u

n n n

 

    



      

  

   

 

    

Utilisons les deux rappels pour affirmer que :

Pour tout nombre réel  tel que

0  1

il existe un unique réel positif

u_

tel que :

 



¹

 

¹



lim lim 1

1

n

n n n

p p p p

X np

p u u p p u F p u

n n

np p

    

 

      

          

    

   

Nous pouvons en déduire que :

Pour un

n

« assez grand » (*) et pour un nombre réel



tel que

0  1

, il existe un unique réel positif

u_

(défini au chapitre précédent) tel que l’approximation ci-dessous soit vérifiée :



¹

 

¹



n 1

p p p p

p p u F p u

n n

  

   

      

 

 

(*) en pratique, les conditions communément admises pour pratiquer ce type d’approximation sont les suivantes :

n30

,

np5

et

ⁿ



¹^^p



^⁵

^.

Intervalle de fluctuation asymptotique

L’intervalle 

¹

 

¹



n ;

p p p p

I p u p u

n n

 

   

 

  

 

 

est un intervalle de fluctuation asymptotique de la variable aléatoire

F_n ^Xⁿ

 n

au seuil

1

, cela signifie que pour un

n

assez

grand, la variable

F_n

prend ses valeurs dans l’intervalle

I_n

avec une probabilité proche de

1

.

(7)

Page 7

Théorème fondamental

On considère une variable aléatoire

X_n

qui suit la loi binomiale

^{B n p}



^;

 et on note

F_n ^Xⁿ

 n

. On considère



un nombre réel tel que

0  1

et

u_

le réel tel que

^p



^u  ^Z ^u



 ¹ 

où

Z

est la variable aléatoire qui suit la loi normale centrée réduite

^N

 

^0;1

^.

Si 

¹

 

¹



n ;

p p p p

I p u p u

n n

 

   

 

  

 

 

alors

n^lim p F



n In



¹ 

   

.

Un troisième rappel important

Intervalle de fluctuation



Au seuil de 95% : 

¹

 

¹



1,96 ; 1,96

n

p p p p

I p p

n n

   

 

    

 

 



Au seuil de 99% : 

¹

 

¹



2,58 ; 2,58

n

p p p p

I p p

n n

   

 

    

 

 

Prise de décision au seuil de 5%

On cherche à savoir, au seuil de décision de 5%, si la proportion

p

du caractère C dans une population donnée vaut

p p₀

ou non.

On prélève un échantillon de taille

n

(on fait en sorte que

n30

,

np5

et

ⁿ



¹^^p



^⁵

^).

La prise de décision consiste en :



Calcul de l’intervalle de fluctuation

I

,



Calcul de la fréquence

f

du caractère C sur l’échantillon de taille

n

prélevé,



Prise de décision : si

f I

on rejette l’hypothèse

p p₀

, sinon on l’accepte.

(8)

Page 8

Petits pois

Selon la théorie de Mendel, certaines cosses de petits pois devraient fournir des petits pois jaunes et verts dans des proportions respectives de 75% et 25%. On souhaite tester l’hypothèse selon laquelle la proportion des pois jaunes est p=0,75 en mettant en place une expérience permettant d’obtenir 224 petits pois considérés comme un échantillon aléatoire.

1. Sous l’hypothèse p=0,75, déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire correspondant à la fréquence des pois jaunes sur un échantillon de taille 224 (arrondir les bornes de l’intervalle au centième près).

2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,75, au seuil de 5% sur un échantillon aléatoire de taille 224.

3. L’expérience a permis d’obtenir 176 pois jaunes et 48 pois verts, que peut-on en déduire ?

Lancers de pièces

On lance 100 fois une pièce de monnaie.

1. En supposant que la pièce est équilibrée, déterminer l’intervalle de fluctuation asymptotique de la fréquence de « pile » : au seuil de 95% ? au seuil de 99% ?

2. On lance une pièce 100 fois et on obtient 38 « pile » et 62 « face ». Peut-on considérer que la pièce est équilibrée : au seuil de décision de 5% ? au seuil de décision de 1% ?

La pièce de Buffon

Dans son essai d’arithmétique morale, Buffon relate une expérience selon laquelle un enfant ayant lancé 4040 fois une pièce de monnaie, obtient 2048 fois « pile ». On peut considérer que cette expérience constitue une observation d’un échantillon de taille n=4040 dans la population de tous les lancers possibles avec la pièce de Buffon.

1. Sous l’hypothèse p=0,5 déterminer l’intervalle de fluctuation au seuil de 95% de la variable aléatoire F correspondant à la fréquence de « pile » sur un échantillon aléatoire de taille 4040.

2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,5 au seuil de 5%. Quelle conclusion peut-on tirer du nombre de « pile » obtenus par l’enfant ?

Groupes sanguins

Les centres de transfusion sanguine ont diffusé le tableau des répartitions, en France, des

principaux groupes sanguins. La proportion des groupes O+ et O- est p=0,44. Une collecte de

sang a été organisée sur le campus d’une université à laquelle ont participé 356 étudiants. On

souhaite tester l’hypothèse selon laquelle ces étudiants sont représentatifs, au seuil de 95%, de la

proportion des groupes O. L’analyse des prélèvements montre que sur les 356 donneurs, 148

appartiennent au groupe O. Quelle conclusion peut-on en tirer ?

(9)

Page 9

D’un intervalle de fluctuation asymptotique vers un intervalle de confiance

On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête.

L’échantillon est-il représentatif de la population ?

Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux informations du recensement.

Ainsi on sait que dans la population il y a 46%

d’hommes et 20% de personnes de plus de 60.

Parallèlement on peut comptabiliser le nombre d’hommes et de femmes dans l’échantillon ainsi que la répartition selon l’âge.

Homme Femme Total échantillon 200 260 460

<60ans >60ans Total échantillon 352 108 460 1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable

aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460.

2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460.

3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation

asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est

représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ?

(10)

Page 10

La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme

« représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est extrait.

Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la manière suivante : masse en kg/(taille en m)².

Intervalle de confiance d’une probabilité

La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit

d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond pas

exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris un

autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de

communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on

puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la

prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance.

(11)

Page 11

Une majoration

Montrer que pour tout

p

compris entre 0 et 1 la quantité

^1,96 ^p



¹^^p



est majorée par 1.

On pourra pour cela étudier les variations de la fonction

^{g x}

  

^^x ¹^^x



sur l’intervalle  

^0;1

^.

Deux inégalités

Montrer que pour tout

p

compris entre 0 et 1 et

n

entier on a 

¹



1

1,96 p p

p p

n n

   

(1)

Montrer que pour tout

p

compris entre 0 et 1 et

n

entier on a 

¹



1

1,96 p p

p p

n n

   

(2)

Une inclusion

On note 

¹

 

¹



1,96 ; 1,96

n

p p p p

I p p

n n

   

 

    

 

 

et

J_n p ¹ ;p ¹

n n

 

   

.

On rappelle que

I_n

est l’intervalle de fluctuation asymptotique au seuil de 95%. On appellera le nouvel intervalle

J_n

défini ci-dessus « intervalle de fluctuation asymptotique simplifié ».

Déduire des inégalités (1) et (2) l’inclusion de l’intervalle

I_n

dans l’intervalle

J_n

. Une conclusion

On peut « agrandir » l’intervalle de fluctuation asymptotique au seuil de 95% en majorant la quantité

^1,96 ^p



¹^^p

 par 1 pour

0 p 1

. Ainsi si

X_n

est une variable aléatoire qui suit la loi binomiale

^{B n p}



^,

 ^{et si}

Fn Xn n

alors : pour tout

p

tel que

0 p 1

, il existe un entier

n₀

tel que si

nn₀

on puisse affirmer :

1 1

0, 95

p p Fn p

n n

     

 

 

(12)

Page 12

Remarquons l’équivalence suivante :

1 1 1 1

n n n

p F p F p F

n n n n

        

Utilisons la conclusion précédente pour affirmer que :

Si

X_n

est une variable aléatoire qui suit la loi binomiale

^{B n p}



^,

 et si

F_n X_n n

alors pour tout

p

tel que

0 p 1

, il existe un entier

n₀

tel que si

nn₀ p F_n ¹ p F_n ¹ 0,95

n n

     

 

 

.

Proposons la définition d’un intervalle de confiance à 95% :

Soit

f

la fréquence observée sur un échantillon de taille n . L’intervalle

f ¹ ;f ¹

n n

   

 

 

est

un intervalle de confiance de la proportion inconnue

p

au niveau de confiance de 95%.

NB : les conditions communément admises sont les suivantes :

n30

,

nf 5

et

ⁿ



¹^ ^f



^⁵

^.

(13)

Page 13

Surpoids

Dans une certaine population, on a observé un échantillon de taille n=500 d’adolescents de 15 ans dans lequel 210 présentent un surpoids. Donner un intervalle de confiance de la proportion p d’adolescents de cette population présentant un surpoids au niveau de confiance 95%.

Poissons malades

On a observé 180 poissons malades sur 800 poissons pêchés dans une rivière. En considérant qu’il s’agit d’un échantillon aléatoire prélevé avec remise (il y a de nombreux poissons dans la rivière), donner un intervalle de confiance de la proportion de poissons malades dans la rivière au niveau de confiance de 95%.

Pièces sans défaut

On considère une grande quantité de pièces industrielles devant être livrées à une chaîne d’hypermarchés. On prélève au hasard un échantillon de 100 pièces dans cette livraison. La livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On constate que 96 pièces sont sans défaut. Déterminer un intervalle de confiance de la proportion de pièces de la livraison qui sont sans aucun défaut, avec un niveau de confiance de 95%.

Virus

On veut estimer la proportion p de personnes immunisées contre un certain virus parmi la population d’une ville. On prélève un échantillon aléatoire de 500 personnes parmi cette population. La population est suffisamment importante pour assimiler ce prélèvement à un tirage au hasard avec remise.

Après analyses, on dénombre 241 personnes immunisées contre ce virus, parmi les 500 de l’échantillon. Donner un intervalle de confiance de la proportion de personnes immunisées contre ce virus parmi la population de la ville, avec un niveau de confiance de 95%. Quelle est la taille minimale de l’échantillon qui aurait permis d’obtenir un intervalle de confiance de rayon inférieur ou égal à 0,01 ?

Une option à prendre

Une agence de voyage propose, en option supplémentaire dans un de ses circuits, la visite d’une exposition. En consultant au hasard et avec remise 60 fiches de clients parmi les 2054 clients inscrits sur la période considérée, le directeur de l’agence observe que l’option est mentionnée seulement 9 fois. Donner un intervalle de confiance à 95% de la proportion inconnue p de personnes ayant fait le choix de cette option parmi les 2054 clients.

Le directeur considère que l’information fournie par l’intervalle de confiance est trop imprécise

(longueur de l’intervalle trop grande). Il procède à un nouveau prélèvement de 60 fiches parmi les

2054. Sur l’échantillon global de taille 120 prélevé, l’option apparaît 18 fois. Quel intervalle de

confiance de 95% l’échantillon complété permet-il de fournir ?

(14)

Page 14

Sondage

Pour décider de la construction d’un grand stade, une municipalité veut sonder la population pour estimer si plus de 50% des électeurs y sont favorables. La municipalité réalise un sondage aléatoire de taille 100 et obtient 54 avis favorables. Quelle est la fréquence d’avis favorables sur ce sondage ? La municipalité peut-elle décider de la construction du stade en prétextant que plus de 50% de la population y est favorable ?

On suppose que la municipalité réalise un sondage de taille n et que la fréquence des votes favorables reste égale à 0,54. Si p est la proportion (inconnue) d’avis favorables dans la population, donner l’expression d’un intervalle de confiance de p au niveau de 95%. La municipalité ne construira ce stade que si la proportion p d’avis favorable dépasse 50%.

Déterminer à partir de quelle valeur de n la municipalité pourra prendre cette décision.

Statistiquement fondé ?

Pour comparer les cotes de popularité de trois personnalités X, Y et Z un journal a réalisé un sondage : sur 1320 personnes interrogées, 27% ont voté pour X, 38,5% ont voté pour Y et 34,5%

ont voté pour Z. Estimer par un intervalle la cote de popularité de X, de Y et de Z dans la population au niveau de confiance de 95%. Un classement peut-il être publié ? Avec ces mêmes taux, pour quelle taille du sondage un classement aurait été statistiquement fondé au niveau de confiance de 95% ?

Premier tour d’une élection présidentielle

Le 18 avril 2002, l’institut IPSOS effectue un sondage dans la population en âge de voter. On constitue un échantillon de 1000 personnes (inscrites sur les listes électorales) que l’on suppose choisies de manière aléatoire. Sur les 1000 personnes : 140 ont déclaré vouloir voter pour Jean- Marie Le Pen, 195 personnes ont déclaré vouloir voter pour Jacques Chirac, 170 ont déclaré vouloir voter pour Lionel Jospin. Quels seront les deux candidats présents au second tour ?

Pour information les résultats obtenus par ces trois candidats au premier tour de l’élection ont été les suivants : 16,9% - 19,9% - 16,2%

Intervalles disjoints

Un maraîcher achète un lot de semences de tomates pour produire ses plants de tomate. Il lui reste des semences de l'année passée, dont il doit contrôler le taux de germination pour pouvoir les utiliser avec les autres. En effet, des taux de germination trop différents provoquent des trous dans les plates-bandes de production, ce qui génère un coût de manutention plus élevé. Il lui faut donc comparer les taux de germination des semences des deux années.

Une stratégie consiste à calculer et à comparer les intervalles de confiance des taux de

germination (qui sont des proportions) des plants de l'année et de l'année précédente. Si les deux

intervalles ne se recoupent pas, on peut conclure à une différence de taux de germination entre

les semences des deux origines. Il faudra alors les semer séparément. Pour faire cette

comparaison, le maraîcher prélève, aléatoirement dans les semences de l'année, un échantillon de

200 graines qu'il met à germer. Il constate que 185 graines germent. Il prélève ensuite,

aléatoirement dans les semences de l'année précédente, un échantillon de 200 graines qu'il met à

germer. Il constate que 150 graines germent. Aidez le maraîcher à prendre une décision.

(15)

Page 15

Exercice 1

Une étude statistique a montré que la durée de vie en années X d’un disque dur DD est une variable aléatoire suivant une loi exponentielle et que la durée de vie moyenne d’un disque dur DD est de cinq ans.

1. Déterminer le paramètre  de la loi exponentielle suivie par X.

2. Le disque dur DD est garanti 2 ans. Quelle proportion de disque dur, arrondie à 0,01 près, sera retournée au fournisseur pour cause de panne ?

3. Calculer

^{p X}



^³

 et interpréter ce résultat.

4. Sachant qu’un disque dur DD n’est plus sous garantie, quelle est la probabilité, arrondie 0,01 près, que sa durée de vie totale dépasse 5 ans.

Exercice 2

On admet que la proportion de femmes dans la population française est égale à 51,4%. Si on considère 577 personnes françaises tirées aléatoirement avec remise, à quel intervalle appartiendra la proportion de femmes parmi ces 577 personnes avec une probabilité de 95% ?

A l’Assemblée Nationale on dénombre actuellement 155 femmes sur les 577 députés élus qui siègent dans l’hémicycle. Peut-on considérer (au seuil de 5% d’erreur) qu’il y a une sous- représentation des femmes au sein de l’Assemblée Nationale ?

Exercice 3

Lors d’un scrutin électoral, plusieurs enquêtes sont menées par différents instituts de sondages afin de prédire le futur gagnant. On suppose que chaque enquête est effectuée auprès de 1000 personnes choisies au hasard et avec remise. A l’issue de ces enquêtes, les instituts fournissent la proportion des personnes votants pour le candidat A. Le tableau suivant résume les résultats fournis par les 6 instituts de sondages.

Institut 1 Institut 2 Institut 3 Institut 4 Institut 5 Institut 6

46,9 48,0 50,2 49,1 47,2 50,6

Recopier et compléter le tableau en ajoutant un intervalle de confiance à 95% pour chaque estimation (arrondir au millième). On désire savoir si le candidat A obtiendra la majorité des votes (c'est-à-dire plus de 50%). Quel institut peut-il affirmer connaître la réponse à cette question avec un niveau de confiance de 95% ?

On suppose que les 6 enquêtes ont été effectuées de manière indépendante. Quelle est la proportion totale de votes pour le candidat A parmi les sondés de ces 6 enquêtes ? Soit p la proportion (inconnue) de personnes qui votent pour A dans la population totale. Fournir un intervalle de confiance au niveau 95% pour l’estimation de p en regroupant les 6 enquêtes.

D’après vous, le candidat A obtiendra-t-il la majorité des votes ? Justifiez.

(16)

Page 16

Exercice 4

Exercice 5

(17)

Page 17

Intervalle de fluctuation ?ou intervalle de confiance ? Règle générale

On utilise un intervalle de fluctuation lorsque la proportion p dans la population est connue ou si l’on fait une hypothèse sur sa valeur.

On utilise un intervalle de confiance lorsque l’on veut estimer une proportion inconnue dans une population.

Test de conformité d’une proportion

On veut déterminer si la proportion observée dans un échantillon est conforme à une valeur de référence connue dans la population. Sous l’hypothèse que l’échantillon est issu d’un tirage aléatoire correspondant à un schéma de Bernoulli (tirage avec remise ou s’y apparentant), la variable fréquence F

_n

appartient à un intervalle de fluctuation avec une probabilité déterminée.

En fonction de l’appartenance ou non de la fréquence observée à cet intervalle, on peut prendre une décision concernant la conformité de l’échantillon. Si les conditions d’utilisation sont réunies, on détermine l’intervalle de fluctuation asymptotique, sinon on a recours à un intervalle de fluctuation calculé avec la loi binomiale.

Estimation d’une proportion inconnue p grâce à un échantillon aléatoire

On se place dans le cas où l’échantillon comporte au moins 30 éléments afin de pouvoir utiliser

l’intervalle de confiance au programme de la classe de terminale (*). Si la fréquence

f

observée

est telle que

nf 5

et

ⁿ



¹^ ^f



^⁵

, on considère qu’on peut conclure qu’un intervalle de

confiance de la proportion inconnue p au niveau de confiance de 95% est

f 1 n f; 1 n

On rejette l’hypothèse selon laquelle la proportion dans la population est

Prise de décision (avec la loi binomiale)

On considère une population dans laquelle on suppose que la proportion d’un certain caractère est

. Pour analyser cette hypothèse, on y prélève, au hasard et avec remise, un échantillon de taille n sur lequel on observe une fréquence

du caractère.

On rejette l’hypothèse selon laquelle la proportion dans la population est

lorsque la fréquence

observée est trop éloignée de

, dans un sens ou dans l’autre.

On choisit de fixer le seuil de décision de telle sorte que la probabilité de rejeter l’hypothèse, alors qu’elle est vraie, soit inférieure à 5 %.

Lorsque la proportion dans la population vaut

, la variable aléatoire

correspondant au nombre de fois où le caractère est observé dans un échantillon aléatoire de taille

, suit la loi binomiale de paramètres



 . On cherche à partager l’intervalle  

, où X prend ses

valeurs, en trois intervalles 

 ,  

et 

 de telle sorte que

prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 2,5%, sans dépasser cette valeur. En tabulant les probabilités cumulées croissantes



 , pour

allant de 0 à

, il suffit de déterminer dans le tableau le plus petit entier

tel que





et le plus petit entier

tel que





. La règle de prise de décision est la suivante :

si la fréquence observée

appartient à l’intervalle 

 , l’hypothèse selon laquelle la proportion est

dans la population n’est pas remise en question et on l’accepte,

sinon, on rejette l’hypothèse selon laquelle cette proportion vaut

.

Santé

Enoncer la règle de décision permettant de rejeter ou non l’hypothèse p=0,16 selon la valeur de la fréquence f d’hypertendus observée dans l’échantillon prélevé au hasard dans la population.

Politique

Monsieur Z, chef du gouvernement d’un pays lointain, affirme que 52 % des électeurs lui font confiance.

On interroge 100 électeurs au hasard (l’échantillon est prélevé au hasard et la population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise).

Sur les 100 électeurs interrogés au hasard, 43 déclarent avoir confiance en Monsieur Z. Peut- on considérer l’affirmation de Monsieur Z comme exacte ? Votre raisonnement sera justifié par la détermination d’un intervalle de fluctuation à 95%.

Discrimination

Une table des probabilités cumulées croissantes de la loi



 est fournie ci-après.

Gauchers

Dans le monde, la proportion de gauchers est 12 %. Soit n le nombre d’élèves dans votre classe.

Déterminer, à l’aide de la loi binomiale, l’intervalle de fluctuation à 95 % de la fréquence des gauchers sur un échantillon aléatoire de taille n.

Votre classe est-elle « représentative » de la proportion de gauchers dans le monde ? Brigade de répression des fraudes

Une émission de télévision a relayé une étude montrant que certaines marques vendent du thé contenant une dose de pesticides dépassant les doses maximales autorisées.

Un commerçant sait que cette information va avoir un impact sur les ventes des marques incriminées. Ce commerçant achète 80% de ses boites chez un fournisseur A et 20% chez un fournisseur B.

10% des boites provenant du fournisseur A et 20% de celles provenant du fournisseur B contiennent une dose de pesticides dépassant les doses maximales autorisées.

1. Un ami du commerçant considéré lui explique qu’il n’a pas lieu de s’inquiéter et que pour 88% des boites de thé qu’il vend, la dose de pesticides ne dépasse pas les doses maximales autorisées.

Justifier ce résultat.

2. Le magasin étant réputé et le stock important, les clients achètent souvent les boites de thé par lots. Quelle est la probabilité que, sur un lot de 10 boites prélevées au hasard, au moins huit ne contiennent pas une dose de pesticides dépassant les doses maximales autorisées ?

Au vu des résultats, quelle sera la réaction de l’inspecteur de la brigade de répression ?

Homme/femme

Deux entreprises recrutent leur personnel dans un vivier comportant autant d’hommes de que de femmes. Voici la répartition entre hommes et femmes dans ces deux entreprises. Peut-on suspecter l’une des deux entreprises de ne pas respecter la parité hommes/femmes ?

Hommes Femmes Total

57 43 100

1350 1150 2500 Extrait d’écran d’une calculatrice

Extrait d’écran d’un tableur

Intervalle de fluctuation (avec la loi binomiale)

Dans une certaine population la proportion d’individus présentant le caractère C est

.

On analyse ce que l’on peut dire de la fréquence

du caractère C sur un échantillon de taille n prélevé de manière aléatoire dans cette population.

Si on note

la variable aléatoire associant à chaque échantillon de taille n le nombre d’individus présentant le caractère C et si on note

la variable aléatoire définie par

qui correspond à la fréquence du caractère C dans l’échantillon, alors nous avons vu que :

suit la loi binomiale



 .

On peut donc déterminer à l’aide de la loi binomiale un intervalle de la forme 

^{, où X} ^{prend ses}

 ^,  

^et 

 ^{, pour}

 ^,