• Aucun résultat trouvé

Echantillon de ´ taille n :

N/A
N/A
Protected

Academic year: 2022

Partager "Echantillon de ´ taille n :"

Copied!
5
0
0

Texte intégral

(1)

18 Fluctuation et estimation

C H A P T E R

Lorsqu’on s’int´eresse `a une caract`eristique d’une population, il est parfois impossible de tester chaque individu, on est alors amen´e `a travailler sur des

´

echantillons.L’inf´erence statistique consiste `a induire les caract´eristiques in- connues d’une population `a partir d’un ´echantillon issu de cette population.

Les caract´eristiques de l’´echantillon, une fois connues, refl`etent avec une certaine marge d’erreur possible celles de la population.

(2)

1 1 Rappels

Dans une population donn´ee o`u la proportion d’individus pr´esentant un caract`ereC estp, on pr´el`eve un ´echantillon de taillen.

En classe de seconde, on a observ´e que sur un grand nombre d’´echantillon de taille net sous certaines conditions, 95% au moins fournissent une fr´equencef appartenant

`

a l’intervalle [p− 1

n ; p+ 1

n].

Echantillon de ´ taille n :

fr´equence f de C ? Population :

Caract´ere C proportion p

En classe de premi`ere : Le tirage al´eatoire d’un individu dans un population est assmill´e `a une ´epreuve de Bernoulli, le pr´elevement au hasard d’un ´echantillon de taille n dans cette population correspond `a un sch´ema de Bernoulli de param`etresn et p.

La variable al´eatoire X qui compte le nombre de succ`es avoir le caract`ereC , suit la loi binomialeB(n; p).

La variable al´eatoire fr´equenceF= X

n repr´esente la fr´equence al´eatoire du succ`es sur un ´echantillon de taillen.

Or (cf cours seconde) on aP(p− 1

n 6F6 p+ 1

n)>95% , l’intervalle [p− 1

n ; p+ 1

n] est un intervalle de fluctuation de F.

SoitX une variable al´eatoire qui suit une loi binomialeB(n ; p). et F = X n la variable al´eatoire fr´equence du succ`es.

Un intervalle de fluctuation deF au seuil de 95% est un intervalle

a

b ; b n

, avecaet bdeux entiers compris entre 0 etn;

• tel queP a

n 6F 6 b n

>95% soitP(a6X 6b)>95%

D´efinition 1

Pour d´eterminer un intervalle de fluctuation il suffit de d´eterminer deux entier aet b tels queP(a6X6b)>95%.

Exemple. Une urne contient 3 boules rouges et 7 boules blanches, on effectue 100 tirages au hasard avec remise. D´eterminer un intervalle de fluctuation au seuil de 95%

de la fr´equence d’apparition d’une boule rouge dans l’´echantillon pr´elev´e.

(3)

3 Chapter 18. Fluctuation et estimation

A l’aide du logiciel GeoGebra, on repr´` esente une loi binomialeB(100 ; 0,3).

On d´etermine deux entiers a= 20 etb= 38 qui conviennent, en effetP(206X 638)>95%

Dans la suite de ce chapitre, on suppose que la taille de l’´echantillonnest la proportion pdu caract`ereC v´erifient :

n>30, n×p>5 etn×(1−p)>5

Intervalle de fluctuation asymptotique et Test

2

2 1 Intervalle de fluctuation asymptotique

Pour tout r´eelαtel que 0< α <1, un intervalle de fluctuation asymptotique de la variable al´eatoireF au seuil de 1−αest un intervalle d´ependant uniquement de net depqui contientF avec une probabilit´e proche de 1−αquandnest grand.

D´efinition 2

Pour tout r´eel α ∈]0 ; 1[, il existe un unique r´eel uα tel que la probabi- lit´e que la variable al´eatoire fr´equence F prenne des valeurs dans l’intervalle In =

"

puα

rp(1p)

n ; p+uα

rp(1p) n

#

se rapproche de 1−α quand la taillende l´echantillon devient grand

n→+∞lim P(FIn) = 1−α Propri´et´e 1

3

(4)

fr´equenceF est :

"

p−1,96

rp(1p)

n ; p+ 1,96

rp(1p) n

# Propri´et´e 2

2 2 Test

Dans cette partie on souhaite v´erifier, `a l’aide d’´echantillon de taille n , si on peut raisonnablement penser que la proportionpde la population est bien celle annonc´ee.

On construit untestqui va nous permettre d’´enoncer une r`egle de d´ecision concernant cette proportion.

H0 : la proportion de la population pr´esentant le caract`ere C est p. (Hypoth`ese H0)

• On ´etablit un IFA au seuilα, (le plus souventα= 95% soit

"

p−1,96

pp(1p)

n ; p+ 1,96

pp(1p)

n

#

• On ´ennonce le test :

Si la fr´equence observ´ee f de l’´echantillon appartient `a l’IFA au seuil αon ac- ceptel’hypoth`eseH0.

Si la fr´equence observ´eef de l’´echantillon n’appartient pas `a l’IFA au seuilαon rejette l’hypoth`eseH0c’est-`a-dire que la proportion de la population n’est pas pau risque de 5% de se tromper.

Remarques.

• Lorsqu’on rejette l’hypoth`eseH0au risque de 5%, on peut rejetter `a tort l’hypoth`ese (rejet sachant qu’elle est vraie) avec une probabilit´e proche de 0,05.

• Par contre lorqu’on accepte l’hypoth`eseH0on ne connait pas la probabilit´e d’erreur.

En effet si la proportionp=p0 cela implique que la fr´equencef d’´echantillon de taille n appartient `a l’intervale de fluctuation asymptote au seuil de 95 % mais on ne sait rien de la r´eciproque :

sif

"

p−1,96

pp(1p)

n ; p+ 1,96

pp(1p)

n

#

n’implique pas forc´ement que p=p0 avec une probabilit´e de 95%.

Estimation

3

Lorsque la proportion pd’un caract`ere C d’une population est inconnue et qu’on est dans l’impossibilit´e de tester l’ensemble de cette population, on fait ce que l’on appelle une estimation par intervalle de confiance.

Pour tout r´eelαtel que 0< α <1, unintervalle de confiance de la proportion pau niveau de confiance 1−αest un intervalle issue d’un ´echantillon de taille n contenant la proportionpavec une probabilit´e sup´erieur ou ´egale `a 1−α.

D´efinition 3

(5)

5 Chapter 18. Fluctuation et estimation

Remarques. L’intervalle de confiance n’est pas unique et il d´epent de l’´echantillon al´eatoire choisi.

Seul l’intervale de confiance au niveau de confiance de 95% est au programme de la classe de terminale.

L’intervalle de confiance au niveau de confiance de 95% est :

f− 1

n ; f+ 1

n

avecf la fr´equence observ´ee d’un ´echantillon de taillen.

Propri´et´e 3

emonstration. soit F la variable al´eatoire qui a un ´echantillon de taille n associe la fr´equencef de cet ´echantillon de taillen.

Pournest assez grand, la probabilit´eP(p− 1

n 6F 6p+ 1

n) est sup´erieur ou ´egale

`

a 95%. Ce qui peut se r´e´ecrire : p− 1

n 6F 6p+ 1

n

− 1

n 6Fp6+ 1

n

−F− 1

n 6−p6−F+ 1

n

F+ 1

n >−p>F− 1

n

F− 1

n 6p6F+ 1

n

d’o`uP(p− 1

n 6F 6p+ 1

n)>95%⇐⇒P(F− 1

n 6p6F+ 1

n)>95%

L’intervalle

f − 1

n ; f+ 1

n

´

etant une r´ealisation de l’intervalle al´eatoire on en d´eduit donc qu’il s’agit d‘un intervalle de confiance au niveau de confiance de 95%.

Exemple.Comparaison de taux de germination

Un maraˆıcher ach`ete un lot de semences de tomates pour produire des plants de tomates. Il lui reste des semences de l’ann´ee pr´ec´edente, dont il doit contrˆoler le taux de germination pour pouvoir les utiliser avec les autres.

Il faut donc comparer les taux de germination des semences des deux ann´ees.

Une strat´egie consiste `a calculer et `a comparer les intervalles de confiances des taux de germination (qui sont des proportions) des plants de l’ann´ee pr´ec´edente

Si les deux intervalles ne se recoupent pas, on peut conclure `a une diff´erence de taux de germination entre les semences des deux origines. Il faudra alors les planter s´epar`ement.

Pour faire cette comparaison le maraˆıcher pr´el`eve, al´eatoirement dans les semences de l’ann´ee, un ´echantillon de 200 graines qu’il met `a germer. Il constate que 185 graines germent. Il pr´el`eve ensuite, al´eatoirement dans les semences de l’ann´ee pr´ec´edente, un

´

echantillon de 200 graines qu’il met `a germer. Il constate que 150 graines germent.

1. D´eterminer un intervalle de confiance, au niveau de confiance de 95%, du taux de germinationpa du lot de semences de l’ann´ee.

2. Mˆeme question pour le lot de semences de l’ann´ee pr´ec´edentepb. Conclure.

5

Références

Documents relatifs

Erreur de deuxi` eme esp` ece : en r´ ealit´ e il n’y a pas d’ obstacle, mais le test en d´ ecouvre un, et donc on recalcule la trajectoire inutilement..

[r]

Enfin, le travail de r´ edaction sera tr` es important, les points au concours se gagnent et se perdent au niveau de la r´ edaction : elle n´ ecessite d’ˆ etre rigoureuse, juste,

Montrer que l’ensemble des points fixes de σ est la

On suppose que le temps de premi` ere panne de certains appareils suit une loi g´ eom´ etrique de param` etre θ (sur une ´ echelle de temps discr` ete, le temps ´ etant compt´ e

Soit X 1 ,. Cet estimateur est-il sans biais ? Quelle est sa variance ? Montrer qu’il converge presque sˆ urement vers θ.. 3) Pour n grand, donner un intervalle de confiance de risque

On examine 12 ampoules et on enregistre les r´ esultats suivants : la moyenne empirique observ´ ee vaut 58 jours, la variance empirique observ´ ee (estimation non biais´ ee) quant `

2.1 Comparaison d’une moyenne observ´ ee ` a une moyenne th´ eorique Grands ´ echantillons de loi