Chapitre 4 : estimations et tests de conformité

(1)

Chapitre 4

Estimation par intervalle de

confiance - Tests de conformité.

4.1 Idées générales.

4.1.1 Estimation.

Dans une population, on s’intéresse à la valeur d’un certain paramètreθ(par exemple une proportion, une moyenne, une variance...). Dans la pratique, on ne connait généralement pas cette valeur dans la population entière. Pour l’estimer, on calcule la valeur de ce paramètre sur un échantillon (de préférence assez grand, si les contraintes d’expérimentation le permettent) : on observe alors une valeurθ^obs. Raisonnablement, pour peu que l’échantillon soitbien choisi, on peut s’attendre à ce que la valeur deθ sur toute la population ne soitpas loin de θ^obs. Cette dernière phrase est très ambiguë.

— Que signifie bien choisi? On ne sait pas a priori si l’échantillon convient, on prend un risque en affirmant qu’il est bien choisi. Heureusement, il y a des méthodes probabilistes et statistiques premettant d’évaluer ce risque. On notera α le niveau de risque maximal que l’on s’autorise à prendre (ou de façon équivalente 1−αle niveau de confiance que l’on se fixe).

— Que signifieθôbsn’est pas loin de valeur deθ? On va calculer un intervalleIα(θôbs) dépendant deαindiquant la proximité entre la vraie valeur deθetθôbs: avec confiance 1−α, on peut affirmer que cet intervalleI_α(θôbs)) contient la vraie valeur deθ.

4.1.2 Test d’hypothèse.

Le problème est l’inverse du précédent. On s’intéresse toujours à la valeur d’un certain paramètre θ dans une population. Cette fois,on emet une hypothèseH0sur cette valeur (qui peut être de la forme

“θ = θ₀”, “θ > θ₀”, “θ < θ₀”,. . .), tirée d’un modèle théorique, d’une intuition, ou faisant simplement référence à un contexte où cette valeur est connue. On l’appelle hypothèse nulle, de “non différence” ; elle sert de référence.

On confronte ensuite cette hypothèseH₀à une autreH₁ qui lui est contradictoire. À partir d’un échan- tillon, on évalue le risque que l’on prendrait en optant pour H₁ plutôt que H₀. Ce risque s’appelle le degré de signification (on évitera d’utiliser ce terme qui peut préter à confusion) et on lui préférera le terme anglo-saxon dep-value, utilisé notamment dans les logiciels de statistique : si ce risque est élevé, on conseveH0, s’il est faible, on opte pourH1.

(2)

On pourra aussi, à l’inverse, se fixer un risque αau préalable (le niveau de signification ) et déterminer la zone de valeurs du paramètre pour lesquelles l’hypothèseH0 n’est plus raisonnable, et pour lesquelles on doit lui préférerH₁. On l’appelle lazone critique La décision est alors conditionnée au fait que la valeur expérimentale est ou non dans cette zone critique.

Pour bien comprendre le choix des hypothèses et la notion dep-value, utilisons l’image suivante.

Imaginons que vous vouliez faire une randonnée en montagne. En règle générale, vous ne vous amusez pas à sauter par dessus les crevasses ! C’est l’hypothèseH0, la règle fixée a priori.

Cela dit, si vous rencontrez une crevasse de moins de 30 cm de large, je suis prêt à parier que vous allez outrepasserH₀ et passer la crevasse c’est à dire opter pourH₁. Mais qu’allez-vous faire si la crevasse fait 50 cm, 70 cm, 1 m, 1,50 m de large ? Plus la largeur est grande, plus le risque de passer la crevasse est élevé : c’est ce risque qu’on appelle lap-value, le risque que l’on prend si on opte pourH₁plutôt queH₀.

Enfin, il existe un autre risque, dit de seconde espèceβ; la probabilitéη= 1−βs’appelle la puissance. Pour comprendre cette notion, on peut faire un parallèle (volontairement simpliste) avec la justice. Supposons que l’on doive juger si une personne a commis ou non un méfait.

— Dans les faits, on a deux possibilités : la personne est coupable ou bien innocente.

— Le verdict présente la même dichotomie : la personne est jugée coupable ou bien innocente.

Par défaut, il y a la présomption d’innocence : c’est l’hypothèse de départ, de référenceH0. La culpabilité correspond à l’hypothèseH1. Plus on amène d’éléments à charge, plus on a tendance à croire queH0est fausse, et donc à opter pourH₁. À l’inverse, les éléments à décharge laissent penser que l’on doit rejeter H₁ et conserver H₀. Evidemment, la justice n’est pas fiable à 100%. On prend un risque en prononçant le verdict. On peut résumer la situation dans un tableau :

Verdict

on choisitH₀ on choisitH₁ Faits

H0 vraie confiance 1−α

erreur de première espèce risqueα(fixé)

H1 vraie erreur de seconde espèceβ

puissance η= 1−β

La justice est considérée comme puissante si elle arrive à faire condamner les coupables, c’est à dire si la probabilité d’accepterH1est grande lorsqu’elle cette hypothèse est vraie : c’est bien ce que mesure la quantitéη= 1−β.

4.2 Cas d’une proportion (ou fréquence).

4.2.1 Echantillonnage d’une proportion.

En vertu du théorème de la limite centrale, si une variable Xn, correspondant à un effectif, suit une loi binomialeB(n;p) avec

n≥30 10%< p <90% np >5 nq=n(1−p)>5 siP_n=^X_nⁿ est la proportion aléatoire associée alors on peut faire les approximations :

Xn B(n, p)'N (np,√

npq) Pn ' N

p, rpq

n

Zn= X_n−np

√npq = P_n−p ppq

n

' N (0,1).

(3)

Dans leparagraphe 4.2.2, on aura besoin du résultat suivant (conséquence de la loi des grands nombres, du théorème de la limite centrale et du théorème de Slutsky) :Pn étant une estimation ponctuelle dep, on peut remplacerppq

n par

qP_n(1−Pn)

n c’est à dire Zn' Pn−p

qP_n(1−P_n) n

' N(0,1).

4.2.2 Estimation d’une proportion.

Contexte : un vétérinaire a comparé le nombre de mâles et de femelles à la naissance dans des élevages traditionnels de bovins. Sur n = 250 bovins mis bas, il a observé 137 mâles et 113 femelles. Pour une confiance 1−α= 95%, donner une estimation par intervalle de confiance de la proportion de mâles à la naissance chez les bovins. En déduire une estimation du “sex-ratio” #mâles/# femelles.

Notons :

— Xn lenombre (l’effectif) aléatoirede mâles sur un échantillon théorique den= 250 veaux à la naissance ;

— P_n =Xn

n laproportion aléatoirecorrespondante ;

— plaproportion théoriquede mâles à la naissance –pest inconnue – ;

— q= 1−pla proportion théorique de femelles.

On sait alors que Xn B(n, p). Raisonnablement, pn’est pas très loin de p^exp = 137/250 = 54,8%.

Ainsi :

n≥30 10%< p <90% np∼np^exp>5 nq∼nq^exp>5 En vertu duparagraphe 4.2.1précédent on a :

Z_n= Pn−p qP_n(1−P_n)

n

' N(0,1).

On peut résumer dans un tableau :

Valeurs théoriques Valeurs sur l’échantillon Variables aléatoires sur la population expérimental sur tous les échantillons

de taillen= 250 de taillen= 250

Nombre de mâles 137 =X_n^exp Xn B(n, p)

Proportion de mâles p p^exp=¹³⁷₂₅₀ =P_n^exp Pn

Centrée réduite Zn= p_Pn(1−Pn)^Pⁿ^−p

n

N (0; 1)

Pour une confiance 1−α= 95%, on a, avec la loiN[0; 1) on a :

P(|Zn| ≤zα) = 1−α =⇒ zα= 1,96 On a donc avec une probabilité de 1−α= 95% :

P_n−z_α×

rP_n(1−P_n)

n ≤p≤P_n+z_α×

rP_n(1−P_n) n

(4)

En se basant sur les résultats expérimentaux, on peut donc affirmer avec une confiance 1−αque l’intervalle Iα(p^exp) =

"

p^exp−zα×

rp^exp(1−p^exp)

n ;p^exp+zα×

rp^exp(1−p^exp) n

#

contient la valeur théoriquep.

À partir des résultats numériques, on a l’intervalle de confiance (à 95%) :

Iα(p^exp) = [54,8%−1,96×3,15% ; 54,8% + 1,96×3,15%] = [48,6% ; 61,0%]

4.2.3 Test de conformité d’une proportion à une valeur théorique.

Un test unilatéral

En France, la proportion de personnes du groupe O est de 43%. Sur un échantillon de n = 200 personnes originaires du Pays Basque, on a observé 112 personnes du groupe O. Au niveau 5%, peut-on estimer que la proportion personnes du groupe O estplus élevéeau Pays Basque qu’ailleurs en France ? On procède par étapes.

1. Formulation des hypothèses.

Paramètre : On notepla proportion théorique de personnes du groupeO au pays Basque.

Ici, on fait un testunilatéral supérieur.

H₀: “La proportion de personnes du groupeOest la même au Pays Basque qu’ailleurs en France”

(p= 43%)

H1 : “La proportion de personnes du groupe O est plus élevée au Pays Basque qu’ailleurs en France” (p >43%)

2. Modèle statistique.

On noteP_n= ^X_nⁿ la proportion aléatoire de personnes du groupeO sur un échantillon théorique den= 200 basques. SousH₀ on a :n= 200>30, 10%≤p= 43%≤90%,np >5 etn(1−p)>5, qp(1−p)

n = 3,50% donc d’après le paragraphe 4.2.1: P_n ^'N p;

rp(1−p) n

!

=N (43%; 3,50%) ou encoreZ = Pn−p qp(1−p)

n

=Pn−0,43 0,0350

'N (0; 1).

3. Région critique.C’est la zone de rejet deH0et d’acceptation deH1. Les valeurs expérimentale se trouvant dans cette zone ne sont pas conformes aux fluctuations auxquelles on pourrait s’attendre avecH0pour une confiance 1−α= 95%. On la noteKα(Zn) (ou bienKα(Pn) si on travaille avec Pn). Comme on fait un test unilatéral supérieur, la région critique est de la forme :

Kα(Z) ={Z ≥zα} où P(Z≥zα) = 5%

c’est à dire :

K_α(Z) ={Z ≥1,645} ou encore K_α(P_n) ={P_n≥43% + 1,645×3,50%}={P_n≥48,76%}.

4. Prise de décision.C’est seulement ici qu’intervient la valeur expérimentale P_n^exp=112

200 = 56%∈K_α(P_n) ou encore Z^exp= 56%−43%

3,50% = 3,71∈K_α(Z)

(5)

donc on rejette H0 et on opte pour H1 : au niveau de risque de 5% et au vu des résultats sur l’échantillon, on peut affirmer proportion de personnes du groupeOest plus élevée au Pays Basque qu’ailleurs en France.

5. Calcul de p-value (signification). Une alternative à 3. et 4. est le calcul du risque que l’on prendrait en accepterH₁avec notre résultat expérimental : c’est lap-value.

p-value =P(Pn≥P_n^exp) =P(Pn≥56%) =P

Z≥ 56%−43%

3,50%

=P(Z ≥3,71) = 0,01%

Ce risque étant très faible (par rapport à 5% par exemple), on opte facilement pourH₁. En exercice : un test bilatéral

En France, la proportion de personnes du groupe A est de 45%. Sur un échantillon de n = 200 provenant du Pays Basque, on a observé 79 personnes du groupe A. Au niveau 5%, peut-on estimer qu’il y a unedifférence significativeentre les Basques et la population française ?

On notepla proportion théorique de personne du groupeAau pays Basque,Pnla proportion aléatoire sur les échantillons de taillen= 200.

1) H₀: “p= 45%” H₁: “p6= 45%”

2) Pn N (45%; 3,50%)

3) Kα(Pn) ={|Pn−45%| ≥6,9%}={Pn ≥51,9%} ∪ {Pn≤38,1%}

4) P_n^exp = 81/200 = 39,5%∈/ K_α(P_n) (45%−39,5% = 5,5%) on conserveH₀ 5) p-value =P |Pn−45%| ≥5,5%

= 11,6% risque élevé : on conserveH0.

4.3 Cas d’une moyenne.

4.3.1 Echantillonnage d’une moyenne.

Soient X1, . . . , Xn des variables aléatoires indépendantes de même loi, de moyenne µet d’écart type σ. Notons

M_n= X₁+· · ·+X_n

n S_n =

rX₁²+· · ·+X_n² n −M_n² la moyenne et l’écart type aléatoires.

On peut montrer queMn et _n−1ⁿ S²_n sont des estimations (ponctuelles) deµetσ².

Dans le cas d’un petit échantillon (n ≤ 30), si les variables X_k suivent une loi N (µ;σ), la variable

Tn =Mn−µ

S_n

√n−1

suit une loi de Student àn−1 = 25 degrés de liberté – notéTn St(n−1).

Les lois de Student (il y en a une pour chaque valeur den) ressemblent à la loi normale centrée réduite, et s’en rapprochent lorsquen→ ∞(en d’autres termes N(0; 1) =St(∞)).

(6)

Dans le cas d’un grand échantillon (au moins n > 30), on peut donc approximer St(n−1) par N (0; 1). De plus, en vertu du théorème de la limite centrale (et du théorème de Slutsky) on peut se passer de l’hypothèse de normalité des variablesX_k :

T_n= M_n−µ

Sn

√n−1

'N (0,1).

4.3.2 Estimation d’une moyenne.

• Pour un petit échantillon (n≤30).

Un éleveur de poulets fermiers cherche à estimer le poids moyen (théorique)µdes poulets fermiers à 12 semaines. Pour cela, il a relevé le poids de 26 poulets de sa production à 12 semaines. Il a obtienu un poids moyenm et un écart types:

m= 1312g s= 153g

Pour obtenir des résultats raisonnables, on doit admettre dans ce contexte des petits échan- tillons (n≤30) que les poids des poulets sont répartis selon une loi normaleN(µ;σ)(µetσ sont inconnus).

Notons Mn la moyenne aléatoire des poids sur un échantillon théorique de n= 26 poulets fermiers, Sn l’écart type aléatoire. On peut résumer dans un tableau :

Valeurs théoriques Valeurs expérimentales Variables aléatoires sur la population sur l’échantillon expérimental sur tous les échantillons

de taillen= 26 de taillen= 26

Moyenne µ m=M_n^exp Mn

Ecart type σ s=S_n^exp Sn=q

n−1 n Sbn

D’après leparagraphe 4.3.1précédent : T_n= M_n−µ

Sn

√n−1

suit une loi de Student àn−1 = 25 degrés de liberté (notéT_n St(n−1)).

Pour une confiance 1−α= 95%, on a avec la loiSt(25) : P(Tn ≥tα) = α

2 =⇒ tα= 2,0595 On a donc avec une probabilité de 1−α= 95% :

Mn−tα× Sn

√n−1 ≤µ≤Mn+tα× Sn

√n−1

On peut donc affirmer avec une confiance 1−αque l’intervalle Iα(m) =

m−tα× s

√n−1;m+tα× s

√n−1

contient la valeur théoriqueµ.

(7)

À partir des résultats numériques, on a l’intervalle de confiance (à 95%) : I_α(m) =

1312−2,0595× 153

√25; 1312 + 2,0595× 153

√25

= [1248,8; 1375,1].

• Pour un grand échantillon (n >30)

Remarque. Lorsque n → ∞ la loi St(n) se rapproche de la loi N(0; 1). Ainsi, on peut remplacer la loi de Student par une loi N(0; 1) pour n assez grand (n > 30 pour fixer les idées). De plus, grace au théorème de la limite centrale, l’hypothèse de normalité de la variable initiale est superflue pour un grand échantillon.

En exercice. Un éleveur de poulets fermiers cherche à estimer le poids moyen (théorique)µdes poulets fermiers à 12 semaines. Pour cela, il a relevé le poids de 145 poulets de sa production à 12 semaines. Voici les résultats qu’il a obtenu :

Classes de de 1000 1050 1100 1150 1200 1250 1300 1350 1400 1450

poids en kg à 1050 1100 1150 1200 1250 1300 1350 1400 1450 1500 Total Centres 1025 1075 1125 1175 1225 1275 1325 1375 1425 1475

Effectifs 4 5 10 22 32 25 17 14 10 6 145

Pour une confiance de 1−α= 95%, donner un intervalle de confiance du poids moyenµ.

Solution.On obtient un poids moyenmet un écart types: m= 1258,8g et s= 104,5g.

NotonsM_n la moyenne aléatoire des poids sur un échantillon théorique den= 145 poulets fermiers,S_n l’écart type aléatoire. Notons aussiσl’écart type théorique des poids.

En vertu du théorème de la limite centrale et de l’estimation ponctuelle ^√^σ_n '^√^Sⁿ

n−1 : la loi deZn= Mn−µ

Sn

√n−1

est proche d’une loiN(0; 1) Pour une confiance 1−α= 95%, on a avec la loiN[0; 1) :

P(|Z_n| ≤z_α) = 1−α =⇒ z_α= 1,96 On peut donc affirmer avec une confiance 1−αque l’intervalle

Iα(m) =

m−zα× s

√n−1;m+zα× s

√n−1

contient la valeur théoriqueµ.

À partir des résultats numériques, on a l’intervalle de confiance (à 95%) : Iα(m) =

1258,8−1,96×104,5

√144; 1258,8 + 1,96×104,5

√144

= [1241,8 ; 1275,8].

(8)

4.3.3 Test de conformité d’une moyenne à une valeur théorique.

• Pour un petit échantillon (n≤30).

La glycémie à jeun (mesuré en gramme par litre de plasma sanguin) d’une population suit une loi normale d’espérance 0,85gl⁻¹. On a relevé la glycémie de 15 femmes enceintes en fin de grossesse. Voici les résultats :

0,87 0,80 0,88 0,79 0,98 0,90 0,87 1,25 0,82 0,82 1,01 0,89 1,25 0,85 0,78 On obtient une moyennemet un écart types: m= 0,917 s= 0,144.

Pensez-vous que cette moyenne est anormalement élevée, au niveau de risque 5% ?

Remarque. Dans le cas d’un petit échantillon, ce test nécessite la normalité de la variable (ici la nor- malité du “taux de glycémie”).

Paramètre : On note µla glycémie moyenne théorique des femmes enceintes en fin de grossesse.

On fait un testunilatéral supérieur.

H0 : “La moyenne des femmes enceinte est semblable à la moyenne de la population” (µ= 0.85) H1: “La moyenne des femmes enceinte est plus élevée que la moyenne de la population” (µ >0.85) 2. Modèle statistique.On noteMn etSn la moyenne et l’écart type aléatoires pour un échantillon

théorique den= 15 femmes enceintes. SousH₀ on a : Tn= Mn−µ

Sn

√n−1

St(14).

3. Région critique.Pour une confiance 1−α= 95%, on a une zone critique : K_α(T_n) ={T_n≥1,761}.

4. Prise de décision.

T_n^exp= 0,917−0,85

0,144

√14

= 1,741∈/K_α(T_n)

donc on conserve H0 : au niveau de risque de 5% et au vu des résultats sur l’échantillon, on ne peut pas affirmer que la glycémie moyenne des femmes enceintes en fin de grossesse est plus élevé que la normale.

5. Calcul dep-value (signification).

p-value =P(Tn ≥T_n^exp) =P(Tn≥1,741) = 5,15%

Ce risque étant supérieur à 5%, on conserveH0.

• Pour un grand échantillon (n >30)

Remarque. Comme pour les intervalles de confiance, on peut remplacer la loi de Student par la loi N (0; 1). De plus, on n’a plus besoin de la normalité de la variable initiale.

En exercice. Les spécifications d’un médicament indiquent que chaque comprimé doit contenir en moyenne 1,5 g de substance active. On a analysé 100 comprimés choisis au hasard dans la production de ce médicament. Voici les résultats :

(9)

Classes [ 0,8 ; 1 [ [ 1 ; 1,2 [ [ 1,2 ; 1,4 [ [ 1,4 ; 1,6 [ [ 1,6 ; 1,8 [ [ 1,8 ; 2 [ [ 2 ; 2,2 [ Total

Effectifs 2 8 15 31 28 13 3 100

Peut-on dire que la production respecte l’indication mentionnée pour un risqueα= 5% ? Solution. On trouve une moyennem= 1,552 et un écart types= 0,257.

Paramètre : On noteµla moyenne de substance active de la production.

H₀ : “la production respecte l’indication mentionnée” (µ= 1,5) H₁ : “la production ne respecte pas l’indication mentionnée” (µ6= 1,5) On fait un test bilatéral.

2. Modèle statistique.On noteM_n etS_n la moyenne et l’écart type aléatoires pour un échantillon théorique den= 100 comprimés. SousH₀ on a :

Zn =Mn−µ

Sn

√n−1

' N (0; 1).

3. Région critique.Pour une confiance 1−α= 95%, on a une zone critique : Kα(Zn) ={|Zn| ≥1,96}.

4. Prise de décision.

Z_n^exp= 1,552−1,5

0,257√ 99

= 2,01∈K_α(Z_n)

donc on accepteH1: au niveau de risque de 5% et au vu des résultats sur l’échantillon, on ne peut pas affirmer que la production respecte l’indication mentionnée

5. Calcul dep-value (signification).

p-value =P(|Zn| ≥ |Z_n^exp|) =P(|Zn| ≥2,01) = 4,4%

Ce risque étant inférieur à 5%, on accepteH1.