Chapitre 10: Tests et intervalles de conﬁance pour proportions

(1)

Chapitre 10: Tests et intervalles de confiance pour proportions

1. Test statistique pour une proportion

2. Intervalle de confiance pour une proportion

3. Test statistique pour deux proportions

(2)

1. Test statistique pour une proportion

Ex: Taux d’individus ayant une caract´eristique A dans une population.

Soit p = P ( A ) ce taux.

De fa¸con g´en´erale dans ce chapitre, on utilisera la notation q = 1 − p

(de mˆeme, q ˆ = 1 − p, etc.) ˆ

(3)

– Hypoth`eses

H

₀

: p = p

₀

H

₁

: p 6 = p

₀

– Echantillon

Tirage al´eatoire de n individus

– Statistique de test (“distance” entre H

₀

et les observations)

K = Nombre d’individus avec A dans l’´echantillon

(4)

Sous H₀, on peut calculer la distribution de K.

Ex: H₀: p = 0.4; n = 120 Distribution: K ∼ B(120,0.4)

0 20 40 60 80 100 120

0.000.020.040.06

k

P(K=k)

On peut par exemple adopter la r`egle de d´ecision suivante:

R`egle de d´ecision: rejeter H si k ≤ 37 ou si k ≥ 60

(5)

Sous H₀, on peut calculer la distribution de K.

Ex: H₀: p = 0.4; n = 120 Distribution: K ∼ B(120,0.4)

0 20 40 60 80 100 120

0.000.020.040.06

k

P(K=k)

p1 = 0.024 p2 = 0.017

On peut par exemple adopter la r`egle de d´ecision suivante:

R`egle de d´ecision: rejeter H₀ si k ≤ 37 ou si k ≥ 60 Niveau: p1 + p2 = 0.041

(6)

Avantage de cette approche: le niveau est connu exactement, pas d’approximation.

D´esavantage: Il faut trouver les bornes“manuellement”pour chaque valeur

de n et de p

₀

.

(7)

Sous certaines conditions (grˆ ace au théorème centrale limite), la distribution de K est bien approximée par la distribution normale:

0 20 40 60 80 100 120

0.000.020.040.06

k

P(K=k)

(8)

Sous certaines conditions (grˆ ace au théorème centrale limite), la distribution de K est bien approximée par la distribution normale:

0 20 40 60 80 100 120

0.000.020.040.06

k

P(K=k)

Densité de X ~ N(^np0, np₀(¹⁻^p0))

(9)

A la place de K, on prend comme statistique de test:

Z = K/n − p₀

q

p₀(1 − p₀)/n .

Sous H₀, et sous les conditions d’application (v. p. suivante), Z a approximativement une distribution N(0,1).

→ R`egle de d´ecision:

Rejeter H₀ si |z| > z_1−α/2

o`u z est la valeur observ´ee de Z et z_1−α/2 est le quantile 1 − α/2 de la distribution N(0,1).

Remarque: pour faire le test unilatéral de H₀: p = p₀ contre H₁: p > p₀, on utilisera la règle de décision

Rejeter H₀ si z > z_1−α .

(10)

Conditions d’application: il faut que n soit suffisamment grand pour que l’approximation normale soit bonne. Or, plus p est extrême (proche de 0 ou de 1), plus n doit être grand. Concrètement, si n et p sont tels que

np > 5 et n (1 − p ) > 5 , alors

K/n − p

q

p (1 − p ) /n

a approximativement une distribution N (0 , 1) .

Nous avons d´ej` a rencontr´e ces conditions dans le chapitre 8.

(11)

2. Intervalle de confiance pour une proportion

Rappel: un intervalle de confiance contient toutes les valeurs du paramètre d’intérêt qui ne seraient pas rejetées par un test.

Ici, ce sont les valeurs de p telles que

|z| = |k/n − p|

q

p (1 − p ) /n ≤ z

₁_−α/2

, (1)

o` u k est la valeur observ´ee de K dans l’´echantillon.

(12)

La relation (1) est satisfaite pour des valeurs de p situ´ees entre p

_i

= 1

1 + c p ˆ + c/ 2 −

r

c

²

/ 4 + c p ˆ (1 − p ˆ )

!

et

p

_s

= 1

1 + c p ˆ + c/ 2 +

r

c

²

/ 4 + c p ˆ (1 − p ˆ )

!

, o` u

c = z

₁²_−α/2

/n et p ˆ = k/n.

Cet intervalle s’appelle l’intervalle de Wilson, que l’on notera IC

_{W I}

. On a donc

IC

_{W I}

= [ p

_i

, p

_s

] .

(13)

Au chapitre précédent, nous avons vu une méthode générale pour construire des intervalles de confiance pour un paramètre θ, appelée la méthode de Wald. Elle se base sur la valeur observée θˆ de l’estimateur du paramètre et définit l’intervalle avec niveau de couverture 1 − α comme

[ˆθ − z₁₋^α

2

sd(ˆˆ θ) , θˆ+ z₁₋^α

2

sd(ˆˆ θ)], o`u sd(ˆˆ θ) est une estimation de l’´ecart-type de θ.ˆ

Dans le cas o`u le param`etre est une proportion p, on a:

• Estimateur de p: pˆ= ^K

n , la proportion observ´ee dans l’´echantillon.

Que vaut sd(ˆˆ p)? → On sait que K, le nombre de personnes avec la caractéristique d’intérêt (“succès”) dans l’échantillon, suit une distribution binomiale B(n, p). Son écart type est donc sd(K) = √

npq. On en déduit (propriété de l’écart-type) que sd(ˆp) =

q

pq/n, que l’on estime par

sd(ˆˆ p) =

q

pˆˆq/n.

On obtient donc que l’intervale de confiance de Wald pour une proportion, not´e IC_{W A} est donn´e par

IC_{W A} =

pˆ− z₁₋^α

2

q

pˆˆq/n , pˆ+ z₁₋^α

2

q

pˆˆq/n

.

(14)

L’intervalle de Wald plus simple mais moins pr´ecis que l’intervalle de Wilson, qui fait moins d’approximations. Concr`etemement, on ne l’utilisera que lorsque

• 0 . 3 ≤ p ˆ ≤ 0 . 7 et

• n ≥ 50 .

Pour l’intervalle de Wald, il peut arriver que la formule de la page

précédente donne une valeur inférieure ` a 0 pour la borne inférieure ou

une valeur sup´erieure ` a 1 pour la borne sup´erieure. Il faut alors corriger

l’intervalle en mettant respectivement 0 ou 1 ` a la place de la borne qui

sort de l’intervalle [0,1]. L’intervalle de Wilson n’a pas ce probl`eme, ses

bornes ´etant automatiquement comprises entre 0 et 1.

(15)

3. Test statistique pour deux proportions

Ex: Taux p

₁

et p

₂

d’individus ayant une caract´eristique A dans deux populations diff´erentes.

On se demande si les proportions d’individus ayant la caract´eristique

d’intérêt sont les mêmes dans les deux populations ou si elles sont

diff´erentes.

(16)

– Hypoth`eses

H

₀

: p

₁

= p

₂

H

₁

: p

₁

6 = p

₂

– Echantillon

Tirage al´eatoire de n

₁

individus dans la premi`ere population et n

₂

dans la deuxi`eme

– Statistique de test (“distance” entre H

₀

et les observations) Sous H

₀

et si n

₁

et n

₂

sont suffisamment grands, la variable

Z = K

₁

/n

₁

− K

₂

/n

₂

q

pq/n

₁

+ pq/n

₂

a approximativement une distribution N (0 , 1) .

Ici K

₁

est le nb d’individus avec A dans le premier ´echantillon et

(17)

Pour effectuer le test, on calcule la valeur observ´ee de Z sur nos ´echantillons:

z = pˆ₁ − pˆ₂

q

pˆˆq(1/n₁ + 1/n₂) o`u

pˆ₁ = k₁/n₁, pˆ₂ = k₂/n₂ et

pˆ= (k₁ + k₂)/(n₁ + n₂)

R`egle de d´ecision:

Rejeter H₀ si |z| > z_1−α/2 .

Remarque: pour faire le test unilatéral de H₀: p₁ = p₂ contre H₁: p₁ > p₂, on utilisera la règle de décision

Rejeter H₀ si z > z_1−α .

(18)

Les données peuvent être présentées de la fa¸con suivante:

Caract`ere A

Echantillon Pr´esent Absent Total

1 n₁₁ n₁₂ n_1.

2 n₂₁ n₂₂ n_2.

Total n_.1 n_.2 n

On peut d´emontrer que

z² = n(n₁₁n₂₂ − n₁₂n₂₁)² n_1.n_2.n_.1n_.2

Règle de décision équivalente (pour un test bilatéral):

Rejeter H₀ si z² > χ²_1,1−α, où χ²_1,1−α est le quantile 1 − α de la distribution χ² à un degré de liberté, notée χ²₁.

(En effet, on rappelle que, par d´efinition de la distribution χ², si Z ∼ N(0,1), alors Z² ∼ χ²₁.)

Remarque:

2 2

(19)

Au niveau des statistiques de test, on a la situation suivante:

Densit´e de Z sous H₀:

0

ϕ

−z₁₋^α

2 z₁₋^α

2

P₀(|Z|>z₁₋^α

2) = α

Densit´e de Z² sous H₀:

(^z ^α)²⁼^χ²

P₀(Z²>χ_1,1² _−α) = α densité χ₁²

(20)

Exemple: On veut tester si la proportion de nouveaux nés dont le poids ` a la naissance est inférieur ` a 2500g est différente dans les deux populations suivantes:

– Age de la m`ere ≤ 20 ans – Age de la m`ere > 20 ans

On prélève deux échantillons de taille 100 et on obtient la situation suivante:

Poids ` a la naissance

Age Proportion de faibles

maternel ≤ 2500 g > 2500 g Total poids ` a la naissance

≤ 20 20 80 100 0.20 (= ˆ p

₁

)

> 20 10 90 100 0.10 (= ˆ p

₂

)

Total 30 170 200 0.15 (= ˆ p )

(21)

Calculs:

z = p ˆ

₁

− p ˆ

₂

q

p ˆ q ˆ (1 /n

₁

+ 1 /n

₂

)

= 0 . 2 − 0 . 1

q

0 . 15 × 0 . 85 × (1 / 100 + 1 / 100)

= 1 . 98

z

²

= n ( n

₁₁

n

₂₂

− n

₁₂

n

₂₁

)

²

n

_1.

n

_2.

n

_.1

n

_.2

= 200 × (20 × 90 − 10 × 80)

²

(100 × 100 × 30 × 170)

= 3 . 92

On a bien 1 . 98

²

= 3 . 92 .

(22)

D´ecision:

z > 1 . 96 = z

_0.975

et donc on rejette H

₀

. De fa¸con ´equivalente:

z

²

> 3 . 84 = χ

²_1,0.95

et donc on rejette H

₀

.

On vient de tester l’hypoth`ese d’ind´ependance entre les variables “poids ` a

la naissance inférieur ` a 2500g” et “ˆ age de la mère inférieur ` a 20 ans”. En

effet, demander si la proprotion de b´eb´es dont le poids ` a la naissance est

inférieur ` a 2500g diffère entre les populations des mères de moins et de

plus de 20 ans revient ` a demander s’il y a une d´ependance entre ces deux

variables. Si les proportions diff`erent cela implique que le fait de connaˆıtre

l’ˆ age de la mère donne une information sur le poids du bébé, ce qui est le

(23)

De fa¸con générale, on pourra donc tester l’indépendance entre deux variables dichotomiques (i.e. qui n’ont que deux modalités) de la fa¸con ci-dessus. Souvent, ces variables indiquent la présence ou l’absence d’un caractère (ex.: âge ≤ 20 ans), et on parle alors de test sur l’indépendance de deux caractères. Donc, pour tester l’indépendance entre deux caractères A et B, on pose

H₀ : A et B ind´ependants H₁ : A et B pas ind´ependants et on construit le tableau suivant:

B pr´esent B absent Total

A pr´esent n₁₁ n₁₂ n_1.

A absent n₂₁ n₂₂ n_2.

Total n_.1 n_.2 n

On calcule ensuite la valeur observ´ee de la statistique de test Z²: z² = n(n₁₁n₂₂ − n₁₂n₂₁)²

n_1.n_2.n_.1n_.2 .

On rejette alors H₀ si z² > χ²_1,1−α, o`u χ²_1,1−α est le quantile 1−α de la distribution

2

(24)

Pour information:

Souvent, lorsqu’on s’intéresse à la dépendance entre deux caractères, il y a un caractère, appelé facteur antédédant ou facteur de risque qui cause potentiellement l’autre (par exemple une maladie). Par exemple, le facteur antécédent fumer cause potentiellement le caractère cancer du poumon. Il y a alors trois types d’études qui se distinguent par leur mode d’échantillonnage:

• Etude prospective: On prélève des échantillons de tailles fixées dans les populations avec et sans le facteur de risque, et on observe ensuite quels individus développent la maladie.

• Etude rétrospective: On prélève des échantillons de tailles fixées dans les populations avec et sans la maladie et on regarde quels individus ont le facteur de risque.

• Etude transversale: On prélève un seul échantillon dans la population globale et on détermine quels individus ont (ou développent) la maladie et quels individus ont le facteur de risque.

Suivant la situation, on choisira le type d’étude le plus approprié (ou le plus réalisable).

Par exemple, dans le cas d’une maladie rare, une étude rétrospective est généralement plus puissante, car avec les deux autres types on obtiendrait très peu d’individus avec la