Test pour la moyenne - Probabilit´es et statistique pour le CAPES

6.6 Tests

6.6.4 Test pour la moyenne

Soit (X₁,· · · , X_n) un ´echantillon de taille nde loi µ_θ et de moyenne commune m. On note Pθ

la loi jointe du vecteur al´eatoire (X₁,· · · , X_n).

On souhaite tester deux sortes d’hypoth`eses pour la moyenne.

1. H₀ : “m =m₀” contre H₁ : “m 6=m₀”, appelé test bilatère et nonbilatéral qui est une mauvaise traduction de l’anglaisbilateral.

2. Si l’on sait que la moyenne m satisfait `a m ≥m₀, on teste alors les hypoth`eses : H₀ :

“m=m0” contreH1 : “m > m0”, appelétest unilatère. De manière analogue, si l’on sait que la moyenne m satisfait à m ≤m₀, on teste alors les hypothèses : H₀ : “m = m₀” contre H₁ : “m < m₀”.

Soit α∈]0,1[ un seuil fix´e. Il est alors naturel de chercher une r´egion critique de la forme : 1. Dα={x∈ X : |M_n−m|> Cα},

2. Dα={x∈ X : Mn−m > Cα} ou Dα ={x∈ X : Mn−m < Cα}.

Etant donn´´ e que l’hypoth`ese H₀ est simple, le test est de niveauα, si : Pm0(D_α) =α.

D´etaillons ceci dans le cas d’un test bilat`ere. On chercheCα tel que : α=Pm0(Dα) =Pm0

(x1,· · · , xn)∈ X : 1 n

k=1

xk−m0

> Cα

. (6.2)

Afin de continuer, nous avons besoin de plus d’informations sur la loi de l’´echantillon ou sur sa taille.

• Echantillon de loi gaussienne de param`´ etres m et σ²

Soit (X₁,· · ·, X_n) un ´echantillon de taillende loi gaussienne de moyennem et de varianceσ². Soit m0 ∈R.

Dans ce cas, il faut traiter séparément le cas où la variance est connue de celui où elle ne l’est pas. On noteTn−1 une variable aléatoire de loi de Student àn−1 degrés de liberté.

Proposition 6.8.

(A) Cas o`u la variance σ² est connue.

Remarque. On rappelle que la densit´e d’une variable de Student est paire, de sorte queP[|T_d| ≥

Le paramètre inconnuθ étant la moyennem de l’échantillon, l’ensemble des paramètres est Θ =R. Dans ce cas,H0 : “m=m0”. Le test repose sur le fait que, sous l’hypothèse NotonsN une variable aléatoire normale centrée réduite.

Nous prouvons le résultat uniquement dans le cas d’un test bilatère : test de m =m₀ contre m6=m₀. D’après l’équation (6.2), nous cherchons C_α tel que :

Le param`etre inconnuθest cette fois le couple moyenne-variance (m, σ²) de l’´echantillon,

de sorte que l’ensemble des param`etres est Θ =R×R^∗+. Dans ce cas,H₀: “(m, σ²)∈ {m₀} ×R^∗+”.

Le test repose sur le fait que, sous l’hypoth`eseH0, la variable√

n^Mⁿ_S^−m⁰

Nous prouvons le résultat uniquement dans le cas d’un test bilatère. Comme pour la construction d’un intervalle de confiance, au lieu de travailler à partir de la variable aléatoireM_n−m₀ ou en fait de√

n^Mⁿ^−m_σ ⁰, nous allons travailler ici `a partir de la variable al´eatoire √

n^Mⁿ_S^−m⁰

n puisqu’on ne connaˆıt pas la variance σ. Nous cherchons donc une constantecα telle que :

α=Pm0[D_α] =Pm0

Remarque.

1. Si on ne rejette pas l’hypothèse H0, pourquoi ne peut-on pas en général l’accepter ? Ac-cepterH₀revient en fait à rejeterH₁. Calculons par exemple la probabilité de commettre une erreur de deuxième espèce, c’est-à-dire de rejeter l’hypothèse H1 à tort, autrement dit d’accepter H0 à tort, dans le cas d’un test de m = m0 contre m < m0 lorsque la variance de l’échantillon gaussien est connue.

PuisqueH₁ est l’hypothèse “m∈]− ∞, m₀[” dans ce cas, l’erreur de deuxième espèce est où N est une variable aléatoire gaussienne centrée réduite.

Or, l’application m 7→ 1−Π

est continue croissante, de sorte que sa borne supérieure sur l’intervalle ]− ∞, m₀[ est égale à sa valeur en m₀, à savoir 1−Π(Π⁻¹(α)) = 1−α.

La probabilité d’accepter à tort l’hypothèse H0 vaut donc 1−α... mais α est “petit”, donc 1−α est “proche de 1”... On comprend pourquoi cela n’a pas de sens d’accepter l’hypothèseH₀ avec ce type de test !

2. Nous avons énoncé les tests tels qu’ils figurent désormais dans les programmes du concours du CAPES. On remarquera que l’on peut aisément étendre les résultats pour des tests de m≤m0 contrem > m0, ou dem≥m0 contrem < m0, qui sont les tests énoncés le plus fréquemment dans la littérature mathématique. On calcule alors l’erreur de première espèce en utilisant la continuité et la croissance de la fonction de répartition Π de la gaussienne centrée réduite, comme pour le calcul de l’erreur de deuxième espèce dans la remarque ci-dessus.

• Echantillon de loi de Bernoulli de param`´ etre inconnu θ∈]0,1[.

Soit (X1, . . . , Xn) un ´echantillon de taille nde loi de Bernoulli de param`etre inconnu θ∈]0,1[.

On suppose quen et θsont tels que la variable al´eatoire

k=1

X_k, qui suit une loi binomiale de paramètres (n, θ), est approchable par une loi normale (classiquement n ≥10 et nθ, n(1−θ) dépassent quelques unités).

Soit θ0 ∈]0,1[. On obtient alors les r´esultats suivants : Proposition 6.9. Soit α∈]0,1[ le niveau fix´e du test.

1. (Test bilat`ere). SoitH₀ : “θ=θ₀” et H₁ : “θ∈]0,1[\{θ₀}”. Posons :

Alors,D_α est la région critique d’un test de niveau (à peu près égal à)α deH₀contreH₁. 2. (Test unilatère). On suppose que l’on sait queθappartient à l’intervalle[θ0,1[. Soit alors,

H₀ : “θ=θ₀” et H₁ : “θ∈]θ₀,1[”. Posons : 3. (Test unilat`ere). On suppose que l’on sait queθappartient `a l’intervalle]0, θ0]. Soit alors,

H₀ : “θ=θ₀” et H₁ : “θ∈]0, θ₀[”. Posons : non plus car on ne sait pas si la probabilité d’accepter à tort l’hypothèseH0, c’est-à-dire

sup

θ6=θ0

Pθ[D_α^c] est faible ou non.

Exercice 6.4. D’apr`es Dunod ex. 11.1, p. 140.

Dans la population fran¸caise, le pourcentage d’individus de rh´esus n´egatif est de 15%. Dans un

echantillon représentatif de 200 basques fran¸cais, on observe que 44 personnes sont de rhésus négatif. Peut-on dire, au risque α = 0,05, que les basques diffèrent du reste de la population fran¸caise en ce qui concerne le rhésus ? Quelle serait la conclusion si on avait observé seulement 37 basques de rhésus négatif parmi les 200 personnes testées ?

Solution 6.4. Le nombre de basques de rhésus négatif suit une loi binomiale de paramètres n = 200 et θ ∈]0,1[ inconnu, avec θ = 0,15 si les basques ne diffèrent pas du reste de la population fran¸caise en ce qui concerne le rhésus,θ6= 0,15 sinon. On pose H₀ : “θ= 0,15” et H1 : “θ∈]0,1[\{0,15}”. On fait donc un test de H0 contre H1 dans le cas d’une loi binomiale approchable par une loi gaussienne. Posons c= Π⁻¹

1−^0,05₂ Les basques diffèrent du reste de la population fran¸caise en ce qui concerne le rhésus, et la probabilité de se tromper est inférieure à 0,05.

Avec 37 basques au lieu de 44, on trouve :

200 . Cette fois l’observation n’appartient pas `a D, de sorte qu’on ne peut pas rejeter l’hypoth`eseH₀.

Exercice 6.5. D’apr`es Dunod ex. 11.2, p. 140.

Dans une population, le pourcentage d’individus pr´esentant des rides est de 25%. Sur 200 per-sonnes ayant suivi un traitement anti-rides, on observe que 40 perper-sonnes ont des rides. Au risque α= 0,05, peut-on dire que le traitement est efficace ?

Solution6.5. Le nombre de personnes ayant des rides après le traitement suit une loi binomiale de paramètres n = 200 et θ ∈]0,1[ inconnu, avec θ = 0,25 si le traitement est inefficace, et θ < 0,25 si le traitement est efficace (on suppose tout de même que le traitement ne favorise pas l’apparition des rides, ce qui serait un comble !) On pose H0 : “θ = 0,25” et H1 : “θ ∈

de sorte que l’observation n’appartient pas àD: on ne peut pas rejeter l’hypothèseH0de l’inef-ficacité du traitement. Ce qui ne veut pas dire non plus qu’il est efficace, on ne sait pas conclure !

Dans le document Probabilit´es et statistique pour le CAPES (Page 135-140)