6.6 Tests
6.6.4 Test pour la moyenne
Soit (X1,· · · , Xn) un ´echantillon de taille nde loi µθ et de moyenne commune m. On note Pθ
la loi jointe du vecteur al´eatoire (X1,· · · , Xn).
On souhaite tester deux sortes d’hypoth`eses pour la moyenne.
1. H0 : “m =m0” contre H1 : “m 6=m0”, appel´e test bilat`ere et nonbilat´eral qui est une mauvaise traduction de l’anglaisbilateral.
2. Si l’on sait que la moyenne m satisfait `a m ≥m0, on teste alors les hypoth`eses : H0 :
“m=m0” contreH1 : “m > m0”, appel´etest unilat`ere. De mani`ere analogue, si l’on sait que la moyenne m satisfait `a m ≤m0, on teste alors les hypoth`eses : H0 : “m = m0” contre H1 : “m < m0”.
Soit α∈]0,1[ un seuil fix´e. Il est alors naturel de chercher une r´egion critique de la forme : 1. Dα={x∈ X : |Mn−m|> Cα},
2. Dα={x∈ X : Mn−m > Cα} ou Dα ={x∈ X : Mn−m < Cα}.
Etant donn´´ e que l’hypoth`ese H0 est simple, le test est de niveauα, si : Pm0(Dα) =α.
D´etaillons ceci dans le cas d’un test bilat`ere. On chercheCα tel que : α=Pm0(Dα) =Pm0
"
(x1,· · · , xn)∈ X : 1 n
n
X
k=1
xk−m0
> Cα
#
. (6.2)
Afin de continuer, nous avons besoin de plus d’informations sur la loi de l’´echantillon ou sur sa taille.
• Echantillon de loi gaussienne de param`´ etres m et σ2
Soit (X1,· · ·, Xn) un ´echantillon de taillende loi gaussienne de moyennem et de varianceσ2. Soit m0 ∈R.
Dans ce cas, il faut traiter s´epar´ement le cas o`u la variance est connue de celui o`u elle ne l’est pas. On noteTn−1 une variable al´eatoire de loi de Student `an−1 degr´es de libert´e.
Proposition 6.8.
(A) Cas o`u la variance σ2 est connue.
Remarque. On rappelle que la densit´e d’une variable de Student est paire, de sorte queP[|Td| ≥
Le param`etre inconnuθ ´etant la moyennem de l’´echantillon, l’ensemble des param`etres est Θ =R. Dans ce cas,H0 : “m=m0”. Le test repose sur le fait que, sous l’hypoth`ese NotonsN une variable al´eatoire normale centr´ee r´eduite.
Nous prouvons le r´esultat uniquement dans le cas d’un test bilat`ere : test de m =m0 contre m6=m0. D’apr`es l’´equation (6.2), nous cherchons Cα tel que :
Le param`etre inconnuθest cette fois le couple moyenne-variance (m, σ2) de l’´echantillon,
de sorte que l’ensemble des param`etres est Θ =R×R∗+. Dans ce cas,H0: “(m, σ2)∈ {m0} ×R∗+”.
Le test repose sur le fait que, sous l’hypoth`eseH0, la variable√
nMnS−m0
Nous prouvons le r´esultat uniquement dans le cas d’un test bilat`ere. Comme pour la construction d’un intervalle de confiance, au lieu de travailler `a partir de la variable al´eatoireMn−m0 ou en fait de√
nMn−mσ 0, nous allons travailler ici `a partir de la variable al´eatoire √
nMnS−m0
n puisqu’on ne connaˆıt pas la variance σ. Nous cherchons donc une constantecα telle que :
α=Pm0[Dα] =Pm0
Remarque.
1. Si on ne rejette pas l’hypoth`ese H0, pourquoi ne peut-on pas en g´en´eral l’accepter ? Ac-cepterH0revient en fait `a rejeterH1. Calculons par exemple la probabilit´e de commettre une erreur de deuxi`eme esp`ece, c’est-`a-dire de rejeter l’hypoth`ese H1 `a tort, autrement dit d’accepter H0 `a tort, dans le cas d’un test de m = m0 contre m < m0 lorsque la variance de l’´echantillon gaussien est connue.
PuisqueH1 est l’hypoth`ese “m∈]− ∞, m0[” dans ce cas, l’erreur de deuxi`eme esp`ece est o`u N est une variable al´eatoire gaussienne centr´ee r´eduite.
Or, l’application m 7→ 1−Π
est continue croissante, de sorte que sa borne sup´erieure sur l’intervalle ]− ∞, m0[ est ´egale `a sa valeur en m0, `a savoir 1−Π(Π−1(α)) = 1−α.
La probabilit´e d’accepter `a tort l’hypoth`ese H0 vaut donc 1−α... mais α est “petit”, donc 1−α est “proche de 1”... On comprend pourquoi cela n’a pas de sens d’accepter l’hypoth`eseH0 avec ce type de test !
2. Nous avons ´enonc´e les tests tels qu’ils figurent d´esormais dans les programmes du concours du CAPES. On remarquera que l’on peut ais´ement ´etendre les r´esultats pour des tests de m≤m0 contrem > m0, ou dem≥m0 contrem < m0, qui sont les tests ´enonc´es le plus fr´equemment dans la litt´erature math´ematique. On calcule alors l’erreur de premi`ere esp`ece en utilisant la continuit´e et la croissance de la fonction de r´epartition Π de la gaussienne centr´ee r´eduite, comme pour le calcul de l’erreur de deuxi`eme esp`ece dans la remarque ci-dessus.
• Echantillon de loi de Bernoulli de param`´ etre inconnu θ∈]0,1[.
Soit (X1, . . . , Xn) un ´echantillon de taille nde loi de Bernoulli de param`etre inconnu θ∈]0,1[.
On suppose quen et θsont tels que la variable al´eatoire
n
P
k=1
Xk, qui suit une loi binomiale de param`etres (n, θ), est approchable par une loi normale (classiquement n ≥10 et nθ, n(1−θ) d´epassent quelques unit´es).
Soit θ0 ∈]0,1[. On obtient alors les r´esultats suivants : Proposition 6.9. Soit α∈]0,1[ le niveau fix´e du test.
1. (Test bilat`ere). SoitH0 : “θ=θ0” et H1 : “θ∈]0,1[\{θ0}”. Posons :
Alors,Dα est la r´egion critique d’un test de niveau (`a peu pr`es ´egal `a)α deH0contreH1. 2. (Test unilat`ere). On suppose que l’on sait queθappartient `a l’intervalle[θ0,1[. Soit alors,
H0 : “θ=θ0” et H1 : “θ∈]θ0,1[”. Posons : 3. (Test unilat`ere). On suppose que l’on sait queθappartient `a l’intervalle]0, θ0]. Soit alors,
H0 : “θ=θ0” et H1 : “θ∈]0, θ0[”. Posons : non plus car on ne sait pas si la probabilit´e d’accepter `a tort l’hypoth`eseH0, c’est-`a-dire
sup
θ6=θ0
Pθ[Dαc] est faible ou non.
Exercice 6.4. D’apr`es Dunod ex. 11.1, p. 140.
Dans la population fran¸caise, le pourcentage d’individus de rh´esus n´egatif est de 15%. Dans un
´
echantillon repr´esentatif de 200 basques fran¸cais, on observe que 44 personnes sont de rh´esus n´egatif. Peut-on dire, au risque α = 0,05, que les basques diff`erent du reste de la population fran¸caise en ce qui concerne le rh´esus ? Quelle serait la conclusion si on avait observ´e seulement 37 basques de rh´esus n´egatif parmi les 200 personnes test´ees ?
Solution 6.4. Le nombre de basques de rh´esus n´egatif suit une loi binomiale de param`etres n = 200 et θ ∈]0,1[ inconnu, avec θ = 0,15 si les basques ne diff`erent pas du reste de la population fran¸caise en ce qui concerne le rh´esus,θ6= 0,15 sinon. On pose H0 : “θ= 0,15” et H1 : “θ∈]0,1[\{0,15}”. On fait donc un test de H0 contre H1 dans le cas d’une loi binomiale approchable par une loi gaussienne. Posons c= Π−1
1−0,052 Les basques diff`erent du reste de la population fran¸caise en ce qui concerne le rh´esus, et la probabilit´e de se tromper est inf´erieure `a 0,05.
Avec 37 basques au lieu de 44, on trouve :
200 . Cette fois l’observation n’appartient pas `a D, de sorte qu’on ne peut pas rejeter l’hypoth`eseH0.
Exercice 6.5. D’apr`es Dunod ex. 11.2, p. 140.
Dans une population, le pourcentage d’individus pr´esentant des rides est de 25%. Sur 200 per-sonnes ayant suivi un traitement anti-rides, on observe que 40 perper-sonnes ont des rides. Au risque α= 0,05, peut-on dire que le traitement est efficace ?
Solution6.5. Le nombre de personnes ayant des rides apr`es le traitement suit une loi binomiale de param`etres n = 200 et θ ∈]0,1[ inconnu, avec θ = 0,25 si le traitement est inefficace, et θ < 0,25 si le traitement est efficace (on suppose tout de mˆeme que le traitement ne favorise pas l’apparition des rides, ce qui serait un comble !) On pose H0 : “θ = 0,25” et H1 : “θ ∈
de sorte que l’observation n’appartient pas `aD: on ne peut pas rejeter l’hypoth`eseH0de l’inef-ficacit´e du traitement. Ce qui ne veut pas dire non plus qu’il est efficace, on ne sait pas conclure !