L’´et´e 2010 Cours 14 — le 29 juin
14.1. Sur l’id´ee des tests d’hypoth`ese. En math´ematique, on fait souvent des preuves par contradiction. Si on veut montrer un ´enonc´eA, on suppose queAest faux, donc la n´egation de A, ¬A, est vraie. On veut rejeter ¬A, et pour ce but on en d´eduit une chose absurde, impossible, une contradiction. Cela veut dire que¬A est faux, par cons´equent on adopteA comme vrai.
C’est pareil avec les tests d’hypoth`ese. On veut rejeter l’hypoth`ese nulle H0, et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeurp, qui est la probabilit´e d’observer une valeur autant, ou plus, extr`eme que la valeur actuellement observ´e.
Sipest trop petit (plus petit que le risqueαfix´e d’avance), on rejetteH0. 14.2. Terminologie et notation.
14.2.1. Erreur standard. C’est un autre nom pour l’´ecart-type de la moyenne de l’´echantillon : SE = sM = s
√n.
14.2.2. L’´ecart observ´e. C’est la diff´erence entre µ (la moyenne observ´ee) et la moyenne µH0 de l’hypoth`ese nulle :
µ0−µH0.
14.2.3. La statistique du test. Cette expression designe deux choses `a la fois.
D’abord, la statistique du test est la variable al´eatoire Z associ´ee au test dont la loi de distribution est (approximativement) connue. Pour les tests d’hypoth`ese de moyenne, il s’agit de la v.a.
Z = X¯ −µH0
σ/√ n . CetteZ est une variable al´atoire th´eorique.
Au mˆeme temps, la statistique du test observ´ee est la valeur de Z qui corr´espond `a la valeur observ´ee du param`etre statistique (dans notre cas, la moyenne d’´echantillonµ0) :
z0 = µ0−µH0
σ/√n . C’est un nombre r´eel.
1
tique du test :
Z = X¯ −µH0
s/√n .
14.2.5. La taille d’´echantillon et le choix entre Z ou T. Si n est petit (pour les tests d’hy- poth`ese de la moyenne, n < 30), on note parfois la statistique du test par la lettreT pour souligner que la statistique suit la loi de Student plutˆot que la loi normale :
T = X¯ −µH0
σ/√
n , ou bienT = X¯ −µH0
s/√ n .
Si on adopte cette notation-l`a, alors la valeur de statistique du test observ´e sera not´eet0. 14.2.6. La loi de la statistique du test. Conditionnellement sur l’hypoth`ese nulle, on suppose que :
σest connu σest inconnu n≥30 Z = X¯s/−µ√H0n ∼N(0,1) Z = X−µ¯s/√H0n ∼N(0,1) n <30 T = X¯σ/−µ√H0n ∼tn−1 T = X¯s/−µ√H0n ∼tn−1
14.2.7. Les valeurs extrˆemes. Il s’agit des valeursaqui correspondent `a unα >0donn´e, et aussi d´ependent de la forme du test (unilateral/bilateral). Au lieu dea, on utilise parfoiszα
outnα−1.
Par exemple, pour un test unilateral `a gauche, avecn≥30, on a a=−zα,
o`u
P[Z <−zα] =α.
La r´egion critique est
(−∞,−zα].
Pour un test bilateral avecn≥30, la r´egion critique est (−∞,−zα/2)∪(zα/2∪+∞), o`u
P[Z > zα/2] = α 2.
De mˆeme fac¸on, si n < 30, si le test est par exemple unilateral `a gauche, on se sert de la valeur
a=−tnα−1, o`u
P[Z <−tnα−1] =α.
−2 0 2 4 6
0.00.10.20.30.40.50.60.7
x
densité
FIG. 1. La courbe `a gauche est la distribution de Z sous H0, et la courbe
`a droite est la vraie distribution deZ (qui est bien sˆur inconnue `a nous). La ligne verticale marque la valeur critique pour l’hypoth`ese nulle. L’aire de la surface hachur´ee est le risqueβde 2e esp`ece.
La r´egion critique dans ce cas est
(−∞,−tα].
14.2.8. z-test ett-test. Si on suppose que la statistique du test suit la loi normale, le test est parfois dit unz-test. Si la statistique suit la loi de Student, il s’agit d’unt-test.
14.3. Le risque de deuxi`eme esp`ece et la puissance du test. Au cadre des tests d’hy- poth`ese, la valeur du risqueα >0est dite le risque de 1e esp`ece. C’est pr´ecisement le risque de rejeter l’hypoth`ese nulleH0 si elle est vraie.
Le risque de 2e esp`ece est le risque de ne pas rejeter l’hypoth`ese nulle en faveur de l’hy- poth`ese alternativeH1mˆeme siH1est vraie. Le risque de 2e esp`ece est not´eβ.
La valeur1−β est dite la puissance de test. De fac¸on informelle, c’est la probabilit´e de discerner une diff´erence entre les deux hypoth`eses lorsqu’elle existe. Regardez le diagramme 1.
Lorsque la taille d’´echantillon s’augmente,βse diminue, car le deux courbes devients plus resserr´ees autours de leurs moyennes respectives. La puissance de test s’accroit.
14.4. La d´emarche pr´ecis´ee.
14.4.1. L’approche traditionnelle utilisant la r´egion critique.
– D´efinirH0etH1.
– Choisisser le risqueα >0.
– Calculer la statistique du test observ´ee. Si la valeur appartient `a la r´egion critique, on rejetteH0en faveur deH1. Sinon, on ´echoue `a rejeterH0.
14.4.2. L’approche plus moderne utilisant la valeursp.
– D´efinirH0etH1.
– Choisisser le risqueα >0.
– M´esurer le param`etre observ´e.
– Determiner la statistique du test et la valeurppour la valeur du param`etre observ´ee.
– Sip < α, on rejetteH0 en faveur deH1. Sinon, on ´echoue `a rejeterH0.
Les deux approaches sont rigoreusement ´equivalentes : elles donnent les mˆemes r´esultats.
Exercice 14.1. La moyenne d’un ´echantillon al´eatoire des 106 temp´eratures humaines est 36.78oC. Supposons que l’´ecart type de la population est connu et vaut 0.34oC. Au 95%, testez la croyance commune que la temp´erature d’un adulte en bonne sant´e est37.0oC.
L’hypoth`ese nulle est l’affirmation queµ= 37oC, symboliquement : H0 :µ= 37.
L’hypoth`ese alternative :
H1 :µ6= 37.
Le test est dont bilateral.
Le risqueα= 0.05.
Voici la statistique du test observ´ee :
z0 = 36.78−37.0
0.34/sqrt106 =−6.66.
La m´ethode de la r´egion critique. Car le test est bilateral, etn >30, on a a=zα/2 =z0.025 = 1.959964.
R commander→distributions→continuous distributions→normal distribution→normal quantiles ...
La region critique :
(−∞,−1.959964]∪[1.959964,+∞).
Carz0 appartient `a la r´egion critique,H0 est rejet´ee en faveur deH1. La m´ethode de la valeurp. La valeurpcorr´espondante `az0est ´egale `a
P[|Z|>|z0|kH0],
donc, avec R commander→distributions→continuous distributions→normal distribution
→normal probabilities, variable value=-6.66, lower tail, on obtient la valeur infinitesimal :
> pnorm(c(-6.66), mean=0, sd=1, lower.tail=TRUE) [1] 1.369138e-11
Il faut le multiplier par2, car le test est bilateral, mais ce ne change rien : p= 2×1.369138×10−11= 2.738276×10−11= 0.00000000001.
Carpest plus petit que0.05, on rejetteH0 en faveur deH1.
14.5. Tests d’hypoth`ese sur la moyenne avec R commander. Voir le solutionnaire au devoir 3, le probl`eme 4(d).