• Aucun résultat trouvé

Introduction `a la biostatistique – Mat 2779

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction `a la biostatistique – Mat 2779"

Copied!
5
0
0

Texte intégral

(1)

L’´et´e 2010 Cours 14 — le 29 juin

14.1. Sur l’id´ee des tests d’hypoth`ese. En math´ematique, on fait souvent des preuves par contradiction. Si on veut montrer un ´enonc´eA, on suppose queAest faux, donc la n´egation de A, ¬A, est vraie. On veut rejeter ¬A, et pour ce but on en d´eduit une chose absurde, impossible, une contradiction. Cela veut dire que¬A est faux, par cons´equent on adopteA comme vrai.

C’est pareil avec les tests d’hypoth`ese. On veut rejeter l’hypoth`ese nulle H0, et avec ce but on en d´eduit une chose quasi impossible, improbable, en calculant la valeurp, qui est la probabilit´e d’observer une valeur autant, ou plus, extr`eme que la valeur actuellement observ´e.

Sipest trop petit (plus petit que le risqueαfix´e d’avance), on rejetteH0. 14.2. Terminologie et notation.

14.2.1. Erreur standard. C’est un autre nom pour l’´ecart-type de la moyenne de l’´echantillon : SE = sM = s

√n.

14.2.2. L’´ecart observ´e. C’est la diff´erence entre µ (la moyenne observ´ee) et la moyenne µH0 de l’hypoth`ese nulle :

µ0−µH0.

14.2.3. La statistique du test. Cette expression designe deux choses `a la fois.

D’abord, la statistique du test est la variable al´eatoire Z associ´ee au test dont la loi de distribution est (approximativement) connue. Pour les tests d’hypoth`ese de moyenne, il s’agit de la v.a.

Z = X¯ −µH0

σ/√ n . CetteZ est une variable al´atoire th´eorique.

Au mˆeme temps, la statistique du test observ´ee est la valeur de Z qui corr´espond `a la valeur observ´ee du param`etre statistique (dans notre cas, la moyenne d’´echantillonµ0) :

z0 = µ0−µH0

σ/√n . C’est un nombre r´eel.

1

(2)

tique du test :

Z = X¯ −µH0

s/√n .

14.2.5. La taille d’´echantillon et le choix entre Z ou T. Si n est petit (pour les tests d’hy- poth`ese de la moyenne, n < 30), on note parfois la statistique du test par la lettreT pour souligner que la statistique suit la loi de Student plutˆot que la loi normale :

T = X¯ −µH0

σ/√

n , ou bienT = X¯ −µH0

s/√ n .

Si on adopte cette notation-l`a, alors la valeur de statistique du test observ´e sera not´eet0. 14.2.6. La loi de la statistique du test. Conditionnellement sur l’hypoth`ese nulle, on suppose que :

σest connu σest inconnu n≥30 Z = X¯s/−µH0n ∼N(0,1) Z = X−µ¯s/H0n ∼N(0,1) n <30 T = X¯σ/−µH0n ∼tn−1 T = X¯s/−µH0n ∼tn−1

14.2.7. Les valeurs extrˆemes. Il s’agit des valeursaqui correspondent `a unα >0donn´e, et aussi d´ependent de la forme du test (unilateral/bilateral). Au lieu dea, on utilise parfoiszα

outnα1.

Par exemple, pour un test unilateral `a gauche, avecn≥30, on a a=−zα,

o`u

P[Z <−zα] =α.

La r´egion critique est

(−∞,−zα].

Pour un test bilateral avecn≥30, la r´egion critique est (−∞,−zα/2)∪(zα/2∪+∞), o`u

P[Z > zα/2] = α 2.

De mˆeme fac¸on, si n < 30, si le test est par exemple unilateral `a gauche, on se sert de la valeur

a=−tnα1, o`u

P[Z <−tnα1] =α.

(3)

−2 0 2 4 6

0.00.10.20.30.40.50.60.7

x

densité

FIG. 1. La courbe `a gauche est la distribution de Z sous H0, et la courbe

`a droite est la vraie distribution deZ (qui est bien sˆur inconnue `a nous). La ligne verticale marque la valeur critique pour l’hypoth`ese nulle. L’aire de la surface hachur´ee est le risqueβde 2e esp`ece.

La r´egion critique dans ce cas est

(−∞,−tα].

14.2.8. z-test ett-test. Si on suppose que la statistique du test suit la loi normale, le test est parfois dit unz-test. Si la statistique suit la loi de Student, il s’agit d’unt-test.

14.3. Le risque de deuxi`eme esp`ece et la puissance du test. Au cadre des tests d’hy- poth`ese, la valeur du risqueα >0est dite le risque de 1e esp`ece. C’est pr´ecisement le risque de rejeter l’hypoth`ese nulleH0 si elle est vraie.

Le risque de 2e esp`ece est le risque de ne pas rejeter l’hypoth`ese nulle en faveur de l’hy- poth`ese alternativeH1mˆeme siH1est vraie. Le risque de 2e esp`ece est not´eβ.

La valeur1−β est dite la puissance de test. De fac¸on informelle, c’est la probabilit´e de discerner une diff´erence entre les deux hypoth`eses lorsqu’elle existe. Regardez le diagramme 1.

Lorsque la taille d’´echantillon s’augmente,βse diminue, car le deux courbes devients plus resserr´ees autours de leurs moyennes respectives. La puissance de test s’accroit.

14.4. La d´emarche pr´ecis´ee.

14.4.1. L’approche traditionnelle utilisant la r´egion critique.

– D´efinirH0etH1.

– Choisisser le risqueα >0.

(4)

– Calculer la statistique du test observ´ee. Si la valeur appartient `a la r´egion critique, on rejetteH0en faveur deH1. Sinon, on ´echoue `a rejeterH0.

14.4.2. L’approche plus moderne utilisant la valeursp.

– D´efinirH0etH1.

– Choisisser le risqueα >0.

– M´esurer le param`etre observ´e.

– Determiner la statistique du test et la valeurppour la valeur du param`etre observ´ee.

– Sip < α, on rejetteH0 en faveur deH1. Sinon, on ´echoue `a rejeterH0.

Les deux approaches sont rigoreusement ´equivalentes : elles donnent les mˆemes r´esultats.

Exercice 14.1. La moyenne d’un ´echantillon al´eatoire des 106 temp´eratures humaines est 36.78oC. Supposons que l’´ecart type de la population est connu et vaut 0.34oC. Au 95%, testez la croyance commune que la temp´erature d’un adulte en bonne sant´e est37.0oC.

L’hypoth`ese nulle est l’affirmation queµ= 37oC, symboliquement : H0 :µ= 37.

L’hypoth`ese alternative :

H1 :µ6= 37.

Le test est dont bilateral.

Le risqueα= 0.05.

Voici la statistique du test observ´ee :

z0 = 36.78−37.0

0.34/sqrt106 =−6.66.

La m´ethode de la r´egion critique. Car le test est bilateral, etn >30, on a a=zα/2 =z0.025 = 1.959964.

R commanderdistributionscontinuous distributionsnormal distributionnormal quantiles ...

La region critique :

(−∞,−1.959964]∪[1.959964,+∞).

Carz0 appartient `a la r´egion critique,H0 est rejet´ee en faveur deH1. La m´ethode de la valeurp. La valeurpcorr´espondante `az0est ´egale `a

P[|Z|>|z0|kH0],

donc, avec R commanderdistributionscontinuous distributionsnormal distribution

normal probabilities, variable value=-6.66, lower tail, on obtient la valeur infinitesimal :

> pnorm(c(-6.66), mean=0, sd=1, lower.tail=TRUE) [1] 1.369138e-11

(5)

Il faut le multiplier par2, car le test est bilateral, mais ce ne change rien : p= 2×1.369138×1011= 2.738276×1011= 0.00000000001.

Carpest plus petit que0.05, on rejetteH0 en faveur deH1.

14.5. Tests d’hypoth`ese sur la moyenne avec R commander. Voir le solutionnaire au devoir 3, le probl`eme 4(d).

Références

Documents relatifs

Le test quantile-quantile, ou le test QQ, trace les points x i contre les n-quantiles cor- respondantes y i de la loi normale ayant la mˆeme moyenne et le mˆeme ´ecart-type que

Par contre, les r´esultats pour la distribution de la dur´ee du sommeil sans rˆeve (figure 2) favourisent l’hypoth`ese de normalit´e de la distribution. La normalit´e de

On a besoin d’un objet du type data.frame et pas une matrice parce que la fonction mean calcule la moyenne d’un data.frame colonne par colonne, en d’autres mots, pour

Mais la structure du test d’hypoth`ese, d´etermin´ee par le choix de H 0 et de H 1 , est telle que, mˆeme s’il est vrai que le moyen du tour de taille s’est r´eduit,

Notons π 1 la proportion des employ´es qui arrˆetent de fumer chaque an de tous les entreprises (disons nord-am´ericaines) avec l’interdiction de fumer, et π 2 la proportion

Chaque ´echantillon est extrait d’une population dans laquelle la variable qui nous int´eresse a une valeur moyenne (la moyenne de la population) inconnue µ 1 , resp... Comme

(a) Si une personne est tir´e au hasard de cette population, quelle est la probabilit´e qu’elle soit test´ee positive pour cette type de cancer.. (b) Calculez la probabilit´e que

(a) [1 point] Donner le nombre attendu des grenouilles poss`edant ce trait, ainsi que l’´ecart-type du nombre des grenouilles avec ce trait.. (b) [1 point] Calculer la