• Aucun résultat trouvé

Supposons que l’on veuille effectuer un test statistique d’hypoth`eses portant surθ

N/A
N/A
Protected

Academic year: 2022

Partager "Supposons que l’on veuille effectuer un test statistique d’hypoth`eses portant surθ"

Copied!
5
0
0

Texte intégral

(1)

Universit´e de Strasbourg S´egolen Geffray

M1 - Magist`ere geffray@math.unistra.fr

Statistique - ´etudes de cas Ann´ee 2015/2016

Sujet 10: tests de comparaison de 2 variances ou plus

• Quelques rappels sur la d´efinition math´ematique des tests d’hypoth`eses:

Soit X une variable al´eatoire `a valeurs dans un ensembleX, de loiPθ o`uθ ∈Θ. Supposons que l’on veuille effectuer un test statistique d’hypoth`eses portant surθ. On formule deux hypoth`eses contradictoires not´ees H0 etH1 dont on suppose que l’une et seulement l’une est vraie. Math-

´

ematiquement, formuler H0 et H1 revient `a choisir deux sous-ensembles disjoints de Θ not´es Θ0 et de Θ1 de sorte que l’hypoth`ese H0 s’´ecrit alors {θ0 ∈ Θ0} tandis que l’hypoth`ese H1

s’´ecrit {θ1 ∈ Θ1}. Soit (X1, ..., Xn) un ´echantillon i.i.d. issu d’une variable parente X et soit (x1, ..., xn)∈ Xn une r´ealisation de (X1, ..., Xn). Construire un test de H0 contre H1 revient `a construire une r´egion critiqueRde telle sorte que l’on rejetteH0 lorsque (x1, ..., xn)∈Ret que l’on s’assure que le risque de 1`ere esp`ece est inf´erieur ou ´egal `a α.

Dans ce cadre, on parle de fonction de risque de 1`ere esp`ece d´efinie sur Θ0 pour θ →α(θ) =Pθ((X1, ..., Xn)∈ R).

On appelle taille du test la probabilit´e maximale de rejeter H0 alors que H0 est vraie:

sup

θ∈Θ0

{Pθ((X1, ..., Xn)∈ R)}. On dit qu’un test est de niveau α si sa taille est ´egale `a α ie si

sup

θ∈Θ0

{Pθ((X1, ..., Xn)∈ R)}=α .

On parle de fonction de risque de 2nde esp`ece d´efinie sur Θ1 pour θ→β(θ) = Pθ((X1, ..., Xn)∈ R)/ .

On parle de fonction puissance d´efinie sur Θ1 pour

θ →1−β(θ) =Pθ((X1, ..., Xn)∈ R).

• Test de comparaison de 2 variances:

Soient X et Y deux variables al´eatoires ind´ependantes. On souhaite tester l’´egalit´e de leurs variances respectives. Formellement, on souhaite tester l’hypoth`ese nulleH0: Var(X) = Var(Y) au niveau α. Soit (X1, . . . , XnX) un ´echantillon i.i.d. distribu´e comme la variable X. Soit (Y1, . . . , YnY) un ´echantillon i.i.d. distribu´e comme la variableY, ind´ependant de (X1, . . . , XnX).

Soit

Sn02

X = 1

nX −1

nX

X

i=1

XnX −Xi2

(2)

un estimateur de Var(X) avec XnX = 1 nX

nX

X

i=1

Xi. Soit

Sn02Y = 1 nY −1

nY

X

i=1

YnY −Yi

2

un estimateur de Var(Y) avec YnY = 1 nY

nY

X

i=1

Yi. Notons ´egalement

Sn02X+nY = (nX −1)Sn02

X + (nY −1)Sn02

Y

nX +nY −2

= 1

nX +nY −2

nX

X

i=1

XnX −Xi2

+

nY

X

i=1

YnY −Yi2

! . 1er cas: nX ≥30 etnY ≥30

Soit la statistique de test:

TnX,nY = Sn02

X −Sn02

Y

Sn02X+nYq

2 nX + n2

Y

.

Sous H0, la statique TnX,nY converge en loi vers une variable de loi N(0,1). LorsqueH0 n’est pas satisfaite, la statistique TnX,nY diverge presque-sˆurement vers ∞.

• Lorsque H1: Var(X)6= Var(Y), la r´egion critique est R=n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :|tnX,nY|> FN−1(0,1)(1−α/2)o .

• Lorsque H1: Var(X)>Var(Y), la r´egion critique est R=

n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :tnX,nY > FN−1(0,1)(1−α) o

.

• Lorsque H1: Var(X)<Var(Y), la r´egion critique est R=n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :tnX,nY < FN−1(0,1)(α)o .

2`eme cas(test de Fisher ou de Fisher-Snedecor): X ∼ N(E[X],Var(X)) etY ∼ N(E[Y],Var(Y)).

Soit la statistique de test:

TnX,nY = Sn02

X

Sn02Y .

Sous H0, la statique TnX,nY suit la loi F(nX, nY) dite de Fisher `a nX et nY degr´es de libert´e.

Heuristiquement, lorsque H0 est vraie, le rapport TnX,nY ne doit pas trop s’´eloigner de 1.

• Lorsque H1: Var(X)6= Var(Y), la r´egion critique est R=n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :tnX,nY > FF−1(n

X,nY)(1−α/2) ou tnX,nY < FF−1(n

X,nY)(α/2)o .

• Lorsque H1: Var(X)>Var(Y), la r´egion critique est R=n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :tnX,nY > FF−1(n

X,nY)(1−α)o .

(3)

• Lorsque H1: Var(X)<Var(Y), la r´egion critique est R=n

(x1, . . . , xnX)∈RnX,(y1, . . . , ynY)∈RnY :tnX,nY < FF−1(n

X,nY)(α)o .

• Test de comparaison de K variances:

SoientX(k), pourk= 1, . . . , K, des variables al´eatoires ind´ependantes o`uX(k) ∼ N(E[X(k)],Var(X(k))), pour k = 1, . . . , K. On souhaite tester l’´egalit´e de leurs variances respectives. Formellement,

on souhaite tester au niveau αl’hypoth`ese nulle H0: Var X(k)

2 pourk = 1, . . . , K contre l’hypoth`ese alternative H1: ∃k1 6= k2 ∈ {1, . . . , K} tels que Var X(k1)

6= Var X(k2)

. Pour k = 1, . . . , K, soit (X1(k), . . . , Xn(k)

k) un ´echantillon i.i.d. distribu´e comme la variableX(k). Pour k = 1, . . . , K, soit

Sk,n02

k = 1 nk−1

nk

X

i=1

X(k)n

k −Xi(k)2

un estimateur de Var X(k) avec

X(k)n

k = 1 nk

nk

X

i=1

Xi(k).

1er cas: Test de Bartlett.

Soit la statistique de test:

Tn1,...,nK =

(n−K)h log

1 n−K

PK

k=1(nk−1)Sk,n02

k

n−K1 PK

k=1(nk−1) log Sk,n02

k

i

1 + 3(K−1)1 PK

k=1 1

nK−1n−K1

en notant n=

K

X

k=1

nk. SousH0, la statistique Tn1,...,nK suit la loi χ2(K−1). Notons tn1,...,nK la r´ealisation de Tn1,...,nK. La r´egion critique est:

R =n

(x1, . . . , xnk)k=1,...,K : tn1,...,nK > Fχ−12(K−1)(1−α)o .

La fonction bartlett.testdu logiciel R impl´emente ce test.

2`eme cas: Test de Levene.

Introduisons:

Zi(k) =

Xi(k)−X(k)n

k

Z(k)nk = 1 nk

nk

X

i=1

Zi(k)

Zn = 1 n

K

X

k=1 nk

X

i=1

Zi(k)= 1 n

K

X

k=1

nkZ(k)n

k. Soit la statistique de test:

Tn1,...,nK = n−K K−1

PK k=1

Z(k)n

k −Zn2

PK k=1

Pnk

i=1

Zi(k)−Z(k)n

k

2.

(4)

Sous H0, la statistique Tn1,...,nK suit la loi de Fisher F(K − 1, n −K). Notons tn1,...,nK la r´ealisation de Tn1,...,nK. La r´egion critique est:

R=n

(x1, . . . , xnk)k=1,...,K : tn1,...,nK > FF−1(K−1,n−K)(1−α)o .

La fonction leveneTest du package cardu logiciel R impl´emente ce test ainsi que la fonction levene.test du packagelawstat.

(5)

Exercice 1.

1. Illustrer de mani`ere empirique `a partir de donn´ees simul´ees le comportement de la taille du test.

2. Illustrer de mani`ere empirique `a partir de donn´ees simul´ees le comportement de la fonction puissance.

3. Tests param´etriques: Illustrer de mani`ere empirique `a partir de donn´ees simul´ees la ro- bustesse ou au contraire la sensibilit´e du test aux hypoth`eses sous-jacentes.

4. Tests non-param´etriques: faire varier la loi servant `a g´en´erer les donn´ees ainsi que la valeur de son/ses param`etre(s).

Vous veillerez `a faire varier tour `a tour:

• le risque de 1`ere esp`ece α,

• la taille de l’´echantillonn,

• la variabilit´e du ph´enom`ene.

Le test de Levene a la r´eputation d’ˆetre robuste aux ´ecarts `a la normalit´e. Qu’en pensez-vous?

Références

Documents relatifs

Illustrer de mani` ere empirique ` a partir de donn´ ees simul´ ees la robustesse ou au contraire la sensibilit´ e du test aux hypoth` eses sous-jacentes.. NB: la loi binomiale

Illustrer de mani` ere empirique ` a partir de donn´ ees simul´ ees la robustesse ou au contraire la sensibilit´ e du test aux hypoth` eses sous-jacentes.. Vous veillerez ` a

Illustrer de mani` ere empirique ` a partir de donn´ ees simul´ ees la robustesse ou au contraire la sensibilit´ e du test aux hypoth` eses sous-jacentes3. NB: la loi de Weibull est

On formule deux hypoth` eses contradictoires not´ ees H 0 et H 1 dont on suppose que l’une et seulement l’une est vraie... Illustrer de mani` ere empirique ` a partir de donn´

On formule deux hypoth` eses contradictoires not´ ees H 0 et H 1 dont on suppose que l’une et seulement l’une est vraie.. Soit un ´

a une distribution continue fournie par l’utilisateur et enti` erement sp´ ecifi´ ee, ` a savoir,

La fonction goodfit du package vcd du logiciel R impl´ emente ce test pour les lois binomiale, de Poisson et binˆ omiale n´ egative, sans pratiquer de regroupement des donn´

Les ´ el´ ements de G sont donc les classes modulo 100 des entiers dont le dernier chiffre est 1 en ´ ecriture d´ ecimale... On a, en utilisant que K est