• Aucun résultat trouvé

MAP 433 : Introduction aux méthodes. statistiques. Cours 8. Marc Ho mann. Notion de test et d erreur de test

N/A
N/A
Protected

Academic year: 2022

Partager "MAP 433 : Introduction aux méthodes. statistiques. Cours 8. Marc Ho mann. Notion de test et d erreur de test"

Copied!
11
0
0

Texte intégral

(1)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

MAP 433 : Introduction aux m´ethodes statistiques. Cours 8

Marc Ho↵mann

4 avril 2014

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Aujourd’hui (et la semaine prochaine...)

1 Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson

2 Construction d’un test : hypoth`eses g´en´erales Retour sur un exemple

Principe de construction 3 Tests asymptotiques

4 Tests d’ad´equation

Tests de Kolmogorov-Smirnov Tests du 2

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Exemple introductif

On observe 10 lancers d’une pi`ece de monnaie et on obtient le r´esultat suivant :

(P,P,F,F,P,F,P,P,F,P).

La pi`ece est-elle ´equilibr´ee?

R´epondre `a cette question revient `aconstruire une proc´edure de d´ecision :

'='(P,P,F,F,P,F,P,P,F,P)

=

⇢ 0 on accepte l’hypoth`esela pi`ece est ´equilibr´ee 1 on rejettel’hypoth`esela pi`ece est ´equilibr´ee

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

R´esolution

On associe l’exp´erience statistique (par exemple) E10 = {0,1}10,parties de({0,1}10),{P10# ,#2[0,1]} , avec (P = 0,F = 1)

P10# = # 0(dx) + (1 #) 1(dx) ⌦10. Hypoth`ese nulle :la pi`ece est ´equilibr´ee

H0:#= 1 2

Hypoth`ese alternative :la pi`ece est truqu´ee H1:#6= 1

2

(2)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

R´esolution (cont.)

On note Z l’observation.

Onconstruitune r`egle de d´ecision simple: '= 1

Z2R} =

⇢ 0 on accepte l’hypoth`ese 1 on rejette l’hypoth`ese.

R⇢Z(espace des observables) : zone de rejetour´egion critique.

Exemple1

R= #(Zb ) 12 >t0 , #(Zb ) =#bnmv exemple= 0,6 o`u t0 est un seuil `a choisir...Comment ?

1. l´eger abus de notation...

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Erreur de d´ecision

Lorsque l’on prend la d´ecision', on peut se tromper de deux mani`eres:

RejeterH0 ('= 1) alors que #= 1 2 ou encore

AccepterH0 ('= 0) alors que #6= 1 2. Erreur de premi`ere esp`ece(=rejeter `a tort)

P101 2

⇥'= 1⇤

Erreur de seconde esp`ece (=accepter `a tort) P10#

⇥'= 0⇤

, #6= 1

2 .

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Conclusion provisoire

Un bon test 'doit garantir simultan´ementdes erreurs de premi`ere et seconde esp`ece petites.

Un test optimal existe-t-il ?

Si non, comment aborder la notion d’optimalit´e et comment construire un test optimal ?

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann

Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

D´efinition formelle

Situation :E = Z,Z,{P#,#2⇥} engendr´ee par l’observationZ.

Hypoth`ese nulle et alternative: ⇥0⇢⇥et⇥1 ⇢⇥ t.q.

0\⇥1=;. D´efinition (Test simple)

Un test (simple) de l’hypoth`ese nulle H0:#2⇥0 contre l’alternative H1 :#2⇥1 est une statistique'='(Z)2{0,1}. (Fonction d’)erreur de premi`ere esp`ece:

#2⇥0 P#⇥ '= 1⇤ (Fonction d’)erreur de seconde esp`ece

#2⇥1 P#

⇥'= 0⇤

= 1 puissance'(#).

(3)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Hypoth`ese simple contre alternative simple

Cas o`u⇥={#0,#1}avec#06=#1.

Existe-t-il un test'? optimal, au sens o`u :8' test simple, on asimultan´ement

P#0

⇥'?= 1⇤

P#0

⇥'= 1⇤ et

P#1

⇥'?= 0⇤

P#1

⇥'= 0⇤

?

Si P#0 etP#1 ne sont pas´etrang`eres(cf. Cours 6) un tel test '? ne peut pas exister.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Absence d’optimalit´e stricte

Equivalencetests simples!estimateurs#bde #via la repr´esentation:

#b=#01Rc +#11R!'= 1R. Fonction de risque

P(',#) =E#⇥ 1#b6=#

, #=#0,#1.

La fonction de perte`(#,b #) = 1#b6=# joue le mˆeme rˆole que la perte quadratique (#b #)2 dans le Cours 6.

Test optimal '? !estimateur optimal#? pour P.

Comme pour le cas du risque quadratique, d`es que P#0 et P#1 ne sont pas ´etrang`eres, un estimateur optimaln’existe pas(cf. Cours 6).

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Riposte : principe de Neyman

Ondisym´etrise les hypoth`eses H0 etH1 : H0 est

plus importante queH1 dans le sens suivant : on imposeune erreur de premi`ere esp`ece prescrite.

D´efinition

Pour↵2[0,1], un test '=' de l’hypoth`ese nulle H0:#2⇥0 contre une alternative H1 est de niveau ↵si

sup

#2⇥0

P#

⇥'= 1⇤

↵.

Un test de niveau↵ ne ditriensur l’erreur de seconde esp`ece (comportement sur l’alternative).

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Principe de Neyman (cont.)

Choix de ladisym´etrisation = choix de mod´elisation.

Principe de Neyman:↵2(0,1), parmi les test de niveau

↵, chercher celui (ou ceux) ayantune erreur de seconde esp`ece minimale.

D´efinition

Un test de niveau↵est dit Uniform´ement Plus Puissant(UPP) si son erreur de seconde esp`ece est minimale parmi celles des tests de niveau↵.

Pour le cas d’unehypoth`ese simplecontre unealternative simple, un test UPP existe.

(4)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Principe de construction

f(#,z) = ddPµ#(z), z 2Z, #=#0,#1, µ mesure dominante. L’EMV–si bien d´efini– s’´ecrit

#bnmv=#01{f(#1,Z)<f(#0,Z)}+#11{f(#0,Z)<f(#1,Z)}. On choisit une r´egion critiquede la forme

R(c) = f(#1,Z)>cf(#0,Z) , c >0 et on calibrec=c de sorte que

P#0

⇥Z 2R(c)⇤

=↵.

Le test ainsi construit (si cette ´equation admet une solution) est de niveau↵. On montrequ’il est UPP.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Lemme de Neyman-Pearson

Proposition

Soit↵2[0,1]. S’il existe c solution de P#0

⇥f(#1,Z)>cf(#0,Z)⇤

=↵

alors le test de r´egion critiqueR= f(#1,Z)>cf(#0,Z) est de niveau↵etUPPpour tester H0:#=#0 contre H1:#=#1.

SiU =f(#1,Z)/f(#0,Z) bien d´efinie etL(U)⌧dx (sous P#0), alorsP#0

⇥U>c

⇤=↵admet une solution.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Exemple de mise en oeuvre

On observe

Z = (X1, . . . ,Xn)⇠i.i.d.N(#,1).

Construction du test de N-P. de H0:#=#0 contre H1:#=#1, avec#0<#1.

Mesure dominante µn = mesure de Lebesgue surRn et f(#,Z) =(2⇡)1n/2exp 1

2 Xn i=1

Xi2+n#Xn n#2 2 . Rapport de vraisemblance

f(#1,Z)

f(#0,Z) = exp n(#1 #0)Xn n

2(#21 #20) .

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Exemple (cont.)

Zone de rejetdu test de N-P. : f(#1,Z)>cf(#0,Z)

= n(#1 #0)Xn n

2(#21 #20)>logc

= Xn > #0+#1

2 +n(#logc

0 #1) . Choix dec. On r´esout

P#0

⇥Xn> 12(#0+#1) +n(#log0 c#1)

=↵.

Approche standard: on raisonne sousP#0. On a Xn =#0+ 1

pn⇠n,#0,

o`u⇠n,#0 est une gaussienne standardN(0,1) sous P#0

mais pas sous une autre probabilit´eP# si#6=#0!

(5)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Exemple (fin)

R´esolution de P#0

⇥#0+ 1

pn⇠n,#0 > 1

2(#0+#1) + logc n(#0 #1)

⇤=↵.

Equivalent `aP#0

⇥⇠n#0 > p2n(#1 #0) +p1 n

logc

#0 #1

⇤=↵, soit

pn

2 (#1 #0) + 1 pn

logc

#0 #1 = 1(1 ↵), o`u (x) =Rx

1e u2/2pdu 2⇡. Conclusion

c= exp n(#1 #0)2

2 +p

n(#0 #1) 1(1 ↵)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test

Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Bilan provisoire

Si l’on acceptele principe de Neyman, on sait r´esoudre le probl`eme `a deux points.

Que faire si l’hypoth`ese nulleH0 ou l’alternative H1 sont composites?

On peut proposer des extensions si l’on dispose de structures particuli`eres sur la vraisemblance du mod`ele (Poly. Ch. 7.3, hors programme).

On sait direbeaucoup de chosesdans le cas gaussien.

Critique m´ethodologique de l’approche de Neyman notion dep-valeur.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Situation

Situation : on part d’une exp´erience statistique Z,Z,{P#,#2⇥} engendr´ee par l’observationZ. On souhaite tester :

H0 : #2⇥0 ⇢⇥ contre H1:#2⇥1

avec⇥0\⇥1=;.

Si ⇥0 ={#0}et⇥1={#1}, on a Neyman-Pearson.Et sinon ?

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Principe de construction

Trouver unestatistique libre sous l’hypoth`ese : toute quantit´e (Z)observable dont on connait la loi sous l’hypoth`ese, c’est-`a-dire la loi de (Z) sous P# avec

#2⇥0.

Onregarde si le comportement de (Z) esttypique d’un comportement sous l’hypoth`ese.

Si oui, onaccepte H0, si non onrejetteH0. On quantifieoui/non par le niveau ↵du test.

(6)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Exemple : test sur la variance

On observe Z = (Y1, . . . ,Yn),

Y1, . . . ,Yni.i.d.N(µ, 2) avec#= (µ, 2)2⇥=R⇥(0,+1).

Premier cas: on teste

H0: 2= 02 contre H1: 2> 02.

Sous l’hypoth`ese (c’est-`a-dire sous P# avec#= (µ, 0) et µ2R quelconque), on a

(n 1)sn2

02

2(n 1) avecsn2:=n11Pn

i=1(Yi Yn)2.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Test sur la variance (cont.)

Donc,sous l’hypoth`ese, le comportementtypique de (Z) = (n 1)sn2

02

est celui d’une variable al´eatoire de loi du 2 `an 1 degr´es de libert´e.

Soitq12↵,n 1>0 tel que siU⇠ 2(n 1), alors P⇥

U>q12↵,n 1

=↵.

Sous l’hypoth`ese (Z)=d U et donc la probabilit´e pour que (Z) d´epasse q12↵,n 1 est inf´erieure (´egale) `a↵ (comportement atypique si↵petit).

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Test sur la variance (cont.)

R`egle de d´ecision : On accepte l’hypoth`ese si (Z)q12↵,n 1. On la rejette sinon.

Par construction, on a untest de niveau↵.

On ne sait rien dire sur l’erreur de seconde esp`ece, mis `a part qu’elle est minimale parmi les tests de zone de rejet de la forme de { (Z)>c},c >0...

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Test sur la variance (fin)

Deuxi`eme cas :On teste

H0: 220 contre H1: 2> 20.

Pas de statistique libre ´evidente...Mais, pour 202, on a

P ⇥

(n 1)sn22

0 >q12↵,n 1

=P ⇥

(n 1)s2n2 > 202q12↵,n 1

P ⇥

(n 1)s2n2 >q12↵,n 1

=↵.

La mˆeme statistique de test convient pour contrˆoler l’erreur de premi`ere esp`ece que pour l’hypoh`ese nulle simple. On choisitici lamˆemer`egle de d´ecision.

(7)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales

Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation

Conclusion provisoire

Pour contruire un test de l’hypoth`ese H0:#2⇥0 contre H1:#2⇥1, on chercheune statistique libre sous

l’hypoth`ese et on rejette pour un seuil qui d´epend de la loi de la statistique sous H0, de sorte de fournir une zone de rejet maximale.

Le plus souvent, la statistique est obtenue via un estimateur. Sauf exception (comme la cas gaussien) une telle statistique est difficile `a trouver en g´en´eral.

Simplification cadre asymptotique (o`u la gaussianit´e r´eapparaˆıt le plus souvent...).

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Le test de Wald : hypoth`ese nulle simple

Situation la suite d’exp´eriences Zn,Zn,{Pn#,#2⇥} est engendr´ee par l’observationZn, #2⇥⇢R

Objectif: Tester

H0:#=#0 contre #6=#0. Hyopth`ese: on dispose d’un estimateur#bn

asymptotiquement normal

pn(#bn #)!d N 0,v(#)

en loi sousPn#,8#2⇥, o`u# v(#)>0 est continue.

Sous l’hypoth`ese (ici sousPn#0) on ala convergence pn#bn #0

q v(#bn)

d!N(0,1)

en loi sousPn#0.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Test de Wald (cont.)

Remarque q

v(#bn)$p

v(#0) ou d’autres choix encore...

On a aussi

Tn=n(#bn #0)2 v(#bn)

d! 2(1) sous Pn#0.

Soit q12↵,1>0 tel que siU ⇠ 2(1), on a P⇥

U >q12↵,1

=↵. On choisit la zone de rejet Rn,↵= Tn q12↵,1 .

Le test de zone de rejet Rn,↵ s’appelleTest de Wald de l’hypoth`ese simple #=#0 contre l’alternative#6=#0 bas´e sur #bn.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Propri´et´es du test de Wald

Proposition

Le test Wald de l’hypoth`ese simple#=#0 contre l’alternative

#6=#0 bas´e sur #bn est

asymptotiquementde niveau↵ : Pn#0

⇥Tn 2Rn,↵

⇤!↵.

convergent ou (consistant). Pour tout point #6=#0

Pn#

⇥Tn2/Rn,↵

!0.

(8)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Preuve

Test asymptotiquement de niveau ↵par construction.

Contrˆole de l’erreur de seconde esp`ece : Soit #6=#0. On a Tn=⇣p

n #bn # q

v(#bn) +p

n # #0 q

v(#bn)

2

=:Tn,1+Tn,2. On a Tn,1 d

!N(0,1) sousPn# et Tn,2 P

n#

!±1 car #6=#0

Donc Tn Pn#

!+1, d’o`u le r´esultat.

Remarque : si #6=#0 mais|# #0|.1/p n, le

raisonnement ne s’applique pas. R´esultatnon uniforme en le param`etre.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Test de Wald : hypoth`ese nulle composite

Mˆeme contexte : ⇥⇢Rd eton dispose d’un estimateur

#bn asymptotiquement normal :

pn #bn # d!N 0,V(#) o`uV(#) estd´efinie positiveet continue en#.

ButTester H0:#2⇥0 contreH1:#2/⇥0, o`u

0= #2⇥, g(#) = 0 et

g :Rd !Rm (md) est r´eguli`ere.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Test de Wald cont.

Hypoth`ese : la di↵´erentielle (de matriceJg(#)) deg est de rang maximal m en tout point de (l’int´erieur) de⇥0. Proposition

En tout point# de l’int´erieur de⇥0 (i.e.sous l’hypoth`ese), on a, en loi sousPn# :

png(#bn) d!N 0,Jg(#)V(#)Jg(#)T ,

Tn=ng(#bn)Tg(#bn) 1g(#bn) d! 2(m) o`u ⌃g(#) =Jg(#)V(#)Jg(#)T.

Preuve : m´ethode delta multidimensionnelle.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Test de Wald (fin)

Proposition

Sous les hypoth`eses pr´ec´edentes, le test de zone de rejet R= Tn q12↵,m

avecP⇥

U >q12↵,m

=↵ si U⇠ 2(m)est

Asymptotiquement de niveau↵en tout point# de (l’int´erieur) de⇥0 :

Pn#

⇥Tn2Rn,↵

!↵.

Convergent: pour tout #2/⇥0 on a Pn#

⇥Tn2/Rn,↵

⇤!0.

C’est lamˆeme preuve qu’en dimension 1.

(9)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Tests d’ad´equation

Situation On observe (pour simplifier) un n-´echantillon de loi F inconnu

X1, . . . ,Xni.i.d.F Objectif Tester

H0:F =F0 contre F 6=F0

o`u F0 distribution donn´ee. Par exemple :F0 gaussienne centr´ee r´eduite.

Il esttr`es facile de construire un test asymptotiquement de niveau↵.Il suffit de trouver une statistique (X1, . . . ,Xn) de loi connue sous l’hypoth`ese.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Test d’ad´equation : situation

Exemples : sous l’hypoth`ese

1(X1. . . ,Xn) =p

nXn ⇠N(0,1)

2(X1, . . . ,Xn) =p nXn

sn ⇠Student(n 1)

3(X1, . . . ,Xn) = (n 1)sn22(n 1).

Le probl`eme est que ces testsont une faible puissance: ils ne sont pas consistants.

Pas exemple, siF 6= gaussienne maisR

RxdF(x) = 0, R

Rx2dF(x) = 1, alors PF

1(X1, . . . ,Xn)x⇤

! Z x

1

e u2/2 du

p2⇡, x 2R. (r´esultats analogues pour 2 et 3).

La statistique de test i ne caract´erise pasla loiF0.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Test de Kolmogorov-Smirnov

Rappel Si la fonction de r´epartition F est continue, pnsup

x2R

Fbn(x) F(x) d!B o`u la loi deB ne d´epend pas deF.

Proposition (Test de Kolmogorov-Smirnov) Soit q1B tel queP⇥

B>q1B

=↵. Le test d´efini par la zone de rejet

Rn,↵= p nsup

x2R

Fbn(x) F0(x) q1B

estasymptotiquement de niveau↵ :PF0⇥bFn2Rn,↵

⇤!↵et consistant:

8F 6=F0:PF⇥bFn 2/Rn,↵

⇤!0.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Test du Chi-deux

X variablesqualitative: X 2{1, . . . ,d}. P⇥

X =`⇤

=p`, `= 1, . . .d. La loi deX est carat´eris´ee par p= (p1, . . . ,pd)T. Notation

Md = p= (p1, . . . ,pd)T, 0p`, Xd

`=1

p`= 1 . Objectifq2Md donn´ee. A partir d’unn-´echantillon

X1, . . . ,Xni.i.d.p, testerH0:p=qcontreH1:p6=q.

(10)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Construction

naturelle d’un test

Comparaison des fr´equences empiriques b

pn,`= 1 n

Xn i=1

1Xi=` proche de q`, `= 1, . . . ,d ? Loi des grands nombres :

b

pn,1, . . . ,bpn,d Pp

!(p1, . . . ,pd) =p.

Th´eor`eme central-limite ? Un(p) =p

n⇣bpn,1 p1

pp1 , . . . ,bpn,d pd

ppd

d

!? Composante par composante oui. Convergence globale plus d´elicate.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Statistique du Chi-deux

Proposition

Si les composantes depsont toute non-nulles On a laconvergence en loi sousPp

Un(p) d!N 0,V(p) avec V(p) =Idd pp pp T etpp= (p

p1, . . . ,p pd)T. De plus

kUn(p)k2=n Xd

`=1

(bpn,` p`)2 p`

d! 2(d 1).

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Preuve de la normalit´e asymptotique

Pour i= 1, . . . ,net 1`d, on pose Y`i = 1

pp`

1{Xi=`} p` .

Les vecteurs Yi = (Y1i, . . . ,Ydi) sontind´ependants et identiquement distribu´es et

Un(p) = 1 pn

Xn i=1

Yi, E⇥

Y`i

= 0,E⇥ (Y`i)2

= 1 p`,E⇥ Y`iY`i0

⇤= (p`p`0)1/2. On applique le TCL vectoriel.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Convergence de la norme au carr´e

On a doncUn(p) d!N 0,V(p) . On a aussi

kUn(p)k2 d! kN 0,V(p) k2

2 Rang V(p)

parCochran: V(p) =Idd pp pp T est la projection orthogonale survect{pp}? qui est de dimensiond 1.

(11)

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Test d’ad´equation du

2

distance du 2 :

2(p,q) = Xd

`=1

(p` q`)2 q`

.

Avec ces notationskUn(p)k2=n 2(bpn,p).

Proposition

Pourq2Md le test simple d´efini par la zone de rejet Rn,↵= n 2(bpn,q) q12↵,d 1 o`uP⇥

U>q12↵,d 1

=↵si U ⇠ 2(d 1)est

asymptotiquement de niveau↵ et consistantpour tester H0:p=q contre H1:p6=q.

MAP 433 : Introduction aux m´ethodes

statistiques.

Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation

Tests de Kolmogorov- Smirnov Tests du 2

Exemple de mise en oeuvre : exp´erience de Mendel

Soitd = 4 et

q=⇣ 9 16, 3

16, 3 16, 1

16

⌘ .

R´epartition observ´ee: n= 556 b

p556= 1

556(315,101,108,32).

Calcul de la statistique du 2

556⇥ 2(bp556,q) = 0,47.

On a q95%,3 = 0,7815.

Conclusion :Puisque 0,47<0,7815, on accepte l’hypoth`esep=qau niveau↵= 5%.

Références

Documents relatifs

[r]

sence d’un bruit, nous verrons dans le théorème 2, comment l’existence d’une telle statistique rend immédiate l’obtention d’une hypothèse ho moins favora- ble

Soit X 1 ,. n donn´ es et prennent au moins deux valeurs distinctes. de loi gaussienne centr´ ee et de variance σ ∗2. Montrer que l’on est ici dans le cadre d’un mod` ele

La règle de décision de ce test est simple, il suffit de vérifier que cette valeur t n’appartient pas au segment formé par les deux valeurs de la variable T de Student

Si on suppose que le caractère poids est distribué normalement et que les variances sont égales dans les deux populations, on peut effectuer un test de comparaison de deux

Pour le test de Wilcoxon, l'idée est de substituer à chaque valeur observée son numéro d'ordre croissant parmi l'ensemble des valeurs observées dans tous les échantillons,

Pour modifier la légende d'une case à cocher, faire un clic droit sur la case à cocher et choisir la commande modifier le texte dans le menu contextuel. Pour modifier une case à

ENGLISH TEST SIMPLE