MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
MAP 433 : Introduction aux m´ethodes statistiques. Cours 8
Marc Ho↵mann
4 avril 2014
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Aujourd’hui (et la semaine prochaine...)
1 Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson
2 Construction d’un test : hypoth`eses g´en´erales Retour sur un exemple
Principe de construction 3 Tests asymptotiques
4 Tests d’ad´equation
Tests de Kolmogorov-Smirnov Tests du 2
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Exemple introductif
On observe 10 lancers d’une pi`ece de monnaie et on obtient le r´esultat suivant :
(P,P,F,F,P,F,P,P,F,P).
La pi`ece est-elle ´equilibr´ee?
R´epondre `a cette question revient `aconstruire une proc´edure de d´ecision :
'='(P,P,F,F,P,F,P,P,F,P)
=
⇢ 0 on accepte l’hypoth`ese⌧la pi`ece est ´equilibr´ee 1 on rejettel’hypoth`ese⌧la pi`ece est ´equilibr´ee
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
R´esolution
On associe l’exp´erience statistique (par exemple) E10 = {0,1}10,parties de({0,1}10),{P10# ,#2[0,1]} , avec (P = 0,F = 1)
P10# = # 0(dx) + (1 #) 1(dx) ⌦10. Hypoth`ese nulle :⌧la pi`ece est ´equilibr´ee
H0:#= 1 2
Hypoth`ese alternative :⌧la pi`ece est truqu´ee H1:#6= 1
2
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
R´esolution (cont.)
On note Z l’observation.
Onconstruitune r`egle de d´ecision simple: '= 1
Z2R} =
⇢ 0 on accepte l’hypoth`ese 1 on rejette l’hypoth`ese.
R⇢Z(espace des observables) : zone de rejetour´egion critique.
Exemple1
R= #(Zb ) 12 >t0 , #(Zb ) =#bnmv exemple= 0,6 o`u t0 est un seuil `a choisir...Comment ?
1. l´eger abus de notation...
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Erreur de d´ecision
Lorsque l’on prend la d´ecision', on peut se tromper de deux mani`eres:
RejeterH0 ('= 1) alors que #= 1 2 ou encore
AccepterH0 ('= 0) alors que #6= 1 2. Erreur de premi`ere esp`ece(=rejeter `a tort)
P101 2
⇥'= 1⇤
Erreur de seconde esp`ece (=accepter `a tort) P10#
⇥'= 0⇤
, #6= 1
2 .
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Conclusion provisoire
Un ⌧bon test 'doit garantir simultan´ementdes erreurs de premi`ere et seconde esp`ece petites.
Un test optimal existe-t-il ?
Si non, comment aborder la notion d’optimalit´e et comment construire un test optimal ?
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann
Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
D´efinition formelle
Situation :E = Z,Z,{P#,#2⇥} engendr´ee par l’observationZ.
Hypoth`ese nulle et alternative: ⇥0⇢⇥et⇥1 ⇢⇥ t.q.
⇥0\⇥1=;. D´efinition (Test simple)
Un test (simple) de l’hypoth`ese nulle H0:#2⇥0 contre l’alternative H1 :#2⇥1 est une statistique'='(Z)2{0,1}. (Fonction d’)erreur de premi`ere esp`ece:
#2⇥0 P#⇥ '= 1⇤ (Fonction d’)erreur de seconde esp`ece
#2⇥1 P#
⇥'= 0⇤
= 1 puissance'(#).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Hypoth`ese simple contre alternative simple
Cas o`u⇥={#0,#1}avec#06=#1.
Existe-t-il un test'? optimal, au sens o`u :8' test simple, on asimultan´ement
P#0
⇥'?= 1⇤
P#0
⇥'= 1⇤ et
P#1
⇥'?= 0⇤
P#1
⇥'= 0⇤
?
Si P#0 etP#1 ne sont pas´etrang`eres(cf. Cours 6) un tel test '? ne peut pas exister.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Absence d’optimalit´e stricte
Equivalencetests simples!estimateurs#bde #via la repr´esentation:
#b=#01Rc +#11R!'= 1R. Fonction de risque
P(',#) =E#⇥ 1#b6=#⇤
, #=#0,#1.
La fonction de perte`(#,b #) = 1#b6=# joue le mˆeme rˆole que la perte quadratique (#b #)2 dans le Cours 6.
Test optimal '? !estimateur optimal#? pour P.
Comme pour le cas du risque quadratique, d`es que P#0 et P#1 ne sont pas ´etrang`eres, un estimateur optimaln’existe pas(cf. Cours 6).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Riposte : principe de Neyman
On⌧disym´etrise les hypoth`eses H0 etH1 : H0 est
⌧plus importante queH1 dans le sens suivant : on imposeune erreur de premi`ere esp`ece prescrite.
D´efinition
Pour↵2[0,1], un test '='↵ de l’hypoth`ese nulle H0:#2⇥0 contre une alternative H1 est de niveau ↵si
sup
#2⇥0
P#
⇥'↵= 1⇤
↵.
Un test de niveau↵ ne ditriensur l’erreur de seconde esp`ece (comportement sur l’alternative).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Principe de Neyman (cont.)
Choix de la⌧disym´etrisation = choix de mod´elisation.
Principe de Neyman:↵2(0,1), parmi les test de niveau
↵, chercher celui (ou ceux) ayantune erreur de seconde esp`ece minimale.
D´efinition
Un test de niveau↵est dit Uniform´ement Plus Puissant(UPP) si son erreur de seconde esp`ece est minimale parmi celles des tests de niveau↵.
Pour le cas d’unehypoth`ese simplecontre unealternative simple, un test UPP existe.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Principe de construction
f(#,z) = ddPµ#(z), z 2Z, #=#0,#1, µ mesure dominante. L’EMV–si bien d´efini– s’´ecrit
#bnmv=#01{f(#1,Z)<f(#0,Z)}+#11{f(#0,Z)<f(#1,Z)}. On choisit une r´egion critiquede la forme
R(c) = f(#1,Z)>cf(#0,Z) , c >0 et on calibrec=c↵ de sorte que
P#0
⇥Z 2R(c↵)⇤
=↵.
Le test ainsi construit (si cette ´equation admet une solution) est de niveau↵. On montrequ’il est UPP.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Lemme de Neyman-Pearson
Proposition
Soit↵2[0,1]. S’il existe c↵ solution de P#0
⇥f(#1,Z)>c↵f(#0,Z)⇤
=↵
alors le test de r´egion critiqueR↵= f(#1,Z)>c↵f(#0,Z) est de niveau↵etUPPpour tester H0:#=#0 contre H1:#=#1.
SiU =f(#1,Z)/f(#0,Z) bien d´efinie etL(U)⌧dx (sous P#0), alorsP#0
⇥U>c↵
⇤=↵admet une solution.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Exemple de mise en oeuvre
On observe
Z = (X1, . . . ,Xn)⇠i.i.d.N(#,1).
Construction du test de N-P. de H0:#=#0 contre H1:#=#1, avec#0<#1.
Mesure dominante µn = mesure de Lebesgue surRn et f(#,Z) =(2⇡)1n/2exp 1
2 Xn i=1
Xi2+n#Xn n#2 2 . Rapport de vraisemblance
f(#1,Z)
f(#0,Z) = exp n(#1 #0)Xn n
2(#21 #20) .
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Exemple (cont.)
Zone de rejetdu test de N-P. : f(#1,Z)>cf(#0,Z)
= n(#1 #0)Xn n
2(#21 #20)>logc
= Xn > #0+#1
2 +n(#logc
0 #1) . Choix dec. On r´esout
P#0
⇥Xn> 12(#0+#1) +n(#log0 c#1)⇤
=↵.
Approche standard: on raisonne sousP#0. On a Xn =#0+ 1
pn⇠n,#0,
o`u⇠n,#0 est une gaussienne standardN(0,1) sous P#0
mais pas sous une autre probabilit´eP# si#6=#0!
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Exemple (fin)
R´esolution de P#0
⇥#0+ 1
pn⇠n,#0 > 1
2(#0+#1) + logc n(#0 #1)
⇤=↵.
Equivalent `aP#0
⇥⇠n#0 > p2n(#1 #0) +p1 n
logc
#0 #1
⇤=↵, soit
pn
2 (#1 #0) + 1 pn
logc
#0 #1 = 1(1 ↵), o`u (x) =Rx
1e u2/2pdu 2⇡. Conclusion
c↵= exp n(#1 #0)2
2 +p
n(#0 #1) 1(1 ↵)
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test
Hypoth`ese simple contre alternative simple Lemme de Neyman-Pearson Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Bilan provisoire
Si l’on acceptele principe de Neyman, on sait r´esoudre le probl`eme `a deux points.
Que faire si l’hypoth`ese nulleH0 ou l’alternative H1 sont composites?
On peut proposer des extensions si l’on dispose de structures particuli`eres sur la vraisemblance du mod`ele (Poly. Ch. 7.3, hors programme).
On sait direbeaucoup de chosesdans le cas gaussien.
Critique m´ethodologique de l’approche de Neyman notion dep-valeur.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Situation
Situation : on part d’une exp´erience statistique Z,Z,{P#,#2⇥} engendr´ee par l’observationZ. On souhaite tester :
H0 : #2⇥0 ⇢⇥ contre H1:#2⇥1
avec⇥0\⇥1=;.
Si ⇥0 ={#0}et⇥1={#1}, on a Neyman-Pearson.Et sinon ?
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Principe de construction
⌧Trouver unestatistique libre sous l’hypoth`ese : toute quantit´e (Z)observable dont on connait la loi sous l’hypoth`ese, c’est-`a-dire la loi de (Z) sous P# avec
#2⇥0.
On⌧regarde si le comportement de (Z) esttypique d’un comportement sous l’hypoth`ese.
Si oui, onaccepte H0, si non onrejetteH0. On quantifie⌧oui/non par le niveau ↵du test.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Exemple : test sur la variance
On observe Z = (Y1, . . . ,Yn),
Y1, . . . ,Yn⇠i.i.d.N(µ, 2) avec#= (µ, 2)2⇥=R⇥(0,+1).
Premier cas: on teste
H0: 2= 02 contre H1: 2> 02.
Sous l’hypoth`ese (c’est-`a-dire sous P# avec#= (µ, 0) et µ2R quelconque), on a
(n 1)sn2
02
⇠ 2(n 1) avecsn2:=n11Pn
i=1(Yi Yn)2.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Test sur la variance (cont.)
Donc,sous l’hypoth`ese, le comportement⌧typique de (Z) = (n 1)sn2
02
est celui d’une variable al´eatoire de loi du 2 `an 1 degr´es de libert´e.
Soitq12↵,n 1>0 tel que siU⇠ 2(n 1), alors P⇥
U>q12↵,n 1⇤
=↵.
Sous l’hypoth`ese (Z)=d U et donc la probabilit´e pour que (Z) d´epasse q12↵,n 1 est inf´erieure (´egale) `a↵ (comportement atypique si↵petit).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Test sur la variance (cont.)
R`egle de d´ecision : On accepte l’hypoth`ese si (Z)q12↵,n 1. On la rejette sinon.
Par construction, on a untest de niveau↵.
On ne sait rien dire sur l’erreur de seconde esp`ece, mis `a part qu’elle est minimale parmi les tests de zone de rejet de la forme de { (Z)>c},c >0...
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Test sur la variance (fin)
Deuxi`eme cas :On teste
H0: 2 20 contre H1: 2> 20.
Pas de statistique libre ´evidente...Mais, pour 2 02, on a
P ⇥
(n 1)sn22
0 >q12↵,n 1⇤
=P ⇥
(n 1)s2n2 > 202q12↵,n 1⇤
P ⇥
(n 1)s2n2 >q12↵,n 1⇤
=↵.
La mˆeme statistique de test convient pour contrˆoler l’erreur de premi`ere esp`ece que pour l’hypoh`ese nulle simple. On choisitici lamˆemer`egle de d´ecision.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales
Retour sur un exemple Principe de construction Tests asymptotiques Tests d’ad´equation
Conclusion provisoire
Pour contruire un test de l’hypoth`ese H0:#2⇥0 contre H1:#2⇥1, on chercheune statistique libre sous
l’hypoth`ese et on rejette pour un seuil qui d´epend de la loi de la statistique sous H0, de sorte de fournir une zone de rejet maximale.
Le plus souvent, la statistique est obtenue via un estimateur. Sauf exception (comme la cas gaussien) une telle statistique est difficile `a trouver en g´en´eral.
Simplification cadre asymptotique (o`u la gaussianit´e r´eapparaˆıt le plus souvent...).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Le test de Wald : hypoth`ese nulle simple
Situation la suite d’exp´eriences Zn,Zn,{Pn#,#2⇥} est engendr´ee par l’observationZn, #2⇥⇢R
Objectif: Tester
H0:#=#0 contre #6=#0. Hyopth`ese: on dispose d’un estimateur#bn
asymptotiquement normal
pn(#bn #)!d N 0,v(#)
en loi sousPn#,8#2⇥, o`u# v(#)>0 est continue.
Sous l’hypoth`ese (ici sousPn#0) on ala convergence pn#bn #0
q v(#bn)
d!N(0,1)
en loi sousPn#0.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Test de Wald (cont.)
Remarque q
v(#bn)$p
v(#0) ou d’autres choix encore...
On a aussi
Tn=n(#bn #0)2 v(#bn)
d! 2(1) sous Pn#0.
Soit q12↵,1>0 tel que siU ⇠ 2(1), on a P⇥
U >q12↵,1⇤
=↵. On choisit la zone de rejet Rn,↵= Tn q12↵,1 .
Le test de zone de rejet Rn,↵ s’appelleTest de Wald de l’hypoth`ese simple #=#0 contre l’alternative#6=#0 bas´e sur #bn.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Propri´et´es du test de Wald
Proposition
Le test Wald de l’hypoth`ese simple#=#0 contre l’alternative
#6=#0 bas´e sur #bn est
asymptotiquementde niveau↵ : Pn#0
⇥Tn 2Rn,↵
⇤!↵.
convergent ou (consistant). Pour tout point #6=#0
Pn#
⇥Tn2/Rn,↵⇤
!0.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Preuve
Test asymptotiquement de niveau ↵par construction.
Contrˆole de l’erreur de seconde esp`ece : Soit #6=#0. On a Tn=⇣p
n #bn # q
v(#bn) +p
n # #0 q
v(#bn)
⌘2
=:Tn,1+Tn,2. On a Tn,1 d
!N(0,1) sousPn# et Tn,2 P
n#
!±1 car #6=#0
Donc Tn Pn#
!+1, d’o`u le r´esultat.
Remarque : si #6=#0 mais|# #0|.1/p n, le
raisonnement ne s’applique pas. R´esultatnon uniforme en le param`etre.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Test de Wald : hypoth`ese nulle composite
Mˆeme contexte : ⇥⇢Rd eton dispose d’un estimateur
#bn asymptotiquement normal :
pn #bn # d!N 0,V(#) o`uV(#) estd´efinie positiveet continue en#.
ButTester H0:#2⇥0 contreH1:#2/⇥0, o`u
⇥0= #2⇥, g(#) = 0 et
g :Rd !Rm (md) est r´eguli`ere.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Test de Wald cont.
Hypoth`ese : la di↵´erentielle (de matriceJg(#)) deg est de rang maximal m en tout point de (l’int´erieur) de⇥0. Proposition
En tout point# de l’int´erieur de⇥0 (i.e.sous l’hypoth`ese), on a, en loi sousPn# :
png(#bn) d!N 0,Jg(#)V(#)Jg(#)T ,
Tn=ng(#bn)T⌃g(#bn) 1g(#bn) d! 2(m) o`u ⌃g(#) =Jg(#)V(#)Jg(#)T.
Preuve : m´ethode ⌧delta multidimensionnelle.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Test de Wald (fin)
Proposition
Sous les hypoth`eses pr´ec´edentes, le test de zone de rejet R↵= Tn q12↵,m
avecP⇥
U >q12↵,m⇤
=↵ si U⇠ 2(m)est
Asymptotiquement de niveau↵en tout point# de (l’int´erieur) de⇥0 :
Pn#
⇥Tn2Rn,↵⇤
!↵.
Convergent: pour tout #2/⇥0 on a Pn#
⇥Tn2/Rn,↵
⇤!0.
C’est la⌧mˆeme preuve qu’en dimension 1.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Tests d’ad´equation
Situation On observe (pour simplifier) un n-´echantillon de loi F inconnu
X1, . . . ,Xn ⇠i.i.d.F Objectif Tester
H0:F =F0 contre F 6=F0
o`u F0 distribution donn´ee. Par exemple :F0 gaussienne centr´ee r´eduite.
Il esttr`es facile de construire un test asymptotiquement de niveau↵.Il suffit de trouver une statistique (X1, . . . ,Xn) de loi connue sous l’hypoth`ese.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Test d’ad´equation : situation
Exemples : sous l’hypoth`ese
1(X1. . . ,Xn) =p
nXn ⇠N(0,1)
2(X1, . . . ,Xn) =p nXn
sn ⇠Student(n 1)
3(X1, . . . ,Xn) = (n 1)sn2 ⇠ 2(n 1).
Le probl`eme est que ces testsont une faible puissance: ils ne sont pas consistants.
Pas exemple, siF 6= gaussienne maisR
RxdF(x) = 0, R
Rx2dF(x) = 1, alors PF
⇥
1(X1, . . . ,Xn)x⇤
! Z x
1
e u2/2 du
p2⇡, x 2R. (r´esultats analogues pour 2 et 3).
La statistique de test i ne caract´erise pasla loiF0.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Test de Kolmogorov-Smirnov
Rappel Si la fonction de r´epartition F est continue, pnsup
x2R
Fbn(x) F(x) d!B o`u la loi deB ne d´epend pas deF.
Proposition (Test de Kolmogorov-Smirnov) Soit q1B ↵ tel queP⇥
B>q1B ↵⇤
=↵. Le test d´efini par la zone de rejet
Rn,↵= p nsup
x2R
Fbn(x) F0(x) q1B ↵
estasymptotiquement de niveau↵ :PF0⇥bFn2Rn,↵
⇤!↵et consistant:
8F 6=F0:PF⇥bFn 2/Rn,↵
⇤!0.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Test du Chi-deux
X variablesqualitative: X 2{1, . . . ,d}. P⇥
X =`⇤
=p`, `= 1, . . .d. La loi deX est carat´eris´ee par p= (p1, . . . ,pd)T. Notation
Md = p= (p1, . . . ,pd)T, 0p`, Xd
`=1
p`= 1 . Objectifq2Md donn´ee. A partir d’unn-´echantillon
X1, . . . ,Xn⇠i.i.d.p, testerH0:p=qcontreH1:p6=q.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Construction
⌧naturelle d’un test
Comparaison des fr´equences empiriques b
pn,`= 1 n
Xn i=1
1Xi=` proche de q`, `= 1, . . . ,d ? Loi des grands nombres :
b
pn,1, . . . ,bpn,d Pp
!(p1, . . . ,pd) =p.
Th´eor`eme central-limite ? Un(p) =p
n⇣bpn,1 p1
pp1 , . . . ,bpn,d pd
ppd
⌘ d
!? Composante par composante oui. Convergence globale plus d´elicate.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Statistique du Chi-deux
Proposition
Si les composantes depsont toute non-nulles On a laconvergence en loi sousPp
Un(p) d!N 0,V(p) avec V(p) =Idd pp pp T etpp= (p
p1, . . . ,p pd)T. De plus
kUn(p)k2=n Xd
`=1
(bpn,` p`)2 p`
d! 2(d 1).
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Preuve de la normalit´e asymptotique
Pour i= 1, . . . ,net 1`d, on pose Y`i = 1
pp`
1{Xi=`} p` .
Les vecteurs Yi = (Y1i, . . . ,Ydi) sontind´ependants et identiquement distribu´es et
Un(p) = 1 pn
Xn i=1
Yi, E⇥
Y`i⇤
= 0,E⇥ (Y`i)2⇤
= 1 p`,E⇥ Y`iY`i0
⇤= (p`p`0)1/2. On applique le TCL vectoriel.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Convergence de la norme au carr´e
On a doncUn(p) d!N 0,V(p) . On a aussi
kUn(p)k2 d! kN 0,V(p) k2
⇠ 2 Rang V(p)
parCochran: V(p) =Idd pp pp T est la projection orthogonale survect{pp}? qui est de dimensiond 1.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Test d’ad´equation du
2⌧distance du 2 :
2(p,q) = Xd
`=1
(p` q`)2 q`
.
Avec ces notationskUn(p)k2=n 2(bpn,p).
Proposition
Pourq2Md le test simple d´efini par la zone de rejet Rn,↵= n 2(bpn,q) q12↵,d 1 o`uP⇥
U>q12↵,d 1⇤
=↵si U ⇠ 2(d 1)est
asymptotiquement de niveau↵ et consistantpour tester H0:p=q contre H1:p6=q.
MAP 433 : Introduction aux m´ethodes
statistiques.
Cours 8 Marc Ho↵mann Notion de test et d’erreur de test Construction d’un test : hypoth`eses g´en´erales Tests asymptotiques Tests d’ad´equation
Tests de Kolmogorov- Smirnov Tests du 2
Exemple de mise en oeuvre : exp´erience de Mendel
Soitd = 4 et
q=⇣ 9 16, 3
16, 3 16, 1
16
⌘ .
R´epartition observ´ee: n= 556 b
p556= 1
556(315,101,108,32).
Calcul de la statistique du 2
556⇥ 2(bp556,q) = 0,47.
On a q95%,3 = 0,7815.
Conclusion :Puisque 0,47<0,7815, on accepte l’hypoth`esep=qau niveau↵= 5%.