• Aucun résultat trouvé

Estimation par tests robustes.

N/A
N/A
Protected

Academic year: 2022

Partager "Estimation par tests robustes."

Copied!
19
0
0

Texte intégral

(1)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Estimation par tests robustes.

Mathieu Sart

Universit´e de Nice Sophia Antipolis

April 17, 2012

(2)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Probl` eme statistique

I On observe (X1, . . . ,Xn) unn-´echantillon admettant la densit´ef par rapport `a Lebesgue.

I On utilise comme mod`ele statistique le mod`ele param´etrique de toutes les lois uniformes sur [0, θ].

I C’est `a dire, que l’on d´efinit

F ={θ−11[0,θ], θ∈]0,1]}

et que l’on cherche un estimateur ˆf `a valeurs dansF ”proche”

de f.

I On d´efinit la distance de HellingerHpar H2(f,g) = 1

2 Z

R

pf(x)−p g(x)2

dx

et on d´efinit le risque de ˆf parEf

h

H2(ˆf,f)i .

(3)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Probl` eme statistique

I On observe (X1, . . . ,Xn) unn-´echantillon admettant la densit´ef par rapport `a Lebesgue.

I On utilise comme mod`ele statistique le mod`ele param´etrique de toutes les lois uniformes sur [0, θ].

I C’est `a dire, que l’on d´efinit

F ={θ−11[0,θ], θ∈]0,1]}

et que l’on cherche un estimateur ˆf `a valeurs dansF ”proche”

de f.

I On d´efinit la distance de HellingerHpar H2(f,g) =1

2 Z

R

pf(x)−p g(x)2

dx

et on d´efinit le risque de ˆf parEf

h

H2(ˆf,f)i .

(4)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

EMV.

I Sif =θ−11[0,θ], l’EMV de θestX(n)= max1≤i≤nXi. On estime doncf par ˆf =X(n)−11[0,X(n)].

I On peut alors montrer que

∀f ∈F, Ef

hH2(ˆf,f)i

= 1

2n+ 1.

I Que se passe-t-il si f 6∈F, mais f ”proche” deF ?

I On suppose que la densit´ef est f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

I f est proche de F: H2(f,101[0,1/10])≤5/(4n).

I Pourtant

Ef

h

H2(ˆf,f)i

>0.38

(5)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

EMV.

I Sif =θ−11[0,θ], l’EMV de θestX(n)= max1≤i≤nXi. On estime doncf par ˆf =X(n)−11[0,X(n)].

I On peut alors montrer que

∀f ∈F, Ef

hH2(ˆf,f)i

= 1

2n+ 1.

I Que se passe-t-il si f 6∈F, mais f ”proche” deF ?

I On suppose que la densit´ef est f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

I f est proche de F: H2(f,101[0,1/10])≤5/(4n).

I Pourtant

Ef

h

H2(ˆf,f)i

>0.38

(6)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

EMV.

I Sif =θ−11[0,θ], l’EMV de θestX(n)= max1≤i≤nXi. On estime doncf par ˆf =X(n)−11[0,X(n)].

I On peut alors montrer que

∀f ∈F, Ef

hH2(ˆf,f)i

= 1

2n+ 1.

I Que se passe-t-il si f 6∈F, mais f ”proche” deF ?

I On suppose que la densit´ef est f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

I f est proche de F: H2(f,101[0,1/10])≤5/(4n).

I Pourtant

Ef

h

H2(ˆf,f)i

>0.38

(7)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

EMV.

I Sif =θ−11[0,θ], l’EMV de θestX(n)= max1≤i≤nXi. On estime doncf par ˆf =X(n)−11[0,X(n)].

I On peut alors montrer que

∀f ∈F, Ef

hH2(ˆf,f)i

= 1

2n+ 1.

I Que se passe-t-il si f 6∈F, mais f ”proche” deF ?

I On suppose que la densit´ef est f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

I f est proche de F: H2(f,101[0,1/10])≤5/(4n).

I Pourtant

Ef

h

H2(ˆf,f)i

>0.38

(8)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

EMV vs Tests robustes

I De mani`ere g´en´erale, l’EMV peut ˆetre tr`es mauvais dans certaines situations. Par exemple lorsque le mod`ele est l´eg`erement faux.

I Cela justifie de chercher des m´ethodes alternatives.

(9)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

D´ efinition d’un test.

Soientf1etf2deux densit´es. On noteT(f1,f2,X) un test `a valeurs dans{0,1}.

I T(f1,f2,X) = 1 signifie que l’on pr´ef`eref2`af1.

I T(f1,f2,X) = 0 signifie que l’on pr´ef`eref1`af2. Il v´erifie en outreT(f1,f2,X) = 1−T(f2,f1,X)

(10)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Choisir parmi un ensemble fini de points

SoitS un ensemble fini ou d´enombrable de densit´es.

But: choisir l’´el´ement deS le plus proche possible de la vraie densit´e.

(11)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

La proc´ edure.

I SoitS un ensemble fini (ou d´enombrable).

I Pour toute densit´ef ∈S notons

Preferable(f) ={f0 ∈S\ {f},T(f,f0,X) = 1}

I D´efinissons

D(f) = sup

H2(f,f0),f0∈ Preferable(f) avec la convention D(f) = 0 si Preferable(f) =∅.

I UnT estimateur est ˆf ∈S tel que

D(ˆf) = inf{D(f), fdensit´e}.

(12)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Illustration pour notre probl` eme.

I Dans notre probl`eme, on souhaite trouver la fonction ˆf de F =

θ−11[0,θ],0< θ≤1 la plus proche possible def.

I Pour ce faire, on discr´etiseF, ce qui conduit `a un ensemble fini (ou d´enombrable)S.

I On s´electionne alors le meilleur ´el´ement deS par la proc´edure pr´ec´edente.

(13)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Illustration pour notre probl` eme.

I Dans notre probl`eme, on souhaite trouver la fonction ˆf de F =

θ−11[0,θ],0< θ≤1 la plus proche possible def.

I Pour ce faire, on discr´etiseF, ce qui conduit `a un ensemble fini (ou d´enombrable)S.

I On s´electionne alors le meilleur ´el´ement deS par la proc´edure pr´ec´edente.

(14)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Illustration pour notre probl` eme.

Proposition ([Birg´ e, 2006])

Soient X1, . . . ,Xn, n variables al´eatoires i.i.d de densit´e f . Il existe un estimateurˆf ∈F tel que

CEf

h

H2(f,ˆf)i

≤H2(f,F) +1 n o`u

F =

θ−11[0,θ],0< θ≤1 et H2(f,F) = inf

g∈FH2(f,g) et o`u C >0est une constante universelle.

I Sif ∈F on a bien une vitesse enn−1.

I Si par exemple ,

f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

on garde la vitesse enn−1.

(15)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Illustration pour notre probl` eme.

Proposition ([Birg´ e, 2006])

Soient X1, . . . ,Xn, n variables al´eatoires i.i.d de densit´e f . Il existe un estimateurˆf ∈F tel que

CEf

h

H2(f,ˆf)i

≤H2(f,F) +1 n o`u

F =

θ−11[0,θ],0< θ≤1 et H2(f,F) = inf

g∈FH2(f,g) et o`u C >0est une constante universelle.

I Sif ∈F on a bien une vitesse enn−1.

I Si par exemple ,

f = 10

(1−2n−1)1[0,1/10]+ 2n−11[9/10,1]

on garde la vitesse enn−1.

(16)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Vers un th´ eor` eme de s´ election de mod` ele.

Proposition

Soient X1, . . . ,Xn, n variables al´eatoires i.i.d de densit´e f , et soitV une collection d’espaces vectoriels de dimension finie deL2(R,dx).

Soit∆ une application positive surVtelle que X

VV

e−∆(V)≤1

Il existe un estimateurˆf tel que CEf

hH2(f,ˆf)i

≤ inf

V∈V

d2

f,V

+dimV + ∆(V) n

o`u C >0est une constante universelle et o`u d est la distance de L2(R, dx).

(17)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

R´ esultats

Cette m´ethode conduit `a un estimateur v´erifiant des in´egalit´es oracles tr`es g´en´erales. On peut en d´eduire des bornes de risques non

asymptotiques sous des hypoth`eses

I de r´egularit´e surf

I structurelles sur f

En outre, l’estimateur est adaptatif et robuste par rapport `a ces hypoth`eses.

(18)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Une m´ ethode souple.

Cette m´ethode peut ˆetre utilis´ee dans diff´erents probl`emes statistiques:

I Estimation d’une densit´e. [Birg´e, 2006] [Birg´e, 2008]

I Estimation de l’intensit´e d’un processus de Poisson.

[Birg´e, 2007] [Baraud, 2010]

I Estimation de l’intensit´e d’un processus de Poisson avec covariables. [Sart, 2012]

I Estimation de la moyenne de variables al´eatoires positives.

[Baraud, 2010]

I R´egression non gaussienne. [Birg´e, 2006] [Baraud, 2010]

I Estimation de la densit´e d’un processus d´eterminental.

[Baraud, 2012]

(19)

Estimation par tests robustes.

Mathieu Sart

Probl`eme statistique.

EMV Proc´edure esultat election de mod`eles

Exemple de esultat.

Bornes de risques.

Frameworks.

Baraud, Y. (2010).

Estimator selection with respect to hellinger-type risks.

Probability Theory and Related Fields, pages 1–49.

10.1007/s00440-010-0302-y.

Baraud, Y. (2012).

Estimation of the density of a determinantal process.

Birg´e, L. (2006).

Model selection via testing: an alternative to (penalized) maximum likelihood estimators.

Annales de l’Institut Henri Poincare (B) Probability and Statistics, 42(3):273 – 325.

Birg´e, L. (2007).

Model selection for poisson processes.

Lecture Notes-Monograph Series, 55:pp. 32–64.

Birg´e, L. (2008).

Model selection for density estimation withL2-loss.

ArXiv e-prints.

Sart, M. (2012).

Model selection for poisson processes with covariates.

Références

Documents relatifs

La diff´erence avec la m´ethode de l’´etat adjoint est que le calcul ci-dessus proc`ede dans le mˆeme sens que le probl`eme direct d’´evolution.. Le stockage des

Bien que la m´ ethode directe de Lyapunov soit ` a l’origine une m´ ethode d’ana- lyse de stabilit´ e, elle peut ˆ etre utilis´ ee pour d’autres probl` emes de contrˆ ole

– Les décisions vont être fondées sur des observations de variables d’intérêt dans cette

Il sera tenu compte dans la correction de la pr´ esentation et de la r´ edaction correcte des d´ emonstrations..

Il sera tenu compte dans la correction de la pr´ esentation et de la r´ edaction correcte des d´ emonstrations..

direct des objets par le juge sera donc de faire apparaître éventuellement des incohérences permettant ainsi de contester l’existence d’un classement (ou plus

Il peut arriver que la m´ethode des moments ne soit pas applicable, par exemple lorsque l’esp´e- rance math´ematique n’existe pas (voir exemple de la distribution de

Si T est inf´ erieur ` a la distance de K ` a la fronti` ere de Ω, la solution explicite donn´ ee par l’exercice pr´ ec´ edent est aussi solution de l’´ equation des ondes dans