• Aucun résultat trouvé

Estimation non paramétrique des ensembles de niveau de la fonction de régression

N/A
N/A
Protected

Academic year: 2022

Partager "Estimation non paramétrique des ensembles de niveau de la fonction de régression"

Copied!
16
0
0

Texte intégral

(1)

Estimation non paramétrique des ensembles de niveau de la fonction de régression

Thomas Laloë

Université Lyon I

04 Mai 2010

Neuvième Colloque JPS, Le Mont-Dore

(2)

Problème général

Fonction de densité ou de régressionr: ΛR; EstimerL(t) ={x Λ :r(x)>t};

Méthode plug-in, masse en excès, “cost-sensitive” ;

Applications en clustering, imagerie médicale, analyse spatiale, détection de flux, etc.

(3)

État de l’art

De nombreux résultats pour la fonction de densité ; Quelques résultats pour la fonction de régression ; Hypothèses sur la fonction de regression souvent contraignantes.

(4)

Cadre général

r(x) =E[Y|X =x]; (X,Y)Λ×R; ΛRd compact.

(5)

Différents critères d’erreur

Distance de Hausdorff : dH(A,B) =max

sup

x∈A

d(x,B),sup

y∈B

d(y,A)

;

Distance de Hausdorff entre les frontières ; Différence symétrique.

(6)

Différence symétrique

(7)

Principe général

rnestimateur convergent der; Méthode plug-in :

Ln(t) ={x Λ :rn(x)>t}.

(8)

Convergence

rnestimateur quelconque der; On suppose queλ({r =t}) =0 ; Théorème

Si

Ekrn−rkp

n→∞0ou sup

Λ

|rn−r| →

n→∞0p.s,

alors

L(t)∆Ln(t)

n→∞→ 0.

(9)

Convergence

Estimateur à Noyaux :rn(x) =

n

P

i=1

YiKh(xXi)

n

P

i=1

Kh(xXi)

;

On suppose queλ({r =t}) =0;

Théorème

Si nhd/logn→ ∞, alors Eλ

L(t)∆Ln(t)

n→∞→ 0.

(10)

Vitesse de convergence

SoitΘ(0,supΛr)un intervalle ouvert ; On suppose

H1 Les fonctionsr etf sont deux fois continûment différentiables, et infΛf >0 ;

H2 Pour toutt Θ,

{rinf=t}kOrk>0.

(11)

Vitesse de convergence

Théorème

Si hd →0, nhd/(logn)7→ ∞et nhd+4log(n)→0, alors pour presque tout t ∈Θ, il existe deux constantes strictement positives C1et C2telles que

lim inf

n→∞

nhdEλ(Ln(t)∆L(t))≥C1(t),

et

lim sup

n→∞

nhdEλ(Ln(t)∆L(t))≤C2(t).

(12)

Difficultés liées a cet estimateur

Choix duhoptimal ;

Fléau de la dimension.

(13)

Application

Soitr : [−6.5,4.5]×[−6.5,4.5][−2,2]définie par r : (u,v)7→sin(u) +sin(v);

FIGURE:Représentation der(u,v) =sin(u) +sin(v)sur [−6.5,4.5]×[−6.5,4.5].

(14)

Illustration

SoitX un couple aléatoire sur[−6.5,4.5]×[−6.5,4.5]de loi binormale centrée en(−1,−1), et de matrice de covariance 6Id;

Soit

(X1,Y1), . . . ,(Xn,Yn)

un échantillon i.i.d. avec Yi =r(Xi) +εi, oùεi ∼ N(0,0.01);

On estimeL(t)pour différentes valeurs denett.

(15)

Application

Différences symétriques pourn=500,2500,7500, t =0.5,1,1.5 :

(16)

Perspectives

Vitesse exacte

Application sur des données réelles Cadre fonctionnel ?

Références

Documents relatifs

Dans la section 3, en supposant que le processus sous-jacent est un processus de Poisson non homogène à intensité multiplicative, nous donnons une écriture

Dans ce programme la variable M désigne le nombre de boules contenues dans l’urne (qui diminue qu fil de l’expérience...) donc à chaque tirage la propbabilité de tirer la boule

Even if this video does not have a direct link with the videos developing the seventh macro-topic (i.e. the Menaced Homeland topic), one can easily understand its ideological link

En s’int´eressant `a l’estimation d’une fonction de r´egression H¨old´erienne de r´egularit´e β ∈]1; 2[ avec le risque li´e `a la fonction de perte absolue, Galtchouk

Various classes of well known copulas are stable under the model (archimedean type and extreme value copulas), meaning that the role of the covariate acts in a simple and explicit

du XVI e siècles » dont l’Espagne a été un acteur déterminant → rôle pionnier des navigateurs, des décou- vreurs et des aventuriers italo-ibériques dans la découverte

[r]

In particular, Biau, Cadre and Pelletier (2007) use an estimator of the level sets of the density function to determine the number of clusters.. The same applications are possible