Estimation non paramétrique des ensembles de niveau de la fonction de régression

(1)

Estimation non paramétrique des ensembles de niveau de la fonction de régression

Thomas Laloë

Université Lyon I

04 Mai 2010

Neuvième Colloque JPS, Le Mont-Dore

(2)

Problème général

Fonction de densité ou de régressionr: Λ→R; EstimerL(t) ={x ∈Λ :r(x)>t};

Méthode plug-in, masse en excès, “cost-sensitive” ;

Applications en clustering, imagerie médicale, analyse spatiale, détection de flux, etc.

(3)

État de l’art

De nombreux résultats pour la fonction de densité ; Quelques résultats pour la fonction de régression ; Hypothèses sur la fonction de regression souvent contraignantes.

(4)

Cadre général

r(x) =E[Y|X =x]; (X,Y)∈Λ×R; Λ⊂R^d compact.

(5)

Différents critères d’erreur

Distance de Hausdorff : d_H(A,B) =max

sup

x∈A

d(x,B),sup

y∈B

d(y,A)

;

Distance de Hausdorff entre les frontières ; Différence symétrique.

(6)

Différence symétrique

(7)

Principe général

r_nestimateur convergent der; Méthode plug-in :

L_n(t) ={x ∈Λ :r_n(x)>t}.

(8)

Convergence

rnestimateur quelconque der; On suppose queλ({r =t}) =0 ; Théorème

Si

Ekr_n−rk_p →

n→∞0ou sup

Λ

|r_n−r| →

n→∞0p.s,

alors

Eλ

L(t)∆L_n(t)

n→∞→ 0.

(9)

Convergence

Estimateur à Noyaux :rn(x) =

n

P

i=1

YiKh(x−Xi)

n

P

i=1

K_h(x−X_i)

;

On suppose queλ({r =t}) =0;

Théorème

Si nh^d/logn→ ∞, alors Eλ

L(t)∆L_n(t)

n→∞→ 0.

(10)

Vitesse de convergence

SoitΘ⊂(0,sup_Λr)un intervalle ouvert ; On suppose

H1 Les fonctionsr etf sont deux fois continûment différentiables, et infΛf >0 ;

H2 Pour toutt ∈Θ,

{rinf=t}kOrk>0.

(11)

Vitesse de convergence

Théorème

Si h^d →0, nh^d/(logn)⁷→ ∞et nh^d+4log(n)→0, alors pour presque tout t ∈Θ, il existe deux constantes strictement positives C₁et C₂telles que

lim inf

n→∞

√

nh^dEλ(L_n(t)∆L(t))≥C₁(t),

et

lim sup

n→∞

√

nh^dEλ(L_n(t)∆L(t))≤C₂(t).

(12)

Difficultés liées a cet estimateur

Choix duhoptimal ;

Fléau de la dimension.

(13)

Application

Soitr : [−6.5,4.5]×[−6.5,4.5]→[−2,2]définie par r : (u,v)7→sin(u) +sin(v);

FIGURE:Représentation der(u,v) =sin(u) +sin(v)sur [−6.5,4.5]×[−6.5,4.5].

(14)

Illustration

SoitX un couple aléatoire sur[−6.5,4.5]×[−6.5,4.5]de loi binormale centrée en(−1,−1), et de matrice de covariance 6∗Id;

Soit

(X₁,Y₁), . . . ,(X_n,Y_n)

un échantillon i.i.d. avec Yi =r(Xi) +ε_i, oùε_i ∼ N(0,0.01);

On estimeL(t)pour différentes valeurs denett.

(15)

Application

Différences symétriques pourn=500,2500,7500, t =0.5,1,1.5 :

(16)

Perspectives

Vitesse exacte

Application sur des données réelles Cadre fonctionnel ?