Estimation adaptative par noyaux d´eform´es.

(1)

Introduction

Cadre g én éral Estimateurs à noyaux

Estimateur avec fen ˆetre fix ´ee

D ´eformation Estimateur Risque

Adaptativit ´e

S élection de la fen être R ésultat principal CasF_Xinconnue

Illustrations

R ´egression Censure par intervalle

Conclusion R ´ef ´erences

E stimation adaptative par noyaux d´ eform´ es .

Ga ¨elle Chagny

Laboratoire Map5, UMR CNRS 8145, Universit ´e Paris Descartes

Colloque ”Jeunes Probabilistes et Statisticiens”, CIRM,

Lundi 16 avril 2012.

(2)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Plan

Introduction Cadre g én éral Estimateurs à noyaux Estimateur avec fen être fix ée

D ´eformation Estimateur Risque Adaptativit ´e

S élection de la fen être R ésultat principal Cas F X inconnue Illustrations

R ´egression

Censure par intervalle Conclusion

R ´ef ´erences

(3)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Cadre statistique

Estimation non param ´etrique

I Mod èle : (X , Y ) couple de variables al éatoires r éelles, de support A × B ⊂ R ² .

I

X variable de support A ⊂ R densit ´e : f X

fonction de r ´epartition : F X .

I Objectif : Reconstruire une fonction s, li ´ee aux variables (X , Y ) avec un estimateur `a noyau.

I Observations : (X i , Y i ) i ∈{ 1 ,..., n } (n ∈ N \{0}), i.i.d de m ˆeme loi

que (X, Y ).

(4)

Exemples ´etudi ´es

Exemples (X , Y ) s Hypoth `eses

Ex1 Y = s(X) + ε s ε ∈ L ² ( P ), E [ε] = 0

R ´egression additive ε y X

Ex2 Y = σ(X )ε σ ² ε ∈ L ⁴ ( P ), E [ε] = 0

R ´egression multiplicative E [ε ² ] = 1, ε y X

Ex3 (X , Y = 1 Z ≤ X ) F Z Z, X ≥ 0

Censure par intervalle Z y X

Ex4 (X = Z ∧ C, Y = 1 _Z _≤ _C ) ₁ ₋ ^f

^Z

_F

Z

Z, C ≥ 0

Censure droite F Z < 1, Z y C

(5)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

M ´ethode : Estimateurs `a noyaux

I Noyau : K : R → R , fonction int ´egrable, tq R

R K (x)dx = 1.

I Approximation de l’unit ´e :

I

H ⊂ R ^∗ + (fen ˆetres), et

∀ h ∈ H, K h : x 7→ ¹ h K

_x h

I

Propri ét é : si s est suffisamment r éguli ère, K h ∗ s =

Z

R

K h (. − x ) s ( x ) dx −→

h → 0 s en un certain sens.

I Principe de l’estimation d’une fonction s avec des noyaux :

I

Trouver ψ telle que, pour tout h ∈ H , E [ψ(( X , Y ), K h )] = K h ∗ s.

I

Proposer un estimateur de type ”moment” pour s :

ˆ s h = ¹ n

n

X

i=1

ψ(( X i , Y i ), K h )

I

Choisir une ”bonne” fen ˆetre ˆ _h ∈ H sur la base des

observations

(6)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

M ´ethode : Estimateurs `a noyaux

Un exemple classique

I Ex1 : R ´egression additive, Y = s(X ) + ε

I Estimateur de Nadaraya-Watson (1964)

I

E [ YK h ( x − X )] = K h ∗ ( sf X )( x ) et E [ K h ( x − X )] = K h ∗ f X ( x ).

I

Id ´ee : s = ^sf ^X f X

≈ ^K ^h ∗ ( sf X ) K h ∗ f X

.

I

Estimateur :

ˆ s ^NW ( x ) = 1 n

n

X

i=1

Y i K h ( x − X i )

1 n

n

X

i=1

K h ( x − X i )

... probl `eme : quotient.

I ... de m ême dans les autres exemples étudi és : on ne peut

pas trouver ψ telle que E [ψ((X , Y ), K h )] = K h ∗ s.

(7)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Estimateur pour une fen ˆetre fix ´ee

M ´ethode de d ´eformation

I Point cl ´e : Il existe une fonction φ _X : A → φ _X (A ) bijective, telle que

E [θ(Y )K _h (u − φ _X (X )] = K _h ∗ (s ◦ φ ⁻ _X ¹ )(u), avec θ( Y ) =



 



 



Y (Ex1,3,4) Y ² (Ex2) I D ´eformation φ X :

I

φ X = F _X , fonction de r ´epartition de X pour Ex1, Ex2 (r ´egression) et Ex3 (censure par intervalle)

bijective si f X > 0 sur A.

I

φ X = φ : x 7→ R x

0 ( 1 − F X ( t )) dt, dans l’Ex4 (censure `a droite) bijective si F X ( x ) < 1 pour tout x ∈ R + .

I M ´ethode :

1. Estimer g = s ◦ φ ⁻¹ _X par un estimateur `a noyau ˆ g.

2. Poser

ˆ s =



 



 



g ˆ ◦ φ X si φ X est connue, g ˆ ◦ˆ φ X sinon.

I R ´ef ´erences : Yang (1981), Stute (1984,1986), Kerkyacharian et Picard

(2004)

(8)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Estimateur pour une fen ˆetre fix ´ee

Soit h ∈ H fen ˆetre fix ´ee.

1. Estimateur pour g = s ◦ φ ⁻ _X ¹ : φ X (A ) → R

∀u ∈ φ _X (A ), ˆ g _h (u) = 1 n

n

X

i = 1

θ(Y _i )K _h (u − φ _X (X _i )) . 2. Estimateur pour s : A → R

∀x ∈ A , ˆ s _h (x) = ˆ g _h ◦φ _X (x) = 1 n

n

X

i = 1

θ(Y _i )K _h (φ _X (x) − φ _X (X _i )) .

−→ estimateur simple (moyenne empirique), sans quotient.

(9)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Estimateur pour une fen ˆetre fix ´ee

Risque

I Risque quadratique int égr é pond ér é par φ ⁰ _X : E

h kˆ s h − sk ² _φ

⁰

X

i = Z

A

(ˆ s h (x) − s(x )) ² φ ⁰ _X (x )dx = E

h kˆ g h − gk ² i .

I D ´ecomposition biais-variance E

h kˆ s h − sk ² _φ

0 X

i = E

h kˆ g h − K h ∗ gk ² i

| {z } Variance

+ kK h ∗ g − gk ²

| {z } Biais

.

I Majoration du risque : si g est r éguli ère d’indice α (espaces de H ölder ou Nikol’skii), et si K est d’ordre suffisant,

E

h kˆ s h − sk ² _φ

⁰

X

i ≤ c(Y ₁ )kK k ² _L

₂

_(R) 1

nh + ch ² ^α .

avec c ( Y 1 ) = E [ Y ₁ ² ], (Ex1), E [ Y ₁ ⁴ ], (Ex2), 1 (Ex3 et 4).

→ pour h bien choisi, vitesse de convergence du risque

n ⁻

^2α+1^2α

.

(10)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

S ´election automatique de la fen ˆetre

M ´ethode de Goldenshluger-Lepski (2011)

1. Approximation du terme de variance

∀h ∈ H, V(h) = δ(1 + kK k ² _L

₁

₍

R ) ) kK k ²

L

²

(R)

nh .

2. Approximation du terme de biais

∀h ∈ H, A (h, φ _X ) = max

h

⁰

∈H

g ˆ _h

⁰

− g ˆ _h _, _h

⁰

2 − V (h ⁰ )

+

.

avec g ˆ _h _, _h

⁰

= K _h

⁰

∗ g ˆ _h .

I R `egle de s ´election : ˆ h ∈ argmin _h _∈H {A (h, φ X ) + V (h)}

I Estimateur :

I

pour g : _g ˆ _h _ˆ

I

pour s :

ˆ s h ˆ = ˆ g ˆ h ◦ φ _X

(11)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

R ´esultat principal

Borne non asymptotique pour le risque : r ´esultat adaptatif

Hypoth `eses

I s ∈ L ^∞ (A ).

I Collection H pas trop ”grosse”

I

H = { k ⁻¹ , k = 1 , . . . , [ √ n ]} ,

I

H = { 2 ^−k , k = 1 , . . . , [ log ₂ ( n )]} .

I hypoth `ese d’existence de moments pour le bruit ε dans les Ex1 et Ex2 (r ´egression)

• Th ´eor `eme

Il existe c i , i = 1, 2 et C des constantes, telles que

E

h kˆ s ˆ _h − sk ² _φ

0 X

i ≤ min

h ∈H

(

c 1 kK k ² _L

₂

₍

R )

1 nh + c 2 kK h ∗ g − gk ² )

+ C n •

→ pour g d’indice de r ´egularit ´e α, et K d’ordre suffisant, vitesse de

convergence du risque n ⁻

^2α+1^2α

.

(12)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Cas g ´en ´eral F _X inconnue

M ´ethode de plug-in

I Remplacer φ X par un estimateur, partout o `u elle intervient.

I Version empirique de φ X

I

Observations suppl émentaires : ( X − i ) _i ∈{ 1,...,n } , ind épendantes des ( X i ) i et de m ême loi.

I

Estimateur ˆ φ X de F X ou de φ :

F ˆ n = ¹ n

n

X

i=1

1 ]−∞;X

_−i

] , ˆ φ n ( x ) = Z x

0 ( 1 − _F ˆ

n ( t )) dt = ¹ n

n

X

i=1

X −i ∧ x .

I Estimateur pour g et pour s :

ˆ g ^ˆ ^φ _ˆ

h (u) = 1 n

n

X

i = 1

θ(Y i )K ˆ _h

u − ˆ φ n (X i )

ˆ s ˆ _h (x) = ˆ g _ˆ ^ˆ ^φ

h ◦ φ ˆ n (u).

−→ M êmes r ésultats th éoriques, avec un peu plus d’hypoth èses

(contrainte sur H, et hypoth `ese s ∈ C ¹ (A )).

(13)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations R ´egression Censure par intervalle

Conclusion R ´ef ´erences

Simulations

1. Objectifs

I

Illustrer la m ´ethode,

I

Comparer des estimateurs de type ’noyaux d éform és’ aux estimateurs de type ’moindres carr és’ (en base

trigonom étrique, ou fond ée sur des polyn ômes par morceaux)

−→ toolbox Matlab FY3P de Y. Rozenholc) 2. Fen ˆetres et noyaux

I

Fen ˆetres : H _n = { k ⁻¹ , k = 1 , . . . , [ √ n ]} ,

I

Noyau : gaussien

−→ noyau d’ordre 1 = ⇒ Polyn ˆomes par morceaux de degr ´e au plus 1.

3. Exemples :

I

en r ´egression additive (Baraud (2002))

I

en censure par intervalle (Brunel et Comte (2009)).

(14)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Simulations : Ex1 R ´egression additive

(X, Y) tels que Y = s(X) + ε, s(x) = x(x − 1)(x − 0.6).

Observations : X ∼ U _[0;1] , ε ∼ N( 0 , 0 . 006 ) , n = 1000.

Comparaison des risques ( × 10

³

)

n=60 200 500 2000 M ´ethode

0.3747 0.1279 0.0604 0.0324 ND

0.5222 0.447 0.5846 0.6469 MCT

0.3772 0.1283 0.0802 0.0666 MCP1

0.3892 0.1293 0.0681 0.0446 MCP2

(15)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Simulations : Ex1 R ´egression additive

(X, Y) tels que Y = s(X) + ε, s(x) = cos(4πx) + exp(−x ² ).

Observations : X ∼ γ( 4 , 0 . 8 ) , ε ∼ N ( 0 , 0 . 194 ) , n = 1000.

Comparaison des risques ( × 10

³

)

n=60 200 500 2000 M ´ethode

67.535 15.735 5.22 2.311 ND

14.177 13.374 13.579 13.149 MCT

41.261 13.34 4.808 3.727 MCP1

23.213 5.549 2.059 0.86 MCP2

(16)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Simulations : Ex1 R ´egression additive

(X, Y) tels que Y = s(X) + ε,

s(x) = − exp(−200(x − 0.1) ² ) − exp(−200(x − 0.9) ² ) + 1.

Observations : X ∼ 0 . 5 N( 0 . 05 , 0 . 01 ) + 0 . 5 N( 0 . 05 , 0 . 95 ) , ε ∼ N( 0 , 0 . 18 ) , n = 1000 .

Comparaison des risques ( × 10

³

)

n=60 200 500 2000 M ´ethode

120.367 36.804 9.737 3.22 ND

9.701 12.174 31.112 78.242 MCT

61.715 26.986 15.08 8.284 MCP1

52.668 11.009 5.817 1.215 MCP2

(17)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Simulations : Ex4 Censure par intervalle, Cas I

(X, Y = 1 _Z≤X ), estimation de F Z

Observations : X ∼ E( 0 . 1 ) , Z ∼ γ( 4 , 3 ) , n = 1000.

Comparaison des risques ( × 10

²

)

n=60 200 500 2000 M ´ethode

15.125 4.432 2.428 1.544 ND

25.383 21.553 2.536 1.733 MCT

28.452 14.315 8.815 7.158 MCP1

19.825 11.797 9.738 5.898 MCP2

(18)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion

R ´ef ´erences

Conclusion

−→ Noyaux d éform és, s élection de la fen être par m éthode de Goldenshluger-Lepski :

I Avantages de la m ´ethode

I

r ésolution de probl èmes vari és d’estimation non param étrique (r égression, estimation pour des donn ées censur ées),

I

extension `a l’estimation de fonctions de 2 variables : densit ´e conditionnelle d’un couple ( X , Y ) ,

I

estimateurs ayant une expression simple, sans quotient donc facilement impl émentables, avec une seule fen être à s électionner,

I

estimateurs `a noyaux adaptatifs, satisfaisants des bornes de risque non asymptotique.

I Inconv ´enients

I

hypoth èse de r égularit é portant sur la fonction auxiliaire g et non sur la fonction cible s pour la majoration du biais.

I

substitution de φ ˆ n `a φ X naturelle, mais n ´ecessitant des calculs

techniques.

(19)

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion

R ´ef ´erences

I Baraud, Y. Model selection for regression on a random design.

ESAIM Probab. Statist. 6 (2002), 127–146.

I Brunel, E. ; Comte, F. Cumulative distribution function estimation under interval censoring case 1. Electron. J. Stat. 3 (2009), 1–24.

I Goldenshluger, A. ; Lepski, O. Bandwidth selection in kernel density estimation : oracle inequalities and adaptive minimax optimality. Ann. Statist., 39 (2011), no. 3, 1608-1632.

I Kerkyacharian, G. ; Picard, D. Regression in random design and warped wavelets. Bernoulli 10 (2004), no. 6, 1053–1105.

I Stute, W. Asymptotic normality of nearest neighbor regression function estimates. Ann. Statist., 12 (1984), no. 3, 917–926.

I Rozenholc, Y., Toolbox Matlab FY3P : Penalized Piecewise Polynomials for Regression (v002).

M erci !

Estimation adaptative par noyaux d´eform´es.

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

E stimation adaptative par noyaux d´ eform´ es .

Ga ¨elle Chagny

Laboratoire Map5, UMR CNRS 8145, Universit ´e Paris Descartes

Colloque ”Jeunes Probabilistes et Statisticiens”, CIRM,

Lundi 16 avril 2012.

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Plan

Introduction Cadre g én éral Estimateurs à noyaux Estimateur avec fen être fix ée

D ´eformation Estimateur Risque Adaptativit ´e

S élection de la fen être R ésultat principal Cas F X inconnue Illustrations

R ´egression

Censure par intervalle Conclusion

R ´ef ´erences

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

Cadre statistique

Estimation non param ´etrique

I Mod èle : (X , Y ) couple de variables al éatoires r éelles, de support A × B ⊂ R 2 .

X variable de support A ⊂ R densit ´e : f X

fonction de r ´epartition : F X .

I Objectif : Reconstruire une fonction s, li ´ee aux variables (X , Y ) avec un estimateur `a noyau.

I Observations : (X i , Y i ) i ∈{ 1 ,..., n } (n ∈ N \{0}), i.i.d de m ˆeme loi

que (X, Y ).

Exemples ´etudi ´es

Exemples (X , Y ) s Hypoth `eses

Ex1 Y = s(X) + ε s ε ∈ L 2 ( P ), E [ε] = 0

R ´egression additive ε y X

Ex2 Y = σ(X )ε σ 2 ε ∈ L 4 ( P ), E [ε] = 0

R ´egression multiplicative E [ε 2 ] = 1, ε y X

Ex3 (X , Y = 1 Z ≤ X ) F Z Z, X ≥ 0

Censure par intervalle Z y X

Ex4 (X = Z ∧ C, Y = 1 Z ≤ C ) 1 − f

F

Z, C ≥ 0

Censure droite F Z < 1, Z y C

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

M ´ethode : Estimateurs `a noyaux

I Noyau : K : R → R , fonction int ´egrable, tq R

R K (x)dx = 1.

I Approximation de l’unit ´e :

H ⊂ R ∗ + (fen ˆetres), et

∀ h ∈ H, K h : x 7→ 1 h K

x h

Propri ét é : si s est suffisamment r éguli ère, K h ∗ s =

Z

R

K h (. − x ) s ( x ) dx −→

h → 0 s en un certain sens.

I Principe de l’estimation d’une fonction s avec des noyaux :

Trouver ψ telle que, pour tout h ∈ H , E [ψ(( X , Y ), K h )] = K h ∗ s.

Proposer un estimateur de type ”moment” pour s :

ˆ s h = 1 n

n

X

i=1

ψ(( X i , Y i ), K h )

Choisir une ”bonne” fen ˆetre ˆ h ∈ H sur la base des

observations

Introduction

Estimateur avec fen ˆetre fix ´ee

Adaptativit ´e

Illustrations

Conclusion R ´ef ´erences

I Mod èle : (X , Y ) couple de variables al éatoires r éelles, de support A × B ⊂ R ² .

Ex1 Y = s(X) + ε s ε ∈ L ² ( P ), E [ε] = 0

Ex2 Y = σ(X )ε σ ² ε ∈ L ⁴ ( P ), E [ε] = 0

R ´egression multiplicative E [ε ² ] = 1, ε y X

Ex4 (X = Z ∧ C, Y = 1 _Z _≤ _C ) ₁ ₋ ^f

_F

H ⊂ R ^∗ + (fen ˆetres), et

∀ h ∈ H, K h : x 7→ ¹ h K

_x h

ˆ s h = ¹ n

Choisir une ”bonne” fen ˆetre ˆ _h ∈ H sur la base des

Id ´ee : s = ^sf ^X f X

≈ ^K ^h ∗ ( sf X ) K h ∗ f X

ˆ s ^NW ( x ) = 1 n

I Point cl ´e : Il existe une fonction φ _X : A → φ _X (A ) bijective, telle que

E [θ(Y )K _h (u − φ _X (X )] = K _h ∗ (s ◦ φ ⁻ _X ¹ )(u), avec θ( Y ) =

Y (Ex1,3,4) Y ² (Ex2) I D ´eformation φ X :

φ X = F _X , fonction de r ´epartition de X pour Ex1, Ex2 (r ´egression) et Ex3 (censure par intervalle)

1. Estimer g = s ◦ φ ⁻¹ _X par un estimateur `a noyau ˆ g.

1. Estimateur pour g = s ◦ φ ⁻ _X ¹ : φ X (A ) → R

∀u ∈ φ _X (A ), ˆ g _h (u) = 1 n

θ(Y _i )K _h (u − φ _X (X _i )) . 2. Estimateur pour s : A → R

∀x ∈ A , ˆ s _h (x) = ˆ g _h ◦φ _X (x) = 1 n