ESTIMATION DE DENSIT´ ES

(1)

UNIVERSIT´E DE BORDEAUX MASTER 1, 2016/2017 OUTILS DE SIMULATION

ESTIMATION DE DENSIT´ ES

Soit X une variable aléatoire réelle continue de densité de probabilité f inconnue. On suppose que f est dérivable à dérivée continue bornée. On peut estimer la densitéf par l’estimateur de Parzen-Rosenblatt défini, pour toutx∈R, par

f_n(x) = 1 nh_n

n

X

k=1

K

x−X_k h_n

où (X₁, . . . , X_n) est un n-échantillon de même loi que X et K est une fonction positive bornée, appelée noyau, telle que

Z

R

K(x)dx= 1,

Z

R

xK(x)dx= 0,

Z

R

K(x)2

dx=ξ².

La fenêtre (h_n) est une suite déterministe, strictement positive et décroissante vers zéro, telle que nh_n tend vers l’infini. On utilisera dans toute la suiteh_n= 1/n^α avec α∈]0,1[.

La d´etermination du noyau n’est pas un point crucial. On peut utiliser le noyau gaussien K(x) = 1

σ√

2π exp

− x² 2σ²

avecσ >0. On peut aussi utiliser des noyaux `a support compact, en particulier les noyaux Uniforme, d’Epanechnikov, ou Quadratique, donn´es pour a >0,b >0 et c >0, par

K(x) = 1

2aI_|x|6a, K(x) = 3 4b

1−x²

b²

I_|x|6b, K(x) = 15 16c

1−x²

c² 2

I_|x|6c. On peut montrer la convergence presque sˆure

n→∞lim f_n(x) = f(x) p.s.

ainsi que la normalit´e asymptotique pour 1/5< α <1, pnh_n

f_n(x)−f(x) L

−→ N 0, ξ²f(x) .

Une autre stratégie pour estimer la densité f consiste à utiliser des estimateurs récursifs comme les estimateurs de Wolverton-Wagner-Yamato ou de Wegman-Davies, respective- ment définis, pour toutx∈R, par

fb_n(x) = 1 n

n

X

k=1

1 h_kK

x−Xk

h_k

, fe_n(x) = 1 nh^1/2n

n

X

k=1

1 h^1/2_k K

x−Xk

h_k

.

L’estimateur de Wegman-Davies partage les mêmes propriétes asymptotiques que celui de Parzen-Rosenblatt. Par contre, pour l’estimateur de Wolverton-Wagner-Yamato, on a la convergence p.s. ainsi que la normalité asymptotique pour 1/5< α <1,

pnh_n

fb_n−f(x) L

−→ N 0, ξ²

1 +αf(x) .

Créer un code Scilab permettant de visualiser les convergences presque sûres et les nor- malités asymptotiques de ces trois estimateurs de f. Utiliser les commandes tic, toc et timer afin de comparer les vitesses d’exécution et le temps CPU consommé de ces trois procédures d’estimation de f. Choisir plusieurs valeurs de la fenêtre αet préciser la procédure d’estimation qui vous semble la plus efficace.

1