UNIVERSIT´E DE BORDEAUX MASTER 1, 2016/2017 OUTILS DE SIMULATION
ESTIMATION DE DENSIT´ ES
Soit X une variable al´eatoire r´eelle continue de densit´e de probabilit´e f inconnue. On suppose que f est d´erivable `a d´eriv´ee continue born´ee. On peut estimer la densit´ef par l’estimateur de Parzen-Rosenblatt d´efini, pour toutx∈R, par
fn(x) = 1 nhn
n
X
k=1
K
x−Xk hn
o`u (X1, . . . , Xn) est un n-´echantillon de mˆeme loi que X et K est une fonction positive born´ee, appel´ee noyau, telle que
Z
R
K(x)dx= 1,
Z
R
xK(x)dx= 0,
Z
R
K(x)2
dx=ξ2.
La fenˆetre (hn) est une suite d´eterministe, strictement positive et d´ecroissante vers z´ero, telle que nhn tend vers l’infini. On utilisera dans toute la suitehn= 1/nα avec α∈]0,1[.
La d´etermination du noyau n’est pas un point crucial. On peut utiliser le noyau gaussien K(x) = 1
σ√
2π exp
− x2 2σ2
avecσ >0. On peut aussi utiliser des noyaux `a support compact, en particulier les noyaux Uniforme, d’Epanechnikov, ou Quadratique, donn´es pour a >0,b >0 et c >0, par
K(x) = 1
2aI|x|6a, K(x) = 3 4b
1−x2
b2
I|x|6b, K(x) = 15 16c
1−x2
c2 2
I|x|6c. On peut montrer la convergence presque sˆure
n→∞lim fn(x) = f(x) p.s.
ainsi que la normalit´e asymptotique pour 1/5< α <1, pnhn
fn(x)−f(x) L
−→ N 0, ξ2f(x) .
Une autre strat´egie pour estimer la densit´e f consiste `a utiliser des estimateurs r´ecursifs comme les estimateurs de Wolverton-Wagner-Yamato ou de Wegman-Davies, respective- ment d´efinis, pour toutx∈R, par
fbn(x) = 1 n
n
X
k=1
1 hkK
x−Xk
hk
, fen(x) = 1 nh1/2n
n
X
k=1
1 h1/2k K
x−Xk
hk
.
L’estimateur de Wegman-Davies partage les mˆemes propri´etes asymptotiques que celui de Parzen-Rosenblatt. Par contre, pour l’estimateur de Wolverton-Wagner-Yamato, on a la convergence p.s. ainsi que la normalit´e asymptotique pour 1/5< α <1,
pnhn
fbn−f(x) L
−→ N 0, ξ2
1 +αf(x) .
Cr´eer un code Scilab permettant de visualiser les convergences presque sˆures et les nor- malit´es asymptotiques de ces trois estimateurs de f. Utiliser les commandes tic, toc et timer afin de comparer les vitesses d’ex´ecution et le temps CPU consomm´e de ces trois proc´edures d’estimation de f. Choisir plusieurs valeurs de la fenˆetre αet pr´eciser la proc´edure d’estimation qui vous semble la plus efficace.
1