• Aucun résultat trouvé

de variables al´eatoires distribu´ees comme une variable al´eatoireX dont la loi admet la densit´ef

N/A
N/A
Protected

Academic year: 2022

Partager "de variables al´eatoires distribu´ees comme une variable al´eatoireX dont la loi admet la densit´ef"

Copied!
4
0
0

Texte intégral

(1)

Universit´e de Strasbourg S´egolen Geffray

M1 - Magist`ere geffray@math.unistra.fr

Statistique Ann´ee 2018/2019

Sujet 9

• Rappels: Soit f une fonction de densit´e `a estimer. Soit (X1, ..., Xn) un ´echantillon i.i.d. de variables al´eatoires distribu´ees comme une variable al´eatoireX dont la loi admet la densit´ef(.) par rapport `a la mesure de Lebesgue sur R.

7→ L’estimateur `a noyau de la densit´e (obtenu par convolution avec un noyau) est d´efini pour x∈R par:

fbh(x) = 1 nh

n

X

i=1

K

Xi−x h

o`u la fenˆetre h > 0 est le param`etre de lissage et o`u K(.) est un noyau positif ie K : R → R est une fonction int´egrable telle que

Z

R

K(u)du= 1 et K(.)≥0.

• Impl´ementation au moyen du logiciel R:

La fonction kde du package ks d´etermine l’estimateur de la densit´e avec un noyau gaussien tronqu´e. Soient les conditions suivantes:

(A1): f est de carr´e int´egrable et deux fois diff´erentiable et sa d´eriv´ee seconde est continue born´ee et de carr´e int´egrable.

(A2): le noyauK :R→Rest tel que Z

R

K(x)2dx <∞,K est sym´etrique et admet un moment d’ordre 2, donc satisfait

Z

xK(x)dx= 0 et Z

x2K(x)dx <∞.

(A3): Les fenˆetres h = hn > 0 forment une suite telle que h n→∞→ 0 et nh n→∞→ ∞. Sous ces conditions, un ´equivalent asymptotique du MISE est:

AM ISE(fbh) =

R K(x)2dx nh + h4

4 Z

x2K(x)dx 2Z

f00(x)2dx.

La fenˆetre optimale est alors celle qui minimise le AMISE. Cela fournit:

hopt =

R K(x)2dx R x2K(x)dx2R

f00(x)2dx

!1/5

1 n1/5.

Comme f00 est inconnue, il faut l’estimer: c’est le principe duplug-in (injection). On estimef00 par un estimateur `a noyau avec une fenˆetre que l’on qualifie de “pilote” et dont le choix est loin d’ˆetre une question triviale. Notons que les probl`emes d’estimation de f et de f00 ne sont pas

´

equivalents... Le AMISE correspondant `a ce choix de fenˆetre est l’ordre de 1/4/5. La fonction kdedu package ks impl´emente ce choix de fenˆetre par d´efaut.

• Estimateur `a noyau beta: Supposons que la densit´ef est `a support compact, disons dans [0,1] sans perte de g´en´eralit´e. Dans ce cas, l’estimateur `a noyau est fortement biais´e au bord

1

(2)

du support. Pour rem´edier `a ces probl`emes de bord, Chen (1999) a introduit le noyau beta.

Rappelons que l’estimateur `a noyau s’´ecrit usuellement

fbh(x) = 1 n

n

X

i=1

Kx,h(Xi) o`u l’on note

Kx,h(Xi) = 1 hK

x−Xi h

pour une fenˆetre h >0 et pour un noyau K. Le noyau beta s’´ecrit, pour 0≤x, y,≤1, Kx,h(y) =fB(α1,h(x),α2,h(x)(y)

en notant fB(a,b)) poura, b >0 la densit´e de la loi Beta de 1`ere esp`ece et avec α1,h(x) = ρh(x) α2,h(x) = (1−x)/h x∈[0,2h[

α1,h(x) =x/h α2,h(x) = (1−x)/h x∈[2h,1−2]

α1,h(x) =x/h α2,h(x) =ρh(1−x) x∈]1−2h,1]

avec

ρh(x) = 2h2+ 5/2−(4h4+ 6h2 + 9/4−u2 −u/h)1/2.

Lorsque f admet une d´eriv´ee seconde continue, Chen (1999) a ´etabli que la fenˆetre qui fournit un AMISE optimal est en O

1 n2/5

et que le AMISE correspondant est alors enO 1

n4/5

. La fonction kde.boundarydu logiciel Rpermet de calculer l’estimateur `a noyau beta. Pour ef- fectuer les calculs avec le noyau pr´esent´e ci-dessus, choisir l’argumentboundary.kernel="beta".

Cette fonction utilise une fenˆetre calcul´ee d’apr`es la m´ethode du plug-in.

• Crit`eres objectifs:

Crit`eres ponctuels: pour un estimateur fbdef, le biais est ponctuellement donn´e par bf

f(x)b

=E h

f(x)b i

−f(x), la variance est ponctuellement donn´ee par

Var

f(x)b

=E

f(x)b −E h

fb(x) i2

,

et l’´ecart quadratique moyen est ponctuellement donn´e par Rf

fb(x)

=E

f(x)b −f(x)2 .

Crit`eres globaux: le carr´e du biais int´egr´e est donn´e par Z

E h

f(x)b i

−f(x)2

dx,

la variance int´egr´ee est donn´ee par Z

Var f(x)b

dx, 2

(3)

et l’´ecart quadratique moyen int´egr´e (MISE = Mean Integrated Squared Error) est donn´e par Z

E

f(x)b −f(x) 2

dx.

Exercice 1.

On note ϕ(m,σ2) la densit´e de la loi gaussienne de param`etresm ∈Retσ2 >0. Consid´erons les distributions suivantes:

• la loi uniforme sur [0,1],

• les lois B(1/2,1/2), B(2,2) et B(2,5) o`u B(a, b) d´esigne la loi Beta de 1`ere esp`ece de param`etre (a, b) pour a, b >0,

• la loi triangulaire de densit´e donn´ee pourx∈R par

g(x) =





4x si 0≤x <1/2, 4−4x si 1/2≤x <1,

0 sinon,

,

• on note ϕe(0,1) la restriction de ϕ(0,0.5) `a [0,1] puis l’on consid`ere la loi de densit´e d´efinie comme suit:

f(x) = ϕe(0,0.5)(x) R

−1ϕ(0,0.5)(u)du, x∈R,

• on note ϕe(0,1) la restriction de ϕ(0.2,0.5) `a [0,1] puis l’on consid`ere la loi de densit´e d´efinie comme suit:

f(x) = ϕe(0.2,0.5)(x) R2

−1ϕ(0.2,0.5)(u)du, x∈R,

• la loi de densit´e donn´ee par la fonction en escalier suivante:

f(x) =









1/2 si 0 ≤x <1/2, 2 si 1/2≤x <2/3, 5/4 si 2/3≤x≤1,

0 sinon,

• la loi dont la densit´e est la fonction lin´eaire par morceaux suivante:

f(x) =









10x si 0≤x <1/4, 4−6x si 1/4≤x <1/2, 2−2x si 1/2≤x≤1, 0 sinon,

• la loi dont la densit´e est donn´ee par la fonction d´efinie par morceaux comme suit:

f(x) =













64x2 si 0≤x <1/4, 6−12x si 1/4≤x <1/2, 4x−2 si 1/2≤x <3/4, 1/2 si 3/4≤x≤1, 0 sinon,

3

(4)

• la loi de densit´e:

f(x) =



 1

(1,0.4)(x) si 0 ≤x <1/2, 1

(0,0.4)(x) si 1/2≤x≤1, o`u c=

Z 1/2 0

ϕ(1,0.4)(u)du+ Z 1

1/2

ϕ(1,0.4)(u)du.

1. Simuler M ´echantillons de taille n suivant les distributions expos´ees ci-dessus pour dif- f´erentes valeurs den.

2. D´eterminer l’estimateur `a noyau de la densit´e avec le noyau gaussien (tronqu´e) et le noyau beta en utilisant la fenˆetre plug-in impl´ement´ee dans le logicielR.

3. Analyser le comportement des deux estimateurs `a noyau ainsi obtenus `a l’aide des crit`eres objectifs pr´ec´edemment pr´esent´es.

4

Références

Documents relatifs

Un usager se présente entre 7h00 et 7h30 à cet arrêt, l’heure d’arrivée étant une variable aléatoire uniforme sur cette période.. Trouver la probabilité qu’il doivent

La masse d’un pain fabriqu´ e par la machine peut ˆ etre mod´ elis´ ee par une variable al´ eatoire X suivant la loi normale d’esp´ erance µ = 400 et d’´ ecart-type σ =

D´ eterminer les estimateurs de la densit´ e par la m´ ethode de l’histogramme, de l’ASH et du polygˆ one des fr´ equences en utilisant diff´ erentes tailles de fenˆ etre (ou

D´ eterminer les estimateurs de la densit´ e par histogramme obtenus avec les diff´ erentes tailles de fenˆ etre propos´ ees dans les r` egles ci-dessus et par la m´ ethode de

On estime f 00 par un estimateur ` a noyau avec une fenˆ etre que l’on qualifie de “pilote” et dont le choix est loin d’ˆ etre une question triviale.. Notons que les probl`

On note X la variable al´ eatoire ´ egale au nombre de milliers de litres d’essence vendus par cette station service en une semaine... En utilisant l’interpr´ etation statistique

Le temps d’attente T ` a la caisse d’un parc d’attraction exprim´ e en minutes est une variable al´ eatoire suivant la loi exponentielle de param` etre 0,2.. Quel est le

A partir du th´ ` eor` eme de transfert, il est possible de d´ emontrer des r´ esultats concernant l’esp´ erance de variables al´ eatoires r´ eelles qui sont quasiment les mˆ