TD Fonctions de densit´ e empiriques

(1)

Master 1 MIM TD Processus stochastiques

Universit´e d’Angers 2010-11

TD Fonctions de densit´ e empiriques

Exercice 1

Convergence p.s. de F_n

Soit (X_n) une suite de variables aléatoires i.i.d. et F la fonction de répartition de X₁. On considère la fonction de répartition empirique F_n définie par :

F_n(t) = 1 n

Pn

i=11_(X_i_≤t), t∈R 1. Quelle est la loi de nF_n(t) ? la loi limite de √

n(F_n(t)−F(t)) ?

2. CalculerE([Fn(t)−F(t)]²) et en d´eduire queFn(t) converge en moyenne quadratique vers F(t) lorsquen →+∞.

3. Montrer que cette convergence est aussi presque sˆure.

Exercice 2

Statistique d’ordre

Soient (Xn) des variables aléatoires i.i.d. de fonction de répartition F. On suppose queF admet une densitéf par rapport àµ, la mesure de Lebesgue.

On définit la statistique d’ordre (X₍₁₎, ..., X_(n)) où lesX_(i)sont les valeursX_i classées dans l’ordre croissant : X(i)∈ {X1, ..., Xn}, X₍₁₎ ≤...≤X_(n)

1. Calculer les fonctions de r´epartition des variables al´eatoires X₍₁₎ etX_(n).

2. Donner la loi du couple (X₍₁₎, X_(n)). Les variables X₍₁₎ et X_(n) sont-elles indépendantes ? 3. En déduire la loi de la statistique W =X_(n)−X₍₁₎ (appelée étendue).

4. Montrer que P(X_(k)< x) =Pn i=k

n i

F(x)ⁱ[1−F(x)]ⁿ⁻ⁱ. 5. Montrer que la fonction de densit´e deX_(k)v´erifief_k(x) = n ⁿ⁻¹_k−1

F(x)^k−1[1−F(x)]^n−kf(x).

On pourra calculer la probabilit´e dex < X_(k) < x+dx.X_(k)suit la loi beta I de param`etres k et n−k+ 1.

Exercice 3

Moment empirique Soit (X_i) une suite de v.a.r. i.i.d. dans L^p. 1. Justifier que m_r,n = 1

n Pn

i=1X_i^r converge p.s. vers m_r = E(X^r). Pr´eciser les conditions surr.

2. Montrer que

√n(m_r,n−m_r)

pm_2r−m²_r converge en loi vers la loi normale centrée réduite. Préciser les conditions surr.

1

(2)

Exercice 4

Moyenne et variance empirique

Soit (X_i) une suite de v.a.r. i.i.d. dans L², on note σ² =E(X²)−E(X)², sa variance. On pose :

X¯ = 1 n

n

X

i=1

X_i Σ² = 1 n

n

X

i=1

(X_i−E(X))² S² = 1 n

n

X

i=1

(X_i−¯(X))²

1. Montrer que ¯X converge p.s. vers E(X) (estimateur consistant) et que E( ¯X) = E(X) (estimateur sans biais).

2. Montrer que Σ² converge p.s. versσ² (estimateur consistant) et que E(Σ²) = σ² (estimateur sans biais). Qu’en est-il de S²?

3. On suppose que les (X_i) suivent une loi normaleN(m, σ²).

(a) Quelles sont les lois de ¯X et nΣ²/σ²?

(b) Montrer que ¯X et S² sont ind´ependants. On pourra utiliser le vecteur gaussien ( ¯X, X₁−X, ..., X¯ _n−X) et montrer que¯ cov( ¯X, X_i−X) = 0.¯

Remarque : On peut montrer la réciproque de la dernière question à l’aide de la fonction caractéristique.

Exercice 5

Quantile d’ordre p

On dit que Q_p est un quantile d’ordre p de la v.a.X si : P(X ≤Q_p)≥p et P(X ≥Q_p)≥1−p.

On considère une suite de v.a. iid (X_i) de fonction de répartition continueF et strictement croissante. On associe àF son inverse généraliséeF⁻¹ définie par :

∀p∈]0,1[, F⁻¹(p) =inf{x∈R, F(x)≥p}

On définit la statistique d’ordre (X₍₁₎, ..., X_(n)) où les X_(i) sont les valeurs X_i classées dans l’ordre croissant : X(i)∈ {X1, ..., Xn}, X₍₁₎ ≤...≤X_(n)

1. Justifier que Q_p,n=X_([np]+1) soit le quantile empirique d’ordre p.

2. Montrer l’unicit´e du quantile d’ordrep, Q_p.

3. Montrer que Q_p,n converge p.s. vers Q_p (utiliser le th´eor`eme de G.C.).

Remarque : On peut montrer que si la loi de X admet une densit´e strictement positive au voisinage de xp, alors p

(n)(Qp,n −xp) converge en loi vers la loi normale N(0, σ²_p) avec σ²_p =p(1−p)/f(x_p)².

Exercice 6

M´ediane

On dit que Q_1/2 est une m´ediane de la v.a. X si :

P(X ≤Q_1/2)≥1/2 et P(X ≥Q_1/2)≥1/2.

1. Montrer que la moyenne minimise l’´ecart L².

2. Montrez que si Q_1/2 est une médiane alors pour tout réel a, on a E(|X − Q_1/2|) ≤ E(|X−a|). Découper Ω suivant le signe deX−Q_1/2 etX−c puis écrire les inégalités.

3. Justifier la propriété analogue pour la médiane empirique Q_1/2,n. Qu’en déduit-on ? 2

(3)

Exercice 7

V´erifier que le seuil s (s > 1/2) du test de K.S. de niveau α vaut s= 1−p

α/2 pour n = 2.

Utiliser la loi uniforme.

Exercice 8

Loi uniforme

L’instruction rand(1,10) permet de générer n = 10 nombres pseudo-aléatoires de loi U, la loi uniforme sur [0,1]. Voici le résultat donné lors de l’appel de cette fonction :

0.2113249 0.7560439 0.0002211 0.3303271 0.6653811 0.6283918 0.8497452 0.6857310 0.8782165 0.0683740

1. Quelle est la fonction de répartition F de la loi U? Déterminer la fonction de répartition empiriqueF_n(t) associée aux observations et tracer F etF_n sur un même graphique.

2. On d´efinit :

D_n= sup_t∈_R |F(t)−F_n(t)|

Que pouvez-vous dire `a propos de la variable D_n? Pour les observations que nous avons, que vaut-elle ?

3. Construire le test de Kolmogorov-Smirnov de niveau 5% de l’hypoth`eseH₀ : ”les nombres sont ind´ependants et de loi U” contre H₁ : ”ils ne le sont pas”. On vous donne P(D₁₀ ≤ 0.4092)≈0.95, appliquez votre test aux observations.

Exercice 9

Loi normale Le logiciel R est-il bugg´e ? round(rnorm(10,2,3),2)

6.30 0.05 3.03 10.05 2.18 -3.12 2.87 0.49 3.88 5.04

Exercice 10

Google ! cherche à évaluer l’attirance des angevins vers son moteur de recherches. Son service marketing a comptabilisé, sur cent journées choisies au hasard, le nombre de connexions sur Google ! via Toulouse, dans le tableau suivant :

Milliers de connexions [3.9 ; 6.0[ [6.0 ; 7.6[ [7.6 ; 8.4[ [8.4 ; 10.0[ [10.0 ; 12.0[

Effectifs associ´es 4 35 37 21 3

Effectuer un test de Kolmogorov-Smirnov d’ad´equation de ces observations `a la loi N(8,1), avec un niveau de confiance de 95% puis de 99%.

3

(4)

Exercice 11

Test d’homogénéité de Kolmogorov-Smirnov

Soit (X₁, . . . , X_n) un n-´echantillon de fonction de r´epartitionF et soit (Y₁, . . . , Y_m) unm-

échantillon de fonction de répartitionG. On suppose que ces deux échantillons sont indépendants et que F etG sont continues.

On veut tester H₀ : F = G contre H₁ : F 6= G. Soient F_n et G_m les fonctions de répartition empirique associées à (X₁, . . . , X_n) et (Y₁, . . . , Y_m). Alors, sous H₀ :

r nm n+m sup

x∈R

|F_n(x)−G_m(x)|−→^L (P_t)0≤t≤1

où (P_t)0≤t≤1 est un pont brownien assimilé à la loi K₂ de Kolmogorov.

Les deux tableaux suivant repr´esentent le revenu net en milliards d’Euros pour l’ann´ee 2002 de vingt groupes fran¸cais et de vingt-quatre groupes allemands de l’industrie et des ser- vices.

Groupes Fran¸cais

1.6 5.6 -0.6 0.8 -5.0 0.1 2.9 3.7 3.9 1.1 Groupes Allemands

3.1 0.3 -1.4 0.4 2.3 0.2 1.5 4.8 0.6 1.0 1.5 5.5 Effectuer un test d’homogénéité de Kolmogorov-Smirnov sur ces observations.

Exercice 12

Le but de cet exercice est de proposer une méthode d’estimation non paramétrique de la densité d’un échantillon aléatoire. SoitX1, ..., Xnune suite de variables aléatoires indépendantes identiquement distribuées de loi absolument continue de densité f supposée de classe C². On pose

K(x) = 3

4(1−x²), et f_n,h(x) = 1 nh

Pn

i=1K x−X_i h

1. Calculer E[f_n,h], que peut-on dire de la convergence def_n,h? 2. On noteµ₂(K) = R

Rx²K(x)dx. Estimer en fonction deµ₂(K) le biais de l’estimateur f_n,h def.

3. Soit h= 1

pn, montrer que f_n,h converge vers f en norme infinie presque surement.

4. Estimer la variance de cet estimateur. En déduire l’erreur asymptotique quadratique intégrée (AMISE) :

(R

R|f_n,h(x)−f(x)|²dx)

pour le noyauK. En optimisant sur les deux premiers termes de cette quantité, en déduire le pas optimal et la valeur correspondante de l’AMISE. Faire de même pour un noyau quelconque. En déduire une propriété particulière de ce noyau.

4