Master 1 MIM TD Processus stochastiques
Universit´e d’Angers 2010-11
TD Fonctions de densit´ e empiriques
Exercice 1
Convergence p.s. de FnSoit (Xn) une suite de variables al´eatoires i.i.d. et F la fonction de r´epartition de X1. On consid`ere la fonction de r´epartition empirique Fn d´efinie par :
Fn(t) = 1 n
Pn
i=11(Xi≤t), t∈R 1. Quelle est la loi de nFn(t) ? la loi limite de √
n(Fn(t)−F(t)) ?
2. CalculerE([Fn(t)−F(t)]2) et en d´eduire queFn(t) converge en moyenne quadratique vers F(t) lorsquen →+∞.
3. Montrer que cette convergence est aussi presque sˆure.
Exercice 2
Statistique d’ordreSoient (Xn) des variables al´eatoires i.i.d. de fonction de r´epartition F. On suppose queF admet une densit´ef par rapport `aµ, la mesure de Lebesgue.
On d´efinit la statistique d’ordre (X(1), ..., X(n)) o`u lesX(i)sont les valeursXi class´ees dans l’ordre croissant : X(i)∈ {X1, ..., Xn}, X(1) ≤...≤X(n)
1. Calculer les fonctions de r´epartition des variables al´eatoires X(1) etX(n).
2. Donner la loi du couple (X(1), X(n)). Les variables X(1) et X(n) sont-elles ind´ependantes ? 3. En d´eduire la loi de la statistique W =X(n)−X(1) (appel´ee ´etendue).
4. Montrer que P(X(k)< x) =Pn i=k
n i
F(x)i[1−F(x)]n−i. 5. Montrer que la fonction de densit´e deX(k)v´erifiefk(x) = n n−1k−1
F(x)k−1[1−F(x)]n−kf(x).
On pourra calculer la probabilit´e dex < X(k) < x+dx.X(k)suit la loi beta I de param`etres k et n−k+ 1.
Exercice 3
Moment empirique Soit (Xi) une suite de v.a.r. i.i.d. dans Lp. 1. Justifier que mr,n = 1n Pn
i=1Xir converge p.s. vers mr = E(Xr). Pr´eciser les conditions surr.
2. Montrer que
√n(mr,n−mr)
pm2r−m2r converge en loi vers la loi normale centr´ee r´eduite. Pr´eciser les conditions surr.
1
Exercice 4
Moyenne et variance empiriqueSoit (Xi) une suite de v.a.r. i.i.d. dans L2, on note σ2 =E(X2)−E(X)2, sa variance. On pose :
X¯ = 1 n
n
X
i=1
Xi Σ2 = 1 n
n
X
i=1
(Xi−E(X))2 S2 = 1 n
n
X
i=1
(Xi−¯(X))2
1. Montrer que ¯X converge p.s. vers E(X) (estimateur consistant) et que E( ¯X) = E(X) (estimateur sans biais).
2. Montrer que Σ2 converge p.s. versσ2 (estimateur consistant) et que E(Σ2) = σ2 (estima- teur sans biais). Qu’en est-il de S2?
3. On suppose que les (Xi) suivent une loi normaleN(m, σ2).
(a) Quelles sont les lois de ¯X et nΣ2/σ2?
(b) Montrer que ¯X et S2 sont ind´ependants. On pourra utiliser le vecteur gaussien ( ¯X, X1−X, ..., X¯ n−X) et montrer que¯ cov( ¯X, Xi−X) = 0.¯
Remarque : On peut montrer la r´eciproque de la derni`ere question `a l’aide de la fonction caract´eristique.
Exercice 5
Quantile d’ordre pOn dit que Qp est un quantile d’ordre p de la v.a.X si : P(X ≤Qp)≥p et P(X ≥Qp)≥1−p.
On consid`ere une suite de v.a. iid (Xi) de fonction de r´epartition continueF et strictement croissante. On associe `aF son inverse g´en´eralis´eeF−1 d´efinie par :
∀p∈]0,1[, F−1(p) =inf{x∈R, F(x)≥p}
On d´efinit la statistique d’ordre (X(1), ..., X(n)) o`u les X(i) sont les valeurs Xi class´ees dans l’ordre croissant : X(i)∈ {X1, ..., Xn}, X(1) ≤...≤X(n)
1. Justifier que Qp,n=X([np]+1) soit le quantile empirique d’ordre p.
2. Montrer l’unicit´e du quantile d’ordrep, Qp.
3. Montrer que Qp,n converge p.s. vers Qp (utiliser le th´eor`eme de G.C.).
Remarque : On peut montrer que si la loi de X admet une densit´e strictement positive au voisinage de xp, alors p
(n)(Qp,n −xp) converge en loi vers la loi normale N(0, σ2p) avec σ2p =p(1−p)/f(xp)2.
Exercice 6
M´edianeOn dit que Q1/2 est une m´ediane de la v.a. X si :
P(X ≤Q1/2)≥1/2 et P(X ≥Q1/2)≥1/2.
1. Montrer que la moyenne minimise l’´ecart L2.
2. Montrez que si Q1/2 est une m´ediane alors pour tout r´eel a, on a E(|X − Q1/2|) ≤ E(|X−a|). D´ecouper Ω suivant le signe deX−Q1/2 etX−c puis ´ecrire les in´egalit´es.
3. Justifier la propri´et´e analogue pour la m´ediane empirique Q1/2,n. Qu’en d´eduit-on ? 2
Exercice 7
V´erifier que le seuil s (s > 1/2) du test de K.S. de niveau α vaut s= 1−pα/2 pour n = 2.
Utiliser la loi uniforme.
Exercice 8
Loi uniformeL’instruction rand(1,10) permet de g´en´erer n = 10 nombres pseudo-al´eatoires de loi U, la loi uniforme sur [0,1]. Voici le r´esultat donn´e lors de l’appel de cette fonction :
0.2113249 0.7560439 0.0002211 0.3303271 0.6653811 0.6283918 0.8497452 0.6857310 0.8782165 0.0683740
1. Quelle est la fonction de r´epartition F de la loi U? D´eterminer la fonction de r´epartition empiriqueFn(t) associ´ee aux observations et tracer F etFn sur un mˆeme graphique.
2. On d´efinit :
Dn= supt∈R |F(t)−Fn(t)|
Que pouvez-vous dire `a propos de la variable Dn? Pour les observations que nous avons, que vaut-elle ?
3. Construire le test de Kolmogorov-Smirnov de niveau 5% de l’hypoth`eseH0 : ”les nombres sont ind´ependants et de loi U” contre H1 : ”ils ne le sont pas”. On vous donne P(D10 ≤ 0.4092)≈0.95, appliquez votre test aux observations.
Exercice 9
Loi normale Le logiciel R est-il bugg´e ? round(rnorm(10,2,3),2)6.30 0.05 3.03 10.05 2.18 -3.12 2.87 0.49 3.88 5.04
Exercice 10
Google ! cherche `a ´evaluer l’attirance des angevins vers son moteur de recherches. Son service marketing a comptabilis´e, sur cent journ´ees choisies au hasard, le nombre de connexions sur Google ! via Toulouse, dans le tableau suivant :
Milliers de connexions [3.9 ; 6.0[ [6.0 ; 7.6[ [7.6 ; 8.4[ [8.4 ; 10.0[ [10.0 ; 12.0[
Effectifs associ´es 4 35 37 21 3
Effectuer un test de Kolmogorov-Smirnov d’ad´equation de ces observations `a la loi N(8,1), avec un niveau de confiance de 95% puis de 99%.
3
Exercice 11
Test d’homog´en´eit´e de Kolmogorov-SmirnovSoit (X1, . . . , Xn) un n-´echantillon de fonction de r´epartitionF et soit (Y1, . . . , Ym) unm-
´echantillon de fonction de r´epartitionG. On suppose que ces deux ´echantillons sont ind´ependants et que F etG sont continues.
On veut tester H0 : F = G contre H1 : F 6= G. Soient Fn et Gm les fonctions de r´epartition empirique associ´ees `a (X1, . . . , Xn) et (Y1, . . . , Ym). Alors, sous H0 :
r nm n+m sup
x∈R
|Fn(x)−Gm(x)|−→L (Pt)0≤t≤1
o`u (Pt)0≤t≤1 est un pont brownien assimil´e `a la loi K2 de Kolmogorov.
Les deux tableaux suivant repr´esentent le revenu net en milliards d’Euros pour l’ann´ee 2002 de vingt groupes fran¸cais et de vingt-quatre groupes allemands de l’industrie et des ser- vices.
Groupes Fran¸cais
1.6 5.6 -0.6 0.8 -5.0 0.1 2.9 3.7 3.9 1.1 Groupes Allemands
3.1 0.3 -1.4 0.4 2.3 0.2 1.5 4.8 0.6 1.0 1.5 5.5 Effectuer un test d’homog´en´eit´e de Kolmogorov-Smirnov sur ces observations.
Exercice 12
Le but de cet exercice est de proposer une m´ethode d’estimation non param´etrique de la densit´e d’un ´echantillon al´eatoire. SoitX1, ..., Xnune suite de variables al´eatoires ind´ependantes identiquement distribu´ees de loi absolument continue de densit´e f suppos´ee de classe C2. On pose
K(x) = 3
4(1−x2), et fn,h(x) = 1 nh
Pn
i=1K x−Xi h
1. Calculer E[fn,h], que peut-on dire de la convergence defn,h? 2. On noteµ2(K) = R
Rx2K(x)dx. Estimer en fonction deµ2(K) le biais de l’estimateur fn,h def.
3. Soit h= 1
pn, montrer que fn,h converge vers f en norme infinie presque surement.
4. Estimer la variance de cet estimateur. En d´eduire l’erreur asymptotique quadratique int´egr´ee (AMISE) :
(R
R|fn,h(x)−f(x)|2dx)
pour le noyauK. En optimisant sur les deux premiers termes de cette quantit´e, en d´eduire le pas optimal et la valeur correspondante de l’AMISE. Faire de mˆeme pour un noyau quelconque. En d´eduire une propri´et´e particuli`ere de ce noyau.
4