Mathématiques – M1 ESR 2019/2020 TP Modélisation Université Toulouse III - Paul Sabatier
TD n
o1 : Représentation graphique et analyse de lois de variables aléatoires et d’échantillons
Exercice 1. (Estimation de densité par un histogramme) On pose f (x) = 2x · 1
x∈[0,1]. 1. Tracer f et montrer que f est la densité d’une loi de probabilité.
On note (X
1, . . . , X
n) un échantillon de taille n de densité f. On fixe K ∈ N
∗et on définit
Z
k=
n
X
i=1
1
Xi∈]k−1K ,Kk]
, k = 1, . . . , K f ˆ
n(x) =
(
Kn
Z
k, si x ∈ ]
k−1K,
Kk] 0, sinon
g
K(x) =
( K R
k/K(k−1)/K
f (y) dy, si x ∈ ]
k−1K,
Kk]
0, sinon.
Alors ˆ f
nest l’estimateur de la densité donnée par l’histogramme avec K classes de l’échantillon (X
1, . . . , X
n).
2. Pour k ∈ {1, . . . , K}, donner la loi de Z
ket en déduire que E [Z
k] = n R
k/K(k−1)/K
f (y) dy et Var(Z
k) ≤ n R
k/K(k−1)/K
f (y) dy.
3. Montrer que E [k f ˆ
n− g
Kk
22] ≤
Kn, où kg − hk
2= q
R
10
(g(x) − h(x))
2dx.
4. En déduire que E [k f ˆ
n− g
Kk
2] ≤ q
K n
. 5. Montrer que kg
K− f k
2=
√13K2
. 6. En déduire que E [k f ˆ
n− f k
2] ≤
√13K2
+ q
Kn
.
7. Montrer que la quantité à droite de la dernière inégalité est minimisée pour K = h
3
q
4 3n i
ou K = h
3