LM 347 : Analyse de données L3 de Mathématiques
A. Dalalyan Année 2007-2008
E
XAMEN DU16
JUIN2008
(Durée 2h, les documents manuscrits sont autorisés)
Exercice 1. (4 points)
SoitXune variable aléatoire de loi normaleN(0,σ2).
1. Déterminer la loi deY=exp(X)et montrer queYet 1/Yont même loi.
2. Calculer les momentsE(Yp)et en déduire en particulier l’expression de l’espérance et de la variance deY.
Exercice 2. (3 points)
Soient X et Y deux variables aléatoires indépendantes de loi de Bernoulli de paramètre 1/2, etZégale aX+Ymodulo 2.
1. Quelle est la loi deZ?
2. Est-ce queXetZsont indépendantes ? Est-ce queYetZsont indépendantes ? 3. Est-ce queX,YetZsont indépendantes ? (On rappelle qu’une familleξ1, . . . ,ξnde
variables aléatoires est dite indépendante si
P(ξ1 ∈ A1, . . . ,ξn ∈ An) =P(ξ1 ∈ A1)·. . .·P(ξn ∈ An) pour toute suite d’ensembles mesurablesA1, . . . ,An.)
Exercice 3. (3 points)
1. On observe 1000 variables i.i.d. de loi χ2k où k, le nombre de degrés de liberté est quelconque. Lequel des deux histogrammes présentés ci-dessous correspond à ces observations ? Justifiez votre réponse.
0 5 10 15 20
0.000.050.100.15
−3 −2 −1 0 1 2 3
0.00.10.20.30.4
2. On observe 1000 variables i.i.d. de loi exponentielle de paramètreλ. La boîte à mous- taches de ces observations est présentée ci-dessous. Déterminer approximativement la valeur deλ.
0 2 4 6 8 10 12 14
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
T.S.V.P.
Exercice 4. (15 points)
Avec les données ci-dessous, on considère le modèle de régression suivant : Yk = a+bxk+ξk, k=1, . . . ,n
où lesξk sont des v.a. gaussiennes indépendantes et centrées de varianceσ2.
x 1 2 3 4 5 6 7 8 9 10
Y 0.39 1.06 0.89 1.15 1.56 1.77 0.94 0.98 1.9 1.59
1. Proposer des estimateurs sans biais ˆaet ˆbpour les coefficients de régression. Calculer les valeurs de ces estimateurs pour l’échantillon présenté ci-dessus. On utilisera les valeurs numériques
¯
x =5.5, s2x =9.2, Y¯ =1.2, s2Y =0.2, sxY =0.92.
Donner la formule d’un estimateur sans biais deσ2et calculer sa valeur sachant que
∑10i=1(Yi−aˆ−bxˆ i)2=1.17.
2. Quelle est la loi du vecteur (a, ˆˆ b)⊤? Calculer les éléments diagonaux de la matrice de covariance de ce vecteur.
3. Effectuer un test de niveau 0.05 de l’hypothèseb= 0 contreb6=0. On pourra utiliser la valeurq0.975(t9) =2.26.
4. Soient ˆaet ˆbles estimateurs des moindres carrés des coefficientsaetbdans un mo- dèle de régression simple. On définit les valeurs ajustées deYpar ˆYi =aˆ+bxˆ iet les résidus estimés par ˆξi =Yi−Yˆi,i=1, . . . ,n.
(a) Montrer que la moyenne empirique des valeurs ajustées est égale à la moyenne empirique desYi et que la variance empirique desYi est égale à la somme des variances empiriques des valeurs ajustées et des résidus estimés :s2Y =s2Yˆ +s2ξˆ. (b) Déterminer la loi du vecteur des résidus estimés. (Indication : on utilisera la
notation vectorielle et les propriétés des vecteurs gaussiens.) 5. Lorsqu’on calcule les résidus estimés, on obtient les valeurs
−0.4 0.2 −0.1 0.1 0.4 0.5 −0.4 −0.5 0.3 −0.1 .
Dessiner la boîte à moustaches de cet échantillon. Cette boîte à moustache, reflète-t- elle le fait que l’espérance des résidus estimés est nulle ?