• Aucun résultat trouvé

5 : Régression linéaire multiple 3

N/A
N/A
Protected

Academic year: 2022

Partager "5 : Régression linéaire multiple 3"

Copied!
2
0
0

Texte intégral

(1)

Université de Caen M1

TD n

o

5 : Régression linéaire multiple 3

Exercice 1. Soient (k, T) ∈ (N)2, n = kT et Z1, . . . , Zn n var indépendantes telles que, pour tout i∈ {1, . . . , n},

Ziii,

où ξ1, . . . , ξn sont n var iid suivant chacune la loi normale N(0, σ2). On se place dans le cas T-périodique : pour tout (u, v)∈ {0, . . . k−1} × {1, . . . , T},

βuT+vv.

Les paramètres β1, . . . , βT sont des réels inconnus. On poseβ = (β1, . . . , βT)t.

1. Écrire le modèle linéaire associé sous la forme matricielle usuelle : Y =Xβ+, en indiquant ce que sont ici Y, X et.

2. Calculer l’emco βbde β, puis donner sa loi.

3. Donner un estimateur sans biaisσb2 deσ2. Exprimerσb2 sous la forme d’une somme double.

Exercice 2. Soient ` ∈ N, n ∈N tel que n >2`+ 1, et Z1, . . . , Zn n var indépendantes telles que, pour tout i∈ {1, . . . , n},

Zi0+

`

X

v=1

vcos (xv,i) +θvsin(xv,i)) +ξi,

oùxv,i = 2viπ

n etξ1, . . . , ξnsontn var iidsuivant chacune la loi normaleN(0, σ2). Les paramètres α0, α1, θ1, . . . , α`, θ` et σ sont des réels inconnus. On pose β= (α0, α1, θ1, . . . , α`, θ`)t.

1. Écrire le modèle linéaire associé sous la forme matricielle usuelle : Y =Xβ+, en indiquant ce que sont ici Y, X et.

2. On admet que, pour tout(u, v)∈(N)2,

n

X

i=1

cos(xv,i) = 0,

n

X

i=1

sin(xv,i) = 0,

n

X

i=1

cos(xv,i) sin(xu,i) = 0,

n

X

i=1

cos(xv,i) cos(xu,i) =

 n

2 si u=v, 0 sinon,

,

n

X

i=1

sin(xv,i) sin(xu,i) =

 n

2 si u=v, 0 sinon.

Calculer l’emco αb0 deα0 et, pour tout v ∈ {1, . . . , `}, l’emcoαbv deαv et l’emcoθbv deθv. 3. Donner un estimateur sans biais bσ2 deσ2. Exprimer σb2 sous la forme d’une somme faisant

intervenir (Zi)i∈{1,...,n}, (xv,i)(v,i)∈{1,...,`}×{1,...,n},αb0,(αbv)v∈{1,...,`} et (bθv)v∈{1,...,`}.

C. Chesneau 1 TD no 5

(2)

Université de Caen M1

Exercice 3. On considère le modèle :

Y =U α+V γ+,

oùU est une matrice à n lignes etp1 colonnes connue,V est une matrice àn lignes et p2 colonnes connue, et suit la loi normale multivariée Nn(0n,In). Ici, α = (α1, . . . , αp1)t est un vecteur inconnu de Rp1 etγ = (γ1, . . . , γp2)t est un vecteur inconnu deRp2. On pose

P =U(UtU)−1Ut, M =In−P.

Dans ce que suit, k.ket< ., . >désignent respectivement la norme et le produit scalaire euclidiens dans Rn.

1. Questions préliminaires.

(a) Montrer queP U =U,M U = 0,Pt =P,P2 =P,Mt=M,M2 =M et< M, P >= 0.

(b) Montrer que, pour toute matriceA àn lignes et k colonnes, avec k ∈ {1, . . . , p1}, on a

< M A, P A >= 0, kAk2 =kM Ak2+kP Ak2.

2. En utilisant les résultats de la question1, montrer que, pour tout(u, v)∈Rp1 ×Rp2, kY −U u−V vk2 =kM Y −M V vk2+kP Y −U u−P V vk2.

3. On définit





bγ =argmin

v∈Rp2

kM Y −M V vk2,

αb tel que P Y −Uαb−P Vbγ = 0.

On suppose que bγ et αb existent et sont uniques.

Montrer que, pour tout (u, v)∈Rp1 ×Rp2, on a

kM Y −M V vk2+kP Y −U u−P V vk2 ≥ kM Y −M Vbγk2+kP Y −Uαb−P Vγbk2.

En déduire que

(α,b bγ) = argmin

(u,v)∈Rp1×Rp2

kY −U u−V vk2.

4. Montrer que

M Y =M V γ+,

suit la loi normale multivariée Nn(0n, M).

5. On suppose désormais queM est définie positive. Montrer que

bγ = (VtM V)−1VtM Y.

C. Chesneau 2 TD no 5

Références

Documents relatifs

Quelles sont les hypothèses adaptées à la situation suivante : &#34;on souhaite affirmer, avec un faible risque de se tromper, qu’en moyenne, le nombre d’années d’études de

Déterminer un intervalle de confiance (aléatoire) pour θ 2 au niveau 90% de la forme ]0, U ], où U est une var que l’on

Ajuster un modèle de régression linéaire simple permettant d’expliquer la variable CRIM à partir de la variable URBE qui est la plus corrélée avec CRIM (on pourra utiliser la

méthode n’a permis d’établir des équations permettant de réaliser des prédictions valables lorsque le nombre de variables explicatives potentielles est supérieur au

Tester au risque 5% l’hypothèse selon laquelle la performance sportive ne dépend pas de la force musculaire en plus de la capacité thoracique.. Tester au risque 5% l’hypothèse

L’ordinateur est capable de faire ce calcul, c’est-à-dire de renvoyer une valeur de a, mais cette méthode est cependant à éviter absolument : d’une part la comparaison visuelle

Si X est une matrice de taille (p,n) dont les colonnes sont les différentes données x k , et Y est un vecteur colonne de taille n, [a,b]=reglin(X,Y) renvoie le vecteur ligne a et

Les choix : présence ou non d’une interaction entre deux variables, présence ou non d’un terme qua- dratique se traitent alors avec les mêmes outils que ceux des choix de variable