• Aucun résultat trouvé

2 Régression linéaire

N/A
N/A
Protected

Academic year: 2022

Partager "2 Régression linéaire"

Copied!
2
0
0

Texte intégral

(1)

UNIVERSITÉ GRENOBLE ALPES Année 2015-2016

D. Piau, L. Coquille M1 – MAT414

Processus stochastiques – Feuille d’exercices 3 Espérance conditionnelle et régression linéaire

Soit (Ω,F,P) un espace probabilisé. On se place dans l’espaceL2(Ω,F,P) des variables aléatoires de carré intégrable sur (Ω,F,P) où l’on quotiente implicitement par la relation d’équivalence X ∼ Y ⇔ P(X = Y) = 1. On suppose connu (cf. théorie de la mesure) que L2(Ω,F,P) muni du produit scalaire suivant :

hX|Yi:=E[XY] = Z

XY dP ∀X, Y ∈L2(Ω,F,P) est un espace de Hilbert.

1 Projection

Question 1.1. Soit G une sous-tribu deF. Montrer que pour tout Y ∈ L2(F,P) l’espérance condi- tionnelleYG:=E[Y|G]est la projection orthogonale deY sur L2(G,P).

Montrer qu’elle est unique, et constitue la meilleure approximation deY au sensL2 par des variables aléatoires deL2(G,P), i.e.E(|Y −YG|2) = inf{E(|Y −X|2) :X∈L2(G,P)}

Question 1.2. Soient X, Y ∈ L2(F,P). Montrer que E(Y|X) est la projection orthogonale de Y sur L2(σ(X),P), c’est-à-dire la meilleure approximation (au sens des moindres carrés) de Y par une fonction de X.

2 Régression linéaire

Question 2.1. Soit Yˆ = aX +b la meilleure approximation de Y par une fonction affine de X, autrement dit la projection orthogonale deY sur le sous-espace de dimension finie deL2(F,P)engendré parX et les v.a. constantes. Montrer que

a= Cov(Y, X)

V ar(X) et b=E(Y −aX).

Vérifier que

a,b∈minRE((Y −aX−b)2) = (1−ρ(X, Y)2)V ar(Y) avec ρ(X, Y) := √ Cov(X,Y)

V ar(X)V ar(Y) le coefficient de corrélation de X etY.

(2)

Question 2.2. Considérons maintenant des variables aléatoires vectorielles, X = (X1, . . . , Xn)t à valeurs dans Rn etY = (Y1, . . . , Ym)t à valeurs dansRm. SoitYˆ =AX+b avecA une matricem×n à coefficients réels etb∈Rm. On noteX˜ =X−E(X),Y˜ =Y −E(Y) et

Cov(X, Y) =

ΓX ΓX,Y

ΓY,X ΓY

avec ΓX =E( ˜XX˜t),ΓY =E( ˜YY˜t),ΓX,Y =E( ˜XY˜t) ΓY,X =E( ˜YX˜t).

On cherche donc à minimiser E(kY −Yˆk2) =E(kY −AX−bk2).

1. Montrer queA= ΓY,XΓ−1X etb=E(Y)−AE(X).Autrement dit Yˆ = ΓY,XΓ−1X (X−E(X)) +E(Y) 2. Montrer que

infA,bE(kY −AX−bk2) =T r(ΓY −ΓY,XΓ−1X ΓX,Y).

3 Cas gaussien

Supposons que le couple (X, Y) est gaussien.

Question 3.1. Montrer qu’il existeA, btels queE(Y|X) =AX+b. La régressionlinéaire est donc la meilleure approximation de X.

Question 3.2. Montrer que la loi conditionnelle de Y sachant X=x est la loi normale d’espérance Mx = ΓY,XΓ−1X (x−E(X)) +E(Y)

et de matrice de covariance

Σ2= ΓY −ΓY,XΓ−1X ΓX,Y.

Références

Documents relatifs

Si X n’est pas de rang maximum p, la matrice X ⊤ X n’est pas inversible et le problème admet plusieurs solutions qui minimisent le risque empirique. ⇒ le problème est mal posé

La deuxième colonne ne nous intéressera que dans le chapitre suivant, sur la régression multiple.. Les éléments de la troisième colonne sont ceux de la première divisés par ceux de

Comme la pond´ eration change avec t, l’algorithme de Newton pour la r´ egression logistique se nomme donc aussi la m´ ethode des “moindres carr´ es pond´ er´ es it´ er´

a) la propriété (2.6.) établit les propriétés asymptotiques de la régression en norme £ , les conditions sur les scores étant vérifiées (convergence et donc

• On considère les écarts entre la droite et les vrais points : on veut LA droite qui minimise ces écarts au carré :.. Régression non linéaires Régression

Le coefficient de corrélation donne une indication sur l’alignement des points expérimentaux : plus |R| ou R 2 sont proches de 1, mieux les points sont alignés?. Le coefficient

Ajuster un modèle de régression linéaire simple permettant d’expliquer la variable CRIM à partir de la variable qui est la plus corrélée avec CRIM (on pourra utiliser la

Ajuster un modèle de régression linéaire simple permettant d’expliquer la variable CRIM à partir de la variable URBE qui est la plus corrélée avec CRIM (on pourra utiliser la