• Aucun résultat trouvé

Le mod`ele de r´egression lin´eaire est dit gaussien lorsqu’on rajoute l’hypoth`eseε∼N(0, σ2)

N/A
N/A
Protected

Academic year: 2022

Partager "Le mod`ele de r´egression lin´eaire est dit gaussien lorsqu’on rajoute l’hypoth`eseε∼N(0, σ2)"

Copied!
2
0
0

Texte intégral

(1)

Universit´e de Strasbourg S´egolen Geffray

M1 - Magist`ere geffray@math.unistra.fr

Statistique Ann´ee 2019/2020

Sujet 8

• Brefs rappels sur la r´egression lin´eaire:

Lorsque X(1), ..., X(p)

est un vecteur de covariables quantitatives, le mod`ele de r´egression lin´eaire correspondant `a l’observation de Y, X(1), ..., X(p)

s’´ecrit:

Y =β0+

p

X

k=1

βkX(k)+ε (1)

o`u E[ε] = 0, Var(εε)<∞ etε⊥⊥ X(1), ..., X(p) .

Le mod`ele de r´egression lin´eaire est dit gaussien lorsqu’on rajoute l’hypoth`eseε∼N(0, σ2).

Le mod`ele de r´egression lin´eaire est dit homosc´edastique lorsqu’on rajoute l’hypoth`ese que la variance de l’erreur r´esiduelle est constante d’un individu `a l’autre.

• R´esidus du mod`ele de r´egression lin´eaire:

Notons β ∈ Rp+1 le vecteur des param`etres de r´egression `a estimer dans le cadre d’un mod`ele de r´egression lin´eaire etβbson estimateur. Afin d’effectuer des diagnostics sur l’ajustement du mod`ele aux donn´ees, on utilise les r´esidus du mod`ele. On utilise souvent en pratique les r´esidus studentis´es:

εbstudi := Yi−Xi.βb q

σb(−i)2 (1−hi)

en notantXi lai`emeligne de la matrice dedesignX,hi lei`emecoefficient de la matrice des leviers H =X.(Xt.X)−1.Xt et bσ2(−i) est l’estimateur de la variance r´esiduelle σ2 calcul´e sans l’individu i. Sous les hypoth`eses (H1)−(H7) du cours, ces r´esidus suivent une loi de StudentT(n−p−2) que l’on peut approximer par une loi N(0,1) d`es que n est assez grand devant p, ce qui est de toute fa¸con souhaitable. Ces r´esidus sont calcul´es par le logiciel R au moyen de la fonction rstudent.

• Exercice:

Notons β le vecteur des param`etres de r´egression `a estimer dans le cadre d’un mod`ele d’analyse de la variance `a un facteur etβbson estimateur.

1. Proposer des simulations de Monte-Carlo permettant d’´evaluer le biais empirique deβbet son ´ecart-type estim´e.

Le biais et l’´ecart-type estim´es sont-ils sensibles `a l’hypoth`ese de normalit´e? `a l’hypoth`ese d’homosc´edasticit´e? `a la taille de l’´echantillon? au design? au nombre de coefficients du mod`ele?

2. Proposer des simulations de Monte-Carlo permettant d’illustrer la convergence asymp- totique de βb vers β. La convergence est-elle sensible `a l’hypoth`ese de normalit´e? `a l’hypoth`ese d’homosc´edasticit´e? au design? au nombre de coefficients du mod`ele?

1

(2)

3. Le test de Shapiro-Wilk est un test de normalit´e. L’hypoth`ese nulle est H0: “ad´equation

`

a la loi normale” tandis que l’hypoth`ese alternative est H1: “non-ad´equation `a la loi normale”. Ce test est impl´ement´e dans le logicielRau moyen de la fonctionshapiro.test.

Pr´esenter ce test. Proposer des simulations de Monte-Carlo permettant d’´evaluer l’erreur empirique de 1`ereesp`ece et la puissance empirique de ce test. Les r´esultats obtenus sont- ils sensibles `a l’hypoth`ese d’homosc´edasticit´e? `a la taille de l’´echantillon? au design? au nombre de coefficients du mod`ele?

2

Références

Documents relatifs

Pour les sommes de type II, on doit faire la diff´erence entre la somme des carr´es relative aux erreurs dans le mod`ele avec les seuls effets de F 2 et la mˆeme somme dans le

Le d´ epartement de contrˆ ole de qualit´ e de l’entreprise a effectu´ e une ´ etude qui a pour but d’´ etablir dans quelle mesure la r´ esistance ` a la rupture (en kg/cm 2 )

Y∼0+X1 r´ egression lin´ eaire simple sans intercept (identique au pr´ ec´ edent) Y∼X1-1 r´ egression lin´ eaire simple sans intercept (identique au pr´ ec´ edent)

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son estimateur?. Proposer des simulations

Proposer des simulations de Monte-Carlo permettant d’´ evaluer l’erreur empirique de 1 ` ere esp` ece et la puissance empirique de ces deux tests.. Les r´ esultats obtenus

Dans le cadre du mod` ele lin´ eaire gaussien standard pr´ esent´ e ci-dessus, on se demande si les variables explicatives introduites dans le mod` ele ont un effet ou non sur

Un particulier cherche `a acqu´erir un appartement aux alentours imm´ediats de la place