Universit´e de Strasbourg S´egolen Geffray
M1 - Magist`ere geffray@math.unistra.fr
Statistique Ann´ee 2019/2020
Sujet 8
• Brefs rappels sur la r´egression lin´eaire:
Lorsque X(1), ..., X(p)
est un vecteur de covariables quantitatives, le mod`ele de r´egression lin´eaire correspondant `a l’observation de Y, X(1), ..., X(p)
s’´ecrit:
Y =β0+
p
X
k=1
βkX(k)+ε (1)
o`u E[ε] = 0, Var(εε)<∞ etε⊥⊥ X(1), ..., X(p) .
Le mod`ele de r´egression lin´eaire est dit gaussien lorsqu’on rajoute l’hypoth`eseε∼N(0, σ2).
Le mod`ele de r´egression lin´eaire est dit homosc´edastique lorsqu’on rajoute l’hypoth`ese que la variance de l’erreur r´esiduelle est constante d’un individu `a l’autre.
• R´esidus du mod`ele de r´egression lin´eaire:
Notons β ∈ Rp+1 le vecteur des param`etres de r´egression `a estimer dans le cadre d’un mod`ele de r´egression lin´eaire etβbson estimateur. Afin d’effectuer des diagnostics sur l’ajustement du mod`ele aux donn´ees, on utilise les r´esidus du mod`ele. On utilise souvent en pratique les r´esidus studentis´es:
εbstudi := Yi−Xi.βb q
σb(−i)2 (1−hi)
en notantXi lai`emeligne de la matrice dedesignX,hi lei`emecoefficient de la matrice des leviers H =X.(Xt.X)−1.Xt et bσ2(−i) est l’estimateur de la variance r´esiduelle σ2 calcul´e sans l’individu i. Sous les hypoth`eses (H1)−(H7) du cours, ces r´esidus suivent une loi de StudentT(n−p−2) que l’on peut approximer par une loi N(0,1) d`es que n est assez grand devant p, ce qui est de toute fa¸con souhaitable. Ces r´esidus sont calcul´es par le logiciel R au moyen de la fonction rstudent.
• Exercice:
Notons β le vecteur des param`etres de r´egression `a estimer dans le cadre d’un mod`ele d’analyse de la variance `a un facteur etβbson estimateur.
1. Proposer des simulations de Monte-Carlo permettant d’´evaluer le biais empirique deβbet son ´ecart-type estim´e.
Le biais et l’´ecart-type estim´es sont-ils sensibles `a l’hypoth`ese de normalit´e? `a l’hypoth`ese d’homosc´edasticit´e? `a la taille de l’´echantillon? au design? au nombre de coefficients du mod`ele?
2. Proposer des simulations de Monte-Carlo permettant d’illustrer la convergence asymp- totique de βb vers β. La convergence est-elle sensible `a l’hypoth`ese de normalit´e? `a l’hypoth`ese d’homosc´edasticit´e? au design? au nombre de coefficients du mod`ele?
1
3. Le test de Shapiro-Wilk est un test de normalit´e. L’hypoth`ese nulle est H0: “ad´equation
`
a la loi normale” tandis que l’hypoth`ese alternative est H1: “non-ad´equation `a la loi normale”. Ce test est impl´ement´e dans le logicielRau moyen de la fonctionshapiro.test.
Pr´esenter ce test. Proposer des simulations de Monte-Carlo permettant d’´evaluer l’erreur empirique de 1`ereesp`ece et la puissance empirique de ce test. Les r´esultats obtenus sont- ils sensibles `a l’hypoth`ese d’homosc´edasticit´e? `a la taille de l’´echantillon? au design? au nombre de coefficients du mod`ele?
2