• Aucun résultat trouvé

Proposer des simulations de Monte-Carlo permettant d’illustrer la robustesse du mod`ele dans le cadre d’un mod`ele de r´egression lin´eaire gaussien

N/A
N/A
Protected

Academic year: 2022

Partager "Proposer des simulations de Monte-Carlo permettant d’illustrer la robustesse du mod`ele dans le cadre d’un mod`ele de r´egression lin´eaire gaussien"

Copied!
2
0
0

Texte intégral

(1)

Universit´e de Strasbourg S´egolen Geffray

M1 - Magist`ere geffray@math.unistra.fr

Statistique - projet Ann´ee 2020/2021

TP2: r´egression lin´eaire

Notons β le vecteur des param`etres de r´egression `a estimer dans le cadre d’un mod`ele de r´egression lin´eaire etβbson estimateur.

1. Proposer des simulations de Monte-Carlo permettant d’illustrer la convergence asympto- tique deβbversβ dans le cadre de l’ajustement d’un mod`ele de r´egression lin´eaire gaussien lorsque le mod`ele propos´e s’adapte bien aux donn´ees.

2. Proposer des simulations de Monte-Carlo permettant de comparer le comportement des diff´erents types de r´esidus introduits en cours dans le cadre de l’ajustement d’un mod`ele de r´egression lin´eaire gaussien.

3. Proposer des simulations de Monte-Carlo permettant d’illustrer la robustesse du mod`ele dans le cadre d’un mod`ele de r´egression lin´eaire gaussien.

Vous veillerez notamment `a

• faire varier n, la taille de l’´echantillon,

• ´etudier l’impact du nombre de pr´edicteurs,

• ´etudier l’impact de l’inclusion de pr´edicteurs superflus,

• ´etudier l’impact d’une ´eventuelle colin´earit´e entre pr´edicteurs.

Pensez ´egalement `a quantifier votre analyse au moyen de crit`eres objectifs tels que biais em- pirique, ´ecart-type estim´e, probabilit´e de couverture dans le cas d’intervalles de confiance, erreurs de type I et II dans le cas de tests.

Quelques fonctions utiles et quelques recommandations

Pour ajuster un mod`ele de r´egression lin´eaire gaussien, utiliser lm(formula,data)

Supposons que Y, X1, X2 et X3 sont des variables quantitatives (donc du type numeric), A est une variable qualitative (donc du type factor). Voici quelques formules possibles pour ´ecrire un mod`ele lin´eaire.

1

(2)

Y∼X1 r´egression lin´eaire simple avec intercept implicite

Y∼1+X1 r´egression lin´eaire simple (identique au pr´ec´edent) avec intercept explicite Y∼-1+X1 r´egression lin´eaire simple sans intercept

Y∼0+X1 r´egression lin´eaire simple sans intercept (identique au pr´ec´edent) Y∼X1-1 r´egression lin´eaire simple sans intercept (identique au pr´ec´edent) log(Y)∼X1+X2 r´egression lin´eaire multiple sur log(Y) (avec intercept implicite) Y∼X1*X2 r´egression lin´eaire multiple avec interaction d’ordre 2

Y∼X1*X2*X3-X1:X2:X3 r´egression lin´eaire multiple avec interaction d’ordre 2

Y∼(X1+X2+X3)b2 r´egression lin´eaire multiple avec interaction d’ordre 2 (identique au pr´ec´edent) Y∼A analyse de la variance `a un crit`ere de classification

Y∼A+X1 analyse de la covariance

Y∼A2%in%A1 r´egression lin´eaire avec 2 covariables,A2 ´etant emboit´ee dansA1

str (utils) donne la structure d’un jeu de donn´ees

head (utils) permet de voir les premi`eres lignes d’un jeu de donn´ees rmvnorm (mvtnorm) simule des vecteurs gaussiens

scatter.smooth (stats) fournit des trac´es exploratoires scatterplotMatrix (car) fournit des trac´es exploratoires

ggPairs (GGally) idem avec estimation des coefficients de corr´elation lin´eaire pairs (graphics) trace les covariables 2 par 2

boxcox (MASS) transformation de Box-Cox dans le cas d’un LNM bcPower (car) transformation de Box-Cox, Yeo-Johnson ou puissance lm (stats) ajuste un mod`ele de r´egression lin´eaire gaussien standard summary (base) renvoie les r´esultats de l’ajustement du mod`ele

model.matrix (stats) renvoie la matrice exp´erimentale

logLik (stats) renvoie la log-vraisemblance du mod`ele

confint (stats) d´etermine un IC pour chaque coefficient d’un LNM shapiro.test (stats) effectue un test de Shapiro-Wilk

ks.test (stats) effectue un test de Kolmogorov-Smirnov

qqnorm (stats) effectue un QQ-plot

qqline (stats) ajoute `a un QQplot une droite qui passe par les 1ers et 3`emes quartiles

influence.measures (stats) effectue un diagnostic d’individus influents hatvalues (stats) =hat (stats) renvoie les leviers

cooks.distance (stats) =cookd (car) calcule la distance de Cook

dffits (stats) calcule les dffits

dfbetas (stats) calcule les dfbetas

coeftest (lmtest) effectue de Student sur chacun des coefficients

anova (stats) comparaison de deux mod`eles emboit´es avec un F-test waldtest (lmtest) effectue un test de Wald pour mod`eles emboit´es bptest (lmtest) test d’h´et´erosc´edasticit´e de Breusch-Pagan ncvTest (car) test d’h´et´erosc´edasticit´e

leveneTest (car) test d’homog´en´eit´e des variances entre diff´erents groupes linearHypothesis (car) effectue des tests lin´eaires d’hypoth`eses

residuals (stats) renvoie les r´esidus de base

rstandard (stats) renvoie les r´esidus standardis´es d’un LNM rstudent (stats) renvoie les r´esidus studentis´es d’un LNM

2

Références

Documents relatifs

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son estimateur?. Proposer des simulations

Proposer des simulations de Monte-Carlo permettant d’´ evaluer l’erreur empirique de 1 ` ere esp` ece et la puissance empirique de ce test.. Les r´ esultats obtenus sont- ils

Proposer des simulations de Monte-Carlo permettant d’´ evaluer l’erreur empirique de 1 ` ere esp` ece et la puissance empirique de ces deux tests.. Les r´ esultats obtenus

Pour les sommes de type II, on doit faire la diff´erence entre la somme des carr´es relative aux erreurs dans le mod`ele avec les seuls effets de F 2 et la mˆeme somme dans le

Un particulier cherche `a acqu´erir un appartement aux alentours imm´ediats de la place

Question 1. Pour r´ epondre ` a cette question, il faudrait s’assurer que les trois hypoth` eses du mod` ele sont v´ erifi´ ees. Malheureusement nous ne pourrons pas le faire

Le d´ epartement de contrˆ ole de qualit´ e de l’entreprise a effectu´ e une ´ etude qui a pour but d’´ etablir dans quelle mesure la r´ esistance ` a la rupture (en kg/cm 2 )