• Aucun résultat trouvé

TD 3 : Théorème de Cochran et modèle linéaire

N/A
N/A
Protected

Academic year: 2022

Partager "TD 3 : Théorème de Cochran et modèle linéaire"

Copied!
2
0
0

Texte intégral

(1)

Sorbonne Université Année 2019/2020

1ère année ISUP Deuxième semestre

TD 3 : Théorème de Cochran et modèle linéaire

Exercice : Le principe de la régression linéaire est de modéliser une variableyà partir de variables explicativesx= x1, . . . ,xpT, i.e de considérer

y=β1x1+. . .+βpxp, oùβ= x1, . . . ,xp

est inconnu. En pratique, on dispose d’un échantillon(x1,y1), . . . ,(xn,yn), mais on obtient jamais réellement une droite (erreurs de mesures...). On va donc considérer le modèle linéaire

y=β1x1+. . .+βpxp+e avece∼ N 0,σ2

. On parle alors de modèle linéaire gaussien. On suppose maintenant que les données suivent le modèle suivant :

Yi =β1xi,1+. . .+βpxi,p+ei, avec

— Yiest une variable aléatoire et on observe les réalisationsyi.

— Lesxi = xi,1, . . . ,xi,pT

sont déterministes.

— Le paramètreβ= β1, . . . ,βpT

est inconnu et déterministe.

— Leseisont i.i.d ete1 ∼ N 0,σ2 . 1. Ecrire le modèle de manière matricielle.

2. Donner la loi du vecteurY. Quelle est la loi deYi?

3. On considère à partir de maintenant que rang(X) = p, et on noteD=Im(X). On s’intéresse à l’estimateur des moindres carrés défini par

βˆ =arg min

hRpkY−Xhk2 Montrer que la matriceXTXest inversible et en déduire ˆβ.

4. Montrer quePD =X XTX1

XT est le projecteur orthogonale surDparallèlement àD. 5. Que pouvez vous en déduire surXβˆ?

6. Donner la loi deXβˆet en déduire celle de ˆβ.

(2)

7. On supposeσ2connu. Soitx0Rp\{0}, donner un intervalle de confiance de niveau au moins 1−αdex0Tβ.

8. On suppose maintenant queσ2est inconnu et on considère l’estimateur ˆ

σ2= 1 n−p

Y−Xβˆ

2

(a) Expliquer ce choix d’estimateur.

(b) Exprimer ˆσ2à l’aide de projections.

(c) Enoncer le théorème de Cochran dans ce cas.

(d) En déduire un intervalle de confiance pourxT0β.

(e) En déduire un test de niveauαpour tout testerβj =βj,0. (f) Construire un intervalle de confiance pourσ.

(g) Construire un test di niveauαpour testerβ= β0.

9. On considère maintenant unen+1-ème donnéexn+1et on souhaite prédireYn+1. (a) Proposer un prédicteur ˆYn+1.

(b) Donner la loi de l’erreur de prédiction ˆen+1=Yn+1−Yˆn+1. (c) En déduire un intervalle de prédiction.

Références

Documents relatifs

Rappeler la définition du modèle ainsi que les expressions des estimateurs des différents paramètres vus dans le cours2. Rappeler la définition du coefficient R 2 vu dans le

Ce jeu de données intéresse les démographes pour analyser les raisons qui ont conduit à une réduction du taux de natalité dans les pays occidentaux avec le développement

On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le modèle GLM Poisson avec pour lien la fonction ln et deux variables explicatives2.

On considère dans cet exercice le modèle de régression linéaire simple dans lequel le nombre de variable explicative est p = 1.. On utilise les notations

Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

On constate d’ailleurs que les trois dernières valeurs sont quasiment égales, ce qui laisse penser à un ralentissement de la diminution du nombre

Le fichier exo2.txt contient les prix en euros d’un produit, P, lors de différentes dates, et le salaire moyen en euros des employés de l’entreprise fabricant ce produit, S (il

k. D’après l’allure de la courbe, on remarque qu’à partir de la position x c = 0.15 vers le bord de fuite, la couche limite est soumise à un gradient de pression défavorable.. La