UNIVERSITE DE BRETAGNE OCCIDENTALE
Année 2017-2018Master EURIA 1ère ANNEE
Examen sur le modèle linéaire
Polycopié distribué en cours, notes manuscrites et ordinateurs autorisés.
Donner toutes les commandes R utilisées.
Exercice 1.
On reprend les notations du cours sur le modèle de régression linéaire simple et on considère le modèle sans constante défini par
Yi =βxi+Wi (1)
pour i∈ {1...n}.
1. Que représentent Yi, β, xi et Wi dans (??) ? Quelles hypothèses sont faites dans le modèle de régression linéaire sur (W1, ..., Wn)? On fera ces
hypothèses dans la suite de l’exercice.
2. Calculer l’estimateur des moindres carrés deβ. On notera B˜ cet estimateur.
3. Calculer le biais et la variance deB.˜
4. On suppose dans la suite de l’exercice que les résidus suivent une loi normale (modèle linéaire gaussien). Donner la fonction de vraisemblance puis les estimateurs du maximum de vraisemblance de β et σ2.
5. Montrer queB˜ suit une loi normale dont on précisera les paramètres.
6. On note∑n Y˜i = ˜Bxi et W˜i =Yi−Y˜i. Montrer que la variable aléatoire
i=1W˜i2 est indépendante de B˜ et suit une loi du χ2, dont on précisera la degrés de liberté.
7. En déduire un estimateur sans biais de σ2.
8. En déduire des intervalles de confiance pourβ etσ.
9. Proposer un test de l’hypothèseH0 :β = 0. On explicitera la p-value du test.
10. Illustrer le résultat de la question 7. en utilisant des simulations et R. On donnera toutes les commandes R utilisées sur la copie.
1
Exercice 2. On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le jeu de données UScrimedisponible dans le package MASS.
1. Décrire rapidement le jeu de données.
2. Représenter la matrice de corrélation et analyser les corrélations entre la variable y et les autres variables.
3. Proposer un modèle permettant d’expliquer la variabley à partir des autres variables. On décrira précisément la démarche utilisée pour choisir et valider le modèle et on discutera les résultats obtenus.
Exercice 3. On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le modèle GLM Poisson avec pour lien la fonction ln et deux variables explicatives.
1. Décrire précieusement le modèle (avec les notations du cours). Comment s’écrit le modèle lorsqueβ2 = 0? Dans la suite de l’exercice, le modèle avec β2 quelconque sera appelé "modèle complet" et le modèle avecβ2 = 0 sera appelé "modèle restreint"
2. On suppose dans cette question que β2 = 0. Pourquoi est-ce-qu’on s’attend à ce que le modèle restreint donne de meilleurs résultats en prédiction que le modèle complet ? Réaliser des simulations qui mettent en évidence ce
phénomène.
2