UNIVERSITE DE BRETAGNE OCCIDENTALE
Année 2015-2016Master EURIA 1ère ANNEE
Examen sur le modèle linéaire Mercredi 16 décembre 2015
Polycopié distribué en cours, notes manuscrites et ordinateurs autorisés.
Donner toutes les commandes R utilisées.
Exercice 1 (7 points)
On considère dans cet exercice un échantillon(X1, ..., Xn)de variables aléatoires réelles indépendantes dans lequelXi suit une loiN(pµ
i, σ2)avecµetσdes paramètres inconnus et (p1, ..., pn)des nombres réels positifs supposés connus. On cherche à construire des estimateurs de µetσ2.
1. On noteM = n1∑n
i=1piXi. Montrer queM est un estimateur sans biais deµet calculer la variance de cet estimateur. Quelle est la loi deM?
2. On note Ele sous-espace vectoriel deRn engendré par le vecteure= (1
p1, ...,p1
n
)′ . CalculerπE(X)et πE⊥(X).
3. On note ν le vecteurν= (µ
p1, ...,pµ
n
)′
. CalculerπE⊥(ν).
4. Déduire des questions précédentes et du théorème de Cochran un estimateur sans biais de σ2ainsi qu'une méthode permettant de construire un intervalle de conance à95%pour σ2. On pourra utiliser que l'espérance d'une loi duχ2n est n. Comment s'écrit l'estimateur lorsque p1=...=pn= 1?
Exercice 2 (6 points)
On considère le modèle GLM gamma à une variable explicativex= (x1, ..., xn)avec la fonction lienln. On suppose dans cet exercice (avec les notations du cours) queβ0= 0,β1= 1et α= 1. On supposera aussi quen= 1000et que xi= 1/ipouri∈ {1, ..., n}. On donnera toutes commandes R utilisées.
1. Décrire précisément le modèle modèle GLM gamma avec la fonction lien ln(donner les équations).
2. Ecrire un code R qui permet de simuler une réalisation (y1, ..., yn)du modèle.
3. Quel est le lien par défaut utilisé par R pour le modèle GLM gamma ? Comment peut-on ajuster le modèle GLM gamma avec la fonction lienln?
4. En déduire une procédure permettant d'estimer le biais et la variance des estimateurs de β0 etβ1 par simulation. Discuter les résultats obtenus.
Exercice 3 (7 points). On donnera toutes les commandes R utilisées
Dans cet exercice on s'intéresse au jeu de données eurodol.csv. Il contient les variables suivantes "EURDOL" : cours Euro-Dollar
"PIB" : Produit Intérieur Brut
"INDCOUTRAVAIL" : indice du coût du travail
"TEMPLEIN" : proportion d'emplois à temps plein dans la population active "CONFMEN" : indice de conance des ménages
"DEFAILLENT" : nombre de défaillances d'entreprises "E3M" : Euribor 3 Mois
1
"BRENT" : cours du baril de pétrole "SBF" : SBF 120
"INFLATION" : taux d'ination
"CHOM" : nombre de chômeurs en milliers avec une donnée par mois sur la période 1999-2012.
1. Proposer un modèle permettant d'expliquer la variable CHOM à partir des autres variables. On décrira précisément la démarche utilisée pour choisir le modèle et on discutera les résultats obtenus.
2. An de mieux modéliser l'eet de la variable BRENT sur la variable CHOM on propose de découper la variable BRENT en classes. Créer une variable qualitative BRENT2 qui est telle que
BREN T2 = 1siBREN T ≤40. BREN T2 = 2si40< BREN T ≤60. BREN T2 = 3si60< BREN T ≤80. BREN T2 = 4si80< BREN T ≤100. BREN T2 = 5si100< BREN T.
Comparer le modèle de régression linéaire simple obtenu quand on explique CHOM à partir de BRENT et le modèle obtenu quand on remplace BRENT par BRENT2. Quel modèle donne les meilleurs résultats ? Pourquoi peut-on utiliser le test d'analyse de la variance pour comparer les deux modèles ? Comment s'interprètent les paramètres des modèles ajustés ?
3. Proposer diérents modèles permettant de décrire l'eet simultané de BRENT2 et E3M sur CHOM. On dénira précisément les modèles considérés (donner les équations) et on discutera les résultats obtenus.
4. Peut-on améliorer les résultats obtenus dans la question 1. en étendant les modèles proposés dans la question précédente ?
2