UNIVERSITE DE BRETAGNE OCCIDENTALE
Année 2012-2013Master EURIA 1ère ANNEE
Première partie de l'examen du mercredi 21 Novembre 2012
Documents et ordinateur autorisés Notée sur 12 points
Exercice 1
On considère dans cet exercice le jeu de données trees disponible sous R. La commande R
? trees
permet d'obtenir un descriptif des données : la première colonne donne le diamètre des arbres, la seconde colonne la hauteur et la troisième le volume. Ces variables sont notées respectivement Diam, Hauteur et Vol dans la suite. Un forestier veut utiliser ces données pour établir une relation empirique permettant d'estimer le volume d'un arbre (variable à expliquer) en fonction de son diamètre et de sa hauteur (variables explicatives) qui sont des quantités plus faciles à mesurer en pratique. Le forestier utilisait précédemment une formule de la forme
V ol=c∗Diama∗Hauteurb (1) avecc une constante numérique qui dépend du type d'arbre et les valeurs numériquesa= 2 et b= 1.
REPRODUIRE SUR LA COPIE TOUTES LES COMMANDES R UTILISEES 1. (5 points) Exécuter sous R la commande
t=lm( log(Volume)∼log(Height)+ log(Girth),data=trees) (a) Décrire précisément le modèle ajusté par cette commande.
(b) Quel est le lien avec le modèle avec le modèle (1) ? Quelle estimation obtient-on pour les coecientsc,aetb?
(c) Dans la suite, on suppose que les hypothèses du modèle linéaire gaussien sont vériées.
Pourquoi fait-on ces hypothèses ? Est-ce qu'elles vous paraissent justiées ? (d) Donner des intervalles de conance à 95% pour les paramètresc,aetb.
(e) Peut-on supposer quea= 2? On répondra à l'aide d'un test statistique en détaillant le raisonnement. Peut-on supposer queb= 1? On répondra à l'aide d'un test statistique.
(f) Le forestier vend son bois au prix de 3 euros par unité de volume (cubic ft). Combien d'argent peut-il espérer gagner si il abat un arbre de longueur85f tet diamètre 20inches? Exprimer le résultat sous la forme d'un intervalle de prédiction à95%. 2. (2 points) An de simplier la procédure, le forestier souhaiterait pouvoir estimer le volume
et donc le prix d'un arbre à partir de son diamètre uniquement (la hauteur est plus dicile à mesurer). Proposer un modèle de régression permettant de répondre à cette attente du forestier et comparer au modèle de la question précédente. Que conseillez-vous au forestier : doit-il continuer à mesurer la hauteur des arbres pour en estimer le volume ?
3. (5 points) On considère dans cette question le modèle de régression linéaire gaussien (avec les notations du cours)
Y =Xβ+W
avecp= 2 variables explicatives. On veut tester l'hypothèse suivante : H0 :β1= 2∗β2 contreH1:H0n'est pas vériée.
1
(a) Montrer que l'hypothèseH0 est vraie si et seulement siHβ= 0avecH une matrice qu'on explicitera.
(b) Quel est le rang de la matriceH?
(c) On noteE0={Xβ|Hβ= 0}. Montrer queE0 est un espace vectoriel dont on donnera la dimension et on explicitera une base.
(d) On revient au modèle (1). Peut-on supposer que a= 2b? On répondra à l'aide d'un test statistique.
2