UNIVERSITE DE BRETAGNE OCCIDENTALE Année 2018-2019 L3 MIASHS
TD1
Exercice 1.
On a calculé les droites des moindres carrés pour un nuage de points. Les équations obtenues sont les suivantes :
— quand on cherche à expliquer y à partir dex, on obtient la droite d’équation y=x+ 30.
— quand on cherche à expliquer xà partir de y, on obtient la droite d’équation x=y/4 + 60.
1. Calculer le coefficient de corrélation linéaire entre les deux séries.
2. Calculer les moyennes arithmétiques des deux séries.
Exercice 2.
On considère le modèle de régression linéaire simple avec les notations du cours. On rappelle en particulier que
Yˆi = ˆB0+ ˆB1xi= ¯Y +RSY
sx
(xi−x)¯ avec SY2 = n1∑n
i=1(Yi−Y¯)2 etR=
1 n
∑n
i=1(xi−x)(Y¯ i−Y¯)
sxSy .
1. CalculerE[Yi],var(Yi)puis E(Yi2).
2. Montrer que∑n
i=1Yˆi(Yi−Yˆi) = 0 et en déduire que
∑n i=1
Yi2 =
∑n i=1
Yˆi2+
∑n i=1
(Yi−Yˆi)2.
3. CalculerE[ ˆYi],var( ˆYi)en utilisant les propriétés des estimateursBˆ0 etBˆ1 vues en cours.
4. CalculerE[∑n
i=1(Yi−Yˆi)2]et en déduire queSˆ2 = n−12∑n
i=1(Yi−Yˆi)2 est un estimateur sans biais deσ2.
5. Montrer que∑n
i=1( ˆYi−Y¯)(Yi−Yˆi) = 0et en déduire la formule d’analyse de la variance
∑n i=1
(Yi−Y¯)2 =
∑n i=1
( ˆYi−Y¯)2+
∑n i=1
(Yi−Yˆi)2.
6. Montrer queR2 =
∑n
i=1( ˆYi−Y¯)2
∑n
i=1(Yi−Y¯)2.
7. En déduire que si R2 ≤1 et que si R2 = 1 alors pour touti∈ {1, ..., n} on aYi= ˆYi. Quelle forme a le nuage de point(xi, yi) lorsque le coefficient de corrélation est égal à 1 ?
1
Exercice 3. A réaliser en utilisant R.
On considère les données disponibles sur la page internet du cours qui décrivent les températures annuelles moyennes à Brest au cours des 72 dernières années. On pourra les charger sous R avec la commande
> z=read.csv("http://pagesperso.univ-brest.fr/∼ailliot/
doc_cours/MIASHS/Tempguip.csv",sep=";")
On propose d’ajuster un modèle de régression linéaire simple pour expliquer les températures en fonction de l’année.
1. Proposer une estimation ponctuelle des paramètres inconnus puis tracer sur une même figure la droite des moindres carrés et les données de température.
2. Donner une estimation par intervalle de confiance des paramètres inconnus. Commenter les résultats obtenus.
3. Peut-on affirmer que les températures moyennes ont augmenté à Brest au cours des 72 dernières années ? On répondra à l’aide d’un test statistique.
4. En supposant que le modèle ajusté reste valable au cours des 100 prochaines années, estimer les températures moyennes à Brest en 2030 puis 2100. On donnera une estimation ponctuelle, ainsi qu’un intervalle de prédiction.
Exercice 4.
Simuler un échantillon de taillen du modèle linéaire Gaussien Yi=β0+β1xi+Wi
avec (W1, ..., Wn)des variables aléatoires indépendantes et identiquement distribuées de moyenne0 et de varianceσ2. On pourra prendre les valeursβ0= 0,β1 = 1,σ= 0.1,n= 50et xi = ni.
1. Calculer l’estimation des paramètres sur un échantillon simulé.
2. Recommencer la question précédenteN = 1000fois, en simulant à chaque fois un nouvel échantillon. Réaliser un histogramme des estimations obtenues : les résultats obtenus par simulation sont-ils conformes aux résultats donnés dans le cours ?
3. Calculer un intervalle de confiance pour les paramètres sur un échantillon simulé. Est-ce que les vraies valeurs des paramètres sont dans ces intervalles de confiance ? Qu’est-ce qui est attendu d’après la théorie ?
4. Recommencer la question précédenteN = 1000fois, en simulant à chaque fois un nouvel échantillon. Les résultats obtenus par simulation sont-ils conformes à la théorie ?
5. Réaliser un test de l’hypothèseH0:β1= 0 puis de l’hypothèse H0 :β1 = 1. Est-ce que l’hypothèseH0 est acceptée ? Qu’est-ce qui est attendu d’après la théorie ?
6. Recommencer la question précédenteN = 1000fois, en simulant à chaque fois un nouvel échantillon. Combien de fois l’hypothèse H0 est acceptée ? Les résultats obtenus par simulation sont-ils conformes à la théorie ?
2