UNIVERSITE DE BRETAGNE OCCIDENTALE
Année 2019-2020L3 MIASHS
Examen sur le Modèle Linéaire
Document autorisé : une feuille A4 sans démonstration ni correction d’exercice.
Ordinateurs autorisés.
Exercice 1.
On considère dans cet exercice le modèle de régression linéaire avec p= 0 variable explicative défini par
Yi =β0+Wi
avec les notations et hypothèses du cours. On supposera que les résidus Wi suivent une loi normale avec E[Wi] = 0 et var(Wi) =σ2.
1. Quel est l’estimateur des moindres-carrésBˆ0 deβ0? On démontrera le résultat en repartant de la définition de l’estimateur des moindres-carrés.
2. Quelle est la loi deYi? Quelle est la loi de Yi−σβ0 ? Quelle est la loi de
∑n
i=1
(Yi−β0)2 σ2 ?
3. D’après le cours, ∑n
i=1
(Yi−Bˆ0)2
σ2 suit une loi du χ2. Quel est le degré de liberté de cette loi ?
4. On noteχ2k,α le quantile d’ordre α de la loi du χ2 à k degrés de liberté.
Montrer que si U suit une loi du χ2 à k degrés de liberté alors P(χ2k,α/2 ≤U ≤χ2k,1−α/2) = 1−α.
5. En déduire un intervalle de confiance au niveau de confiance1−α pour σ.
6. En déduire un test de l’hypothèseH0 :σ=σ0 avecσ0 ∈R+∗ une valeur donnée. Quelle est la p-value du test ?
1
Exercice 2.
On considère dans cet exercice le jeu de données swiss disponible dansR. On pourra créer un data.frame nommé z qui contient les données en tapant la
commande z=swiss. La commande?swiss permet d’obtenir un descriptif du jeu de données. Il contient, pour chaque canton suisse en 1888, les variables suivantes
— "Fertility" : taux de fertilité normalisé ;
— "Agriculture" : pourcentage de la population qui travaille dans le domaine agricole ;
— "Examination" : le pourcentage d’appelés au service militaire qui a obtenu une bonne note aux évaluations réalisées par l’armée ;
— "Education" : le pourcentage de la population qui a continué ses études après l’école primaire
— "Catholic" : le pourcentage de catholique dans la population
— "Infant.Mortality" : taux de décès chez les enfants de moins de 1 an.
Ce jeu de données intéresse les démographes pour analyser les raisons qui ont conduit à une réduction du taux de natalité dans les pays occidentaux avec le développement économique.
1. Ajuster un modèle de régression linéaire simple pour expliquer la variable
"Fertility" à partir de la variable "Education" puis discuter les points suivants. On donnera les commandes R utilisées sur la copie.
(a) Ecrire précisément le modèle ajusté.
(b) Donner une estimation des paramètres avec un intervalle de confiance à 95%.
(c) Discuter les résultats numériques donnés par la fonction summary.
(d) Tracer le nuage de points et la droite des moindres carrés sur le même graphique. Reproduire rapidement le graphique obtenu sur la copie. Les hypothèses du modèle linéaire vous semblent-elles raisonnables ?
2. Ajuster un modèle de régression linéaire pour expliquer la variable
"Fertility" à partir des autres variables puis discuter les points suivants. On donnera les commandes R utilisées sur la copie.
(a) Ecrire précisément le modèle ajusté.
(b) Discuter les résultats numériques donnés par la fonction summary.
(c) Le modèle est-il meilleur que le modèle de la question précédente ? (d) Avez-vous des idées pour améliorer ce modèle ?
2