• Aucun résultat trouvé

Examen sur le modèle linéaire

N/A
N/A
Protected

Academic year: 2022

Partager "Examen sur le modèle linéaire"

Copied!
2
0
0

Texte intégral

(1)

UNIVERSITE DE BRETAGNE OCCIDENTALE

Année 2017-2018

Master EURIA 1ère ANNEE

Examen sur le modèle linéaire

Polycopié distribué en cours, notes manuscrites et ordinateurs autorisés.

Donner toutes les commandes R utilisées.

Exercice 1.

On reprend les notations du cours sur le modèle de régression linéaire simple et on considère le modèle sans constante défini par

Yi =βxi+Wi (1)

pour i∈ {1...n}.

1. Que représentent Yi, β, xi et Wi dans (??) ? Quelles hypothèses sont faites dans le modèle de régression linéaire sur (W1, ..., Wn)? On fera ces

hypothèses dans la suite de l’exercice.

2. Calculer l’estimateur des moindres carrés deβ. On notera B˜ cet estimateur.

3. Calculer le biais et la variance deB.˜

4. On suppose dans la suite de l’exercice que les résidus suivent une loi normale (modèle linéaire gaussien). Donner la fonction de vraisemblance puis les estimateurs du maximum de vraisemblance de β et σ2.

5. Montrer queB˜ suit une loi normale dont on précisera les paramètres.

6. On note∑n Y˜i = ˜Bxi et W˜i =Yi−Y˜i. Montrer que la variable aléatoire

i=1W˜i2 est indépendante de B˜ et suit une loi du χ2, dont on précisera la degrés de liberté.

7. En déduire un estimateur sans biais de σ2.

8. En déduire des intervalles de confiance pourβ etσ.

9. Proposer un test de l’hypothèseH0 :β = 0. On explicitera la p-value du test.

10. Illustrer le résultat de la question 7. en utilisant des simulations et R. On donnera toutes les commandes R utilisées sur la copie.

1

(2)

Exercice 2. On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le jeu de données UScrimedisponible dans le package MASS.

1. Décrire rapidement le jeu de données.

2. Représenter la matrice de corrélation et analyser les corrélations entre la variable y et les autres variables.

3. Proposer un modèle permettant d’expliquer la variabley à partir des autres variables. On décrira précisément la démarche utilisée pour choisir et valider le modèle et on discutera les résultats obtenus.

Exercice 3. On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le modèle GLM Poisson avec pour lien la fonction ln et deux variables explicatives.

1. Décrire précieusement le modèle (avec les notations du cours). Comment s’écrit le modèle lorsqueβ2 = 0? Dans la suite de l’exercice, le modèle avec β2 quelconque sera appelé "modèle complet" et le modèle avecβ2 = 0 sera appelé "modèle restreint"

2. On suppose dans cette question que β2 = 0. Pourquoi est-ce-qu’on s’attend à ce que le modèle restreint donne de meilleurs résultats en prédiction que le modèle complet ? Réaliser des simulations qui mettent en évidence ce

phénomène.

2

Références

Documents relatifs

k. D’après l’allure de la courbe, on remarque qu’à partir de la position x c = 0.15 vers le bord de fuite, la couche limite est soumise à un gradient de pression défavorable.. La

Estimer, à l’aide de l’équation de cette droite d’ajustement linéaire, le nombre de mariages entre personnes de sexes différents en France

Afin de modéliser le nombre de sinistres (noté y i ) en fonction de l’âge de l’assuré (noté x i ), un actuaire utilise un modèle GLM log-Poisson (c’est à dire un GLM Poisson

On considère dans cet exercice le modèle de régression linéaire simple dans lequel le nombre de variable explicative est p = 1.. On utilise les notations

On considère dans cet exercice le jeu de données AutoClaims disponible dans le package insuranceData (les données ont été envoyées avant l’examen, contactez le surveillant si

(e) Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

On constate d’ailleurs que les trois dernières valeurs sont quasiment égales, ce qui laisse penser à un ralentissement de la diminution du nombre