• Aucun résultat trouvé

Examen sur le modèle linéaire Mardi 17 décembre 2019

N/A
N/A
Protected

Academic year: 2022

Partager "Examen sur le modèle linéaire Mardi 17 décembre 2019"

Copied!
2
0
0

Texte intégral

(1)

UNIVERSITE DE BRETAGNE OCCIDENTALE

Année 2019-2020

Master EURIA 1ère ANNEE

Examen sur le modèle linéaire Mardi 17 décembre 2019

Polycopié distribué en cours, notes manuscrites et ordinateurs autorisés.

Exercice 1.

Démontrer que l’estimateur des moindres-carrés coïncide avec l’estimateur du maximum de vraisemblance dans le modèle linéaire gaussien. On détaillera le raisonnement.

Exercice 2.

1. On noteE l’espace vectoriel engendré par les vecteurs (1,1,0) et(1,0,1). Soit x= (x1, x2, x3) R3. Calculer πE(x) le projeté orthogonal dex surE etπE(x) le projeté orthogonal de x surE.

2. SoientX1, X2 et X3 trois variables aléatoires gaussiennes indépendantes telles que E[Xi] = 0 et var(Xi) = 1. On note X = (X1, X2, X3). Quelle est la loi de πE(X)? Quelle est la loi de ||πE(X)||2?

3. Quelle est la loi de (2X1+X2+X3)2+(X6(X1+2X2X3)2+(X1X2+2X3)2

1X2X3)2 ?

Exercice 3.

1. Simuler un jeu de données qui contient

— 100 femmes et 100 hommes,

— une variable x, qui représente l’âge des individus, simulée selon une loi uniforme sur l’intervalle [20,80],

— une variable y, qui représente le montant des sinistres, simulée selon le modèle

Yi = {

αF +βFxi+Wi si l’individu i est une femme αM +βMxi+Wi si l’individu i est un homme avec (W1, ..., Wn)des variables aléatoires qui suivent la loi N(0, σ2).

On prendra les valeurs αF = 0, αM = 1,βF = 1, βM = 2,σ = 10 pour les paramètres. On stockera les simulations dans un objet de type data.frame avec des colonnes nommées AGE, GENRE, MONTANT. Donner les commandes R utilisées sur la copie.

1

(2)

2. Estimer les paramètres du modèle à partir des données simulées en utilisant la commande lm. On donnera les commandes R utilisées sur la copie et on reportera les valeurs numériques obtenues.

3. Réaliser le test de l’hypothèseH0 :βF =βM avec R de deux manières différentes :

— en utilisant un test basé sur la loi de Student ;

— en utilisant un test basé sur la loi de Fisher

On donnera les commandes R utilisées sur la copie et on reportera les valeurs numériques obtenues.

4. Montrer que le modèle peut s’écrire sous la forme matricielleY =+W avecX une matrice qu’on explicitera. Vérifier avec R qu’on retrouve la même estimation en utilisant la formule du cours Bˆ = (XX)−1XY et la fonction lm.

5. Décrire une procédure permettant d’estimer le biais et la variance des estimateurs des paramètres inconnus. Implémenter la méthode avec R et reporter les valeurs numériques obtenues sur la copie.

Exercice 4.

On considère dans cet exercice le jeu de données AutoClaims disponible dans le package insuranceData (les données ont été envoyées avant l’examen, contactez le surveillant si vous n’avez pas accès au jeu de données).

Proposer un ou plusieurs modèles de régression pour expliquer la variable PAID à partir des autres variables. On discutera précisément les modèles ajustés, les méthodes utilisées et les résultats obtenus. Les valeurs numériques et graphiques les plus intéressants doivent être reproduits sur la copie mais il n’est pas utile de reproduire les codes R.

2

Références

Documents relatifs

Comparer le modèle de régression linéaire simple obtenu quand on explique CHOM à partir de BRENT et le modèle obtenu quand on remplace BRENT par BRENT2.. Quel modèle donne les

Afin de modéliser le nombre de sinistres (noté y i ) en fonction de l’âge de l’assuré (noté x i ), un actuaire utilise un modèle GLM log-Poisson (c’est à dire un GLM Poisson

On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le modèle GLM Poisson avec pour lien la fonction ln et deux variables explicatives2.

On considère dans cet exercice le modèle de régression linéaire simple dans lequel le nombre de variable explicative est p = 1.. On utilise les notations

Dans ce contexte de données manquantes, une solution simple pour estimer β 0 consiste à mener une analyse en "cas complets" ("CC" par la suite) c’est-à-dire à :

Combien de sous-familles obtenez-vous ? Justifiez votre réponse. En utilisant l’architecture en domaines et l’alignement multiple, identifiez à quelle

d) Détailler l’expression du flux d’un champ de vecteurs ~ v au travers de la surface du paral- lélépipède, en fonction de ces quantités. En déduire l’expression de la

 Soit le code 38 du sujet de la question ne figure pas dans la table SUJET, Dans ce cas, il faut l’insérer avec le libellé ‘Sport’ dans la table SUJET. Liste des