• Aucun résultat trouvé

Examen sur le Modèle Linéaire

N/A
N/A
Protected

Academic year: 2022

Partager "Examen sur le Modèle Linéaire"

Copied!
2
0
0

Texte intégral

(1)

UNIVERSITE DE BRETAGNE OCCIDENTALE

Année 2019-2020

L3 MIASHS

Examen sur le Modèle Linéaire

Document autorisé : une feuille A4 sans démonstration ni correction d’exercice.

Ordinateurs autorisés.

Exercice 1.

On considère dans cet exercice le modèle de régression linéaire avec p= 0 variable explicative défini par

Yi =β0+Wi

avec les notations et hypothèses du cours. On supposera que les résidus Wi suivent une loi normale avec E[Wi] = 0 et var(Wi) =σ2.

1. Quel est l’estimateur des moindres-carrésBˆ0 deβ0? On démontrera le résultat en repartant de la définition de l’estimateur des moindres-carrés.

2. Quelle est la loi deYi? Quelle est la loi de Yiσβ0 ? Quelle est la loi de

n

i=1

(Yiβ0)2 σ2 ?

3. D’après le cours, ∑n

i=1

(YiBˆ0)2

σ2 suit une loi du χ2. Quel est le degré de liberté de cette loi ?

4. On noteχ2k,α le quantile d’ordre α de la loi du χ2 à k degrés de liberté.

Montrer que si U suit une loi du χ2 à k degrés de liberté alors P2k,α/2 ≤U ≤χ2k,1α/2) = 1−α.

5. En déduire un intervalle de confiance au niveau de confiance1−α pour σ.

6. En déduire un test de l’hypothèseH0 :σ=σ0 avecσ0 R+ une valeur donnée. Quelle est la p-value du test ?

1

(2)

Exercice 2.

On considère dans cet exercice le jeu de données swiss disponible dansR. On pourra créer un data.frame nommé z qui contient les données en tapant la

commande z=swiss. La commande?swiss permet d’obtenir un descriptif du jeu de données. Il contient, pour chaque canton suisse en 1888, les variables suivantes

— "Fertility" : taux de fertilité normalisé ;

— "Agriculture" : pourcentage de la population qui travaille dans le domaine agricole ;

— "Examination" : le pourcentage d’appelés au service militaire qui a obtenu une bonne note aux évaluations réalisées par l’armée ;

— "Education" : le pourcentage de la population qui a continué ses études après l’école primaire

— "Catholic" : le pourcentage de catholique dans la population

— "Infant.Mortality" : taux de décès chez les enfants de moins de 1 an.

Ce jeu de données intéresse les démographes pour analyser les raisons qui ont conduit à une réduction du taux de natalité dans les pays occidentaux avec le développement économique.

1. Ajuster un modèle de régression linéaire simple pour expliquer la variable

"Fertility" à partir de la variable "Education" puis discuter les points suivants. On donnera les commandes R utilisées sur la copie.

(a) Ecrire précisément le modèle ajusté.

(b) Donner une estimation des paramètres avec un intervalle de confiance à 95%.

(c) Discuter les résultats numériques donnés par la fonction summary.

(d) Tracer le nuage de points et la droite des moindres carrés sur le même graphique. Reproduire rapidement le graphique obtenu sur la copie. Les hypothèses du modèle linéaire vous semblent-elles raisonnables ?

2. Ajuster un modèle de régression linéaire pour expliquer la variable

"Fertility" à partir des autres variables puis discuter les points suivants. On donnera les commandes R utilisées sur la copie.

(a) Ecrire précisément le modèle ajusté.

(b) Discuter les résultats numériques donnés par la fonction summary.

(c) Le modèle est-il meilleur que le modèle de la question précédente ? (d) Avez-vous des idées pour améliorer ce modèle ?

2

Références

Documents relatifs

Afin de modéliser le nombre de sinistres (noté y i ) en fonction de l’âge de l’assuré (noté x i ), un actuaire utilise un modèle GLM log-Poisson (c’est à dire un GLM Poisson

On donnera toutes les commandes R utilisées sur la copie On considère dans cet exercice le modèle GLM Poisson avec pour lien la fonction ln et deux variables explicatives2.

On considère dans cet exercice le modèle de régression linéaire simple dans lequel le nombre de variable explicative est p = 1.. On utilise les notations

On considère dans cet exercice le jeu de données AutoClaims disponible dans le package insuranceData (les données ont été envoyées avant l’examen, contactez le surveillant si

Dans ce contexte de données manquantes, une solution simple pour estimer β 0 consiste à mener une analyse en "cas complets" ("CC" par la suite) c’est-à-dire à :

Et les rapports qu'ils feront apparaître entre les collectivités considérées seront également faussés : car selon la répartition par âges adoptée, les avantages ou

Tous ces chiffres se sont rapidement abaissés pendant cette période décennale, à tel point qu'en 1901 la probabilité qu'une femme ayant eu deux enfants redevienne mère dans

Avec cinq graduations intermédiaires au minimum, celui-ci donne 40 configurations possibles qui incluent les deux qui viennent d’être mentionnées.. Pour L variant de 24