• Aucun résultat trouvé

6 : Régression linéaire multiple 3

N/A
N/A
Protected

Academic year: 2022

Partager "6 : Régression linéaire multiple 3"

Copied!
2
0
0

Texte intégral

(1)

Université de Caen M1

TP n

o

6 : Régression linéaire multiple 3

Exercice 1. On considère le jeu de donnéescars disponible dans R.

1. Reproduire les commandes suivantes : data(cars)

attach(cars) names(cars) help(cars)

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variabledist à partir de la variable speed. Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant. Envisager une amélioration possible de votre modèle.

Exercice 2. On considère le jeu de donnéesforbes disponible dans la librairie alr3de R.

1. Reproduire les commandes suivantes : library(alr3)

data(forbes) attach(forbes) names(forbes)

help(forbes) # choisir celui de la librairie alr3

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variableLpres à partir de la variable Temp. Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant. Envisager une amélioration possible de votre modèle.

Exercice 3. On considère le jeu de donnéesstackloss disponible dans R.

1. Reproduire les commandes suivantes : data(stackloss)

attach(stackloss) names(stackloss) help(stackloss)

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variable stack.loss à partir des variablesAir.Flow,

Water.Temp et Acid.Conc.. Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant. Envisager une amélioration possible de votre mod- èle.

C. Chesneau 1 TP no 6

(2)

Université de Caen M1

Exercice 4. On considère le jeu de donnéestrees disponible dans R.

1. Reproduire les commandes suivantes :

data(trees) attach(trees) names(trees) help(trees)

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variable Volume à partir des variablesHeightet Girth. Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant.

Envisager une amélioration possible de votre modèle.

Exercice 5. On considère le jeu de donnéesLifeCycleSavings disponible dans R.

1. Reproduire les commandes suivantes :

data(LifeCycleSavings) attach(LifeCycleSavings) names(LifeCycleSavings) help(LifeCycleSavings)

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variable sr à partir des variables pop15, pop75, dpi et ddpi.

Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant. Envisager une amélioration possible de votre modèle.

Exercice 6. On considère le jeu de donnéesp9.10 disponible dans la librairieMPV de R.

1. Reproduire les commandes suivantes :

library(MPV) data(p9.10) attach(p9.10) names(p9.10) help(p9.10)

Comprendre le contexte de l’étude.

2. On cherche à expliquer la variableyà partir des variablesx1,x2, x3,x4,x5etx6. Proposer un modèle adapté au problème, avec un maximum d’arguments mathématiques le validant.

Envisager une amélioration possible de votre modèle.

C. Chesneau 2 TP no 6

Références

Documents relatifs

Si X est une matrice de taille (p,n) dont les colonnes sont les différentes données x k , et Y est un vecteur colonne de taille n, [a,b]=reglin(X,Y) renvoie le vecteur ligne a et

En régression multiple (toutes les variables expli- catives quantitatives), le modèle complet est considéré comme étant celui de faible biais mais en analyse de covariance quels

Les choix : présence ou non d’une interaction entre deux variables, présence ou non d’un terme qua- dratique se traitent alors avec les mêmes outils que ceux des choix de variable

Tester au risque 5% l’hypothèse selon laquelle la performance sportive ne dépend pas de la force musculaire en plus de la capacité thoracique.. Tester au risque 5% l’hypothèse

Ces points doivent se répartir de façon aléatoire de part et d’autre de l’axe des abscisses, faute de quoi le modèle affine est à rejeter.. Coefficient de corrélation

Quelles sont les hypothèses adaptées à la situation suivante : "on souhaite affirmer, avec un faible risque de se tromper, qu’en moyenne, le nombre d’années d’études de

Déterminer un intervalle de confiance (aléatoire) pour θ 2 au niveau 90% de la forme ]0, U ], où U est une var que l’on

On suppose désormais que M est