• Aucun résultat trouvé

Introduction à la régression cours n°2

N/A
N/A
Protected

Academic year: 2022

Partager "Introduction à la régression cours n°2"

Copied!
22
0
0

Texte intégral

(1)

Introduction à la régression cours n°2

ENSM.SE – axe MSA

(2)

Analyse de variance (ANOVA)

SST n-1

Total

SSE/(n-p-1) SSE

n-p-1 Error

SSR/p SSR

p Regression

MS SS

DF Source

sum of squares

degrees of freedom mean squares

source de variation

(3)

Sum of squares

SSR =

SSE =

SST =

!

i=1 n

(y^i - y_ )?

!

i=1 n

(yi - y^i)?

!

i=1 n

(yi - y_ )?

(4)

Exercice

Représenter graphiquement les vecteurs Y, et de sorte que les quantités SSR, SSE et SST soient apparentes. Indiquer

tous les angles droits et en déduire des relations.

Donner la dimension des e.v. auxquels appartiennent les vecteurs :

Y^ Y_

Y-Y_

, Y^ -Y_

et Y-Y^

(5)

Formule d’ANOVA

SST = SSR + SSE

Coefficient de détermination :

R² = SSR/SST = 1 – SSE/SST

Utilisations de R²

Coefficient de détermination ajusté :

R²-adj = 1 - MSE/MST

(6)

Exemple 2

Réponse = pourcentage d'un rendement maximal de blé

Prédicteur = quantité de pluies printanières (en m).

54 observations

(7)

Exemple 1

0.050 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

pluie en m r

e n d e m e n t ( s a n s u n i t é )

(8)

modèle rend= β

0

+ β

pluie

pluie

0.050 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

modèle β

0 + β

pluie pluie

pluie en m

rendement (sans unité)

(9)

Exemple 2 – modèle de degré 1

Modèle rendement ! "0 + "pluie pluie

Source DF SS MS

Regression 1 1.279 1.279

Error 52 0.141 0.003

Total 53 1.420

R? 0.901 R?-adj 0.899

(10)

rend= β

0

+ β

pluie

pluie + β

pluie^2

pluie²

0.050 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

modèle β 0 + β

pluie pluie+ β

pluie2 pluie2

pluie en m

rendement (sans unité)

(11)

Exemple 2 – modèle de degré 2

Modèle rendement ! "0 + "pluie pluie + "pluie^2 pluie?

Source DF SS MS

Regression 2 1.298 0.649

Error 51 0.122 0.002

Total 53 1.420

R? 0.914 R?-adj 0.911

(12)

Questions de prédicteurs

prédicteurs qualitatifs

codage des niveaux

prédicteurs corrélés

problème d’identifiabilité

interaction de prédicteurs

notion liée à la réponse

sans rapport avec la corrélation

(13)

Exemple 1

Rappel étape précédente : passer au logarithme et modèle de degré 1.

Autres prédicteurs :

Surface

Catégorie

Prestataire

(14)

Interaction CA*prestataire

8.0 8.5 9.0 9.5 10.0 10.5 11.0

1234567

log(CA)

log(cartons)

prestataire O prestataire C

(15)

1234567

8.0 9.0 10.0 11.0

8.0 9.0 10.0 11.0 8.0 9.0 10.0 11.0

1234567

log(CA)

log(cartons)

6 7 8 9

Given : log(surface)

(16)

8.0 9.0 10.0 11.0

1234567

8.0 9.0 10.0 11.0

log(CA)

log(cartons)

hyper

super

Given : Catégorie

(17)

8.0 9.0 10.0 11.0

1234567

8.0 9.0 10.0 11.0

log(CA)

log(cartons)

prestataire C

prestataire O

Given : Prestataire

(18)

Le modèle linéaire

Y vecteur des réponses

X matrice du plan d’expériences

β vecteurs des paramètres

ε vecteurs des écarts au modèle : Y = Xβ + ε

(19)

Hypothèses sur les résidus

ε1, …, εn sont des réalisations de v.a.

E1, …, En

Les Ei sont indépendantes

Les Ei sont de loi N(0,σ²)

(20)

Estimation de β

Estimation par Maximum de vraisemblance

résultat = moindres carrés !

adaptation à des hypothèses différentes sur la loi des résidus

à voir : régression logistique

(21)

Propriétés de

E( ) = β

Cov( ) = σ² (X’ X)-1

 est BLUE

A un facteur près, cov( ) ne dépend que du plan d’expériences, pas des résultats.

! ^

!^

!^ !^

!^

(22)

Exercice

Soit un modèle de dimension 1 avec un seul prédicteur :

y = β0 + β1 x + ε

Déterminer cov( )

Les expériences sont menées avec x[-1,1].

Déterminer les niveaux des variables de façon à estimer « au mieux » β.

!^

Références

Documents relatifs

• Exemple : ajuster la série précédente à l’aide d’une droite en utilisant la méthode de Meyer. • Méthode : on détermine l’équation de la droite passant par deux points moyens

Les vecteurs bleus sont tous égaux les uns aux autres : on dit qu’ils sont les représentants du même vecteur.. Les vecteurs verts sont tous égaux les uns aux autres : on dit

Exercice 2 La fréquence de vibration f (en hertz) d'une corde tendue dépend de sa longueur (en mètres) et de sa tension T (en newtons).. Pour une corde de violon (de longueur utile

Lorsque nous comparons entre elles, sous le point de vue appelé rapport géométrique, deux quantités d’un genre susceptible de four-.. nir des valeurs négatives,

 Résidus bruts, standardisés, studentisés très différents pour cette observation... sans obs n°9 -

Introduction à la régression cours n°1. ENSM.SE –

Introduction à la régression cours n°3.. ENSM.SE –

 Intérêt  : la concentration en peptide-C reflète le potentiel d’un individu à sécréter l’insuline et donc à métaboliser les glucides.  Problème : prévoir