• Aucun résultat trouvé

Exemple de sélection de variables

N/A
N/A
Protected

Academic year: 2022

Partager "Exemple de sélection de variables"

Copied!
2
0
0

Texte intégral

(1)

90 92 94 96 98 100 102 104 106 108 110 -1

-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

Résidus du modele y=b 0+b

1*x+b 2*x2

x

e

Sélection de variables

Cas 1: Y=(X-100)2

a) Sélection avant et « stepwise »:

La variable la plus corrélée est x2, mais SCRm=16.3 et SCE=22416. L’ajout de la variable x2 n’est donc pas significatif puisque (16.3/1)/(22416/19)=.0138, ce qui est très inférieur à une F1,19,.05=4.38. Donc, aucune variable n’est sélectionnée mais les résidus sont inacceptables car ils montrent clairement qu’une tendance quadratique a été oubliée dans le modèle.

Supposons que l’on force le modèle Y=b0+b1X+b2X2+e.

On obtient les résidus suivants :

b) Élimination arrière : aucune variable ne peut être éliminée -> on a le bon modèle.

c) Statistique Cp : avec x et x2 : Cp=3 avec x, Cp=1.1*1028

avec x2, Cp=1.1*1028

Clairement seul le modèle avec x et x2 est adéquat, donc on a le bon modèle.

2e cas : Y=X3+300*x+N(0,1) a) Sélection avant :

Étape Variable F ajout F table (.05)

1 x2 8080 4.38

2 x 6.5 4.41

3 x3 58000 4.45

Les 3 ajouts sont significatifs. Le R2 vaut 1. Toutefois, l’examen des coefficients et de leurs écarts-types révèle que le coefficient associé à x2 et à la constante n’est pas significativement différent de zéro :

90 92 94 96 98 100 102 104 106 108 110

-80 -60 -40 -20 0 20 40

Résidus du modele y=b0

x

e

(2)

Variable b Écart-type

x 300.2 0.34

x2 -.029 0.04

x3 1.00 0.001

cte -0.44 0.764

En reprenant la régression sans la constante et sans le x2, on obtient à nouveau un R2 de 1, et les coefficients de x et x3 sont fortement significatifs.

b) Élimination arrière :

SCE avec cte, x, x2 x3 : 18.23 SCE avec cte, x, x3 : 18.80 SCE avec x, x3 : 18.81

On peut éliminer x2 car

0 53 4 45

17 23 18

1 23 18 80 18

05 17

1

.

F / .

.

/ ) . .

(

,.

,

=

<

=

.

On peut éliminer la constante, car : 0.01 4.41 18

/ 80 . 18

1 / ) 80 . 18 81 . 18 (

05 ,.

18 ,

1 =

<

=

F

c) Stepwise : on inclut x2, x, x3 puis on élimine x2 et on élimine la constante.

d) Statistique Cp :

Modèle Cp Modèle Cp

cte, x, x2, x3 4 x, x2, x3 3 cte, x, x2 5.8*105 x, x2 9.2*105

cte, x,x3 2.5 x,x3 1.2

cte, x2, x3 7.8*105 x2, x3 8*105

cte, x1 1.9*107 x1 3.4*107

cte, x2 7.9*105 x2 3.9*106

cte, x3 1.1*107 x3 3.9*107

Les seuls modèles acceptables sont (cte, x, x2 et x3), (cte, x, x3), (x,x2,x3) et (x,x3), celui-ci étant le meilleur de tous au sens de la statistique Cp. Si l’on examine le modèle cte, x, x2 x3, on constate que la constante et le coefficient pour b2 ne sont pas significatifs puisque l’intervalle de confiance inclut le 0 au niveau

α

=0.05.

(b0/sb0=-0.57; b1/sb1=885; b2/sb2=-0.7; b3/sb3=763).

Note : Les coefficients trouvés avec x et x3 (modèle sans constante) sont b1=299.9 et b3=1.00, soit presque exactement le modèle théorique. Le R2 vaut presque 1.

Les résidus ne montrent pas d’anomalies particulières :

0 2 4 6 8 10 12 14 16 18 20

-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

Résidus du modele y=b1*x+b3*x3

x

e

Références

Documents relatifs

© Hugolescargot.com - Retrouvez d’autres fiches scolaires sur le site d’Hugo l’escargot..

par V. — L'algorithme présenté généralise celui de Balas au cas quadratique, moyennant certaines hypothèses restrictives sur les coefficients. Néanmoins, Valgorithme s'applique à

Le cardinal de l'ensemble préfixe (u) f) suffixe (w) est proportionnel à la longueur de l'équation, et la substitution peut être réalisée en temps proportionnel à la longueur

D’autre part si on compare les prédicteurs lissage exponentiel simple et moyenne mobile simple, on note que le prédicteur MBS d’ordre élevé donne pour la plupart

Nous donnons ici des résultats sur données simulées pour comparer les estimateurs obtenus en supposant le modèle à erreurs et ceux de la régression classique. En

Dans la section 2, nous introduisons brièvement les modèles loglinéaires pour variables qualitatives ; une attention spéciale est portée sur les modèles graphiques qui

Résumé : Reprenant les travaux [9] [19] [ 2 ] , nous présentons les distributions asymptotiques des estimateurs du maximum de vraisemblance approchée pour un modèle de

Nous allons voir maintenant comment poursuivre la démarche pour obtenir la normalité des résidus modifiés, la présentation géométrique adoptée rendant leur élaboration intui-