Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I R² est aussi égal à la corrélation (échantillonnale) au carré entre Y et ˆY.

I Pour rendre la preuve plus facile, introduisons un peu de notation.

M⁰ ≡

I−i i⁰i−1

i⁰ .

I On a

M⁰Y =Y −Y,¯

M⁰⁰=M⁰, et M⁰M⁰ =M⁰.

I M⁰ est une matrice idempotente.

Ajustement statistique (suite)

I Nous pouvons r´e´ecrire leR² comme

R² ≡ ESS TSS =

Yˆ −Y¯0

Yˆ −Y¯ Y −Y¯0

Y −Y¯

= Yˆ⁰M⁰Yˆ Y⁰M⁰Y. Nous avons aussi

M⁰Uˆ = Û puisque la somme des résidus est zéro.

Ajustement statistique (suite)

I Nous pouvons r´e´ecrire leR² comme

R² ≡ ESS TSS =

Yˆ −Y¯0

Yˆ −Y¯ Y −Y¯0

Y −Y¯

= Yˆ⁰M⁰Yˆ Y⁰M⁰Y.

Nous avons aussi

M⁰Uˆ = Û puisque la somme des résidus est zéro.

Ajustement statistique (suite)

I Nous pouvons r´e´ecrire leR² comme

R² ≡ ESS TSS =

Yˆ −Y¯0

Yˆ −Y¯ Y −Y¯0

Y −Y¯

= Yˆ⁰M⁰Yˆ Y⁰M⁰Y. Nous avons aussi

M⁰Uˆ= Û puisque la somme des résidus est zéro.

Ajustement statistique (suite)

I Donc, nous avons

Yˆ⁰M⁰Yˆ = ˆY⁰M⁰

Y −Uˆ

= ˆY⁰M⁰Y −Yˆ⁰M⁰Uˆ

= ˆY⁰M⁰Y −Yˆ⁰Uˆ

= ˆY⁰M⁰Y −βˆ⁰X⁰Uˆ (puisque ˆY ≡Xβ)ˆ

= ˆY⁰M⁰Y −0 = ˆY⁰M⁰Y

puisque X⁰Uˆ= 0 (orthogonalit´e entre les variables expicatives et les r´esidus).

Ajustement statistique (suite)

I Donc, nous avons

Yˆ⁰M⁰Yˆ = ˆY⁰M⁰

Y −Uˆ

= ˆY⁰M⁰Y −Yˆ⁰M⁰Uˆ

= ˆY⁰M⁰Y −Yˆ⁰Uˆ

= ˆY⁰M⁰Y −βˆ⁰X⁰Uˆ (puisque ˆY ≡Xβ)ˆ

= ˆY⁰M⁰Y −0 = ˆY⁰M⁰Y

puisque X⁰Uˆ= 0 (orthogonalit´e entre les variables expicatives et les r´esidus).

Ajustement statistique (suite)

I Donc, nous avons

Yˆ⁰M⁰Yˆ = ˆY⁰M⁰

Y −Uˆ

= ˆY⁰M⁰Y −Yˆ⁰M⁰Uˆ

= ˆY⁰M⁰Y −Yˆ⁰Uˆ

= ˆY⁰M⁰Y −βˆ⁰X⁰Uˆ (puisque ˆY ≡Xβ)ˆ

= ˆY⁰M⁰Y −0 = ˆY⁰M⁰Y

puisque X⁰Uˆ= 0 (orthogonalit´e entre les variables expicatives et les r´esidus).

Ajustement statistique (suite)

I Donc, nous avons

Yˆ⁰M⁰Yˆ = ˆY⁰M⁰

Y −Uˆ

= ˆY⁰M⁰Y −Yˆ⁰M⁰Uˆ

= ˆY⁰M⁰Y −Yˆ⁰Uˆ

= ˆY⁰M⁰Y −βˆ⁰X⁰Uˆ (puisque ˆY ≡Xβ)ˆ

= ˆY⁰M⁰Y −0 = ˆY⁰M⁰Y

puisque X⁰Uˆ= 0 (orthogonalit´e entre les variables expicatives et les r´esidus).

Ajustement statistique (suite)

I Donc, nous avons

Yˆ⁰M⁰Yˆ = ˆY⁰M⁰

Y −Uˆ

= ˆY⁰M⁰Y −Yˆ⁰M⁰Uˆ

= ˆY⁰M⁰Y −Yˆ⁰Uˆ

= ˆY⁰M⁰Y −βˆ⁰X⁰Uˆ (puisque ˆY ≡Xβ)ˆ

= ˆY⁰M⁰Y −0 = ˆY⁰M⁰Y

puisque X⁰Uˆ= 0 (orthogonalit´e entre les variables expicatives et les r´esidus).

Ajustement statistique (suite)

I Nous pouvons donc ´ecrire leR² comme R² = Yˆ⁰M⁰Y

Y⁰M⁰Y

= Yˆ⁰M⁰Y Y⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y

(multipliant numérateur et dénominateur par la même chose)

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Yˆ .

Ajustement statistique (suite)

I Nous pouvons donc ´ecrire leR² comme R² = Yˆ⁰M⁰Y

Y⁰M⁰Y

= Yˆ⁰M⁰Y Y⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y

(multipliant numérateur et dénominateur par la même chose)

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Yˆ .

Ajustement statistique (suite)

I Nous pouvons donc ´ecrire leR² comme R² = Yˆ⁰M⁰Y

Y⁰M⁰Y

= Yˆ⁰M⁰Y Y⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y

(multipliant numérateur et dénominateur par la même chose)

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Yˆ .

Ajustement statistique (suite)

I Nous pouvons donc ´ecrire leR² comme R² = Yˆ⁰M⁰Y

Y⁰M⁰Y

= Yˆ⁰M⁰Y Y⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y

(multipliant numérateur et dénominateur par la même chose)

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Y

Yˆ⁰M⁰Y Yˆ⁰M⁰Y (Y⁰M⁰Y)

Yˆ⁰M⁰Yˆ .

Ajustement statistique (suite)

I On peut r´e´ecrire ceci en notation non matricielle pour obtenir Yˆ⁰M⁰Y Yˆ⁰M⁰Y

Ajustement statistique (suite)

I On peut r´e´ecrire ceci en notation non matricielle pour obtenir Yˆ⁰M⁰Y Yˆ⁰M⁰Y

Ajustement statistique (suite)

I On peut r´e´ecrire ceci en notation non matricielle pour obtenir Yˆ⁰M⁰Y Yˆ⁰M⁰Y

Ajustement statistique (suite)

I On peut r´e´ecrire ceci en notation non matricielle pour obtenir Yˆ⁰M⁰Y Yˆ⁰M⁰Y

Ajustement statistique (suite)

prédire les variations de la variable dépendante autour de sa moyenne (mesuré par la corrélation entre les valeurs prédites et les valeurs réalisées).

Ajustement statistique (suite)

prédire les variations de la variable dépendante autour de sa moyenne (mesuré par la corrélation entre les valeurs prédites et les valeurs réalisées).

Ajustement statistique (suite)

prédire les variations de la variable dépendante autour de sa moyenne (mesuré par la corrélation entre les valeurs prédites et les valeurs réalisées).

Ajustement statistique (suite)

I Dans le cas du mod`ele de r´egression simple, nous avons Yˆ_i−Y¯

= X_i−X¯βˆ₁.

I Nous avons tout de suite



Ajustement statistique (suite)

I Dans le cas du mod`ele de r´egression simple, nous avons Yˆ_i−Y¯

= X_i−X¯βˆ₁.

I Nous avons tout de suite



Ajustement statistique (suite)

I Dans le cas du mod`ele de r´egression simple, nous avons Yˆ_i−Y¯

= X_i−X¯βˆ₁.

I Nous avons tout de suite



Ajustement statistique (suite)





1 n−1

i=1 X_i −X¯

Y_i −Y¯ q 1

n−1

i=1 Yi −Y¯2q

1 n−1

i=1 Xi−X¯2





≡ Corr (Y,X)2

⇒R² = Corr (Y,X)2

I On voit que le résultat trouvé dans le chapitre sur le modèle de régression simple n’est qu’un cas spécial du résultat général développé ici.

Ajustement statistique (suite)





1 n−1

i=1 X_i −X¯

Y_i −Y¯ q 1

n−1

i=1 Yi −Y¯2q

1 n−1

i=1 Xi−X¯2





≡ Corr (Y,X)2

⇒R² = Corr (Y,X)2

I On voit que le résultat trouvé dans le chapitre sur le modèle de régression simple n’est qu’un cas spécial du résultat général développé ici.

Ajustement statistique (suite)





1 n−1

i=1 X_i −X¯

Y_i −Y¯ q 1

n−1

i=1 Yi −Y¯2q

1 n−1

i=1 Xi−X¯2





≡ Corr (Y,X)2

⇒R² = Corr (Y,X)2

I On voit que le résultat trouvé dans le chapitre sur le modèle de régression simple n’est qu’un cas spécial du résultat général développé ici.

Ajustement statistique (suite)





1 n−1

i=1 X_i −X¯

Y_i −Y¯ q 1

n−1

i=1 Yi −Y¯2q

1 n−1

i=1 Xi−X¯2





≡ Corr (Y,X)2

⇒R² = Corr (Y,X)2

I On voit que le résultat trouvé dans le chapitre sur le modèle de régression simple n’est qu’un cas spécial du résultat général développé ici.

R

ajust´ e

I Ajouter une variable explicative au mod`ele ne peut que faire augmenter R².

I Avec autant de variables explicatives que d’observations ((k+ 1) =n), on aura R² = 1.X est alors une matrice carr´ee et on a

0 =U =Y −Xβˆ

⇒Y =Xβ.ˆ

⇒βˆ=X⁻¹Y.

I Donc, unR² ´elev´e n’est pas toujours et partout une bonne chose.

R

ajust´ e

I Ajouter une variable explicative au mod`ele ne peut que faire augmenter R².

I Avec autant de variables explicatives que d’observations ((k+ 1) =n), on aura R² = 1.X est alors une matrice carr´ee et on a

0 =U =Y −Xβˆ

⇒Y =Xβ.ˆ

⇒βˆ=X⁻¹Y.

I Donc, unR² ´elev´e n’est pas toujours et partout une bonne chose.

R

ajust´ e

I Ajouter une variable explicative au mod`ele ne peut que faire augmenter R².

I Avec autant de variables explicatives que d’observations ((k+ 1) =n), on aura R² = 1.X est alors une matrice carr´ee et on a

0 =U =Y −Xβˆ

⇒Y =Xβ.ˆ

⇒βˆ=X⁻¹Y.

I Donc, unR² ´elev´e n’est pas toujours et partout une bonne chose.

R

ajust´ e

I Ajouter une variable explicative au mod`ele ne peut que faire augmenter R².

I Avec autant de variables explicatives que d’observations ((k+ 1) =n), on aura R² = 1.X est alors une matrice carr´ee et on a

0 =U =Y −Xβˆ

⇒Y =Xβ.ˆ

⇒βˆ=X⁻¹Y.

I Donc, unR² ´elev´e n’est pas toujours et partout une bonne chose.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

2. Ajouter une variable explicative suppl´ementaire a deux effets sur ¯R². 1) SSR doit baisser, ce qui fait augmenter ¯R². 2) Le facteur _n−kⁿ⁻¹₋₁ augmente, ce qui fait diminuer ¯R². L’effet net est ambigu.

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R².

1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

2. Ajouter une variable explicative suppl´ementaire a deux effets sur ¯R².

1) SSR doit baisser, ce qui fait augmenter ¯R². 2) Le facteur _n−kⁿ⁻¹₋₁ augmente, ce qui fait diminuer ¯R². L’effet net est ambigu.

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

2. Ajouter une variable explicative suppl´ementaire a deux effets sur ¯R². 1) SSR doit baisser, ce qui fait augmenter ¯R².

2) Le facteur _n−kⁿ⁻¹₋₁ augmente, ce qui fait diminuer ¯R². L’effet net est ambigu.

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

2. Ajouter une variable explicative suppl´ementaire a deux effets sur ¯R². 1) SSR doit baisser, ce qui fait augmenter ¯R². 2) Le facteur _n−kⁿ⁻¹₋₁ augmente, ce qui fait diminuer ¯R².

L’effet net est ambigu.

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I Une autre mesure qui p´enalisel’ajustement lorsqu’on ajoute des variables explicatives.

R¯²≡1− n−1 n−k−1

SSR

TSS = 1− s_u²_ˆ s_Y² .

I Trois propri´et´es importantes du ¯R². 1. _n−k−1ⁿ⁻¹ >1, et donc ¯R²<R².

3. R¯²peut ˆetre n´egatif.

R

ajust´ e (suite)

I La d´efinition du R² ajust´e semble arbitraire.

I Elle a une justificationstatistique.

I Si on ajoute une variable explicative additionnelle X_k+1 à un modèle, on peut tester sa significativité.

I Si la statistique t normalisée pour le test à une valeur absolue supérieure à 1, leR² ajusté augmente. Si non, il diminue.

I Nous allons revenir à cette question après la section sur les tests d’hypothèse.

R

ajust´ e (suite)

I La d´efinition du R² ajust´e semble arbitraire.

I Elle a une justificationstatistique.

I Si on ajoute une variable explicative additionnelle X_k+1 à un modèle, on peut tester sa significativité.

I Si la statistique t normalisée pour le test à une valeur absolue supérieure à 1, leR² ajusté augmente. Si non, il diminue.

I Nous allons revenir à cette question après la section sur les tests d’hypothèse.

R

ajust´ e (suite)

I La d´efinition du R² ajust´e semble arbitraire.

I Elle a une justificationstatistique.

I Si on ajoute une variable explicative additionnelle X_k+1 à un modèle, on peut tester sa significativité.

I Si la statistique t normalisée pour le test à une valeur absolue supérieure à 1, leR² ajusté augmente. Si non, il diminue.

I Nous allons revenir à cette question après la section sur les tests d’hypothèse.

R

ajust´ e (suite)

I La d´efinition du R² ajust´e semble arbitraire.

I Elle a une justificationstatistique.

I Si on ajoute une variable explicative additionnelle X_k+1 à un modèle, on peut tester sa significativité.

I Si la statistique t normalisée pour le test à une valeur absolue supérieure à 1, leR² ajusté augmente. Si non, il diminue.

I Nous allons revenir à cette question après la section sur les tests d’hypothèse.

R

ajust´ e (suite)

I La d´efinition du R² ajust´e semble arbitraire.

I Elle a une justificationstatistique.

I Si on ajoute une variable explicative additionnelle X_k+1 à un modèle, on peut tester sa significativité.

I Si la statistique t normalisée pour le test à une valeur absolue supérieure à 1, leR² ajusté augmente. Si non, il diminue.

I Nous allons revenir à cette question après la section sur les tests d’hypothèse.

Dans le document ECO 4272 : Introduction ` a l’´ Econom´ etrie Le mod` ele de r´ egression multiple (Page 97-153)