Objectifs du cours

(1)

ECO 4272 : Introduction ` a l’´ Econom´ etrie Statistique: estimation et inf´ erence

Steve Ambler

Département des sciences économiques Ecole des sciences de la gestion´ Université du Québec à Montréal

2018: Steve Amblerc

Hiver 2018

(2)

Objectifs du cours

1. Concept d’un estimateur.

2. Propriétés désirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne. 5. Intervalles de confiance.

6. Inférence sur la différence entre les moyennes de deux populations différentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(3)

Objectifs du cours

(4)

Objectifs du cours

(5)

Objectifs du cours

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne.

5. Intervalles de confiance.

(6)

Objectifs du cours

(7)

Objectifs du cours

(8)

Objectifs du cours

(9)

Estimateurs

I Définition formelle : un estimateur du paramètre inconnu θ d’un modèle ou loi de probabilité est une fonction qui fait correspondre à une suite d’observations x1,x2, . . . , xnissues du modèle ou de la loi de probabilité, la valeur ˆθque l’on nomme estimé ou estimation :

θˆn≡f (x1,x2, . . . ,xn).

I Ainsi, ˆθest une fonctiondes donn´ees.

I L’exemple que nous avons d´ej`a vu, la moyenne

´

echantillonnale, est évidemment une fonction linéaire des observations de l’échantillon.

I L’estimateur nous permet de faire de l’inf´erence (tester des hypoth`eses, construire des intervalles de confiance)

concernant les propriétés inconnues de la variable aléatoire qui nous intéresse.

(10)

Estimateurs

θˆn≡f (x1,x2, . . . ,xn).

´

(11)

Estimateurs

θˆn≡f (x1,x2, . . . ,xn).

´

(12)

Estimateurs

θˆn≡f (x1,x2, . . . ,xn).

´

(13)

Propri´ et´ es d´ esirables d’un estimateur

I Nous souhaiterions que l’estimateur soit le plus pr`es possible de sa vraie valeur

1. Absence de biais: l’estimateur est en moyenne´egal `a sa vraie valeur

E ¯Y

=µY

2. Convergence en probabilit´e : un nombre suffisant

d’observations ⇒l’estimateur se retrouve avec une probabilité très élevée à l’intérieur d’un intervalle arbitrairement petit autour de sa vraie valeur. Pour une séquence de variables aléatoires Yn et la constante µY,

n→∞lim Pr (|Y_n−µ_Y| ≥) = 0, >0 Y¯ −→^p µ_Y.

(14)

Propri´ et´ es d´ esirables d’un estimateur

E ¯Y

=µY

n→∞lim Pr (|Y_n−µ_Y| ≥) = 0, >0 Y¯ −→^p µ_Y.

(15)

Propri´ et´ es d´ esirables d’un estimateur

E ¯Y

=µY

n→∞lim Pr (|Y_n−µ_Y| ≥) = 0, >0 Y¯ −→^p µ_Y.

(16)

Propri´ et´ es d´ esirables d’un estimateur

E ¯Y

=µY

n→∞lim Pr (|Y_n−µ_Y| ≥) = 0, >0 Y¯ −→^p µ_Y.

(17)

Propri´ et´ es d´ esirables d’un estimateur (suite)

3. Efficience : 2 estimateurs non biais´es, Var ¯Y

<Var Y˜

,

⇒ Y¯ est plus efficientque ˜Y. L’efficience est un concept relatif

4. Erreur moyenne quadratique : permet de comparer deux estimateurs qui ne sont pas forcément non biaisés. Définition :

EQM β˜

≡E

β˜−β2

Un estimateur peut être baisé et néanmoins avoir une erreur moyenne quadratique plus petite qu’un autre.

(18)

Propri´ et´ es d´ esirables d’un estimateur (suite)

3. Efficience : 2 estimateurs non biais´es, Var ¯Y

<Var Y˜

,

⇒ Y¯ est plus efficientque ˜Y. L’efficience est un concept relatif

4. Erreur moyenne quadratique : permet de comparer deux estimateurs qui ne sont pas forcément non biaisés. Définition :

EQM β˜

≡E

β˜−β2

Un estimateur peut être baisé et néanmoins avoir une erreur moyenne quadratique plus petite qu’un autre.

(19)

Propri´ et´ es d´ esirables d’un estimateur (suite)

EQM est la somme de la variance plus le biais au carr´e. Pour une variable quelconqueX,

Var (X) = E X²

−(E (X))²

⇒Var β˜−β

= E

β˜−β2

− E

β˜−β2

⇒E

β˜−β 2

= Var

β˜−β

+

E

β˜−β 2

⇒E

β˜−β2

= Var β˜

+ E

β˜−β2

(20)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Problème : choisir un estimateurm pour prédire les valeurs d’une variable aléatoire Y, minimiser la somme des erreurs au carré :

minm n

X

i=1

(Y_i−m)².

I La CPO pour le choix de m est

−2

n

X

i=1

(Y_i −m) = 0⇒

n

X

i=1

Y_i =nm ⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(21)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

minm n

X

i=1

(Y_i−m)².

−2

n

X

i=1

(Y_i −m) = 0

⇒

n

X

i=1

Y_i =nm ⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

(22)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

minm n

X

i=1

(Y_i−m)².

−2

n

X

i=1

(Y_i −m) = 0⇒

n

X

i=1

Y_i =nm

⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

(23)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

minm n

X

i=1

(Y_i−m)².

−2

n

X

i=1

(Y_i −m) = 0⇒

n

X

i=1

Y_i =nm ⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

(24)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

minm n

X

i=1

(Y_i−m)².

−2

n

X

i=1

(Y_i −m) = 0⇒

n

X

i=1

Y_i =nm ⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

(25)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

minm n

X

i=1

(Y_i−m)².

−2

n

X

i=1

(Y_i −m) = 0⇒

n

X

i=1

Y_i =nm ⇒m= 1 n

n

X

i=1

Y_i ≡Y¯.

(26)

Gauss-Markov

Soit une variable al´eatoire tel que E (Y_i) =µ_Y, Var (Y_i) =σ²_Y. Soit unestimateur lin´eairequelconque

Ye =

n

X

i=1

a_iY_i

E

n

X

i=1

a_iY_i

!

=

n

X

i=1

a_iE (Y_i) =µ_Y

n

X

i=1

a_i

donc

E

n

X

i=1

a_iY_i

!

=µ_Y ⇔

n

X

i=1

a_i = 1

(27)

Gauss-Markov (suite)

Choix desa_i qui minimise la variance de l’estimateur Var

n

X

i=1

a_iY_i

!

=

n

X

i=1

Var (a_iY_i) =

n

X

i=1

a_i²Var (Y_i) =σ_Y²

n

X

i=1

a_i²

Programme :

minai,λ

" _n X

i=1

a_i²+λ 1−

n

X

i=1

a_i

!#

CPO :

ai : 2ai−λ= 0, ∀i, i = 1. . .n λ: 1−

n

X

i=1

ai = 0.

⇒a_i = λ 2 ⇒

n

X

i=1

λ

2 = 1⇒λ= 2

n ⇒a_i = 1 n

⇒Ye = ¯Y

(28)

Gauss-Markov (suite)

Choix desa_i qui minimise la variance de l’estimateur Var

n

X

i=1

a_iY_i

!

=

n

X

i=1

Var (a_iY_i) =

n

X

i=1

a_i²Var (Y_i) =σ_Y²

n

X

i=1

a_i²

Programme :

minai,λ

" _n X

i=1

a_i²+λ 1−

n

X

i=1

a_i

!#

CPO :

ai : 2ai−λ= 0, ∀i, i = 1. . .n λ: 1−

n

X

i=1

ai = 0.

⇒a_i = λ 2 ⇒

n

X

i=1

λ

2 = 1⇒λ= 2

n ⇒a_i = 1 n

⇒Ye = ¯Y

(29)

Tests d’hypoth` ese concernant la moyenne

I Statistique : une fonction de nos observations (notre

´

echantillon). Par exemple, la moyenne ´echantillonnale.

I L’hypothèse nullespécifie que la statistique utilisée pour estimer un moment est égale à une valeur spécifique.

I Principe : nous rejetons une hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calculée de la statistique au moins aussi éloignée de sa valeur sous l’hypothèse nulle si l’hypothèse nulle est vraie.

I Statistique normalis´ee : on soustrait la moyenne sousH0, et on divise par l’´ecart type :

t_act ≡ Y¯_act−µ_Y₀ σY¯

σ_Y²_¯ = σ_Y² n ,

(30)

Tests d’hypoth` ese concernant la moyenne

´

I Principe : nous rejetons une hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calculée de la statistique au moins aussi éloignée de sa valeur sous l’hypothèse nulle si l’hypothèse nulle est vraie.

σ_Y²_¯ = σ_Y² n ,

(31)

Tests d’hypoth` ese concernant la moyenne

´

I Principe :nous rejetons une hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calculée de la statistique au moins aussi éloignée de sa valeur sous l’hypothèse nulle si l’hypothèse nulle est vraie.

σ_Y²_¯ = σ_Y² n ,

(32)

Tests d’hypoth` ese concernant la moyenne

´

I Principe :nous rejetons une hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calculée de la statistique au moins aussi éloignée de sa valeur sous l’hypothèse nulle si l’hypothèse nulle est vraie.

σ_Y²_¯ = σ_Y² n ,

(33)

Tests avec hypoth` ese alternative bilat´ erale

I H0 :µY =µY0,H1 :µY 6=µY0.

I H₀ :t_act = 0,H₁ :t_act 6= 0.

I Principe : Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi éloignée de zéro de la statistique normalisée, soit positif soit négatif.

I Si on a des observations sont i.i.d. on aura t_act ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(34)

Tests avec hypoth` ese alternative bilat´ erale

I H₀ :t_act = 0,H₁ :t_act 6= 0.

I Principe : Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi éloignée de zéro de la statistique normalisée, soit positif soit négatif.

(35)

Tests avec hypoth` ese alternative bilat´ erale

I H₀ :t_act = 0,H₁ :t_act 6= 0.

I Principe :Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi éloignée de zéro de la statistique normalisée, soit positif soit négatif.

(36)

Tests avec hypoth` ese alternative bilat´ erale

I H₀ :t_act = 0,H₁ :t_act 6= 0.

(37)

Tests avec hypoth` ese alternative bilat´ erale

I H₀ :t_act = 0,H₁ :t_act 6= 0.

(38)

P-value

I Lap-value de notre test est Pr_H₀

Y¯ −µ_Y₀ σY¯

>

Y¯_act−µ_Y₀ σY¯

! ,

I Soit Φ(z) la valeur de la distribution normale centrée réduite cumulée. La p-value serait donnée par :

p-value = 2Φ

−

Y¯act−µ_Y₀ σY¯

.

(39)

P-value

>

! ,

p-value = 2Φ

−

.

(40)

P-value

>

! ,

p-value = 2Φ

−

.

(41)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H₀ :µ_Y =µ_Y₀,H₁ µ_Y < µ_Y₀.

I H₀ :t_act = 0,H₁ :t_act <0.

I Principe : Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi négative de la statistique normalisée.

I On a encore t_act ∼N(0,1).

(42)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H₀ :µ_Y =µ_Y₀,H₁ µ_Y < µ_Y₀.

I H₀ :t_act = 0,H₁ :t_act <0.

I Principe : Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi négative de la statistique normalisée.

(43)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H₀ :µ_Y =µ_Y₀,H₁ µ_Y < µ_Y₀.

I H₀ :t_act = 0,H₁ :t_act <0.

I Principe :Nous rejetons l’hypothèse nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi négative de la statistique normalisée.

(44)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H₀ :µ_Y =µ_Y₀,H₁ µ_Y < µ_Y₀.

I H₀ :t_act = 0,H₁ :t_act <0.

(45)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H₀ :µ_Y =µ_Y₀,H₁ µ_Y < µ_Y₀.

I H₀ :t_act = 0,H₁ :t_act <0.

(46)

Tests avec hypoth` ese alternative unilat´ erale (a) (suite)

I Lap-value du test est PrH0

Y¯−µY0

σY¯

!

<

Y¯act −µY0

σY¯

!!

.

I On a

p-value = Φ

,

où Φ(z) est encore la valeur de la distribution normale centrée réduite cumulée. Notez que l’on ne calcule pas la valeur absolue de la statistique.

(47)

Tests avec hypoth` ese alternative unilat´ erale (a) (suite)

I Lap-value du test est PrH0

Y¯−µY0

σY¯

!

<

Y¯act −µY0

σY¯

!!

.

I On a

p-value = Φ

,

où Φ(z) est encore la valeur de la distribution normale centrée réduite cumulée. Notez que l’on ne calcule pas la valeur absolue de la statistique.

(48)