• Aucun résultat trouvé

Objectifs du cours

N/A
N/A
Protected

Academic year: 2022

Partager "Objectifs du cours"

Copied!
99
0
0

Texte intégral

(1)

ECO 4272 : Introduction ` a l’´ Econom´ etrie Statistique: estimation et inf´ erence

Steve Ambler

D´epartement des sciences ´economiques Ecole des sciences de la gestion´ Universit´e du Qu´ebec `a Montr´eal

2018: Steve Amblerc

Hiver 2018

(2)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne. 5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(3)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne. 5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(4)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne. 5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(5)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne.

5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(6)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne.

5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(7)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne.

5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(8)

Objectifs du cours

1. Concept d’un estimateur.

2. Propri´et´es d´esirables d’un estimateur.

3. Estimateur de la moyenne d’une variable al´eatoire.

4. Tests d’hypoth`eses concernant l’estimateur de la moyenne.

5. Intervalles de confiance.

6. Inf´erence sur la diff´erence entre les moyennes de deux populations diff´erentes.

7. Tests d’hypoth`ese concernant la variance d’une population.

(9)

Estimateurs

I D´efinition formelle : un estimateur du param`etre inconnu θ d’un mod`ele ou loi de probabilit´e est une fonction qui fait correspondre `a une suite d’observations x1,x2, . . . , xnissues du mod`ele ou de la loi de probabilit´e, la valeur ˆθque l’on nomme estim´e ou estimation :

θˆn≡f (x1,x2, . . . ,xn).

I Ainsi, ˆθest une fonctiondes donn´ees.

I L’exemple que nous avons d´ej`a vu, la moyenne

´

echantillonnale, est ´evidemment une fonction lin´eaire des observations de l’´echantillon.

I L’estimateur nous permet de faire de l’inf´erence (tester des hypoth`eses, construire des intervalles de confiance)

concernant les propri´et´es inconnues de la variable al´eatoire qui nous int´eresse.

(10)

Estimateurs

I D´efinition formelle : un estimateur du param`etre inconnu θ d’un mod`ele ou loi de probabilit´e est une fonction qui fait correspondre `a une suite d’observations x1,x2, . . . , xnissues du mod`ele ou de la loi de probabilit´e, la valeur ˆθque l’on nomme estim´e ou estimation :

θˆn≡f (x1,x2, . . . ,xn).

I Ainsi, ˆθest une fonctiondes donn´ees.

I L’exemple que nous avons d´ej`a vu, la moyenne

´

echantillonnale, est ´evidemment une fonction lin´eaire des observations de l’´echantillon.

I L’estimateur nous permet de faire de l’inf´erence (tester des hypoth`eses, construire des intervalles de confiance)

concernant les propri´et´es inconnues de la variable al´eatoire qui nous int´eresse.

(11)

Estimateurs

I D´efinition formelle : un estimateur du param`etre inconnu θ d’un mod`ele ou loi de probabilit´e est une fonction qui fait correspondre `a une suite d’observations x1,x2, . . . , xnissues du mod`ele ou de la loi de probabilit´e, la valeur ˆθque l’on nomme estim´e ou estimation :

θˆn≡f (x1,x2, . . . ,xn).

I Ainsi, ˆθest une fonctiondes donn´ees.

I L’exemple que nous avons d´ej`a vu, la moyenne

´

echantillonnale, est ´evidemment une fonction lin´eaire des observations de l’´echantillon.

I L’estimateur nous permet de faire de l’inf´erence (tester des hypoth`eses, construire des intervalles de confiance)

concernant les propri´et´es inconnues de la variable al´eatoire qui nous int´eresse.

(12)

Estimateurs

I D´efinition formelle : un estimateur du param`etre inconnu θ d’un mod`ele ou loi de probabilit´e est une fonction qui fait correspondre `a une suite d’observations x1,x2, . . . , xnissues du mod`ele ou de la loi de probabilit´e, la valeur ˆθque l’on nomme estim´e ou estimation :

θˆn≡f (x1,x2, . . . ,xn).

I Ainsi, ˆθest une fonctiondes donn´ees.

I L’exemple que nous avons d´ej`a vu, la moyenne

´

echantillonnale, est ´evidemment une fonction lin´eaire des observations de l’´echantillon.

I L’estimateur nous permet de faire de l’inf´erence (tester des hypoth`eses, construire des intervalles de confiance)

concernant les propri´et´es inconnues de la variable al´eatoire qui nous int´eresse.

(13)

Propri´ et´ es d´ esirables d’un estimateur

I Nous souhaiterions que l’estimateur soit le plus pr`es possible de sa vraie valeur

1. Absence de biais: l’estimateur est en moyenne´egal `a sa vraie valeur

E ¯Y

Y

2. Convergence en probabilit´e : un nombre suffisant

d’observations ⇒l’estimateur se retrouve avec une probabilit´e tr`es ´elev´ee `a l’int´erieur d’un intervalle arbitrairement petit autour de sa vraie valeur. Pour une s´equence de variables al´eatoires Yn et la constante µY,

n→∞lim Pr (|Yn−µY| ≥) = 0, >0 Y¯ −→p µY.

(14)

Propri´ et´ es d´ esirables d’un estimateur

I Nous souhaiterions que l’estimateur soit le plus pr`es possible de sa vraie valeur

1. Absence de biais: l’estimateur est en moyenne´egal `a sa vraie valeur

E ¯Y

Y

2. Convergence en probabilit´e : un nombre suffisant

d’observations ⇒l’estimateur se retrouve avec une probabilit´e tr`es ´elev´ee `a l’int´erieur d’un intervalle arbitrairement petit autour de sa vraie valeur. Pour une s´equence de variables al´eatoires Yn et la constante µY,

n→∞lim Pr (|Yn−µY| ≥) = 0, >0 Y¯ −→p µY.

(15)

Propri´ et´ es d´ esirables d’un estimateur

I Nous souhaiterions que l’estimateur soit le plus pr`es possible de sa vraie valeur

1. Absence de biais: l’estimateur est en moyenne´egal `a sa vraie valeur

E ¯Y

Y

2. Convergence en probabilit´e : un nombre suffisant

d’observations ⇒l’estimateur se retrouve avec une probabilit´e tr`es ´elev´ee `a l’int´erieur d’un intervalle arbitrairement petit autour de sa vraie valeur. Pour une s´equence de variables al´eatoires Yn et la constante µY,

n→∞lim Pr (|Yn−µY| ≥) = 0, >0 Y¯ −→p µY.

(16)

Propri´ et´ es d´ esirables d’un estimateur

I Nous souhaiterions que l’estimateur soit le plus pr`es possible de sa vraie valeur

1. Absence de biais: l’estimateur est en moyenne´egal `a sa vraie valeur

E ¯Y

Y

2. Convergence en probabilit´e : un nombre suffisant

d’observations ⇒l’estimateur se retrouve avec une probabilit´e tr`es ´elev´ee `a l’int´erieur d’un intervalle arbitrairement petit autour de sa vraie valeur. Pour une s´equence de variables al´eatoires Yn et la constante µY,

n→∞lim Pr (|Yn−µY| ≥) = 0, >0 Y¯ −→p µY.

(17)

Propri´ et´ es d´ esirables d’un estimateur (suite)

3. Efficience : 2 estimateurs non biais´es, Var ¯Y

<Var Y˜

,

⇒ Y¯ est plus efficientque ˜Y. L’efficience est un concept relatif

4. Erreur moyenne quadratique : permet de comparer deux estimateurs qui ne sont pas forc´ement non biais´es. D´efinition :

EQM β˜

≡E

β˜−β2

Un estimateur peut ˆetre bais´e et n´eanmoins avoir une erreur moyenne quadratique plus petite qu’un autre.

(18)

Propri´ et´ es d´ esirables d’un estimateur (suite)

3. Efficience : 2 estimateurs non biais´es, Var ¯Y

<Var Y˜

,

⇒ Y¯ est plus efficientque ˜Y. L’efficience est un concept relatif

4. Erreur moyenne quadratique : permet de comparer deux estimateurs qui ne sont pas forc´ement non biais´es. D´efinition :

EQM β˜

≡E

β˜−β2

Un estimateur peut ˆetre bais´e et n´eanmoins avoir une erreur moyenne quadratique plus petite qu’un autre.

(19)

Propri´ et´ es d´ esirables d’un estimateur (suite)

EQM est la somme de la variance plus le biais au carr´e. Pour une variable quelconqueX,

Var (X) = E X2

−(E (X))2

⇒Var β˜−β

= E

β˜−β2

− E

β˜−β2

⇒E

β˜−β 2

= Var

β˜−β

+

E

β˜−β 2

⇒E

β˜−β2

= Var β˜

+ E

β˜−β2

(20)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0⇒

n

X

i=1

Yi =nm ⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(21)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0

n

X

i=1

Yi =nm ⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(22)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0⇒

n

X

i=1

Yi =nm

⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(23)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0⇒

n

X

i=1

Yi =nm ⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(24)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0⇒

n

X

i=1

Yi =nm ⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(25)

La moyenne ´ echantillonnale comme estimateur MCO de la moyenne

I Probl`eme : choisir un estimateurm pour pr´edire les valeurs d’une variable al´eatoire Y, minimiser la somme des erreurs au carr´e :

minm n

X

i=1

(Yi−m)2.

I La CPO pour le choix de m est

−2

n

X

i=1

(Yi −m) = 0⇒

n

X

i=1

Yi =nm ⇒m= 1 n

n

X

i=1

Yi ≡Y¯.

I La solution est tout simplement ¯Y.

I Possible de montrer que ¯Y est le plus efficient parmi tous les estimateurs lin´eaires non biais´es. (BLUE)

(26)

Gauss-Markov

Soit une variable al´eatoire tel que E (Yi) =µY, Var (Yi) =σ2Y. Soit unestimateur lin´eairequelconque

Ye =

n

X

i=1

aiYi

E

n

X

i=1

aiYi

!

=

n

X

i=1

aiE (Yi) =µY

n

X

i=1

ai

donc

E

n

X

i=1

aiYi

!

Y

n

X

i=1

ai = 1

(27)

Gauss-Markov (suite)

Choix desai qui minimise la variance de l’estimateur Var

n

X

i=1

aiYi

!

=

n

X

i=1

Var (aiYi) =

n

X

i=1

ai2Var (Yi) =σY2

n

X

i=1

ai2

Programme :

minai

" n X

i=1

ai2+λ 1−

n

X

i=1

ai

!#

CPO :

ai : 2ai−λ= 0, ∀i, i = 1. . .n λ: 1−

n

X

i=1

ai = 0.

⇒ai = λ 2 ⇒

n

X

i=1

λ

2 = 1⇒λ= 2

n ⇒ai = 1 n

⇒Ye = ¯Y

(28)

Gauss-Markov (suite)

Choix desai qui minimise la variance de l’estimateur Var

n

X

i=1

aiYi

!

=

n

X

i=1

Var (aiYi) =

n

X

i=1

ai2Var (Yi) =σY2

n

X

i=1

ai2

Programme :

minai

" n X

i=1

ai2+λ 1−

n

X

i=1

ai

!#

CPO :

ai : 2ai−λ= 0, ∀i, i = 1. . .n λ: 1−

n

X

i=1

ai = 0.

⇒ai = λ 2 ⇒

n

X

i=1

λ

2 = 1⇒λ= 2

n ⇒ai = 1 n

⇒Ye = ¯Y

(29)

Tests d’hypoth` ese concernant la moyenne

I Statistique : une fonction de nos observations (notre

´

echantillon). Par exemple, la moyenne ´echantillonnale.

I L’hypoth`ese nullesp´ecifie que la statistique utilis´ee pour estimer un moment est ´egale `a une valeur sp´ecifique.

I Principe : nous rejetons une hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calcul´ee de la statistique au moins aussi ´eloign´ee de sa valeur sous l’hypoth`ese nulle si l’hypoth`ese nulle est vraie.

I Statistique normalis´ee : on soustrait la moyenne sousH0, et on divise par l’´ecart type :

tact ≡ Y¯act−µY0 σY¯

σY2¯ = σY2 n ,

(30)

Tests d’hypoth` ese concernant la moyenne

I Statistique : une fonction de nos observations (notre

´

echantillon). Par exemple, la moyenne ´echantillonnale.

I L’hypoth`ese nullesp´ecifie que la statistique utilis´ee pour estimer un moment est ´egale `a une valeur sp´ecifique.

I Principe : nous rejetons une hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calcul´ee de la statistique au moins aussi ´eloign´ee de sa valeur sous l’hypoth`ese nulle si l’hypoth`ese nulle est vraie.

I Statistique normalis´ee : on soustrait la moyenne sousH0, et on divise par l’´ecart type :

tact ≡ Y¯act−µY0 σY¯

σY2¯ = σY2 n ,

(31)

Tests d’hypoth` ese concernant la moyenne

I Statistique : une fonction de nos observations (notre

´

echantillon). Par exemple, la moyenne ´echantillonnale.

I L’hypoth`ese nullesp´ecifie que la statistique utilis´ee pour estimer un moment est ´egale `a une valeur sp´ecifique.

I Principe :nous rejetons une hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calcul´ee de la statistique au moins aussi ´eloign´ee de sa valeur sous l’hypoth`ese nulle si l’hypoth`ese nulle est vraie.

I Statistique normalis´ee : on soustrait la moyenne sousH0, et on divise par l’´ecart type :

tact ≡ Y¯act−µY0 σY¯

σY2¯ = σY2 n ,

(32)

Tests d’hypoth` ese concernant la moyenne

I Statistique : une fonction de nos observations (notre

´

echantillon). Par exemple, la moyenne ´echantillonnale.

I L’hypoth`ese nullesp´ecifie que la statistique utilis´ee pour estimer un moment est ´egale `a une valeur sp´ecifique.

I Principe :nous rejetons une hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur calcul´ee de la statistique au moins aussi ´eloign´ee de sa valeur sous l’hypoth`ese nulle si l’hypoth`ese nulle est vraie.

I Statistique normalis´ee : on soustrait la moyenne sousH0, et on divise par l’´ecart type :

tact ≡ Y¯act−µY0 σY¯

σY2¯ = σY2 n ,

(33)

Tests avec hypoth` ese alternative bilat´ erale

I H0YY0,H1Y 6=µY0.

I H0 :tact = 0,H1 :tact 6= 0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi ´eloign´ee de z´ero de la statistique normalis´ee, soit positif soit n´egatif.

I Si on a des observations sont i.i.d. on aura tact ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(34)

Tests avec hypoth` ese alternative bilat´ erale

I H0YY0,H1Y 6=µY0.

I H0 :tact = 0,H1 :tact 6= 0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi ´eloign´ee de z´ero de la statistique normalis´ee, soit positif soit n´egatif.

I Si on a des observations sont i.i.d. on aura tact ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(35)

Tests avec hypoth` ese alternative bilat´ erale

I H0YY0,H1Y 6=µY0.

I H0 :tact = 0,H1 :tact 6= 0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi ´eloign´ee de z´ero de la statistique normalis´ee, soit positif soit n´egatif.

I Si on a des observations sont i.i.d. on aura tact ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(36)

Tests avec hypoth` ese alternative bilat´ erale

I H0YY0,H1Y 6=µY0.

I H0 :tact = 0,H1 :tact 6= 0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi ´eloign´ee de z´ero de la statistique normalis´ee, soit positif soit n´egatif.

I Si on a des observations sont i.i.d. on aura tact ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(37)

Tests avec hypoth` ese alternative bilat´ erale

I H0YY0,H1Y 6=µY0.

I H0 :tact = 0,H1 :tact 6= 0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi ´eloign´ee de z´ero de la statistique normalis´ee, soit positif soit n´egatif.

I Si on a des observations sont i.i.d. on aura tact ∼N(0,1).

I Un exemple de l’inf´erence asymptotique.

(38)

P-value

I Lap-value de notre test est PrH0

Y¯ −µY0 σY¯

>

act−µY0 σY¯

! ,

I Soit Φ(z) la valeur de la distribution normale centr´ee r´eduite cumul´ee. La p-value serait donn´ee par :

p-value = 2Φ

act−µY0 σY¯

.

(39)

P-value

I Lap-value de notre test est PrH0

Y¯ −µY0 σY¯

>

act−µY0 σY¯

! ,

I Soit Φ(z) la valeur de la distribution normale centr´ee r´eduite cumul´ee. La p-value serait donn´ee par :

p-value = 2Φ

act−µY0 σY¯

.

(40)

P-value

I Lap-value de notre test est PrH0

Y¯ −µY0 σY¯

>

act−µY0 σY¯

! ,

I Soit Φ(z) la valeur de la distribution normale centr´ee r´eduite cumul´ee. La p-value serait donn´ee par :

p-value = 2Φ

act−µY0 σY¯

.

(41)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H0YY0,H1 µY < µY0.

I H0 :tact = 0,H1 :tact <0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi n´egative de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(42)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H0YY0,H1 µY < µY0.

I H0 :tact = 0,H1 :tact <0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi n´egative de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(43)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H0YY0,H1 µY < µY0.

I H0 :tact = 0,H1 :tact <0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi n´egative de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(44)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H0YY0,H1 µY < µY0.

I H0 :tact = 0,H1 :tact <0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi n´egative de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(45)

Tests avec hypoth` ese alternative unilat´ erale (a)

I H0YY0,H1 µY < µY0.

I H0 :tact = 0,H1 :tact <0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi n´egative de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(46)

Tests avec hypoth` ese alternative unilat´ erale (a) (suite)

I Lap-value du test est PrH0

Y¯−µY0

σY¯

!

<

act −µY0

σY¯

!!

.

I On a

p-value = Φ

act−µY0 σY¯

,

o`u Φ(z) est encore la valeur de la distribution normale centr´ee r´eduite cumul´ee. Notez que l’on ne calcule pas la valeur absolue de la statistique.

(47)

Tests avec hypoth` ese alternative unilat´ erale (a) (suite)

I Lap-value du test est PrH0

Y¯−µY0

σY¯

!

<

act −µY0

σY¯

!!

.

I On a

p-value = Φ

act−µY0 σY¯

,

o`u Φ(z) est encore la valeur de la distribution normale centr´ee r´eduite cumul´ee. Notez que l’on ne calcule pas la valeur absolue de la statistique.

(48)

Tests avec hypoth` ese alternative unilat´ erale (b)

I H0YY0,H1 µY > µY0.

I H0 :tact = 0,H1 :tact >0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi positive de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(49)

Tests avec hypoth` ese alternative unilat´ erale (b)

I H0YY0,H1 µY > µY0.

I H0 :tact = 0,H1 :tact >0.

I Principe : Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi positive de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(50)

Tests avec hypoth` ese alternative unilat´ erale (b)

I H0YY0,H1 µY > µY0.

I H0 :tact = 0,H1 :tact >0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi positive de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(51)

Tests avec hypoth` ese alternative unilat´ erale (b)

I H0YY0,H1 µY > µY0.

I H0 :tact = 0,H1 :tact >0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi positive de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(52)

Tests avec hypoth` ese alternative unilat´ erale (b)

I H0YY0,H1 µY > µY0.

I H0 :tact = 0,H1 :tact >0.

I Principe :Nous rejetons l’hypoth`ese nulle lorsqu’il serait suffisamment peu probable d’obtenir une valeur au moins aussi positive de la statistique normalis´ee.

I On a encore tact ∼N(0,1).

(53)

Tests avec hypoth` ese alternative unilat´ erale (b) (suite)

I Lap-value de notre test est PrH0

Y¯ −µY0 σY¯

!

>

act −µY0 σY¯

!!

I On a

p-value = 1−Φ

act−µY0

σY¯

,

o`u Φ(z) est encore la valeur de la distribution normale centr´ee r´eduite cumul´ee

(54)

Tests avec hypoth` ese alternative unilat´ erale (b) (suite)

I Lap-value de notre test est PrH0

Y¯ −µY0 σY¯

!

>

act −µY0 σY¯

!!

I On a

p-value = 1−Φ

act−µY0 σY¯

,

o`u Φ(z) est encore la valeur de la distribution normale centr´ee r´eduite cumul´ee

(55)

La notion de p-value

I P-value : probabilit´e d’obtenir une valeur calcul´ee de la statistique au moins aussi d´efavorable `a l’hypoth`ese nulle, si elle est vraie

I Seuils habituels : 10%, 5%, 1%. Pourquoi ? Arbitraire, mais on veut ˆetre conservateur

I Se limiter `a dire si un test est rejet´e ou non `a un taux de 10%, de 5% ou de 1% remonte `a l’´epoque o`u il fallait utiliser des tables de valeurs pour les diff´erents types de distribution

I Il est pr´ef´erable de donner tout simplement la p-value exacte. Le lecteur peut d´ecider si l’´evidence est assez forte pour rejeter ou non

(56)

La notion de p-value

I P-value : probabilit´e d’obtenir une valeur calcul´ee de la statistique au moins aussi d´efavorable `a l’hypoth`ese nulle, si elle est vraie

I Seuils habituels : 10%, 5%, 1%. Pourquoi ? Arbitraire, mais on veut ˆetre conservateur

I Se limiter `a dire si un test est rejet´e ou non `a un taux de 10%, de 5% ou de 1% remonte `a l’´epoque o`u il fallait utiliser des tables de valeurs pour les diff´erents types de distribution

I Il est pr´ef´erable de donner tout simplement la p-value exacte. Le lecteur peut d´ecider si l’´evidence est assez forte pour rejeter ou non

(57)

La notion de p-value

I P-value : probabilit´e d’obtenir une valeur calcul´ee de la statistique au moins aussi d´efavorable `a l’hypoth`ese nulle, si elle est vraie

I Seuils habituels : 10%, 5%, 1%. Pourquoi ? Arbitraire, mais on veut ˆetre conservateur

I Se limiter `a dire si un test est rejet´e ou non `a un taux de 10%, de 5% ou de 1% remonte `a l’´epoque o`u il fallait utiliser des tables de valeurs pour les diff´erents types de distribution

I Il est pr´ef´erable de donner tout simplement la p-value exacte. Le lecteur peut d´ecider si l’´evidence est assez forte pour rejeter ou non

(58)

La notion de p-value

I P-value : probabilit´e d’obtenir une valeur calcul´ee de la statistique au moins aussi d´efavorable `a l’hypoth`ese nulle, si elle est vraie

I Seuils habituels : 10%, 5%, 1%. Pourquoi ? Arbitraire, mais on veut ˆetre conservateur

I Se limiter `a dire si un test est rejet´e ou non `a un taux de 10%, de 5% ou de 1% remonte `a l’´epoque o`u il fallait utiliser des tables de valeurs pour les diff´erents types de distribution

I Il est pr´ef´erable de donner tout simplement la p-value exacte.

Le lecteur peut d´ecider si l’´evidence est assez forte pour rejeter ou non

(59)

Taux de significativit´ e marginal

I On dit qu’une hypoth`ese nulle est rejet´ee`a un niveau de X% si la probabilit´e de la rejeter si elle est vraie est ´egale ou inf´erieure `aX/100

I Donc on rejette `aX% si lap-value du test est ´egale ou inf´erieure `a X/100

(60)

Taux de significativit´ e marginal

I On dit qu’une hypoth`ese nulle est rejet´ee`a un niveau de X% si la probabilit´e de la rejeter si elle est vraie est ´egale ou inf´erieure `aX/100

I Donc on rejette `aX% si lap-value du test est ´egale ou inf´erieure `a X/100

(61)

Risques de premi` ere, deuxi` eme esp` ece, puissance

I Risque de premi`ere esp`ece(probability of a type 1 error) : probabilit´e de rejeter H0 lorsqu’elle est vraie.

I Concept tr`es semblable `a celui de p-value

I Souvent appel´e α

I Risque de deuxi`eme esp`ece(probability of a type 2 error) : probabilit´e d’accepter l’hypoth`ese nulle si elle est fausse

I Souvent appel´e β

I Puissance d’un test : probabilit´e de rejeter H0 lorsqu’elle est fausse

I Si β est le risque de deuxi`eme esp`ece, alors (1−β) est la puissance du test

(62)

Risques de premi` ere, deuxi` eme esp` ece, puissance

I Risque de premi`ere esp`ece(probability of a type 1 error) : probabilit´e de rejeter H0 lorsqu’elle est vraie.

I Concept tr`es semblable `a celui de p-value

I Souvent appel´e α

I Risque de deuxi`eme esp`ece(probability of a type 2 error) : probabilit´e d’accepter l’hypoth`ese nulle si elle est fausse

I Souvent appel´e β

I Puissance d’un test : probabilit´e de rejeter H0 lorsqu’elle est fausse

I Si β est le risque de deuxi`eme esp`ece, alors (1−β) est la puissance du test

(63)

Risques de premi` ere, deuxi` eme esp` ece, puissance

I Risque de premi`ere esp`ece(probability of a type 1 error) : probabilit´e de rejeter H0 lorsqu’elle est vraie.

I Concept tr`es semblable `a celui de p-value

I Souvent appel´e α

I Risque de deuxi`eme esp`ece(probability of a type 2 error) : probabilit´e d’accepter l’hypoth`ese nulle si elle est fausse

I Souvent appel´e β

I Puissance d’un test : probabilit´e de rejeter H0 lorsqu’elle est fausse

I Si β est le risque de deuxi`eme esp`ece, alors (1−β) est la puissance du test

(64)

Tests lorsque la variance n’est pas connue

I Typiquement on ne connaˆıt pas σY2

I On peut remplacer par un estimateur convergent : sY2 = 1

(n−1)

n

X

i=1

Yi −Y¯2

I Une technique que nous allons employer `a maintes reprises dans le cours

I La convergence est cruciale. En grand ´echantillon, l’estimateur se comporte de plus en plus comme une constante

(65)

Tests lorsque la variance n’est pas connue

I Typiquement on ne connaˆıt pas σY2

I On peut remplacer par un estimateur convergent : sY2 = 1

(n−1)

n

X

i=1

Yi −Y¯2

I Une technique que nous allons employer `a maintes reprises dans le cours

I La convergence est cruciale. En grand ´echantillon, l’estimateur se comporte de plus en plus comme une constante

(66)

Tests lorsque la variance n’est pas connue

I Typiquement on ne connaˆıt pas σY2

I On peut remplacer par un estimateur convergent : sY2 = 1

(n−1)

n

X

i=1

Yi −Y¯2

I Une technique que nous allons employer `a maintes reprises dans le cours

I La convergence est cruciale. En grand ´echantillon, l’estimateur se comporte de plus en plus comme une constante

(67)

Tests lorsque la variance n’est pas connue

I Typiquement on ne connaˆıt pas σY2

I On peut remplacer par un estimateur convergent : sY2 = 1

(n−1)

n

X

i=1

Yi −Y¯2

I Une technique que nous allons employer `a maintes reprises dans le cours

I La convergence est cruciale. En grand ´echantillon, l’estimateur se comporte de plus en plus comme une constante

(68)

Intervalles de confiance pour la moyenne de la population

I Intervalle de confiance deX% pour ¯Y : toutes les valeurs ¯Yi

de ¯Y o`u on ne rejette pasH0: ¯Y = ¯Yi `a un taux de significativit´e de (100−X)%

I H1 : toujours bilat´erale

(69)

Intervalles de confiance pour la moyenne de la population

I Intervalle de confiance deX% pour ¯Y : toutes les valeurs ¯Yi

de ¯Y o`u on ne rejette pasH0: ¯Y = ¯Yi `a un taux de significativit´e de (100−X)%

I H1 : toujours bilat´erale

(70)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zˆσY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zˆσY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(71)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zˆσY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zˆσY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(72)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zσˆY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zˆσY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(73)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zσˆY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zσˆY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(74)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zσˆY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zσˆY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(75)

Intervalles de confiance (suite)

I D’abord on cherche la valeur dez >0 telle que Φ(−z) = 1−X2/100 .

I Maintenant, on a X 100 = Pr

−z ≤ Y¯−µY

ˆ σY¯

≤z

= Pr −zσˆY¯ ≤ Y¯ −µY

≤zσˆY¯

= Pr −zσˆY¯ ≤ µY −Y¯

≤zσˆY¯

= Pr ¯Y −zσˆY¯ ≤µY ≤Y¯ +zˆσY¯

,

I La probabilit´e que la moyenne de la distribution est entre Y¯−zσˆY¯

et Y¯+zσˆY¯

est ´egale `aX%.

(76)

Stat t en petit ´ echantillon

I Si nos observations suivent une loi normale, nous pouvons construire des statistiques t qui ob´eissent `a une loi t de Student, avec n−1 degr´es de libert´e o`u n est la taille de l’´echantillon.

I Il faut ´ecrire la statistique sous une forme particuli`ere :

t= Z

pW/(n−1),

I Z est une variable al´eatoire normale centr´ee r´eduite et W est une variable al´eatoire qui ob´eit `a une loiχ2 avec n−1 degr´es de libert´e

I Pour une discussion plus d´etaill´ee, voir la page 87 du manuel ou les notes de cours

(77)

Stat t en petit ´ echantillon

I Si nos observations suivent une loi normale, nous pouvons construire des statistiques t qui ob´eissent `a une loi t de Student, avec n−1 degr´es de libert´e o`u n est la taille de l’´echantillon.

I Il faut ´ecrire la statistique sous une forme particuli`ere :

t= Z

pW/(n−1),

I Z est une variable al´eatoire normale centr´ee r´eduite et W est une variable al´eatoire qui ob´eit `a une loiχ2 avec n−1 degr´es de libert´e

I Pour une discussion plus d´etaill´ee, voir la page 87 du manuel ou les notes de cours

(78)

Stat t en petit ´ echantillon

I Si nos observations suivent une loi normale, nous pouvons construire des statistiques t qui ob´eissent `a une loi t de Student, avec n−1 degr´es de libert´e o`u n est la taille de l’´echantillon.

I Il faut ´ecrire la statistique sous une forme particuli`ere :

t= Z

pW/(n−1),

I Z est une variable al´eatoire normale centr´ee r´eduite et W est une variable al´eatoire qui ob´eit `a une loiχ2 avec n−1 degr´es de libert´e

I Pour une discussion plus d´etaill´ee, voir la page 87 du manuel ou les notes de cours

(79)

Stat t en petit ´ echantillon

I Si nos observations suivent une loi normale, nous pouvons construire des statistiques t qui ob´eissent `a une loi t de Student, avec n−1 degr´es de libert´e o`u n est la taille de l’´echantillon.

I Il faut ´ecrire la statistique sous une forme particuli`ere :

t= Z

pW/(n−1),

I Z est une variable al´eatoire normale centr´ee r´eduite et W est une variable al´eatoire qui ob´eit `a une loiχ2 avec n−1 degr´es de libert´e

I Pour une discussion plus d´etaill´ee, voir la page 87 du manuel ou les notes de cours

(80)

Tests concernant la diff´ erence entre 2 moyennes

I (Variances connues) : Soit ¯Ym la moyenne ´echantillonnale d’une 1`ere population, ¯Yw la moyenne ´echantillonnale d’une 2e population, et H0 : µm−µw = 0

I La statistique suivante :

m−Y¯w −0 qσ2m

nm + σn2w

w

aurait une moyenne nulle est une variance unitaire sous H0 I L’´echantillonnage al´eatoire est cruciale. Il permet de calculer

la variance (pas de covariance)

I Sous H0, la statistique converge `a une normale centr´ee r´eduite

(81)

Tests concernant la diff´ erence entre 2 moyennes

I (Variances connues) : Soit ¯Ym la moyenne ´echantillonnale d’une 1`ere population, ¯Yw la moyenne ´echantillonnale d’une 2e population, et H0 : µm−µw = 0

I La statistique suivante :

m−Y¯w −0 qσ2m

nm + σn2w

w

aurait une moyenne nulle est une variance unitaire sous H0

I L’´echantillonnage al´eatoire est cruciale. Il permet de calculer la variance (pas de covariance)

I Sous H0, la statistique converge `a une normale centr´ee r´eduite

(82)

Tests concernant la diff´ erence entre 2 moyennes

I (Variances connues) : Soit ¯Ym la moyenne ´echantillonnale d’une 1`ere population, ¯Yw la moyenne ´echantillonnale d’une 2e population, et H0 : µm−µw = 0

I La statistique suivante :

m−Y¯w −0 qσ2m

nm + σn2w

w

aurait une moyenne nulle est une variance unitaire sous H0 I L’´echantillonnage al´eatoire est cruciale. Il permet de calculer

la variance (pas de covariance)

I Sous H0, la statistique converge `a une normale centr´ee r´eduite

(83)

Tests concernant la diff´ erence entre 2 moyennes

I (Variances connues) : Soit ¯Ym la moyenne ´echantillonnale d’une 1`ere population, ¯Yw la moyenne ´echantillonnale d’une 2e population, et H0 : µm−µw = 0

I La statistique suivante :

m−Y¯w −0 qσ2m

nm + σn2w

w

aurait une moyenne nulle est une variance unitaire sous H0 I L’´echantillonnage al´eatoire est cruciale. Il permet de calculer

la variance (pas de covariance)

I Sous H0, la statistique converge `a une normale centr´ee r´eduite

(84)

Tests concernant la diff´ erence entre 2 moyennes (suite)

I Si nous ne connaissons pas les variances, nous pouvons utiliser des estimateurs convergents :

m−Y¯w −0 qsm2

nm+ snw2

w

−→d N(0,1)

I Qu’est qui arrive en petit ´echantillon si Ym et Yw sont g´en´er´ees par des lois normales ?

I On peut utiliser sm2 etsw2, mais la statistique ne satisfait pas les crit`eres pour la distributiont de Student (p.87 du

manuel), et donc la distribution qui g´en`ere la statistique n’est pas connue

(85)

Tests concernant la diff´ erence entre 2 moyennes (suite)

I Si nous ne connaissons pas les variances, nous pouvons utiliser des estimateurs convergents :

m−Y¯w −0 qsm2

nm+ snw2

w

−→d N(0,1)

I Qu’est qui arrive en petit ´echantillon siYm et Yw sont g´en´er´ees par des lois normales ?

I On peut utiliser sm2 etsw2, mais la statistique ne satisfait pas les crit`eres pour la distributiont de Student (p.87 du

manuel), et donc la distribution qui g´en`ere la statistique n’est pas connue

(86)

Tests concernant la diff´ erence entre 2 moyennes (suite)

I Si nous ne connaissons pas les variances, nous pouvons utiliser des estimateurs convergents :

m−Y¯w −0 qsm2

nm+ snw2

w

−→d N(0,1)

I Qu’est qui arrive en petit ´echantillon siYm et Yw sont g´en´er´ees par des lois normales ?

I On peut utiliser sm2 etsw2, mais la statistique ne satisfait pas les crit`eres pour la distributiont de Student (p.87 du

manuel), et donc la distribution qui g´en`ere la statistique n’est pas connue

Références

Documents relatifs

L’un des objectifs de la cartographie du risque appliqu´ ee en ´ epid´ emiologie est l’´ etude et la comparaison de plusieurs mod` eles pour apporter un soutien aux diff´

Dans cette th` ese on ´ etudie l’ergodicit´ e et les grandes d´ eviations pour l’´ equation des ondes non lin´ eaire avec bruit blanc lisse en 3D.. Sous certaines hypoth`

Toutefois, compte tenu des hypoth`eses faites sur le chargement, ` a un champ de d´eplacement admissible pour deux ´etats de fissuration diff´erents est associ´ee une mˆeme valeur

(2008), concernant l’´ evaluation mon´ etaire des zones humides de l’estuaire de la Seine, r´ ev` elent une diff´ erence significative concernant le consentement ` a payer entre

R´ esum´ e – Nous proposons une m´ethode permettant sous certaines hypoth`eses de diminuer la variance d’un estimateur optimal sans d´egrader son risque, en utilisant

met variables et hypoth` eses dans le mˆ eme sac, et ne fait pas de diff´ erence entre environnement et contexte.. Nous, on parlera d’environnement pour les variables seules et

La diff´ erence entre le th´ eor` eme et sa r´ eciproque tient aux conclusions et aux hypoth` eses : Pour montrer que deux droites sont parall` eles, on utilise le th´ eor` eme de

Dans cette note, nous reprenons les r´ esultats de [Bou06] sous une hypoth` ese diff´ erente : que notre op´ erateur lin´ eaire de r´ ef´ erence n’a qu’une valeur propre