• Aucun résultat trouvé

3 Tests d’hypoth`ese (20 points)

N/A
N/A
Protected

Academic year: 2022

Partager "3 Tests d’hypoth`ese (20 points)"

Copied!
6
0
0

Texte intégral

(1)

Examen intra Examen final x

Sigle Groupe Trimestre

ECO4272 50 20181

Titre Introduction `a l’´econom´etrie

Enseignant(e) Steve Ambler

Consignes importants

1. Ecrivez lisiblement.´

2. Justifiez vos r´eponses. La majorit´e des points seront attribu´ees pour le raisonnement.

3. Je ne pourrai accorder des pointspour une mauvaise r´eponse sans justification. Voir le point 2.

4. La documentation n’est pas permise.

5. Ne simplifiez pas vos r´eponses. Cela va me permettre de suivre plus facilement votre raisonnement. Voir le point 2.

6. Les calculatrices ne sont pas permises. Voir le point 5.

7. Les t´el´ephones ne sont pas permis.

8. Si je vous demande si une statistique calcul´ee est significative,sans consulter les tables, vous pouvez donner une r´eponse approximative. Je vous donne par contre les ´egalit´es suivantes :Φ (−1.645)≈0.05

Φ (−1.96) ≈0.025etΦ (−2.57)≈0.005, o`u la fonctionΦ (·)est la loi normale centr´ee r´eduite cumul´ee.

1 R´eponses courtes (20 points)

1. Expliquez en mots pourquoi une statistiqueF calcul´ee pour tester des hypoth`eses jointes doit forc´ement ˆetre positive.

(2)

2. D´ecrivez en d´etail comment tester un ensemble d’hypoth`eses jointes portant sur les coefficients individuels d’un mod`ele de r´egression multiple si on a seulement les coefficients estim´es et leurs ´ecarts types individuels.

(Ceci pourrait ˆetre le cas si on a acc`es `a des r´esultats publi´es dans un article mais non aux donn´ees originales.)

3. D´ecrivez de quoi d´epend l’impact de l’ajout d’une variable explicative `a un mod`ele de r´egression sur leR¯2. Est-ce que le crit`ere pour savoir le signe de l’impact surR¯2 a une interpr´etation statistique ? Expliquez.

4. D´ecrivez de quoi d´epend le signe et la taille du biais introduit par l’omission d’une variable explicative significative d’un mod`ele de r´egression multiple.

5. Dans le cadre du mod`ele de r´egression multiple, que signifietester la significativit´e de la r´egression?

2 Propri´et´es d’estimateurs (30 points)

Soit l’estimateurβ˜d’un vecteur de param`etresβ d’un mod`ele de r´egression lin´eaire multiple.

1. Si l’estimateurβ˜est non biais´e, cela veut direen notation math´ematiqueque . . .

2. Expliquez en mots la signification rigoureuse deconvergence en probabilit´e.

3. L’erreur d’un estimateur peut ˆetre ´ecrit comme βb−β

o`u vous pouvez supposer (pour cette sous-question) queβ est un scalaire (un seul param`etre et non un vecteur),βest sa valeur etβbest sa valeur estim´ee. ´Ecrivez une expression pour ce qu’on appelle l’erreur

quadratique moyenne (qui est en fait une esp´erance). Montrez que l’erreur quadratique moyenne est la somme de la variance de l’estimateur plus le carr´e du biais de l’estimateur (indice — il suffit d’ajouter et de soustraire l’esp´erance de l’estimateur et ensuite de simplifier l’expression que vous obtenez). Cette sous-question est l´eg`erement plus difficile que les autres.

(3)

4. Si un estimateur est non biais´e et si sa variance tend vers z´ero lorsque la taille de l’´echantillon tend vers l’infini, vers quoi tend son erreur

quadratique moyenne ? Vous pouvez r´epondre sans avoir d´emontr´e le r´esultat de la sous-question pr´ec´edente.

5. Dans le cours, quelle est la fac¸on habituelle de d´emontrer la convergence en probabilit´e d’un estimateur ? (Indice — pensez `a la sous-question pr´ec´edente.)

6. Expliquez en mots ce que veut dire la notation suivante : β˜−→d N

β,Σ˜β .

7. Dans le mod`ele de r´egression multiple (lin´eaire), qu’est-ce qui arrive `aΣ˜βˆ (est-ce que les ´el´ements de la matrice tendent vers quelque chose ?) lorsque la taille de l’´echantillon augmente ?

8. D´ecrivez en mots ce que veut dire l’efficience d’un estimateur lin´eaireβ˜ dans le contexte de la r´egression multiple(et o`u doncβ est unvecteur de param`etres). D´ecrivez aussi ce que cela veut dire en notation

math´ematique.

9. Sous quelles conditions est-ce que l’estimateur MCO deβ(β) estb

efficient dans le mod`ele de r´egression multiple ? Est-ce que ces conditions font partie des hypoth`eses de base du mod`ele de r´egression multiple, au moins la version du mod`ele pr´esent´ee dans le chapitre 6 du manuel de Stock & Watson ou dans les notes de cours ?

10. En mots, d´ecrivez pourquoi le fait d’avoir un ´echantillon d’observations plus grand peut ˆetre une solution au probl`eme de multicollin´earit´e imparfaite.

11. D´efinissez en mots le probl`eme de multicollin´earit´e parfaite. Quelle est la cons´equence de la multicollin´earit´e parfaite ?

3 Tests d’hypoth`ese (20 points)

Vous venez d’estimer le mod`ele de r´egression suivant :

Yi01X1i2X2i3X3i4X4i5X5i+ui

(4)

Vous voulez tester l’hypoth`ese suivante :

H01 + 2β2 = 3

contre l’hypoth`ese alternative bilat´erale

H01+ 2β2 6= 3.

1. Montrez comment tester l’hypoth`ese en ´ecrivant un mod`ele´equivalenten termes d’un nouveau param`etre qui est la combinaison lin´eaire pertinente deβ1et deβ2.

2. D´ecrivez comment tester l’hypoth`ese en utilisant la formule g´en´erale pour tester des hypoth`eses lin´eaires (possiblement mais non n´ecessairement jointes). Pas n´ecessaire d’´ecire la formule au complet, mais je vous demande d’´ecrire la restriction qui tient sousH0 sous forme matricielle.

3. Comment est-ce que la statistique de la sous-question pr´ec´edente est distribu´ee ?

4. D´ecrivez comment tester l’hypoth`ese en ´ecrivant et estimant un mod`ele contraint qui impose l’hypoth`ese nulle que vous voulez tester.

5. Pour les trois fac¸ons de tester cette hypoth`ese nulle, expliquez s’il est possible (et comment) d’utiliser des ´ecarts types robustes (des param`etres estim´es) pour effectuer le test.

4 Mod`eles de r´egression non lin´eaires (20 points)

Soit le mod`ele de r´egression non lin´eaire suivant :

Yi01X1i2X1i23X2iX1i4X3i+ui Vous avez estim´e ce mod`ele et vous voulez pr´edire l’impact surYi d’une augmentation deX1i.

1. Est-ce que ce mod`ele est non lin´eaire dans les param`etres ? Expliquez clairement en donnant une r´eponse math´ematique ainsi qu’en mots.

2. D´erivez une expression alg´ebrique pour le changement pr´edit

∆ ˆY ≡Yˆ2−Yˆ1 suite `a un changement de la valeur deX1

(∆X1 ≡X12−X11),pour des valeurs constantes des autres variables.

Notez queY2 fait r´ef´erence `a la valeur deY apr`es le changement de la

(5)

valeur deX1, etY1fait r´ef´erence `a sa valeur avant le changement. Vous pouvez utiliser l’approximation

X122 = (X11+ ∆X1)2

=X112+ 2×∆X1×X11+ (∆X1)2

≈X112+ 2×∆X1 ×X11 si∆X1 est suffisamment petit.

3. En ´ecrivant∆ ˆY /∆X1sous la formeδ0β, ´ecrivez une expressionb

alg´ebrique pour l’´ecart type du changement pr´edit. Montrez votre travail.

4. Utilisant l’´ecart type calcul´e `a la sous-question pr´ec´edente, ´ecrivez l’intervalle de confiance autour du changement pr´edit. Vous pouvez supposer un niveau de confiance de 95%.

5. ´Ecrivez un mod`ele ´equivalentqui permet de calculer l’´ecart type du changement pr´edit en fonction de l’´ecart type d’un des coefficients estim´es. ´Ecrivez l’intervalle de confiance pour le changement pr´edit bas´e sur cette estimation, utilisant l’´ecart type estim´e du coefficient tranform´e.

6. ´Ecrivez sous forme matricielle l’hypoth`ese nulle jointe `a tester qui permettrait de calculer l’´ecart type du changement pr´edit. ´Ecrivez l’intervalle de confiance pour le changement pr´edit bas´e sur cette m´ethode.

5 Tests diagnostics (10 points)

1. D´ecrivez quelque fac¸ons informelles de d´etecter l’h´et´erosc´edasticit´e du terme d’erreur dans le mod`ele de r´egression multiple.

2. D´ecrivez deux fac¸ons diff´erentes de tester formellement l’hypoth`ese nulle de l’homosc´edasticit´e du terme d’erreur dans le mod`ele de r´egression multiple.

6 Biais d ˆu `a des variables omises (20 points en bonus)

Soit le mod`ele de r´egression multiple donn´e par

Y =Xβ+U =X1β1+X2β2+U

(6)

avec la notation habituelle, et o`uX1etX2 regroupent des sous-ensembles des variables explicatives. (Cela veut dire queβ1etβ2sont desvecteursde

param`etres.) On suppose que le mod`ele ob´eit aux hypoth`eses statistiques de base du mod`ele de r´egression multiple. Vous estimez le mod`ele donn´e par

Y =X1β1+ ˜U o`uU˜ ≡X2β2+U.

1. ´Ecrivez le probl`eme de minimisation `a r´esoudre pour trouver l’estimateur MCO deβ1.

2. ´Ecrivez les conditions du premier ordre pour ce probl`eme de minimisation.

3. ´Ecrivez une expression alg´ebrique pour l’estimateur MCO deβ1,βˆ1. Notez qu’il n’est pas forc´ement n´ecessaire d’avoir r´epondu aux deux premi`eres sous-questions pour r´epondre `a celle-ci.

4. D´erivez une expression pour le biais dˆu aux variables omises. Cette sous-question est probablement la sous-question la plus difficile de cette question.

5. `A quoi doit converger (en probabilit´e) ce biais ?

6. Donnez une interpr´etation en mots de cette expression pour le biais.

7. Qu’est-ce qu’on peut dire concernant le signe du biais ? Expliquez.

N’oubliez pas qu’iciβ1 etβ2 sont desvecteursde param`etres.

document cr´e´e le : 15/04/2018

Références

Documents relatifs

boxcox (MASS) transformation de Box-Cox dans le cas d’un LNM bcPower (car) transformation de Box-Cox, Yeo-Johnson ou puissance lm (stats) ajuste un mod` ele de r´ egression lin´

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son estimateur?. Proposer des simulations

L’entreprise Granulex distribue un aliment pour chat dans un contenant m´ etallique dont le poids apr` es remplissage, repr´ esent´ e par une variable al´ eatoire X, est calibr´ e `

Pour pouvoir d´ eterminer la concentration du Glucose ` a partir de la mesure de l’absorbance, on effectue une calibration pr´ eliminaire: une courbe d’´ etalonnage du dosage

Les ´ echantillons pr´ elev´ es seront dilu´ es afin de rester dans la zone de lin´ earit´ e du spectrophotom` etre, zone pour laquelle la densit´ e optique est proportionnelle ` a

Les ´ echantillons pr´ elev´ es seront dilu´ es afin de rester dans la zone de lin´ earit´ e du spectrophotom` etre, zone pour laquelle la densit´ e optique est proportionnelle ` a

Extension du mod` ele: croissance logistique (prise en compte de toutes les donn´ ees) On ´ etudie toujours la croissance dans un chemostat en batch mais la mod´ elisation qui suit