Exercices
Econom´ etrie 2
Exercice 1
(*)Soity1,· · ·, yn des r´eels. D´eterminer le r´eelmb qui minimiseSCR(m) = Xn
i=1
|yi−m|2 (Indication : on peut d´eriver la fonctionm7→SCR(m)). Que repr´esente mb par rapport `ay1,· · ·, yn ?
Exercice 2
(**)Soity1,· · ·, yndes r´eels. D´eterminer le r´eel ˜mqui minimise la somme des valeurs absoluesSV A(m) = Xn
i=1
|yi−m| (on pourra traiter d’abord le cas o`u n= 2p+ 1 et classer les r´eels (yi) sous la formey(1) ≤y(1) ≤. . .≤y(n−1)≤y(n), puis passer au cas o`u n= 2p). Que repr´esente ˜mpar rapport `a y1,· · ·, yn ?
Exercice 3
(*) Soit (x1, y1),· · ·,(xn, yn) des couples de r´eels. D´eterminer le r´eel ba qui minimise la somme des carr´es r´esiduelle SCR(a) =
Xn
i=1
|yi−a·xi|2 (Indication : on peut d´eriver la fonction a 7→ SCR(a)). Que repr´esenteba par rapport `a y1,· · ·, yn ? Comparer avec la valeur βbobtenue dans le cadre de la r´egression lin´eaire simple classique.
Exercice 4
(**)[Maximum de vraisemblance] On rappelle que, dans le cadre d’un mod`ele statistique param´etrique (c’est-`a-dire que la loi du mod`ele ne d´epend que d’un nombre fini de param`etres), la densit´e des observationsY1, . . . , Ynvue comme une fonction des param`etres est appel´e la vraisemblance. L’estimateur du maximum de vraisemblance de ces param`etres est la valeur des param`etres qui maximise la vraisemblance.
i. Consid´erons le mod`ele gaussien
Yi=µ+β Zi+εi, i= 1, . . . , n
et ses param`etres (µ, β, σ2), avec les εi des v.a.i.i.d. gaussiennes de loi N(0, σ2). Montrer que −2× log- vraisemblance vaut
L(µ, β, σ2) =n·log(2π) +n·log(z) +1 z ·
Xn
i=1
(Yi−µ−βZi)2, en notantz=σ2 pour d´eriver plus facilement.
ii. Comparer les estimateurs du maximum de vraisemblance avec ceux des moindres carr´es deµet β.
iii. Comparer (au sens de la vitesse de convergence) l’estimateur du maximum de vraisemblance deσ2 avecσb2 d´efini dans le corps du chapitre.
Exercice 5
(***) [Test du rapport de vraisemblance] On rappelle que dans le cadre de variables al´eatoires Y1, . . . , Yn suivant un mod`ele statistique et admettant une densit´e, la statistique U du rapport de vraisemblance est le rapport entre le maximum (en les param`etres) de la vraisemblance sous l’hypoth`ese H1 et le maximum (en les param`etres) de la vraisemblance sous l’hypoth`ese H0. La r´egion d’acceptation du test est du type U ≤ λ, avec λ ∈ IR d´ependant du niveau du test.
i. On consid`ere le test du rapport de vraisemblance de H0 : β = 0 contre H1 : β 6= 0 dans le cadre du mod`ele gaussien (1). Montrer que si l’on pose
SC:=
Xn
i=1
(Yi−bµ−βZb i)2, alors le maximum sousH1 de la log-vraisemblance vaut
−1
2 n·log(2π) +n·log(SC/n) +n
ii. Montrer un r´esultat ´equivalent sousH0en posant gSC:=
Xn
i=1
(Yi−Yi)2,
iii. Donner l’expression de log(U) et comparer avec les tests de Student et Fisher.
Exercice 6
(*)SoitY qui suit un mod`ele lin´eaire non-gaussien, et soitT ∈IRn un vecteur d´eterministe. Montrer que IE (kT−Yk2) =nσ2+kT −Xθk2.
Exercice 7
(**)[Th´eor`eme de Gauss-Markov] On se propose de montrer dans cet exercice que, pour le mod`ele lin´eaire non gaussien (avec les postulatsP1-3mais sans P4), l’estimateur des moindres carr´es θbreste optimal mais maintenant seulement parmi les estimateurs lin´eaires sans biais.
L’optimalit´e veut dire que siθeest un autre estimateur lin´eaire sans biais :
Var (eθ)−Var (bθ) est une matrice semi-d´efinie positive, ou encore, ce qui est ´equivalent, que pour toute combinaison lin´eaireC′·θdes param`etres,
Var (C′·θ)e ≥Var (C′·θ).b
i. Posonsθe=M ·Y o`u M est une matrice de taille (k, n). Montrer queM·X =In.
ii. Ecrireθb=T·P[X]Y, et montrer queM ·P[X]=T·P[X].
iii. Montrer queθe=θb+M·P[X]⊥Y, la somme ´etant non-corr´el´ee. Conclure.
Exercice 8
(**)Soitθ1 etθ2 deux param`etres r´eels inconnus et soit :
• Y1un estimateur sans biais deθ1+θ2 et de varianceσ2;
• Y2un estimateur sans biais de 2θ1−θ2 et variance 4σ2;
• Y3un estimateur sans biais de 6θ1+ 3θ2 et de variance 9σ2,
les estimateursY1,Y2 et Y3´etant ind´ependants. Quels estimateurs de θ1 et θ2 proposeriez-vous ? (on pourra utiliser l’exercice pr´ec´edent).
Exercice 9
(**)[Estimation de la variance] On consid`ere un mod`ele lin´eaire non-gaussien (sansP4). On veut d´eterminer l’esp´erance decσ2.
i. Montrer que (n−k)cσ2= Tr(ε′·P[X]⊥ε) o`u Tr d´esigne la trace.
ii. En utilisant le fait que Tr(A·B) = Tr(B·A), montrer que (n−k)IE (σc2) =σ2T r(P[X]⊥ε′·ε).
iii. Conclure.
Exercice 10
(*)[Maximum de vraisemblance] Reprendre l’exercice dans le cadre g´en´eral du mod`ele lin´eaire vectoriel de taillen,
Y =X θ+ε, ε∼ Nn(0, σ2In), (1)
o`uX est une matrice (n, p) de rang plein etθ∈IRp. Exercice 11
(*)[Test du rapport de vraisemblance] Reprendre l’exercice dans le cadre g´en´eral du mod`ele lin´eaire (1).
Exercice 12
(***) [Moindres carr´es g´en´eralis´es] On suppose le mod`ele lin´eaire g´en´eral (1), mais seulement sous le postulat P1 (erreurs centr´ees). Cependant, on suppose ´egalement connue la matrice de variance-covariance des erreurs (qui n’est donc pas forc´ement diagonale), qui sera not´ee Σ, que l’on suppose de rangn.
i. D´eterminer alors l’esp´erance et la matrice de variance-covariance de θ, estimateur des moindres carr´es que l’onb appeler ici moindres carr´es ordinaires.
ii. On consid`ere maintenant, en lieu et place de la distance euclidienne classique dans IRn utilis´ee pour les moindres carr´es ordinaires, la distance d´efinie par la norme :
kU −VkΣ= (U−V)′·Σ−1·(U −V).
L’estimateur θbG de θ par moindres carr´es g´en´eralis´es minimisera kY −X ·θkΣ. Montrer que bθG = (X′·Σ−1· X)−1X′·Σ−1·Y, et en d´eduire son esp´erance et sa matrice de variance-covariance.
iii. En d´eduire que l’estimateur θbG a une matrice de variance-covariance ”plus petite” que θb (c’est-`a-dire que la diff´erence entre leur matrice de variance-covariance est une matrice semi-d´efinie positive). Ce r´esultat est une variante du Th´eor`eme de Gauss-Markov vu `a l’exercice pr´ec´edent
iv. En supposant de plus que les observations sont conjointement gaussiennes, montrer que θbG est l’estimateur du maximum de vraisemblance.
Exercice 13s
(***) [Statistique des diffusions en mod`eles de la finance] On consid`ere un actif financier dont la valeur au temps t est not´eeXt. Un mod`ele classique en math´ematiques financi`eres consiste `a supposer que le logarithme de cette valeur, Zt := log(Xt), suit un mod`ele de diffusion. Dans sa version la plus simple (drift constant et variance infinit´esimale constante), ce mod`ele s’´ecrit :
dZt=θ·dt+σ·dWt, (2)
o`uθ et σ >0 sont des param`etres r´eels inconnus etWtest un mouvement brownien, c’est-`a-dire un processus continu gaussien centr´e `a accroissement stationnaires et ind´ependants, ce que l’on peut encore quantifier par le fait que∀(s, t)∈ IR2+, IE (Wt) = 0 et IE (Ws.Wt) = min(t, s)). Dans notre cas particulier, l’´equation diff´erentielle stochastique (2) a une solution tr`es simple :
Zt−Z0=θ·t+σ·Wt. (3)
Des propri´et´es du mouvement brownien, nous n’utiliserons que les deux suivantes :
• W0= 0;
• les accroissements de (Wt)t v´erifient la propri´et´e suivante : pour tout n∈ IN et pour tout t0 = 0 < t1 <· · · <
tn ∈IRn+, les variables Wt1, Wt2 −Wt1
,· · ·, Wtn−Wtn−1
sont des variables al´eatoires ind´ependantes de lois respectivesN(0, t1),N(0, t2−t1),· · ·,N(0, tn−tn−1).
Comme Xt (ouZt) ne peut ˆetre observ´e en temps continu, on suppose que l’observation est constitu´ee de n points (Xti)1≤i≤n uniform´ement r´epartis en temps, soitti =i∆,i= 1,· · ·, npour un certain pas de discr´etisation ∆>0. On posera de plus par conventiont0= 0.
i. En posant
Yi:=Zti−Zti−1, i= 1,· · ·, n,
montrer que le vecteurY suit un mod`ele lin´eaire et que les estimateurs optimaux deθetσsont θb = Ztn−Zt0
n∆
cσ2 = 1 (n−1)∆
X
i=1,n
Zti−Zti−1
−Ztn−Zt0
n 2
ii. Montrer que ces estimateurs convergent quandntend vers l’infini, ∆ restant fix´e.
Exercice 14
(*)[Moindres carr´es pond´er´es] On suppose que l’on ne veut pas accorder la mˆeme importance `a toutes les observations dans un mod`ele de r´egression multiple (voir un exemple important de ceci dans l’exercice sur le filtrage exponentiel).
Pour simplifier, on se place tout de mˆeme sous les les postulatsP1-3(erreurs centr´ees, homosc´edasticit´e et ind´ependance des erreurs). Soit (p1, . . . , pn) les poids respectifs que l’on accorde aux diff´erentes variables, avec 0< pipouri= 1, . . . , n et P
pi =n. Soit Ω la matrice diagonale compos´ee de (p1, . . . , pn) sur la diagonale. Tout comme pour les moindres carr´es g´en´eralis´es, on consid´erera la norme :
kU−VkΩ= (U−V)′·Ω−1·(U−V).
etθbΩ, l’estimateur qui minimisekY−XθkΩD´eterminer l’expression de l’estimateurθbΩdeθ, son esp´erance et sa variance, ainsi que l’expression de l’estimateurbσΩ2 deσ2la variance des erreurs.
Exercice 15
(*)SoitZ1, . . . , Zm,mr´eels. On rappelle que le d´eterminant de Van-der-Monde, d´efini par :
△=
1 Z1 . . . Z1m−1 ... ... ... ... 1 Zm . . . Zmm−1
= Y
1≤i<j≤m
(Zi−Zj)
ne s’annule que si deux desZi sont ´egaux. On consid`ere le mod`ele de r´egression quadratique : Yi=µ+β1·Zi+β2·Zi2+εi pour i= 1, . . . , n >2.
i. Montrer que si les Zi ne prennent que deux valeurs distinctes, la matriceX du mod`ele n’est pas de plein rang.
ii. Montrer que si lesZine prennent que trois valeurs distinctes au moins, la matriceX du mod`ele est de plein rang.
iii. G´en´eraliser au cas de la r´egression polynˆomiale de degr´e quelconque.
Exercice 16
(**)[Pr´ediction et Filtrage exponentiel] On suppose un mod`ele de r´egression multiple sous les postulats P1-3, dont les diff´erentes variables (explicatives et `a expliquer) d´ependent du temps (les individus sont par exemple des jours ou des ann´ees). On connaˆıt donc Y1, . . . , Yn et on veut utiliser un mod`ele lin´eaire pour pr´edire Yn+1, sachant que l’on connaˆıt par un moyen ou un autreZn+1(1) , . . . , Zn+1(k) .
i. Par quoi peut-on naturellement approcher Yn+1 si l’on utilise les r´esultats des moindres carr´es ? On appellera cette variable al´eatoire pr´ediction. Quelle est la variance (th´eorique) de l’erreur commise ? Par quelle valeur approchera-t-on cette variance ?
ii. Le mod`ele des moindres carr´es ordinaires accorde le mˆeme poids `a tous les individus. Pour effectuer une pr´ediction
`
a l’instantn+ 1, il est raisonnable de penser, surtout dans le cas fr´equent o`u l’on n’est pas sˆur du mod`ele choisi, que ce sont essentiellement les individus proches dans le temps denqui comptent et que plus le pass´e est lointain moins les individus du pass´e importent. On peut ainsi accord´e un poids qui d´ecroˆıt exponentiellement vite avec le pass´e (d’o`u le nom de filtrage exponentielle). En utilisant un param`etre 0 < β ≤ 1, on pourra utiliser un mod`ele de moindres carr´es pond´er´es dont les poids pourront s’´ecrirepi=p·βn−i, o`up >0 est un param`etre de normalisation. D´eterminerp. Que se passe-t-il lorsqueβ = 1 ? Quelle est alors l’estimation deYn+1 par filtrage exponentiel ? Quelle est sa variance et comment l’approcher ?
Remarque : le probl`eme de cette m´ethode est le choix de la valeur de β; en pratique on choisit souventβ = 0.8 ou 0.7, mais une proc´edure dite adaptative, c’est-`a-dire estimant, `a partir des donn´ees, une valeur optimale deβ, pour un certain crit`ere, peut ´egalement ˆetre mise en place.
Un tel filtre exponentiel peut aussi ˆetre utiliser pour ce que l’on appelle une r´egression locale dont le cadre est le suivant : on suppose que l’on dispose d’une s´erie chronologique (Yi)i∈INposs´edant une tendance mais pas de composante saisonni`ere (voir exercice ), et telle queY1,· · ·, Ynest connue. Pour estimer la tendance, en vue par exemple d’identifier le bruit de la s´erie (εi) et pour s’adapter aux possibles variations tr`es locales de cette tendance, on peut effectuer une r´egression locale qui consiste en une suite de r´egressions lin´eaires simples (ou polynˆomiales de faible degr´e) effectu´ees `a l’aide d’un filtre exponentiel dont le centre est chaque couple (i0, Yi0) de l’ensemble des donn´ees; cela revient `a consid´erer les couples (i0,Ybi0) pouri0= 1, . . . , n, obtenus par une r´egression par moindres carr´es pond´er´es (de matrice diagonale de poids Ωi0 = (p·β−|i0−i|·δij)ij). On appelle parfois une telle m´ethode r´egression dite LOESS. Rendu plus robuste par la prise en compte d’une matrice de poids adapt´e `a chaque point, on obtient une r´egression dite LOWESS. Ces proc´edures, non-param´etriques, sont pr´esentes dans les trois logiciels R, SAS et Splus, et le filtre exponentiel peut
´egalement ˆetre remplac´e par d’autres fonctions r´eguli`eres et d´ecroissant suffisamment vite.
Exercice 17
(**)[Transformation de variables] Soit des observationsYij qui suivent le mod`ele suivant : Yij =µi+εij·p
µi(1−µi), pour i= 1,· · ·, I, j= 1,· · ·, J, (4) o`u les erreursεij v´erifient les postulats habituelsP1-4. On pose
Zij = arcsin(p Yij).
i. ´Ecrire un d´eveloppement limit´e `a l’ordre 1 de la fonctionx7→arcsin(√x) au pointx0.
ii. On admet que l’on peut n´egliger le reste : soit c’est une hypoth`ese que l’on assume, soit on suppose queσ2tend vers z´ero. Dans ce dernier cas on utilise ce que l’on appelle la δm´ethode ou Th´eor`eme de Slutsky. Montrer que Zij suit un mod`ele d’analyse de la variance `a un facteur.
iii. Montrer que si les Yij sont des donn´ees de comptage sur de grands effectifs, avec une probabilit´e de succ`es qui d´epend de l’indiceion est approximativement dans la situation du mod`ele (4).
Exercice 18
(**)[Test de runs] Ce test est utilis´e pour tester la pr´esence ou non de corr´elations dans lesεi. On commence d’abord par le d´ecrire dans le cas o`u l’on observe des variables al´eatoiresY1, . . . , Yn dont on veut tester l’ind´ependance. On les suppose de m´ediane z´ero. On compte parmiY1,· · ·, Yn le nombreRde ”paquets” (ou ”runs”) de (Yi) cons´ecutifs ayant le mˆeme signe.
Par exemple, siY1, . . . , Y9= (1.1,1.3,−2,−1,4.5,1.6,−2.7,−1.3,4), il y a 5 runs pour n= 9 donn´ees.
i. Montrer que si on suppose qu ’aucun desYi n’est nul, alors :
R= 1 +
n−1X
i=1
1IYiYi+1<0:= 1 +
n−1X
i=1
Zi
ii. On suppose que les Yi sont ind´ependantes et de loi diffuse (c’est-`a-dire absolument continue par rapport `a la mesure de Lebesgue). Montrer que IE (R) =n+ 1
2 ,
iii. Montrer que si|i−j|>1,Zi et Zj sont ind´ependantes. Montrer que Zi et Zi+1 sont ´egalement ind´ependantes.
En d´eduire Var (R).
iv. En utilisant le th´eor`eme de la limite centrale, construire pour des grands ´echantillons une statistique libre qui suit une loi normale centr´ee r´eduite sous l’hypoth`eseH0 d’ind´ependance et qui tend vers±∞sous les alternativesH1
d’intrication et de r´epulsion. Nous laissons au lecteur le soin de deviner le sens de ces deux derniers mots.
Remarque : Pour ce qui est du test de l’ind´ependance des erreurs dans un mod`ele lin´eaire, on appliquera le test de runs aux estimateursεbi en n´egligeant leurs liaisons (toujours pr´esentes, mˆeme sous l’hypoth`ese d’ind´ependance desεi) et en n´egligeant le fait que leur m´ediane n’est qu’approximativement nulle. Il existe d’autres versions de ce test sous des hypoth`eses d’´echangeabilit´e.
Exercice 19
(**) [Tendance et composante saisonni`ere d’une s´erie chronologique] On consid`ere une suite de variables al´eatoires (Yi)i∈IN d´efinies sur le mˆeme espace de probabilit´e et poss´edant un moment d’ordre 2 constantσ2. L’indiceiest relatif au temps et peut repr´esenter des jours, des ann´ees,... Une telle suite (Yi) est appel´ee s´erie chronologique.
On suppose ´egalement que pour touti∈IN, on peut d´ecomposerYi de fa¸con unique sous la forme : Yi=t(i) +s(i) +εi
o`usest une fonction de IR dans IR, appel´ee composante saisonni`ere, p´eriodique de p´eriodeT ∈IN∗ connue et telle que PT
i=1s(i) = 0,test une fonction de IR dans IR appel´ee tendance et (εi)i∈IN est une suite de variables centr´ees appel´ee bruit. On suppose que la tendancets’´ecrit sous la formet(x) =a1·g1(x) +. . .+ak·gk(x) pourx∈IR, o`uk∈IN∗ est connu,g1, . . . , gk sont des fonctions connues et a1, . . . , ak sont des r´eels inconnus. Enfin, on suppose que l’on connaˆıt une trajectoire (Y1, . . . , YnT), o`un∈IN.
i. On suppose ques= 0. En utilisant une r´egression lin´eaire par moindres carr´es ordinaires, quels sont les estimateurs b
t(x) pourx∈IR etbσ21 ?
ii. On suppose maintenant que t= 0 et que pour k∈IN, si kest un multiple de i∈ {1, . . . , T} alorss(k) = si (et doncPT
i=1si= 0). En utilisant une r´egression lin´eaire par moindres carr´es ordinaires (attention, lesT param`etres si sont li´es lin´eairement...), donner l’expression deσb22et montrer que
b si= 1
n Xn
k=1
Yi+(k−1)T− 1 nT
XnT
k=1
Yk pour i= 1, . . . , T.
iii. Dans le cas o`u la tendance et la composante saisonni`ere ne sont pas nulles, quels estimateurs proposeriez vous pour ces fonctions, ainsi que pour la variance ? (on suppose les mˆemes ´ecritures de t et s que pr´ec´edemment).
Ces estimateurs sont-ils les mˆemes que ceux obtenus en estimant d’abord la tendance, et ensuite la composante saisonni`ere `a partir de la s´erie `a laquelle on a retir´e cette estimation de la tendance ?
Exercice 20
(***)[Interpolation et splines] On suppose que l’on dispose dencouples de r´eels (xi, yi), lesxi´etant tous distincts les uns des autres, `a partir desquels on d´esirerait avoir une id´ee d’une fonctionyi=g(xi).
i. Montrer qu’il existe un unique polynˆome de degr´en−1 passant par l’ensemble des points. On pourra utiliser l’exercice . Rappeler la formule de ce polynˆome d’interpolation dit de Lagrange (indication : ce polynˆome s’´ecrit comme une combinaison lin´eaire de polynˆomes de la formePj(x) =Y
i6=j
x−xi
xj−xi
pour j = 1, . . . , n). Quelles sont les limitations d’une telle estimation de g? Quelle r´egression lin´eaire suffirait-il de mettre en place pour obtenir le mˆeme polynˆome ?
ii. Une autre m´ethode d’interpolation ”d´eterministe” consiste en l’utilisation de splines cubiques, qui sont des polynˆomes d’interpolation de degr´e 3 que l’on raccorde en chaque points. Plus pr´ecis´ement, en supposant x1 < x2 < · · · < xn, on consid`ere une suite de polynˆomes de degr´e 3 qui sur chaque intervalle [xi, xi+1] telle que le polynˆome passe enxi etxi+1et telle que les d´eriv´ees premi`eres et secondes soient continues en ces points.
Montrer que si l’on impose des conditions au bord (enx1etxn) soit sur les d´eriv´ees premi`eres, soit sur les d´eriv´ees secondes (par exemple qu’elles soient nulles), alors la suite de splines est unique.
iii. Demander que la fonction interpolatrice passe exactement par tous les points est une exigence contraignante qui finalement a peu de sens dans le cadre assez g´en´eral de donn´ees entach´ees d’erreurs, voire la pr´esence de donn´ees aberrantes. On pr´ef´erera alors utiliser une m´ethode d’approximation avec la volont´e que la fonction d’approximation, que l’on supposera au moins C2, n’ait pas de brusques variations. Un choix possible est de choisir une fonctionf qui minimise la somme des carr´es p´enalis´ee :
Sλ(f) = 1 n
Xn
i=1
yi−f(xi)2
+λ· Z ∞
−∞
∂2f
∂x2(x)
2
dx,
o`uλ >0. On peut montrer que si l’on suppose quef appartient `a l’espace des fonctions continˆument d´erivables et de d´eriv´ee seconde de carr´e int´egrable (on admet que cet espace est un espace de Hilbert) alors il existe une unique fonction minimisant Sλ. On peut ´egalement montrer qu’une suite (appel´ee ”smoothing”-splines) de polynˆomes de degr´e 3 entre chaquexi et dont les d´eriv´ees secondes (donc ´egalement premi`eres) sont continˆument raccord´es en xi minimise Sλ(.). La fonction form´e par cette suite ne passe plus forc´ement par les points (xi, yi). Que se passe-t-il quand λ est proche de 0 ? Et lorsque λ tend vers l’infini ? Expliquer comment faire num´eriquement pour obtenir cette fonction.
Exercice 21
(*)Soit le mod`ele d’analyse de la variance `a un facteur ´equir´ep´et´e. On suppose que le mod`ele est non gaussien mais v´erifie l’hypoth`eseH. On suppose de plus que le nombre I de niveaux du facteur est constant, mais que le nombre de r´ep´etitionsKtend vers l’infini. Montrer directement par une utilisation du Th´eor`eme de la Limite Centrale la normalit´e asymptotique debθn et la convergence debσ2,nversσ2.
Exercice 22
(**) Soit le mod`ele de r´egression lin´eaire simple de Y par Z, muni des postulats P1-4 de param`etres µ, β et σ2. Cependant, croyant plutˆot que le mod`ele est quadratique, on utilise les estimateursθbet bγ2,n du mod`ele de r´egression polynˆomiale de degr´e 2 (de param`etres θ = (θ1, θ2, θ3)′ et γ2). On dira alors que l’on a sur-ajust´e le mod`ele. A-t-on IE (θb3
n) = 0 ;θb3
n P
n→+∞−→ 0 ;bγ2,n n→+∞−→P σ2quand le nombre de donn´eesntend vers l’infini ?
Si z est une valeur donn´ee de la variable Z, quelle est la variance de Yb en z calcul´ee `a l’aide de l’estimateur θb ? Comparer au cas de la r´egression simple.
Exercice 23
(**)A l’inverse de l’exercice pr´ec´edent, on suppose maintenant que l’on a un mod`ele de r´egression polynˆomiale de degr´e 2 muni des postulatsP1-4, mais que pour l’analyser on utilise un mod`ele de r´egression simple. On dira alors que l’on a sous-ajust´e le mod`ele. En se pla¸cant dans le cas particulier o`uZi=ipouri= 1, . . . , n, v´erifier que l’estimateur de la variance ne converge pas et que|Ybn+1−Yn+1| n→+∞−→P +∞.