• Aucun résultat trouvé

EXAMEN DU 21 MAI 2013 – LM347 CORRECTION

N/A
N/A
Protected

Academic year: 2022

Partager "EXAMEN DU 21 MAI 2013 – LM347 CORRECTION"

Copied!
3
0
0

Texte intégral

(1)

EXAMEN DU 21 MAI 2013 – LM347 CORRECTION

Exercice 1.

Soit a > 0, c > 0, et un échantillon X1, . . . , Xn de loi de densité f(u) = ce−au2 pour u∈ R. On note X= (X1· · ·Xn)0.

i) – Calculer la valeur de la constante cen fonction dea (vous pouvez vous ramener à la densité d’une loi normale).

ii) – Calculer E(X12) (vous pouvez utiliser le même argument que celui utilisé pour résoudre i)).

iii) – En notant σˆ2 =v(X) la variance empirique de X, proposer un estimateur ea de a obtenu par la méthode des moments.

iv) – En se rappelant que σˆ2 est asymptotiquement normal de loi limite la loi N(0,2σ4), en déduire que l’estimateurea est asymptotiquement normal et donner sa loi limite.

v) – Calculer la densité fX(x, a) du v.a. X et le logarithme de la vraisemblance de X.

vi) – Trouver, en le justifiant proprement, l’estimateurba du maximum de vraisemblance de a.

vii) – Montrer que l’estimateurba est asymptotiquement normal et donner sa loi limite.

viii) – Calculer l’information de Fisher et montrer que les estimateursba eteasont asymptotique- ment efficaces.

i) – La fonction f doit vérifier R

Rf(u) du = 1 ⇔1/c = R

Re−au2du = R

Re−u2/(2σ2)du = √ 2πσ, en posantσ2 = 1/(2a), c’est-à-direc=p

a/π et ainsif est la densité de la loi normaleN(0, σ2). ii) – E(X12) = R

Ru2f(u) du=cR

Ru2e−au2du=σ2 = 1/(2a).

iii) – Comme EX1 = 0 ne dépend pas de a, on va utiliser la variance qui vaut 1/(2a), ainsi, en notant σˆ2 = v(X) on doit résoudre l’équation 1/(2a) = ˆσ2 ⇔ea = 1/(2ˆσ2), en se rappelant que pour un échantillon de loi gaussienne on a d’après le cours σˆ2 >0 presque sûrement.

iv) – Comme σ2 =VX1 = E(X12) = 1/(2a), la méthode delta implique en posant h(u) = 1/(2u) queea=h(ˆσ2) est asymptotiquement normal de loi limite la loi N(0,2σ4(h02))2) =N(0,2a2). v) – Par indépendance, fX(x, a) = Qn

i=1fXi(xi) = Qn

i=1f(xi) =cne−a(x21+···+x2n) et logfX(x, a) = (n/2) loga−(n/2) logπ−a(x21+· · ·+x2n), pour x= (x1· · ·xn)0 ∈Rn.

vi) – La fonction a → logfX(x, a) est toujours strictement concave (comme la fonction a → (n/2) loga) et, lorsque x 6= 0, sa dérivée s’annule au point a = n/(2(x21 +· · ·+x2n)). Comme presque sûrement X12+· · ·+Xn2 >0 puisque queP(Xi = 0) = 0pour i∈ {1, . . . , n}, il en résulte queba=n/(2(X12+· · ·+Xn2)).

vii) – Les v.a. X12, . . . , Xn2 sont i.i.d. de moyenne σ2 et de variance 2σ4 (carré d’une variable de loi N(0, σ2)), ainsi, par le théorème limite central la v.a. 1/(2ba) = (X12 +· · ·+Xn2)/n est asymptotiquement normale de loi limite la loiN(0,2σ4). En appliquant la méthode delta comme précédemment il en résulte que l’estimateur ba est asymptotiquement normal de loi limite la loi N(0,2a2).

viii) – La dérivée seconde par rapport à a de la log vraisemblance vaut −n/(2a2), ainsi l’infor- mation de Fisher vaut I(a) = Ea(n/(2a2)) = n/(2a2) = nI1(a) avec 1/I1(a) = 2a2 qui est la variance de la loi asymptotique des estimateursba etea : ils sont donc asymptotiquement efficaces.

Exercice 2.

Soitn1 etn2 deux entiers supérieurs ou égaux à1. Considérons le modèle de régression linéaire Xi = m1+i, pour i∈ {1, . . . , n1}, Xi = m2 +i, pour i ∈ {n1+ 1, . . . , n1+n2}, avec m1, m2 des paramètres réels, et 1, . . . , n1+n2 des v.a.i.i.d. de loi N(0,σ2) où σ2 est un paramètre réel strictement positif. On posera n =n1+n2 dans ce qui suit.

i) – Ecrire le modèle sous la forme X = Aθ +, θ∈R2, le modèle linéaire déterministe associé X˜ =Aθ est-il régulier ?

ii) – Calculer les matrices A0A et (A0A)−1.

iii) – Résoudre le problème de moindres carrés associé au modèle de régression linéaire X˜ =Aθ.

iv) – Ecrire la vraisemblance deX.

v) – Calculer les estimateurs du maximum de vraisemblancemˆ1,mˆ2,σˆ2, des paramètresm1, m2, σ2, en précisant bien pour quelles valeurs de n1 etn2 ils existent.

(2)

On supposera ces conditions vérifiées par la suite.

vi) – Préciser la loi demˆ1 et celle deσˆ2.

vii) – Construire un intervalle de confiance pour le paramètre m1 de degré de confiance 95%.

viii) – Proposer en le justifiant un test de l’hypothèsem1 = 1 d’erreur de première espèce 5%.

i) – On prend θ = (m1m2)0 et A = [A1A2] où A1 = (1· · ·1 0· · ·0)0 ∈ Rn avec n1 valeurs 1 et A2 = (0· · ·0 1· · ·1)0 ∈Rn avec n2 valeurs1, on pose aussi= (1· · ·n)0. Ce modèle est régulier puisque les vecteurs A1 et A2 sont non nuls (n1 et n2 ≥ 1) et orthogonaux, donc forment une famille libre et le rang de A est bien égal à 2.

ii) – Les coefficients de la matrice A0A sont les produits scalaires des colonnes de A, ainsi A0A=

n1 0 0 n2

et (A0A)−1 =

1/n1 0 0 1/n2

.

iii) – Comme le modèle de régression est régulier, l’uniqueθ qui minimise ||X−Aθ||2 est donné par θ= ˆθ = (A0A)−1A0X =

1/n1 0 0 1/n2

X1 +· · ·+Xn1

Xn1+1+· · ·+Xn

=

(X1+· · ·+Xn1)/n1

(Xn1+1+· · ·+Xn)/n2

. iv) – Le vecteur X suit la loi Nn(Aθ, σ2In) et sa vraisemblance vaut :

fX(x) = (2π)−n/2σ−ne−||x−Aθ||2/(2σ2)= (2π)−n/2σ−n exp

− 1 2σ2

Xn1

i=1

(xi−m1)2+

n

X

i=n1+1

(xi−m2)2 .

v) – On commence par trouver le minimum en θ de ||x−Aθ||2 dont la solution est donnée dans la question iii), ainsi mˆ1 = (X1+· · ·+Xn1)/n1 et mˆ2 = (Xn1+1+· · ·+Xn)/n2. Ensuite il faut trouver le maximum en σ2 de la fonction :

σ2 −→(σ2)−n/2 exp

− 1 2σ2

Xn1

i=1

(xi−mˆ1)2+

n

X

i=n1+1

(xi−mˆ2)2 , et dès que le terme Pn1

i=1(xi−mˆ1)2+Pn

i=n1+1(xi−mˆ2)2 est strictement positif, ce maximum est atteint en (Pn1

i=1(xi−mˆ1)2+Pn

i=n1+1(xi−mˆ2)2)/n, or, d’après le cours, pour n≥3 il vient : P

Xn1

i=1

(xi−mˆ1)2+

n

X

i=n1+1

(xi−mˆ2)2 >0

= 1, en conséquence pour n ≥3 on a σˆ2 = (Pn1

i=1(xi −mˆ1)2+Pn

i=n1+1(xi−mˆ2)2)/n.

vi) – mˆ1 étant une somme de v.a.i.i.d. de loi N(m1, σ2), on a mˆ1 ∼ N(m1, σ2/n1). D’après le cours nσˆ22 ∼χ2n−2 puisqu’il y a deux paramètres dans la moyenne .

vii) – Comme d’après le cours mˆ1 et σˆ2 sont indépendants, la statistique T = √

n1( ˆm1 − m1)/p

nˆσ2/(n−2) suit la loi de Student Tn−2, ce qui conduit à poser avec les notations du cours :

I = i

ˆ

m1− tn−2,α

√n1

√nˆσ2

√n−2, mˆ1+ tn−2,α

√n1

√nσˆ2

√n−2 h

,

on a alors P(m1 ∈ I) = P(|T| < tn−2,α) = 1−α et en choisissant α = 5% l’intervalle I est un intervalle de confiance pour m1 de degré de confiance 95%.

viii) – Si on poseR ={1∈ I}, cette région de l’espace des observations peut être utilisée comme/ la région de rejet d’un test de l’hypothèse m1 = 1. On a alors pour l’erreur de première espèce, lorsque θ= (1 m2)0 :

Pθ(R) = P(1∈ I) =/ P(|T| ≥tn−2,α) = 1−P(|T|< tn−2,α) =α . On répond à la question en choisissant α= 5%.

Exercice 3.

Soity1 = 1, y2 = 0, y3 = 0, y4 =−1, y5 = 1, et le modèle de régression linéaireXi =ayi+b+i, pouri∈ {1, . . . ,5}, aveca, bdes paramètres réels, et1, . . . , 5 des v.a.i.i.d. de loiN(0,σ2)oùσ2 est un paramètre réel strictement positif.

i) – Ecrire le modèle sous la forme X = Aθ+, θ∈R2, et montrer que le modèle linéaire déter- ministeX˜ =Aθ est régulier.

ii) – Reconnaître un modèle présenté en cours et en déduire la solution du problème de moindres

2

(3)

carrés associé au modèle de régression linéaireX˜ =Aθ.

iii) – Toujours par le cours en déduire les estimateurs du maximum de vraisemblancea,ˆ ˆb,σˆ2, des paramètres a, b, σ2, lorsque X1= 2,1, X2= 0,9, X3= 1,1, X4= 0,1, X5= 1,9 (on commencera par établir la formule théorique).

iv) – Calculer la loi du vecteur de coordonnées ˆa etˆb.

v) – Pour z ∈R fixé, en déduire la loi de la “prédiction” ˆaz+ ˆb.

vi) – Construire un intervalle de confiance pour la quantitéaz+b.

i) – On prend θ = (a b)0 et A = [A1A2] où A1 =y = (1 0 0−1 1)0 ∈R5 et A2 = (1· · ·1)0 ∈R5, on pose aussi = (1· · ·5)0. Ce modèle est régulier puisque les vecteurs A1 et A2 sont non nuls et ne sont pas colinéaires, donc forment une famille libre et le rang de A est bien égal à 2. ii) – C’est le modèle de la droite de régression et la solution du problème des moindres carrés est donnée par ˆa=c(y, X)/v(y) etˆb =m(X)−(c(y, X)/v(y))m(y).

iii) – ˆa et ˆb ont leur formule donnée dans la question précédente et σˆ2 = (1/5)P5

i=1(Xi−ˆayi− ˆb)2. Ainsi, il vient : m(y) = 1/5 = 0,2; m(X) = 6,1/5 = 1,22; v(y) = 3/5−0,04 = 0,56; c(y, X) = 3,9/5 −0,244 = 0,78−0,244 = 0,536; ˆa = 0,536/0,56 = 13,4/14 = 0,957 ≈ 1; ˆb= 1,22−0,2×13,4/14 = 1,029 ≈1; σˆ2 ≈(1/5)×5×(0,1)2 = (0,1)2.

iv) – D’après le cours θˆ= (ˆaˆb)0 suit la loi N2(θ, σ2(A0A)−1) avec θ = (a b)0, A0A =

3 1 1 5

et

(A0A)−1 = 141

5 −1

−1 3

.

v) – Commeˆaz+ˆb= (z1)ˆθ, il vientˆaz+ˆb∼ N(az+b, σ2(z1)(A0A)−1(z1)0) =N(az+b, σ2(5z2− 2z+ 3)/14).

vi) – Remarquons pour commencer que nous savons que c = (5z2 −2z + 3)/14 > 0 puisque le vecteur(z1)0 est non nul. Alors, comme d’après le coursθˆetσˆ2 sont indépendants, la statistique T =p

1/c(ˆaz+ ˆb−(az+b))/p

nˆσ2/(n−2) suit la loi de Student Tn−2, ce qui conduit à poser avec les notations du cours :

I = i

ˆ

az+ ˆb−√ c

√nˆσ2

√n−2tn−2,α, ˆaz+ ˆb+√ c

√nσˆ2

√n−2tn−2,α

h , on a alors P(az+b ∈ I) =P(|T|< tn−2,α) = 1−α.

3

Références

Documents relatifs

Soit a et n deux entiers naturels non nuls et différents de 1.. Montrer que n

Le résultat est donc vrai pour tout entier naturel n supérieur ou égal

MATHÉMATIQUES 2 Juin 2013 - Contrôle Terminal, Semestre 1, Session 2.. Durée de l'épreuve : 2h00

3) Appliquer la m´ ethode de Gauss pour d´ ecomposer q en combinaison lin´ eaire de carr´ es de formes lin´ eaire ind´ ependantes.. 4) Utiliser la question pr´ ec` edente pour

[r]

v) – Les quatre premiers points, symétriquement disposés, ne contribuent pas aux axes principaux (avec uniquement ces quatre points, les deux valeurs propres seraient égales à cause

de R 3 , car c’est l’ensemble des solutions d’un syst` eme lin´ eaire homog` ene.. Ce suppl´ ementaire est donc de

−−→ AC et −−→ AE sont colinéaires ; les droites (AC) et (AE) sont donc parallèles (même direction) et ont un point commun ; elles sont donc confondues. Les points A, C et