• Aucun résultat trouvé

EXAMEN DU 1 JUIN 2012 – LM347 CORRECTION

N/A
N/A
Protected

Academic year: 2022

Partager "EXAMEN DU 1 JUIN 2012 – LM347 CORRECTION"

Copied!
3
0
0

Texte intégral

(1)

EXAMEN DU 1 JUIN 2012 – LM347 CORRECTION

Exercice 1.

Soit a > 0 et un échantillon X1, . . . , Xn de loi de densité f(x) = axa−1, pour x ∈]0,1[, et 0 sinon. On note X= (X1· · ·Xn)0.

i) – Montrer que f est bien une densité de probabilité.

ii) – Calculer la valeur de EX1 et proposer un estimateur de a obtenu par la méthode des moments.

iii) – Calculer la densité fX(x, a) du v.a. X et le logarithme de la vraisemblance de X.

iv) – Trouver l’estimateur ˆa du maximum de vraisemblance de a.

v) – Déterminer la densité de la variable logX1. vi) – Calculer E((logX1)k) pourk ∈ {1,2}.

vii) – En déduire que ˆa est asymptotiquement normal, et donner sa loi limite.

viii) – Calculer les deux formes de l’information de Fisher I(a) de l’échantillon X1, . . . , Xn et montrer qu’elles sont égales.

i) – La fonction f est continue par morceaux, positive, et vérifie R

Rf(x) dx = R1

0 axa−1dx = [xa]10 = 1, c’est donc une densité de probabilité.

ii) – Comme EX1 =R1

0 x axa−1dx = (a/(a+ 1))[xa+1]10 =a/(a+ 1), un estimateur par la mé- thode des moments réalise l’identité a/(a+ 1) = m(X) = (1/n)(X1 +· · ·+Xn), c’est-à-dire a =m(X)/(1−m(X)), quantité qui existe presque sûrement dans ]0,∞[ puisque presque sûre- ment Xi ∈]0,1[ et donc presque sûrement m(X)∈]0,1[.

iii) – Si x= (x1· · ·xn)∈]0,1[n, on a fX(x, a) =Qn

i=1fX1(xi) =an(x1· · ·xn)a−1, et sinon on a fX(x, a) = 0. Ainsi, pourx= (x1· · ·xn)∈]0,1[n, on alogfX(x, a) =nloga+(a−1)Pn

i=1logxi. iv) – Comme les xi sont dans]0,1[, leslogxi sont dans ]−∞,0[etPn

i=1logxi <0, alors la fonc- tion a → logfX(x, a) est strictement concave de limite −∞ en 0 et en ∞, avec sa dérivée qui s’annule au point a =−1/((1/n)Pn

i=1logxi) = −1/m(logx)∈]0,∞[, ce qui correspond donc à un maximum du logarithme de la vraisemblance. Ainsi aˆ=−1/m(logX).

v) – En passant par la fonction de répartition, il vient pourx∈]−∞,0[,P(logX1 ≤x) = P(X1 ≤ ex) =eax, et la densité de logX1 vaut aeax sur ]−∞,0[ et 0 sinon.

vi) – Avec la densité de logX1, il vient E((logX1)k) =R0

−∞ykaeaydy = ((−1)k/ak)R

0 zke−zdz (changement de variables z = −ay), avec, par intégration par parties, R

0 zke−zdz = 1 pour k = 1 et = 2R

0 ze−zdz = 2 pour k = 2, et donc E(logX1) = −a−1 et E((logX1)2) = 2a−2. vii) – Les v.a. logXi sont i.i.d. de moyenne −a−1 et de variance 2a−2−(−a−1)2 =a−2, le théo- rème limite central implique donc que√

n(m(logX)−(−a−1))converge en loi lorsquen → ∞vers la loi normaleN(0, a−2). Alors une application de la méthode delta avec la fonctionf(x) =−1/x conduit au résultat recherché : √

n(f(m(logX)−f(−a−1)) = √

n(ˆa−a) converge en loi lorsque n→ ∞ vers la loi N(0, a−2(f0(−a−1))2) =N(0, a2).

viii) – Pour x = (x1· · ·xn) ∈]0,1[n, on a ∂logfX(x, a)/∂a = n/a − Pn

i=1logxi et aussi

2logfX(x, a)/∂a2 =−n/a2, ainsiI(a) =−E(∂2logfX(X, a)/∂a2) = na−2, et pour la deuxième expression, les v.a. logXi étant i.i.d. de variance déjà calculée, I(a) = V(∂logfX(X, a)/∂a) = nV(logX1) = na−2.

Exercice 2.

Soit y1, . . . , yn et z1, . . . , zn des valeurs réelles connues et le modèle de régression linéaire Xi = ayi +bzi +c+i, pour i ∈ {1, . . . , n}, avec a, b, c des paramètres réels, et 1, . . . , n des v.a.i.i.d. de loiN(0,σ2) oùσ2 est un paramètre réel strictement positif.

On suppose alors que n≥3, et que y1+· · ·+yn =z1 +· · ·+zn=y1z1+· · ·+ynzn = 0.

i) – Ecrire le modèle sous la formeX=Aθ+,θ∈R3, et indiquer sous quelles conditions le modèle linéaire déterministe X˜ =Aθ est régulier. On supposera ces conditions vérifiées par la suite.

ii) – Calculer les matrices A0A et (A0A)−1.

iii) – Résoudre le problème de moindres carrés associé au modèle de régression linéaire X˜ =Aθ.

iv) – Ecrire la vraisemblance deX.

1

(2)

v) – Trouver les estimateurs du maximum de vraisemblance ˆa,ˆb,ˆc,σˆ2, des paramètresa, b, c, σ2, en précisant pour quelles valeurs de n ils existent.

vi) – Préciser la loi deˆa et celle de σˆ2.

vii) – Construire un intervalle de confiance pour le paramètre a de degré de confiance 95%.

viii) – Proposer en le justifiant un test de l’hypothèsea = 0 d’erreur de première espèce 5%.

i) – En notant 1, y, z, X et les vecteurs de Rn de coordonnées respectivement, que des 1, les yi, les zi, les Xi et les i, on a A = [y z1], θ = (a b c)0 ∈ R3, et donc X = Aθ +. Le modèle X˜ =Aθ est régulier si et seulement si le rang de A est égal à 3, or les trois colonnes constituant A sont par hypothèse orthogonales, elles forment donc une famille libre (⇔ rangA = 3) si et seulement si y6= 0 et z 6= 0.

ii) – La matrice A0A est constituée des produits scalaire des colonnes de A, comme ces co- lonnes sont orthogonales, elle est diagonale et vaut

y0y 0 0 0 z0z 0

0 0 n

, avec y0y et z0z > 0, ainsi (A0A)−1 =

1/y0y 0 0 0 1/z0z 0

0 0 1/n

.

iii) – Comme le modèle est régulier, la solution du problème des moindres carrés est donnée par θˆ = (A0A)−1A0X = (y0X/y0y z0X/z0z 10X/n)0, c’est-à-dire ˆa = y0X/y0y = m(Xy)/m(y2), ˆb=z0X/z0z=m(Xz)/m(z2) et cˆ=10X/n=m(X).

iv) – PuisqueX ∼ Nn(Aθ, σ2In), sa densité vaut fX(x) = (2π)−n/2σ−nexp(−(1/2σ2)||x−Aθ||2).

v) – D’après le cours, lorsque n −rangA ≥ 1 ⇔ n ≥ 4, les EMV des paramètres existent et sont donnés par θˆ la solution du problème des moindres carrés (calculée à la question iii)) et ˆ

σ2 = (1/n)||X−Aθ||ˆ 2 = (1/n)Pn

i=1(Xi−ˆayi−ˆbzi−ˆc)2.

vi) – Comme ˆa = (1/y0y)y0X est une fonction linéaire de X, ˆa suit donc la loi normale N((1/y0y)y0Aθ,(1/y0y)2y02In)y) = N(a, σ2/y0y), et, d’après le cours, nˆσ22 ∼χ2n−3.

vii) – On utilise la méthode de “studentisation”, √

y0yˆa−aσ suit la loi normale standard, si bien que la statistique :

T =

√y0yˆa−aσ q σ2

(n−3)σ2

=

p(n−3)y0y(ˆa−a)

√nσˆ

suit la loi de Student Tn−3, les v.a. √

y0yˆa−aσ et nσˆ22 étant indépendantes. En notant tn−3,α le réel positif vérifiant P(|T| ≤tn−3,α) = 1−α, pour α ∈]0,1[, un intervalle de confiance pour le paramètre a est donc :

I = i

ˆ a−

√n

p(n−3)y0ytn−3,ασ ,ˆ ˆa+

√n

p(n−3)y0ytn−3,ασˆ h

; il est de niveau de confiance 1−α puisque P(a∈ I) = P(|T| ≤tn−3,α) = 1−α.

viii) – Si on poseR ={0∈ I}, cette région de l’espace des observations peut être utilisée comme/ la région de rejet d’un test de l’hypothèse a = 0. On a alors pour l’erreur de première espèce, lorsque δ= (0 b c σ2)0 :

Pδ(R) = Pδ(0∈ I) =/ P(|T|> tn−3,α) = 1−P(|T| ≤tn−3,α) =α , et on répond à la question en choisissant α= 5%.

Exercice 3.

Six points du plan ont pour coordonnées, pourα >0 etβ >0vérifiant α22 = 1 :

point C1 C2

1 1 1

2 1 −1

3 −1 1

4 −1 −1

5 α β

6 −α −β

i)−Calculer la matrice de variance-covariance empirique CX.

ii)−Calculer l0inertie du nuage de points associ´ee au tableau de donn´ees.

iii)−Calculer les composantes principales de l0ACP sur CX (utiliser l0aide).

iv)−Repr´esenter les points et les axes principaux dans le plan de d´epart.

v)−Expliquer le calcul des vecteurs propres `a partir de la figure pr´ec´edente.

vi)−Calculer le pourcentage d0inertie expliqu´ee par le premier axe.

2

(3)

Aide : la matrice de variance-covariance admet comme vecteurs propres α

β

pour la valeur propre1, et

β

−α

pour la valeur propre 2/3.

i) – Le tableau est centré, ainsiXc=X etCX =X0X/n, la matriceX0X s’obtenant en effectuant les produits scalaires des colonnes de X, de la sorte on obtient CX = (1/3)

2 +α2 αβ αβ 2 +β2

. ii) – C’est la trace de CX, elle vaut donc 5/3 (puisque α22 = 1).

iii) – D’après l’aide V1 = (α β)0 et V2 = (β −α)0 (dans cet ordre), de sorte que les composantes principales sont µ1U1 = XcV1 = XV1 = (α+β α−β −α+β −α−β 1 −1)0 et µ2U2 = XcV2 = XV2 = (−α+β −α−β α+β α−β 0 0)0 .

iv) – Les quatre premiers points sont les sommets d’un carré centré en (0,0), ils sont situés sur les deux diagonales, tandis que les deux derniers points sont situés sur le cercle de rayon1centré en (0,0), de façon symétrique par rapport au centre du cercle. Ces deux derniers points portent les axes principaux du nuage de points.

v) – Les quatre premiers points, symétriquement disposés, ne contribuent pas aux axes principaux (avec uniquement ces quatre points, les deux valeurs propres seraient égales à cause de la symétrie de la figure). Ainsi les axes principaux sont déterminés par les deux derniers points, celui de plus grande inertie étant porté par ces deux points.

vi) – C’est l’inertie du premier axe, qui est égale à la première valeur propre de CX, divisée par l’inertie totale, c’est-à-dire 1/(5/3) = 3/5, ce rapport exprimé en pourcentage valant 60%.

3

Références

Documents relatifs

Il me semble qu’il faut se focaliser sur la notion de racine carrée comme ayant une propriété spécifique et négliger les angles car je crois que ces angles étant en nombre infini,

[r]

On voit sans plus de détails que, si trois tangentes restent (ixes et que la quatrième varie de façon que la relation (4) soit satisfaite, la quatrième tangente enve- loppe une

Enfin on peut l'appliquer à la recherche des relations entre les distances mutuelles de cinq points situés d'une manière quelconque dans un plan, de six points situés d'une

A, B, C et D étant les sommets d'un tétraèdre inscrit dans une surface de révolution du second ordre, consi- dérons les perpendiculaires abaissées sur les f aces de ce tétraèdre

Cela posé, soient AC, BC deux côtés opposés du qua- drilatère et AB la droite donnée \ si nous recherchons la courbe dont les ordonnées perpendiculaires à la droite AB soient

Toute utilisation commerciale ou impression systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente men- tion

L’accès aux archives de la revue « Nouvelles annales de mathématiques » implique l’accord avec les conditions générales d’utilisation ( http://www.numdam.org/conditions )..