Durée 2h - Aucun document - Pas de calculette

(1)

EXAMEN DU 27 MAI 2009 – LM347 – CORRECTION (Programme : parties I, II, III, IV et V)

Durée 2h - Aucun document - Pas de calculette

Exercice 1.

Six points du plan ont pour coordonnées, pourα et β >0 vérifiant α²+β² = 1 :

point C1 C2

1 1 0

2 −1 0

3 0 1

4 0 −1

5 α β

6 −α −β

i)−Calculer la matrice de variance-covariance empirique CX. ii)−Calculer les valeurs propres de cette matrice.

iii)−Calculer l⁰inertie du nuage de points associ´ee au tableau de donn´ees.

iv)−Calculer les vecteurs propres de CX.

v)−Calculer les composantes principales de l⁰ACP surCX.

vi)−Repr´esenter les points et les axes principaux dans le plan de d´epart.

vii)−Calculer et diagonaliser la matrice des corr´elations empiriques ρ(X).

viii)−Cela a-t-il un sens d⁰effectuer une ACP sur ρ(X) en dimension 2 ? Aide :la matrice de variance-covariance est proportionnelle à la matriceA=

1 +α² αβ αβ 1 +β²

et ses valeurs propres ne dépendent pas deα etβ.

i) – Le tableau de données X est centré, ainsi X_c=X et : CX =X_c⁰Xc=X⁰X =

1²+ (−1)²+α²+ (−α)² αβ+ (−α)(−β) αβ + (−α)(−β) 1²+ (−1)²+β²+ (−β)²

= 2A .

ii) – En utilisant α²+β² = 1, les valeurs propres λ de A sont les solutions du trinôme : (1 +α²−λ)(1 +β² −λ)−(αβ)² =λ²−(2 +α²+β²)λ+ (1 +α²)(1 +β²)−α²β²

=λ²−3λ+ 1 +α²+β² =λ²−3λ+ 2 . Ces solutions valent (3±√

3²−4×2)/2 = (3±1)/2, c’est-à-dire 2 et 1.

iii) – D’après le cours, l’inertie du nuage de points est égale à la trace de CX, qui vaut 2× (1+α² + 1+β²) = 2×3 = 6.

iv) – Un vecteur propre V = v₁

v₂

de A correspondant à la valeur propre 1 est solution de : (1 +α²)v₁+αβv₂ =v₁

αβv₁+ (1 +β²)v₂ =v₂ ⇐⇒

α²v₁+αβv₂ = 0

αβv₁+β²v₂ = 0 ⇐⇒ αv₁+βv₂ = 0 , ainsiV₂ =

β

−α

est vecteur propre de norme1pour la valeur propre1, et, par orthogonormalité des vecteurs propres correspondant à des valeurs propres différentes lorsqu’on diagonalise une matrice symétrique, le vecteur V₁ =

α β

est vecteur propre de norme1 pour la valeur propre 2.

v) – Avec les notations du cours les composantes principales de l’ACP surCX sont :µ₁U₁ =X_cV₁ et µ2U2 =XcV2; c’est-à-dire µ1U1 = (α −α β −β 1 −1)⁰ et µ2U2 = (β −β −α α 0 0)⁰.

vi) – A faire vous-mêmes : tous les points du nuages sont sur le cercle de rayon 1 centré en 0, et le premier axe principal passe par le centre du cercle et le point (α β)⁰.

vii) – La matrice ρ(X) se déduit de CX, elle vaut

1 r r 1

, avec r =αβ/p

(1 +α²)(1 +β²), elle admet

1/√ 2 1/√

2

comme vecteur propre pour la valeur propre 1 +r, et donc

1/√ 2

−1/√ 2

comme vecteur propre pour la valeur propre 1−r.

viii) – Cela n’a pas de sens puisque, en dimension 2, les vecteurs propres obtenus, qui définissent les axes principaux du nuage de points, sont indépendants du nuage de points.

1

(2)

Exercice 2.

Soit un échantillon X₁, . . . , X_n de loi γ(1, b), de densité f(x) = be^−bx/Γ(1) pour x > 0. On note X = (X₁· · ·X_n)⁰.

i) – Montrer que Γ(1) = 1 et que f est bien une densité de probabilité.

ii) – Calculer EX₁ etVX₁.

iii) – Proposer un estimateur deb obtenu par la méthode des moments.

iv) – Calculer la densité f_X(x, b)du v.a. X et le logarithme de la vraisemblance de X.

v) – Montrer que l’estimateurˆb du maximum de vraisemblance de b est égal à 1/m(X).

vi) – Montrer queˆb est asymptotiquement normal et calculer sa loi limite.

vii) – Calculer l’information de Fisher I(b)de l’échantillon X₁, . . . , X_n.

viii) – Quelle relation attend-t-on entre la variance deˆb et l’information de Fisher I(b)? i) – Γ(1) = R∞

0 e^−xdx = [−e^−x]^∞₀ = 1. De plus, la fonction f est positive, continue sauf en 0, intégrable, et en effectuant le changement de variables y=bx, on a R∞

0 f(x)dx = R∞

0 be^−bxdx = R∞

0 e^−ydy= 1. Ce qui montre que f est une densité de probabilité.

ii) – Pour k ∈ {1,2, . . .}, on a : E(X^k) =

Z ∞

0

x^kbe^−bxdx= 1 b^k

Z ∞

0

b^k+1x^ke^−bxdx= Γ(k+ 1) b^k = k!

b^k . Ainsi EX₁ = 1/b et VX₁ =E(X₁²)−(EX₁)² = 2/b²−1/b² = 1/b².

iii) – Comme P(X₁>0)=1⇒P(m(X)>0)=1, l’équation m(X)=EX₁=¹_ˆ

b se résoud en ˆb = _m(X¹ ₎. iv) – La densité = la vraisemblance de X est égale à f_X(x, b) = Qn

i=1be^−bxⁱ = bⁿe^−b(x¹^+···+xⁿ⁾ pour x= (x₁. . . x_n)⁰∈]0,∞[ⁿ, le logarithme de la vraisemblance s’écrit donc :

log(fX(x, b)) =nlogb−b(x1+. . .+xn) .

v) – Cette dernière fonction est strictement concave de limite en 0 égale à −∞, et lorsque x₁ +. . . +x_n > 0, de limite en +∞ égale à −∞; dans ce cas elle admet donc un unique maximum qui est atteint en b solution de n/b−(x₁+· · ·+x_n) = 0 ⇔ b =n/(x₁+· · ·+x_n).

Ce qui prouve queˆb= 1/m(X) est l’EMV de b puisque P(m(X)>0)=1.

vi) – D’après le cours, m(X) est asymptotiquement normal : la suite √

n(m(X)−1/b) converge en loi lorsque n → ∞ vers la loi N(0,1/b²), en utilisant les résultats de la question ii). La méthode delta (théorème 4 de la partie V), appliquée à cette suite et à la fonction f(x) = 1/x, implique alors que la suite √

n(ˆb −b) converge en loi lorsque n → ∞ vers la loi N(0,1/b²), puisque (f⁰(1/b))²/b² =b⁴/b² =b².

vii) – On a :

∂log(f_X)

∂b (x, b) = n

b −(x₁+· · ·+x_n) et ∂²log(f_X)

∂b² (x, b) =−n b² ,

ainsi, comme les conditions de régularité sont vérifiées, I(b) = −E(^∂²^log(f_∂b2 ^X⁾(X, b)) =n/b². viii) – En posant g(b) = Eˆb, on doit vérifier l’inégalité d’information :

Vˆb≥ (g⁰(b))²

I(b) = b²(g⁰(b))²

n .

Exercice 3.

Soit y₁, . . . , y_n des valeurs réelles connues et le modèle de régression linéaireX_i =ay_i+b+_i pour i ∈ {1, . . . , n}, avec a, b des paramètres réels, et ₁, . . . , _n des v.a.i.i.d. de loi N(0,σ²) où σ² est un paramètre réel strictement positif.

On suppose que les vecteurs 1 ety = (y1· · ·yn)⁰ deRⁿ sont orthogonaux et que y6= 0.

i) – Ecrire le modèle sous la formeX =Aθ+,θ∈R² et montrer que le modèle linéaire détermi- niste X˜ =Aθ est régulier.

ii) – Montrer que la matrice A⁰A est diagonale et calculer (A⁰A)⁻¹.

iii) – Résoudre le problème de moindres carrés associé au modèle de régression linéaire X˜ =Aθ.

2

(3)

iv) – Ecrire la vraisemblance deX.

v) – Trouver les estimateurs du maximum de vraisemblanceˆa,ˆb,σˆ²des paramètresa, b, σ² lorsque n >2.

vi) – Calculer la loi de ˆa et celle de σˆ².

vii) – Construire un intervalle de confiance pour le paramètre a de degré de confiance 95%.

viii) – Proposer un test de l’hypothèsea = 0 d’erreur de première espèce 5%.

i) – Posons X = (X₁· · ·X_n)⁰, = (₁· · ·_n)⁰, y= (y₁· · ·y_n)⁰ et 1= (1· · ·1)⁰ quatre vecteurs de Rⁿ. Posons aussiA= [y1]une matricen×2etθ= (a b)⁰ ∈R². Alors on a l’identitéX =Aθ+.

De plus, le vecteur y étant non nul et orthogonal au vecteur 1, les deux colonnes de la matrice A sont linéairement indépendantes et le rang de A est égal à 2. Ce qui montre que le modèle linéaire déterministe X˜ =Aθ est régulier.

ii) – La matrice A⁰A est constituée des produits scalaires des colonnes de A : A⁰A=

y⁰y y⁰1 y⁰1 1⁰1

=

y⁰y 0 0 n

d⁰o `u (A⁰A)⁻¹ =

(y⁰y)⁻¹ 0 0 n⁻¹

, ce qui a bien un sens puisque y6= 0 ⇒y⁰y6= 0.

iii) – Le paramètre θˆsolution du problème des moindres carrés pour le modèle régulier X˜ =Aθ est donné par la formule θˆ= (A⁰A)⁻¹A⁰X. Comme A⁰X = (y⁰X 1⁰X)⁰, il vient :

θˆ=

(y⁰y)⁻¹ 0 0 n⁻¹

y⁰X 1⁰X

=

y⁰X/y⁰y 1⁰X/n

=

c(y,X)/v(y) m(X)

,

la dernière égalité provenant du fait que le vecteur y est centré, puisque qu’il est orthogonal au vecteur 1.

iv) – Le vecteur X suit la loi normaleNn(Aθ,σ²In), il admet une densité par rapport à la mesure de Lebesgue sur Rⁿ qui est sa vraisemblance :

f_X(x, a, b, σ²) = (2π)^−n/2σ⁻ⁿe⁻^kx−Aθk

2

2σ2 = (2π)^−n/2σ⁻ⁿe⁻^2σ¹²^Pⁿⁱ⁼¹^(xⁱ^−ayⁱ^−b)².

v) – D’après le cours, puisqu’il y a deux paramètres pour la moyenne et comme il est supposé quen >2, les EMV de a et b sont donnés par le θˆobtenu à la question iii) et l’EMV de σ² vaut ˆ

σ² = _n¹kX−Aθkˆ ² = ¹_nPn

i=1(X_i−ˆay_i−ˆb)².

vi) – Toujours d’après le cours (proposition 9 de la partie V), θˆsuit la loi N₂(θ, σ²(A⁰A)⁻¹) et nˆσ²/σ² suit la loi χ²_n−2. De l’expression de (A⁰A)⁻¹ obtenu à la question ii), on déduit alors que ˆ

a suit la loi N(a, σ²(y⁰y)⁻¹).

vii) – On utilise la méthode de “studentisation”, p

nv(y)(ˆa−a)/σ suit la loi normale standard, si bien que la statistique :

T =

pnv(y)(ˆa−a)/σ pnˆσ²/σ² =

pv(y)(ˆa−a)

√ ˆ σ² suit la loi de Student Tn−2, les v.a. p

nv(y)(ˆa−a)/σ et nσˆ²/σ² étant indépendantes. En notant tn−2,α le réel positif vérifiant P(|T| ≤tn−2,α) = 1−α, pour α ∈]0,1[, un intervalle de confiance pour le paramètre a est :

I = ˆ

a−tn−2,α

√ ˆ σ²

pv(y), ˆa+tn−2,α

√ ˆ σ² pv(y)

,

il est de niveau de confiance 1−α puisque :

P(a∈ I) =P(|T| ≤tn−2,α) = 1−α .

viii) – Si on poseR ={0∈ I}, cette région de l’espace des observations peut être utilisée comme/ la région de rejet d’un test de l’hypothèse a = 0. On a alors pour l’erreur de première espèce, lorsque θ= (0 b)⁰ :

Pθ(R) = P(0∈ I) =/ P(|T|> tn−2,α) = 1−P(|T| ≤tn−2,α) =α . On répond à la question en choisissant α= 5%.

3