On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P .

(1)

Énoncé

Le but du problème

¹

est l'étude du coecient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas particulier (partie II).

PARTIE I

On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P .

On rappelle que V (X) = 0 si et seulement si, avec une probabilité égale à 1 , X est constante ; on dit alors que X est constante presque surement.

On suppose ici que V (X) > 0 .

1. Covariance des variables aléatoires X et Y

a. Donner la dénition de la covariance de X et Y , notée Cov(X, Y ) .

b. Soit λ un réel. Exprimer Cov(λX + Y, λX + Y ) en fonction de V (λX + Y ) et en déduire la formule :

V (λX + Y ) = λ

²

V (X ) + 2λCov(X, Y ) + V (Y ).

c. En déduire que

(Cov(X, Y ))

²

6 V (X)V (Y ).

A quelle condition nécessaire et susante a-t-on l'égalité (Cov(X, Y ))

²

= V (X)V (Y )

2. Coecient de corrélation linéaire des variables aléatoires X et Y.

On suppose dans cette question les variances V (X ) et V (Y ) strictement positives. On rappelle que le coecient de corrélation linéaire ρ des variables aléatoires X et Y est

ρ = Cov (X, Y ) σ (X ) σ (Y ) .

a. Montrer que ρ ∈ [−1, +1] . Préciser, de plus, à quelle condition nécessaire et susante ρ est égal à −1 ou +1 .

b. Quelle est la valeur de ρ lorsque les variables aléatoires X et Y sont indépen- dantes ?

1d'après ESSEC, option éco, maths 2, 2001

PARTIE II

1. Calculs préliminaires

a. On considère deux entiers naturels q et n tels que n > q . Établir la formule

suivante :

_n

X

k=q

k q

= n + 1

q + 1

b. En déduire une expression factorisée des quatre sommes suivantes :

n

X

k=1

k,

n

X

k=2

k(k − 1) et

n

X

k=1

k

²

,

n

X

k=3

k(k − 1)(k − 2).

On considère dans toute la suite de cette partie un nombre entier n > 2 et une urne contenant n jetons numérotés de 1 à n .

On extrait de cette urne successivement et sans remise deux jetons et on désigne alors par :

• N

₁

la variable aléatoire indiquant le numéro du premier jeton tiré.

• N

2

la variable aléatoire indiquant le numéro du second jeton tiré.

• X la variable aléatoire indiquant le plus petit des numéros des deux jetons tirés.

• Y la variable aléatoire indiquant le plus grand des numéros des deux jetons tirés.

2. Lois conjointe et marginales de N

1

et N

2

.

a. Déterminer les probabilités P (N

1

= i) pour 1 6 i 6 n et P (N

2

= j/N

1

= i) pour 1 6 j 6 n .

En déduire P (N

2

= j) pour 1 6 j 6 n , puis comparer les lois de N

1

et N

2

. b. Calculer les espérances E(N

1

) et E(N

2

) , les variances V (N

1

) et V (N

2

) .

c. Déterminer les probabilités P (N

₁

= i ∩ N

₂

= j) pour 1 6 i 6 n et 1 6 j 6 n en distinguant les deux cas i = j et i 6= j et déterminer E(N

₁

N

₂

) . En déduire la covariance et le coecient de corrélation linéaire de N

₁

et N

₂

.

d. Exprimer enn sous forme factorisée la variance V (N

1

+ N

2

) . 3. Lois conjointe, marginales et conditionnelles de X et Y .

a. Soit (i, j) ∈ [[1, n]]

²

. Déterminer la probabilité P((X = i) ∩ (Y = j)) .

b. En déduire les probabilités P(Y = j) pour 2 6 j 6 n et P(X = i) pour 1 6 i 6 n − 1 .

(On vériera que les formules donnant P(Y = j) et P (X = i) restent valables si

j = 1 ou i = n ).

(2)

c. Déterminer les probabilités P

Y=j

(X = i) et P

X=i

(Y = j) pour 1 6 i < j 6 n , puis reconnaître la loi de X conditionnée par Y = j et la loi de Y conditionnée par X = i.

d. Comparer les lois des variables aléatoires n+1−X et Y . En déduire les expressions de E(X ) en fonction de E(Y ) et de V (X ) en fonction de V (Y ) .

4. Espérances et variances de X et Y .

a. Exprimer les espérances E(Y ) et E(X ) en fonction de n .

b. Exprimer sous forme factorisée E[(Y (Y − 2)] , puis E(Y

²

), V (Y ) et V (X ) en fonction de n .

5. Covariance et coecient de corrélation linéaire de X et Y .

a. Vérier que X + Y = N

₁

+ N

₂

, puis en déduire sous forme factorisée la variance de X + Y et la covariance de X et Y .

b. En déduire le coecient de corrélation de X et Y .

On remarquera que ce coecient de corrélation linéaire de X et Y est indépendant de n .

Corrigé PARTIE I

1. Covariance des variables aléatoires X et Y a. On a

Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] = E(XY ) − E(X )E(Y ).

b. Pour Z une variable aléatoire sur un espace probabilisé ni, on a : Cov (Z, Z) = E Z

²

− E (Z)

²

= V (Z) donc

Cov(λX + Y, λX + Y ) = V (λX + Y ) et

V (λX + Y ) = E

(λX + Y )

²

− E (λX + Y )

²

= E λ

²

X

²

+ 2λXY + Y

²

− [λE (X ) + E (Y )]

²

= λ

²

E X

²

+ 2λE (XY ) + E Y

²

− λ

²

E (X )

²

− 2λE (X ) E (Y ) − E (Y )

²

= λ

²

V (X ) + 2λCov (X, Y ) + V (Y ) c. Comme une variance est positive ou nulle, le polynôme P , déni pour λ ∈ R, par

P (λ) = λ

²

V (X ) + 2λCov (X, Y ) + V (Y )

est positif ou nul et de degré deux car V (X) 6= 0 . D'où son discriminant est négatif ou nul.

∆ = 4Cov (X, Y )

²

− 4V (X) V (Y )

= 4 h

Cov (X, Y )

²

− V (X ) V (Y ) i

≤ 0 Donc Cov (X, Y )

²

≤ V (X) V (Y )

On a égalité si et seulement si ∆ = 0 c'està dire s'il existe λ tel que V (λX + Y ) = 0 . Ce qui équivaut à λX + Y constante presque surement.

Il y a égalité si et seulement si il existe (λ, µ) ∈ R

²

tel que Y = λX + µ presque

surement.

(3)

2. Coecient de corrélation linéaire des variables aléatoires X et Y.

a. Comme

Cov (X, Y )

²

≤ V (X ) V (Y ) alors

Cov (X, Y )

²

V (X ) V (Y ) ≤ 1 et, en prenant la racine,

Cov (X, Y ) σ (X ) σ (Y )

≤ 1 D'où ρ ∈ [−1, 1] et l'on a

ρ = ±1 ⇐⇒ ρ

²

= 1 ⇐⇒ Cov (X, Y )

²

= V (X ) V (Y )

D'après la question précédente, ρ ∈ [−1, 1] si et seulement si il existe des constantes λ et µ telles que Y = λX + µ presque surement.

b. Si X et Y sont indépendantes, Cov (X, Y ) = 0 et donc ρ = 0.

PARTIE II

1. Calculs préliminaires

a. Montrons le résultat par récurrence sur n . Pour n = q on a :

q

X

k=q

k q

= q

q

= 1 = q + 1

q + 1

Soit n ≥ q tel que

n

X

k=q

k q

= n + 1

q + 1

alors

n+1

X

k=q

k q

=

n

X

k=q

k q

+

n + 1 q

=

n + 1 q + 1

+

n + 1 q

=

n + 2 q + 1

D'où la formule demandée par récurrence.

b. En prenant q = 1 , on trouve :

n

X

k=1

k 1

=

n

X

k=1

k = n + 1

2 = (n + 1) n 2 pour q = 2 :

n

X

k=2

k 2

=

n

X

k=2

k (k − 1)

2 =

n + 1 3

= (n + 1) n (n − 1) 3 · 2

et donc

_n

X

k=2

k (k − 1) = (n + 1) n (n − 1) 3 on obtient aussi

n

X

k=1

k

²

=

n

X

k=2

k (k − 1) + 1 +

n

X

k=2

k

!

= (n + 1) n (n − 1)

3 + (n + 1) n 2

D'où

_n

X

k=1

k

²

= n(n + 1)(2n + 1) 6

enn pour q = 3 :

n

X

k=3

k 3

=

n

X

k=3

k (k − 1) (k − 2)

3 · 2 =

n + 1 4

= (n + 1) n (n − 1) (n − 2) 4 · 3 · 2

et donc

_n

X

k=3

k (k − 1) (k − 2) = (n + 1) n (n − 1) (n − 2) 4

2. Lois conjointe et marginales des variables aléatoires N

₁

et N

₂

. a. Les numéros présents dans l'urne sont équiprobables donc

P (N

₁

= i) = 1 n pour 1 6 i 6 n .

On obtient de même

P

_N₁_=i

(N

₂

= j) = 1

n − 1 pour 1 6 j 6 n, j 6= i

(4)

et P

N₁=j

(N

2

= j) = 0 car la boule j est retirée de l'urne.

La famille (N

1

= i)

_i∈[[1,n]]

est un système complet d'événements donc

P (N

₂

= j) =

n

X

i=1

P

_N₁_=i

(N

₂

= j) P (N

₁

= i)

=

n

X

i=1

1 n − 1 · 1

n + P

N₁=j

(N

2

= j) P (N

1

= j) = (n − 1) 1 n − 1 · 1

n = 1 n

La loi de N

2

est donc la même que celle de N

1

. b. On a E (N

₁

) = E (N

₂

) =

ⁿ⁺¹₂

(loi uniforme sur [[1, n]] )

E N

₁²

=

n

X

k=1

k

²

n = 1

n

n (n + 1) (2n + 1)

6 = (n + 1) (2n + 1) 6 et

V (N

₁

) = E N

₁²

− E (N

₁

)

²

= (n + 1) (2n + 1)

6 −

n + 1 2

²

= n + 1

12 (4n + 2 − 3n − 3) = n

²

− 1 12

D'où E (N

1

) = E (N

2

) = n + 1

2 et V (N

1

) = V (N

2

) = n

²

− 1 12 c. On a

P ((N

1

= i) ∩ (N

2

= j)) = 0 si i = j (événement impossible) Pour i 6= j

P ((N

1

= i) ∩ (N

2

= j)) = P (N

1

= i) P

N₁=i

(N

2

= j) = 1 n (n − 1)

On a alors E (N

₁

N

₂

) =

n

X

i=1 n

X

j=1

i j P ((N

₁

= i) ∩ (N

₂

= j))

=

n

X

i=1

i





n

X

j=1j6=i

j P ((N

1

= i) ∩ (N

2

= j)) + 0





=

n

X

i=1

i 1 n (n − 1)





n

X

j=1

j − i



 =

n

X

i=1

i n (n + 1) 2n (n − 1) −

n

X

i=1

i

²

1 n (n − 1)

= n

²

(n + 1)

²

4n (n − 1) − n (n + 1) (2n + 1) n (n − 1) 6

= (n + 1)

(n − 1) 12 3 n + n

²

− 2 (2n + 1)

= (n + 1)

(n − 1) 12 3n

²

− n − 2

= (n + 1) (3n + 2) (n − 1)

(n − 1) 12 = (n + 1) (3n + 2) 12 On a donc E (N

1

N

2

) = (n + 1) (3n + 2)

12 .

La covariance de N

1

et N

2

vaut

Cov (N

1

, N

2

) = E (N

1

N

2

) − E (N

1

) E (N

2

)

= (n + 1) (3n + 2)

12 − (n + 1)

²

4 = (n + 1)

12 [3n + 2 − 3n − 3]

= − n + 1 12 On a donc Cov (N

1

, N

2

) = − n + 1

12 et ρ (N

1

, N

2

) = Cov (N

1

, N

2

)

p V (N

₁

) V (N

₂

) = − n + 1 12

12 n

²

− 1 = − 1 n − 1

Le coecient de corrélation linéaire de N

₁

et N

₂

vaut donc − 1

n − 1

(5)

d. On a alors

V (N

1

+ N

2

) = V (N

1

) + V (N

2

) + 2Cov (N

1

, N

2

)

= 2 n

²

− 1

12 − 2 n + 1

12 = n + 1

6 (n − 1 − 1) = (n + 1) (n − 2) 6 D'où V (N

1

+ N

2

) = (n + 1) (n − 2)

6 3. Lois conjointe, marginales et conditionnelles de X et Y a. Soit (i, j) ∈ [[1, n]]

²

.

Pour 1 6 i < j 6 n , l'événement ((X = i) ∩ (Y = j)) correspond à l'événement le plus grand vaut j et le plus petit vaut i et comme on a bien i < j l'événement ((X = i) ∩ (Y = j)) correspond donc à un numéro vaut i et l'autre j c'est à dire

((N

₁

= i) ∩ (N

₂

= j)) ∪ ((N

₁

= j) ∩ (N

₂

= i)) C'est une union de deux événements incompatibles donc

P ((X = i) ∩ (Y = j))

= P ((N

1

= i) ∩ (N

2

= j)) + P ((N

1

= j) ∩ (N

2

= i)) = 2 n (n − 1) Sinon, l'événement est impossible et la probabilité est nulle.

b. Les lois de X et de Y sont les lois marginales du couple donc, pour j ≥ 2

P (Y = j) =

n

X

i=1

P ((X = i) ∩ (Y = j)) =

j−1

X

i=1

2 n (n − 1) + 0

= 2 (j − 1)

n (n − 1) (on a bien j − 1 ≥ 1) et pour j = 1 on P (Y = 1) = 0 , ce que donne encore la formule.

Pour i ≤ n − 1

P (X = i) =

n

X

j=1

P ((X = i) ∩ (Y = j)) =

n

X

j=i+1

2 n (n − 1) + 0

= 2 (n − (i + 1) + 1)

n (n − 1) (on a bien i + 1 ≤ n)

qui donne bien 0 pour i = n.

D'où, pour i et j dans J 1, n K,

P (Y = j) = 2 (j − 1)

n (n − 1) P (X = i) = 2 (n − i) n (n − 1) c. Pour 1 6 i < j 6 n :

On peut utiliser que :

P

Y=j

(X = i) = P ((X = i) ∩ (Y = j))

P (Y = j) =

2 n(n−1)

2(j−1) n(n−1)

= 1

j − 1

Ou remarquer directement que, quand Y = j , le plus petit numéro tiré peut prendre toutes les valeurs de J 1, j − 1 K et ceci de façon équiprobable.

Donc

P

Y=j

(X = i) = 1

j − 1 pour i ∈ [[1, j − 1]] . et de même

P

X=i

(Y = j) = 1 n − i

D'où Y , conditionné par X = i , suit la loi uniforme sur [[i + 1, n]]

d. En notant Ω l'univers, on a X (Ω) = [[1, n − 1]] donc (n + 1 − X ) (Ω) = [[2, n]] = Y (Ω)

Pour 2 6 j 6 n on a

P (n + 1 − X = j) = P (X = n + 1 − j)

= 2 (n − (n + 1 − j))

n (n − 1) car 1 ≤ n + 1 − j ≤ n − 1

= 2 (j − 1)

n (n − 1) = P (Y = j) On en déduit que n + 1 − X et Y ont la même loi. ,

Les deux variables aléatoires ont donc même espérance et même variance.

Or E (n + 1 − X ) = n + 1 − E (X) d'où E (X) = n + 1 − E (Y ) et V (n + 1 − X ) = (−1)

²

V (X ) donc

E (X ) = n + 1 − E (Y ) et V (X ) = V (Y )

(6)

4. Espérances et variances des variables aléatoires X et Y a. On revient à la déntion :

E (Y ) =

n

X

j=2

j 2 (j − 1)

n (n − 1) = 2 n (n − 1)

n

X

j=2

j (j − 1)

= 2

n (n − 1)

(n + 1) n (n − 1)

3 par II1b = 2

3 (n + 1) D'où

E (X) = n + 1 − E (Y ) = 1

3 (n + 1) b. On a :

E [Y (Y − 2)] =

n

X

j=2

j (j − 2) 2 (j − 1) n (n − 1)

= 2

n (n − 1)

n

X

j=2

j (j − 1) (j − 2)

= 2

n (n − 1)

(n + 1) n (n − 1) (n − 2)

4 ( par II1b)

= (n + 1) (n − 2) 2 Or

E [Y (Y − 2)] = E

Y

²

− 2Y

= E Y

²

− 2E (Y ) et E Y

²

= E

Y

²

− 2Y

+ 2E (Y ) donc

E Y

²

= (n + 1) (n − 2)

2 + 4

3 (n + 1) = (n + 1)

6 (3n − 6 + 8)

= (n + 1) (3n + 2) 6 et

V (Y ) = E Y

²

− E (Y )

²

= (n + 1) (3n + 2)

6 − 4

9 (n + 1)

²

= n + 1

18 (9n + 6 − 8n − 8) = (n + 1) (n − 2) 18 Conclusion : V (X) = V (Y ) = (n + 1) (n − 2)

18 5. Covariance et coecient de corrélation linéaire de X et Y

a. Comme X est l'une des deux valeur et Y l'autre alors X + Y = N

1

+ N

2

Donc

V (X + Y ) = V (N

1

+ N

2

) = (n + 1) (n − 2) 6 D'autre part V (X + Y ) = V (X) + V (Y ) + 2Cov (X, Y ) donc