Énoncé
Le but du problème
1est l'étude du coecient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas particulier (partie II).
PARTIE I
On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P .
On rappelle que V (X) = 0 si et seulement si, avec une probabilité égale à 1 , X est constante ; on dit alors que X est constante presque surement.
On suppose ici que V (X) > 0 .
1. Covariance des variables aléatoires X et Y
a. Donner la dénition de la covariance de X et Y , notée Cov(X, Y ) .
b. Soit λ un réel. Exprimer Cov(λX + Y, λX + Y ) en fonction de V (λX + Y ) et en déduire la formule :
V (λX + Y ) = λ
2V (X ) + 2λCov(X, Y ) + V (Y ).
c. En déduire que
(Cov(X, Y ))
26 V (X)V (Y ).
A quelle condition nécessaire et susante a-t-on l'égalité (Cov(X, Y ))
2= V (X)V (Y )
2. Coecient de corrélation linéaire des variables aléatoires X et Y.
On suppose dans cette question les variances V (X ) et V (Y ) strictement positives. On rappelle que le coecient de corrélation linéaire ρ des variables aléatoires X et Y est
ρ = Cov (X, Y ) σ (X ) σ (Y ) .
a. Montrer que ρ ∈ [−1, +1] . Préciser, de plus, à quelle condition nécessaire et susante ρ est égal à −1 ou +1 .
b. Quelle est la valeur de ρ lorsque les variables aléatoires X et Y sont indépen- dantes ?
1d'après ESSEC, option éco, maths 2, 2001
PARTIE II
1. Calculs préliminaires
a. On considère deux entiers naturels q et n tels que n > q . Établir la formule
suivante :
nX
k=q
k q
= n + 1
q + 1
b. En déduire une expression factorisée des quatre sommes suivantes :
n
X
k=1
k,
n
X
k=2
k(k − 1) et
n
X
k=1
k
2,
n
X
k=3
k(k − 1)(k − 2).
On considère dans toute la suite de cette partie un nombre entier n > 2 et une urne contenant n jetons numérotés de 1 à n .
On extrait de cette urne successivement et sans remise deux jetons et on désigne alors par :
• N
1la variable aléatoire indiquant le numéro du premier jeton tiré.
• N
2la variable aléatoire indiquant le numéro du second jeton tiré.
• X la variable aléatoire indiquant le plus petit des numéros des deux jetons tirés.
• Y la variable aléatoire indiquant le plus grand des numéros des deux jetons tirés.
2. Lois conjointe et marginales de N
1et N
2.
a. Déterminer les probabilités P (N
1= i) pour 1 6 i 6 n et P (N
2= j/N
1= i) pour 1 6 j 6 n .
En déduire P (N
2= j) pour 1 6 j 6 n , puis comparer les lois de N
1et N
2. b. Calculer les espérances E(N
1) et E(N
2) , les variances V (N
1) et V (N
2) .
c. Déterminer les probabilités P (N
1= i ∩ N
2= j) pour 1 6 i 6 n et 1 6 j 6 n en distinguant les deux cas i = j et i 6= j et déterminer E(N
1N
2) . En déduire la covariance et le coecient de corrélation linéaire de N
1et N
2.
d. Exprimer enn sous forme factorisée la variance V (N
1+ N
2) . 3. Lois conjointe, marginales et conditionnelles de X et Y .
a. Soit (i, j) ∈ [[1, n]]
2. Déterminer la probabilité P((X = i) ∩ (Y = j)) .
b. En déduire les probabilités P(Y = j) pour 2 6 j 6 n et P(X = i) pour 1 6 i 6 n − 1 .
(On vériera que les formules donnant P(Y = j) et P (X = i) restent valables si
j = 1 ou i = n ).
c. Déterminer les probabilités P
Y=j(X = i) et P
X=i(Y = j) pour 1 6 i < j 6 n , puis reconnaître la loi de X conditionnée par Y = j et la loi de Y conditionnée par X = i.
d. Comparer les lois des variables aléatoires n+1−X et Y . En déduire les expressions de E(X ) en fonction de E(Y ) et de V (X ) en fonction de V (Y ) .
4. Espérances et variances de X et Y .
a. Exprimer les espérances E(Y ) et E(X ) en fonction de n .
b. Exprimer sous forme factorisée E[(Y (Y − 2)] , puis E(Y
2), V (Y ) et V (X ) en fonc- tion de n .
5. Covariance et coecient de corrélation linéaire de X et Y .
a. Vérier que X + Y = N
1+ N
2, puis en déduire sous forme factorisée la variance de X + Y et la covariance de X et Y .
b. En déduire le coecient de corrélation de X et Y .
On remarquera que ce coecient de corrélation linéaire de X et Y est indépendant de n .
Corrigé PARTIE I
1. Covariance des variables aléatoires X et Y a. On a
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] = E(XY ) − E(X )E(Y ).
b. Pour Z une variable aléatoire sur un espace probabilisé ni, on a : Cov (Z, Z) = E Z
2− E (Z)
2= V (Z) donc
Cov(λX + Y, λX + Y ) = V (λX + Y ) et
V (λX + Y ) = E
(λX + Y )
2− E (λX + Y )
2= E λ
2X
2+ 2λXY + Y
2− [λE (X ) + E (Y )]
2= λ
2E X
2+ 2λE (XY ) + E Y
2− λ
2E (X )
2− 2λE (X ) E (Y ) − E (Y )
2= λ
2V (X ) + 2λCov (X, Y ) + V (Y ) c. Comme une variance est positive ou nulle, le polynôme P , déni pour λ ∈ R, par
P (λ) = λ
2V (X ) + 2λCov (X, Y ) + V (Y )
est positif ou nul et de degré deux car V (X) 6= 0 . D'où son discriminant est négatif ou nul.
∆ = 4Cov (X, Y )
2− 4V (X) V (Y )
= 4 h
Cov (X, Y )
2− V (X ) V (Y ) i
≤ 0 Donc Cov (X, Y )
2≤ V (X) V (Y )
On a égalité si et seulement si ∆ = 0 c'està dire s'il existe λ tel que V (λX + Y ) = 0 . Ce qui équivaut à λX + Y constante presque surement.
Il y a égalité si et seulement si il existe (λ, µ) ∈ R
2tel que Y = λX + µ presque
surement.
2. Coecient de corrélation linéaire des variables aléatoires X et Y.
a. Comme
Cov (X, Y )
2≤ V (X ) V (Y ) alors
Cov (X, Y )
2V (X ) V (Y ) ≤ 1 et, en prenant la racine,
Cov (X, Y ) σ (X ) σ (Y )
≤ 1 D'où ρ ∈ [−1, 1] et l'on a
ρ = ±1 ⇐⇒ ρ
2= 1 ⇐⇒ Cov (X, Y )
2= V (X ) V (Y )
D'après la question précédente, ρ ∈ [−1, 1] si et seulement si il existe des constantes λ et µ telles que Y = λX + µ presque surement.
b. Si X et Y sont indépendantes, Cov (X, Y ) = 0 et donc ρ = 0.
PARTIE II
1. Calculs préliminaires
a. Montrons le résultat par récurrence sur n . Pour n = q on a :
q
X
k=q
k q
= q
q
= 1 = q + 1
q + 1
Soit n ≥ q tel que
n
X
k=q
k q
= n + 1
q + 1
alors
n+1
X
k=q
k q
=
n
X
k=q
k q
+
n + 1 q
=
n + 1 q + 1
+
n + 1 q
=
n + 2 q + 1
D'où la formule demandée par récurrence.
b. En prenant q = 1 , on trouve :
n
X
k=1
k 1
=
n
X
k=1
k = n + 1
2
= (n + 1) n 2 pour q = 2 :
n
X
k=2
k 2
=
n
X
k=2
k (k − 1)
2 =
n + 1 3
= (n + 1) n (n − 1) 3 · 2
et donc
nX
k=2
k (k − 1) = (n + 1) n (n − 1) 3 on obtient aussi
n
X
k=1
k
2=
n
X
k=2
k (k − 1) + 1 +
n
X
k=2
k
!
= (n + 1) n (n − 1)
3 + (n + 1) n 2
D'où
nX
k=1
k
2= n(n + 1)(2n + 1) 6
enn pour q = 3 :
n
X
k=3
k 3
=
n
X
k=3
k (k − 1) (k − 2)
3 · 2 =
n + 1 4
= (n + 1) n (n − 1) (n − 2) 4 · 3 · 2
et donc
nX
k=3
k (k − 1) (k − 2) = (n + 1) n (n − 1) (n − 2) 4
2. Lois conjointe et marginales des variables aléatoires N
1et N
2. a. Les numéros présents dans l'urne sont équiprobables donc
P (N
1= i) = 1 n pour 1 6 i 6 n .
On obtient de même
P
N1=i(N
2= j) = 1
n − 1 pour 1 6 j 6 n, j 6= i
et P
N1=j(N
2= j) = 0 car la boule j est retirée de l'urne.
La famille (N
1= i)
i∈[[1,n]]est un système complet d'événements donc
P (N
2= j) =
n
X
i=1
P
N1=i(N
2= j) P (N
1= i)
=
n
X
i=1
1 n − 1 · 1
n + P
N1=j(N
2= j) P (N
1= j) = (n − 1) 1 n − 1 · 1
n = 1 n
La loi de N
2est donc la même que celle de N
1. b. On a E (N
1) = E (N
2) =
n+12(loi uniforme sur [[1, n]] )
E N
12=
n
X
k=1
k
2n = 1
n
n (n + 1) (2n + 1)
6 = (n + 1) (2n + 1) 6 et
V (N
1) = E N
12− E (N
1)
2= (n + 1) (2n + 1)
6 −
n + 1 2
2= n + 1
12 (4n + 2 − 3n − 3) = n
2− 1 12
D'où E (N
1) = E (N
2) = n + 1
2 et V (N
1) = V (N
2) = n
2− 1 12 c. On a
P ((N
1= i) ∩ (N
2= j)) = 0 si i = j (événement impossible) Pour i 6= j
P ((N
1= i) ∩ (N
2= j)) = P (N
1= i) P
N1=i(N
2= j) = 1 n (n − 1)
On a alors E (N
1N
2) =
n
X
i=1 n
X
j=1
i j P ((N
1= i) ∩ (N
2= j))
=
n
X
i=1
i
n
X
j=1j6=i
j P ((N
1= i) ∩ (N
2= j)) + 0
=
n
X
i=1
i 1 n (n − 1)
n
X
j=1
j − i
=
n
X
i=1
i n (n + 1) 2n (n − 1) −
n
X
i=1
i
21 n (n − 1)
= n
2(n + 1)
24n (n − 1) − n (n + 1) (2n + 1) n (n − 1) 6
= (n + 1)
(n − 1) 12 3 n + n
2− 2 (2n + 1)
= (n + 1)
(n − 1) 12 3n
2− n − 2
= (n + 1) (3n + 2) (n − 1)
(n − 1) 12 = (n + 1) (3n + 2) 12 On a donc E (N
1N
2) = (n + 1) (3n + 2)
12 .
La covariance de N
1et N
2vaut
Cov (N
1, N
2) = E (N
1N
2) − E (N
1) E (N
2)
= (n + 1) (3n + 2)
12 − (n + 1)
24 = (n + 1)
12 [3n + 2 − 3n − 3]
= − n + 1 12 On a donc Cov (N
1, N
2) = − n + 1
12 et ρ (N
1, N
2) = Cov (N
1, N
2)
p V (N
1) V (N
2) = − n + 1 12
12
n
2− 1 = − 1 n − 1
Le coecient de corrélation linéaire de N
1et N
2vaut donc − 1
n − 1
d. On a alors
V (N
1+ N
2) = V (N
1) + V (N
2) + 2Cov (N
1, N
2)
= 2 n
2− 1
12 − 2 n + 1
12 = n + 1
6 (n − 1 − 1) = (n + 1) (n − 2) 6 D'où V (N
1+ N
2) = (n + 1) (n − 2)
6
3. Lois conjointe, marginales et conditionnelles de X et Y a. Soit (i, j) ∈ [[1, n]]
2.
Pour 1 6 i < j 6 n , l'événement ((X = i) ∩ (Y = j)) correspond à l'événement le plus grand vaut j et le plus petit vaut i et comme on a bien i < j l'événement ((X = i) ∩ (Y = j)) correspond donc à un numéro vaut i et l'autre j c'est à dire
((N
1= i) ∩ (N
2= j)) ∪ ((N
1= j) ∩ (N
2= i)) C'est une union de deux événements incompatibles donc
P ((X = i) ∩ (Y = j))
= P ((N
1= i) ∩ (N
2= j)) + P ((N
1= j) ∩ (N
2= i)) = 2 n (n − 1) Sinon, l'événement est impossible et la probabilité est nulle.
b. Les lois de X et de Y sont les lois marginales du couple donc, pour j ≥ 2
P (Y = j) =
n
X
i=1
P ((X = i) ∩ (Y = j)) =
j−1
X
i=1
2
n (n − 1) + 0
= 2 (j − 1)
n (n − 1) (on a bien j − 1 ≥ 1) et pour j = 1 on P (Y = 1) = 0 , ce que donne encore la formule.
Pour i ≤ n − 1
P (X = i) =
n
X
j=1
P ((X = i) ∩ (Y = j)) =
n
X
j=i+1
2
n (n − 1) + 0
= 2 (n − (i + 1) + 1)
n (n − 1) (on a bien i + 1 ≤ n)
qui donne bien 0 pour i = n.
D'où, pour i et j dans J 1, n K,
P (Y = j) = 2 (j − 1)
n (n − 1) P (X = i) = 2 (n − i) n (n − 1) c. Pour 1 6 i < j 6 n :
On peut utiliser que :
P
Y=j(X = i) = P ((X = i) ∩ (Y = j))
P (Y = j) =
2 n(n−1)
2(j−1) n(n−1)
= 1
j − 1
Ou remarquer directement que, quand Y = j , le plus petit numéro tiré peut prendre toutes les valeurs de J 1, j − 1 K et ceci de façon équiprobable.
Donc
P
Y=j(X = i) = 1
j − 1 pour i ∈ [[1, j − 1]] . et de même
P
X=i(Y = j) = 1 n − i
D'où Y , conditionné par X = i , suit la loi uniforme sur [[i + 1, n]]
d. En notant Ω l'univers, on a X (Ω) = [[1, n − 1]] donc (n + 1 − X ) (Ω) = [[2, n]] = Y (Ω)
Pour 2 6 j 6 n on a
P (n + 1 − X = j) = P (X = n + 1 − j)
= 2 (n − (n + 1 − j))
n (n − 1) car 1 ≤ n + 1 − j ≤ n − 1
= 2 (j − 1)
n (n − 1) = P (Y = j) On en déduit que n + 1 − X et Y ont la même loi. ,
Les deux variables aléatoires ont donc même espérance et même variance.
Or E (n + 1 − X ) = n + 1 − E (X) d'où E (X) = n + 1 − E (Y ) et V (n + 1 − X ) = (−1)
2V (X ) donc
E (X ) = n + 1 − E (Y ) et V (X ) = V (Y )
4. Espérances et variances des variables aléatoires X et Y a. On revient à la déntion :
E (Y ) =
n
X
j=2
j 2 (j − 1)
n (n − 1) = 2 n (n − 1)
n
X
j=2
j (j − 1)
= 2
n (n − 1)
(n + 1) n (n − 1)
3 par II1b = 2
3 (n + 1) D'où
E (X) = n + 1 − E (Y ) = 1
3 (n + 1) b. On a :
E [Y (Y − 2)] =
n
X
j=2
j (j − 2) 2 (j − 1) n (n − 1)
= 2
n (n − 1)
n
X
j=2