• Aucun résultat trouvé

On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P .

N/A
N/A
Protected

Academic year: 2022

Partager "On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P ."

Copied!
6
0
0

Texte intégral

(1)

Énoncé

Le but du problème

1

est l'étude du coecient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas particulier (partie II).

PARTIE I

On considère deux variables aléatoires X et Y dénies sur un même espace probabilisé ni. La fonction probabilité est notée P .

On rappelle que V (X) = 0 si et seulement si, avec une probabilité égale à 1 , X est constante ; on dit alors que X est constante presque surement.

On suppose ici que V (X) > 0 .

1. Covariance des variables aléatoires X et Y

a. Donner la dénition de la covariance de X et Y , notée Cov(X, Y ) .

b. Soit λ un réel. Exprimer Cov(λX + Y, λX + Y ) en fonction de V (λX + Y ) et en déduire la formule :

V (λX + Y ) = λ

2

V (X ) + 2λCov(X, Y ) + V (Y ).

c. En déduire que

(Cov(X, Y ))

2

6 V (X)V (Y ).

A quelle condition nécessaire et susante a-t-on l'égalité (Cov(X, Y ))

2

= V (X)V (Y )

2. Coecient de corrélation linéaire des variables aléatoires X et Y.

On suppose dans cette question les variances V (X ) et V (Y ) strictement positives. On rappelle que le coecient de corrélation linéaire ρ des variables aléatoires X et Y est

ρ = Cov (X, Y ) σ (X ) σ (Y ) .

a. Montrer que ρ ∈ [−1, +1] . Préciser, de plus, à quelle condition nécessaire et susante ρ est égal à −1 ou +1 .

b. Quelle est la valeur de ρ lorsque les variables aléatoires X et Y sont indépen- dantes ?

1d'après ESSEC, option éco, maths 2, 2001

PARTIE II

1. Calculs préliminaires

a. On considère deux entiers naturels q et n tels que n > q . Établir la formule

suivante :

n

X

k=q

k q

= n + 1

q + 1

b. En déduire une expression factorisée des quatre sommes suivantes :

n

X

k=1

k,

n

X

k=2

k(k − 1) et

n

X

k=1

k

2

,

n

X

k=3

k(k − 1)(k − 2).

On considère dans toute la suite de cette partie un nombre entier n > 2 et une urne contenant n jetons numérotés de 1 à n .

On extrait de cette urne successivement et sans remise deux jetons et on désigne alors par :

• N

1

la variable aléatoire indiquant le numéro du premier jeton tiré.

• N

2

la variable aléatoire indiquant le numéro du second jeton tiré.

• X la variable aléatoire indiquant le plus petit des numéros des deux jetons tirés.

• Y la variable aléatoire indiquant le plus grand des numéros des deux jetons tirés.

2. Lois conjointe et marginales de N

1

et N

2

.

a. Déterminer les probabilités P (N

1

= i) pour 1 6 i 6 n et P (N

2

= j/N

1

= i) pour 1 6 j 6 n .

En déduire P (N

2

= j) pour 1 6 j 6 n , puis comparer les lois de N

1

et N

2

. b. Calculer les espérances E(N

1

) et E(N

2

) , les variances V (N

1

) et V (N

2

) .

c. Déterminer les probabilités P (N

1

= i ∩ N

2

= j) pour 1 6 i 6 n et 1 6 j 6 n en distinguant les deux cas i = j et i 6= j et déterminer E(N

1

N

2

) . En déduire la covariance et le coecient de corrélation linéaire de N

1

et N

2

.

d. Exprimer enn sous forme factorisée la variance V (N

1

+ N

2

) . 3. Lois conjointe, marginales et conditionnelles de X et Y .

a. Soit (i, j) ∈ [[1, n]]

2

. Déterminer la probabilité P((X = i) ∩ (Y = j)) .

b. En déduire les probabilités P(Y = j) pour 2 6 j 6 n et P(X = i) pour 1 6 i 6 n − 1 .

(On vériera que les formules donnant P(Y = j) et P (X = i) restent valables si

j = 1 ou i = n ).

(2)

c. Déterminer les probabilités P

Y=j

(X = i) et P

X=i

(Y = j) pour 1 6 i < j 6 n , puis reconnaître la loi de X conditionnée par Y = j et la loi de Y conditionnée par X = i.

d. Comparer les lois des variables aléatoires n+1−X et Y . En déduire les expressions de E(X ) en fonction de E(Y ) et de V (X ) en fonction de V (Y ) .

4. Espérances et variances de X et Y .

a. Exprimer les espérances E(Y ) et E(X ) en fonction de n .

b. Exprimer sous forme factorisée E[(Y (Y − 2)] , puis E(Y

2

), V (Y ) et V (X ) en fonc- tion de n .

5. Covariance et coecient de corrélation linéaire de X et Y .

a. Vérier que X + Y = N

1

+ N

2

, puis en déduire sous forme factorisée la variance de X + Y et la covariance de X et Y .

b. En déduire le coecient de corrélation de X et Y .

On remarquera que ce coecient de corrélation linéaire de X et Y est indépendant de n .

Corrigé PARTIE I

1. Covariance des variables aléatoires X et Y a. On a

Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))] = E(XY ) − E(X )E(Y ).

b. Pour Z une variable aléatoire sur un espace probabilisé ni, on a : Cov (Z, Z) = E Z

2

− E (Z)

2

= V (Z) donc

Cov(λX + Y, λX + Y ) = V (λX + Y ) et

V (λX + Y ) = E

(λX + Y )

2

− E (λX + Y )

2

= E λ

2

X

2

+ 2λXY + Y

2

− [λE (X ) + E (Y )]

2

= λ

2

E X

2

+ 2λE (XY ) + E Y

2

− λ

2

E (X )

2

− 2λE (X ) E (Y ) − E (Y )

2

= λ

2

V (X ) + 2λCov (X, Y ) + V (Y ) c. Comme une variance est positive ou nulle, le polynôme P , déni pour λ ∈ R, par

P (λ) = λ

2

V (X ) + 2λCov (X, Y ) + V (Y )

est positif ou nul et de degré deux car V (X) 6= 0 . D'où son discriminant est négatif ou nul.

∆ = 4Cov (X, Y )

2

− 4V (X) V (Y )

= 4 h

Cov (X, Y )

2

− V (X ) V (Y ) i

≤ 0 Donc Cov (X, Y )

2

≤ V (X) V (Y )

On a égalité si et seulement si ∆ = 0 c'està dire s'il existe λ tel que V (λX + Y ) = 0 . Ce qui équivaut à λX + Y constante presque surement.

Il y a égalité si et seulement si il existe (λ, µ) ∈ R

2

tel que Y = λX + µ presque

surement.

(3)

2. Coecient de corrélation linéaire des variables aléatoires X et Y.

a. Comme

Cov (X, Y )

2

≤ V (X ) V (Y ) alors

Cov (X, Y )

2

V (X ) V (Y ) ≤ 1 et, en prenant la racine,

Cov (X, Y ) σ (X ) σ (Y )

≤ 1 D'où ρ ∈ [−1, 1] et l'on a

ρ = ±1 ⇐⇒ ρ

2

= 1 ⇐⇒ Cov (X, Y )

2

= V (X ) V (Y )

D'après la question précédente, ρ ∈ [−1, 1] si et seulement si il existe des constantes λ et µ telles que Y = λX + µ presque surement.

b. Si X et Y sont indépendantes, Cov (X, Y ) = 0 et donc ρ = 0.

PARTIE II

1. Calculs préliminaires

a. Montrons le résultat par récurrence sur n . Pour n = q on a :

q

X

k=q

k q

= q

q

= 1 = q + 1

q + 1

Soit n ≥ q tel que

n

X

k=q

k q

= n + 1

q + 1

alors

n+1

X

k=q

k q

=

n

X

k=q

k q

+

n + 1 q

=

n + 1 q + 1

+

n + 1 q

=

n + 2 q + 1

D'où la formule demandée par récurrence.

b. En prenant q = 1 , on trouve :

n

X

k=1

k 1

=

n

X

k=1

k = n + 1

2

= (n + 1) n 2 pour q = 2 :

n

X

k=2

k 2

=

n

X

k=2

k (k − 1)

2 =

n + 1 3

= (n + 1) n (n − 1) 3 · 2

et donc

n

X

k=2

k (k − 1) = (n + 1) n (n − 1) 3 on obtient aussi

n

X

k=1

k

2

=

n

X

k=2

k (k − 1) + 1 +

n

X

k=2

k

!

= (n + 1) n (n − 1)

3 + (n + 1) n 2

D'où

n

X

k=1

k

2

= n(n + 1)(2n + 1) 6

enn pour q = 3 :

n

X

k=3

k 3

=

n

X

k=3

k (k − 1) (k − 2)

3 · 2 =

n + 1 4

= (n + 1) n (n − 1) (n − 2) 4 · 3 · 2

et donc

n

X

k=3

k (k − 1) (k − 2) = (n + 1) n (n − 1) (n − 2) 4

2. Lois conjointe et marginales des variables aléatoires N

1

et N

2

. a. Les numéros présents dans l'urne sont équiprobables donc

P (N

1

= i) = 1 n pour 1 6 i 6 n .

On obtient de même

P

N1=i

(N

2

= j) = 1

n − 1 pour 1 6 j 6 n, j 6= i

(4)

et P

N1=j

(N

2

= j) = 0 car la boule j est retirée de l'urne.

La famille (N

1

= i)

i∈[[1,n]]

est un système complet d'événements donc

P (N

2

= j) =

n

X

i=1

P

N1=i

(N

2

= j) P (N

1

= i)

=

n

X

i=1

1 n − 1 · 1

n + P

N1=j

(N

2

= j) P (N

1

= j) = (n − 1) 1 n − 1 · 1

n = 1 n

La loi de N

2

est donc la même que celle de N

1

. b. On a E (N

1

) = E (N

2

) =

n+12

(loi uniforme sur [[1, n]] )

E N

12

=

n

X

k=1

k

2

n = 1

n

n (n + 1) (2n + 1)

6 = (n + 1) (2n + 1) 6 et

V (N

1

) = E N

12

− E (N

1

)

2

= (n + 1) (2n + 1)

6 −

n + 1 2

2

= n + 1

12 (4n + 2 − 3n − 3) = n

2

− 1 12

D'où E (N

1

) = E (N

2

) = n + 1

2 et V (N

1

) = V (N

2

) = n

2

− 1 12 c. On a

P ((N

1

= i) ∩ (N

2

= j)) = 0 si i = j (événement impossible) Pour i 6= j

P ((N

1

= i) ∩ (N

2

= j)) = P (N

1

= i) P

N1=i

(N

2

= j) = 1 n (n − 1)

On a alors E (N

1

N

2

) =

n

X

i=1 n

X

j=1

i j P ((N

1

= i) ∩ (N

2

= j))

=

n

X

i=1

i

n

X

j=1j6=i

j P ((N

1

= i) ∩ (N

2

= j)) + 0

=

n

X

i=1

i 1 n (n − 1)

n

X

j=1

j − i

 =

n

X

i=1

i n (n + 1) 2n (n − 1) −

n

X

i=1

i

2

1 n (n − 1)

= n

2

(n + 1)

2

4n (n − 1) − n (n + 1) (2n + 1) n (n − 1) 6

= (n + 1)

(n − 1) 12 3 n + n

2

− 2 (2n + 1)

= (n + 1)

(n − 1) 12 3n

2

− n − 2

= (n + 1) (3n + 2) (n − 1)

(n − 1) 12 = (n + 1) (3n + 2) 12 On a donc E (N

1

N

2

) = (n + 1) (3n + 2)

12 .

La covariance de N

1

et N

2

vaut

Cov (N

1

, N

2

) = E (N

1

N

2

) − E (N

1

) E (N

2

)

= (n + 1) (3n + 2)

12 − (n + 1)

2

4 = (n + 1)

12 [3n + 2 − 3n − 3]

= − n + 1 12 On a donc Cov (N

1

, N

2

) = − n + 1

12 et ρ (N

1

, N

2

) = Cov (N

1

, N

2

)

p V (N

1

) V (N

2

) = − n + 1 12

12

n

2

− 1 = − 1 n − 1

Le coecient de corrélation linéaire de N

1

et N

2

vaut donc − 1

n − 1

(5)

d. On a alors

V (N

1

+ N

2

) = V (N

1

) + V (N

2

) + 2Cov (N

1

, N

2

)

= 2 n

2

− 1

12 − 2 n + 1

12 = n + 1

6 (n − 1 − 1) = (n + 1) (n − 2) 6 D'où V (N

1

+ N

2

) = (n + 1) (n − 2)

6

3. Lois conjointe, marginales et conditionnelles de X et Y a. Soit (i, j) ∈ [[1, n]]

2

.

Pour 1 6 i < j 6 n , l'événement ((X = i) ∩ (Y = j)) correspond à l'événement le plus grand vaut j et le plus petit vaut i et comme on a bien i < j l'événement ((X = i) ∩ (Y = j)) correspond donc à un numéro vaut i et l'autre j c'est à dire

((N

1

= i) ∩ (N

2

= j)) ∪ ((N

1

= j) ∩ (N

2

= i)) C'est une union de deux événements incompatibles donc

P ((X = i) ∩ (Y = j))

= P ((N

1

= i) ∩ (N

2

= j)) + P ((N

1

= j) ∩ (N

2

= i)) = 2 n (n − 1) Sinon, l'événement est impossible et la probabilité est nulle.

b. Les lois de X et de Y sont les lois marginales du couple donc, pour j ≥ 2

P (Y = j) =

n

X

i=1

P ((X = i) ∩ (Y = j)) =

j−1

X

i=1

2

n (n − 1) + 0

= 2 (j − 1)

n (n − 1) (on a bien j − 1 ≥ 1) et pour j = 1 on P (Y = 1) = 0 , ce que donne encore la formule.

Pour i ≤ n − 1

P (X = i) =

n

X

j=1

P ((X = i) ∩ (Y = j)) =

n

X

j=i+1

2

n (n − 1) + 0

= 2 (n − (i + 1) + 1)

n (n − 1) (on a bien i + 1 ≤ n)

qui donne bien 0 pour i = n.

D'où, pour i et j dans J 1, n K,

P (Y = j) = 2 (j − 1)

n (n − 1) P (X = i) = 2 (n − i) n (n − 1) c. Pour 1 6 i < j 6 n :

On peut utiliser que :

P

Y=j

(X = i) = P ((X = i) ∩ (Y = j))

P (Y = j) =

2 n(n−1)

2(j−1) n(n−1)

= 1

j − 1

Ou remarquer directement que, quand Y = j , le plus petit numéro tiré peut prendre toutes les valeurs de J 1, j − 1 K et ceci de façon équiprobable.

Donc

P

Y=j

(X = i) = 1

j − 1 pour i ∈ [[1, j − 1]] . et de même

P

X=i

(Y = j) = 1 n − i

D'où Y , conditionné par X = i , suit la loi uniforme sur [[i + 1, n]]

d. En notant Ω l'univers, on a X (Ω) = [[1, n − 1]] donc (n + 1 − X ) (Ω) = [[2, n]] = Y (Ω)

Pour 2 6 j 6 n on a

P (n + 1 − X = j) = P (X = n + 1 − j)

= 2 (n − (n + 1 − j))

n (n − 1) car 1 ≤ n + 1 − j ≤ n − 1

= 2 (j − 1)

n (n − 1) = P (Y = j) On en déduit que n + 1 − X et Y ont la même loi. ,

Les deux variables aléatoires ont donc même espérance et même variance.

Or E (n + 1 − X ) = n + 1 − E (X) d'où E (X) = n + 1 − E (Y ) et V (n + 1 − X ) = (−1)

2

V (X ) donc

E (X ) = n + 1 − E (Y ) et V (X ) = V (Y )

(6)

4. Espérances et variances des variables aléatoires X et Y a. On revient à la déntion :

E (Y ) =

n

X

j=2

j 2 (j − 1)

n (n − 1) = 2 n (n − 1)

n

X

j=2

j (j − 1)

= 2

n (n − 1)

(n + 1) n (n − 1)

3 par II1b = 2

3 (n + 1) D'où

E (X) = n + 1 − E (Y ) = 1

3 (n + 1) b. On a :

E [Y (Y − 2)] =

n

X

j=2

j (j − 2) 2 (j − 1) n (n − 1)

= 2

n (n − 1)

n

X

j=2

j (j − 1) (j − 2)

= 2

n (n − 1)

(n + 1) n (n − 1) (n − 2)

4 ( par II1b)

= (n + 1) (n − 2) 2 Or

E [Y (Y − 2)] = E

Y

2

− 2Y

= E Y

2

− 2E (Y ) et E Y

2

= E

Y

2

− 2Y

+ 2E (Y ) donc

E Y

2

= (n + 1) (n − 2)

2 + 4

3 (n + 1) = (n + 1)

6 (3n − 6 + 8)

= (n + 1) (3n + 2) 6 et

V (Y ) = E Y

2

− E (Y )

2

= (n + 1) (3n + 2)

6 − 4

9 (n + 1)

2

= n + 1

18 (9n + 6 − 8n − 8) = (n + 1) (n − 2) 18 Conclusion : V (X) = V (Y ) = (n + 1) (n − 2)

18

5. Covariance et coecient de corrélation linéaire de X et Y

a. Comme X est l'une des deux valeur et Y l'autre alors X + Y = N

1

+ N

2

Donc

V (X + Y ) = V (N

1

+ N

2

) = (n + 1) (n − 2) 6 D'autre part V (X + Y ) = V (X) + V (Y ) + 2Cov (X, Y ) donc

Cov (X, Y ) = 1

2 [V (X + Y ) − V (X ) − V (Y )]

= 1 2

(n + 1) (n − 2)

6 − 2 (n + 1) (n − 2) 18

= (n + 1) (n − 2) 2 · 18 Conclusion : Cov (X, Y ) = (n + 1) (n − 2)

36 b. On a alors

ρ (X, Y ) = Cov (X, Y )

p V (X) V (Y ) = (n + 1) (n − 2) 36

18

(n + 1) (n − 2) = 1 2 On a donc ρ (X, Y ) = 1

2 (ce qui est bien indépendant de n )

Références

Documents relatifs

Une variable aléatoire X sur Ω est une fonction, qui à chaque issue de Ω, associe un nombre réel Exemples: Un joueur lance un dé a

On lance une pièce équilibrée, et on dénit la variable aléatoire Z comme valant 0 si la pièce donne face, et 1 sinon.. Il est alors direct que P engendre une probabilité, et que X

Si ce numéro est supérieur ou égal à k alors on note le numéro, sinon on remet le jeton dans l'urne et on retire un jeton dont on note alors le numéro.. Soit Y la variable

Cette valeur maximale est strictement positive donc c'est aussi la plus grande valeur de ψ sur [0, +∞[ car ψ est négative au delà de b.. La

Le but du problème 1 est l'étude du coecient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas

Le but du problème 1 est l'étude du coecient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas

On répète cette expérience 10 fois de suite. On tire au hasard une boule et on la remet dans l'urne. On répète l'expérience deux fois de suite.. 1) Représenter l'ensemble des issues

On considère une urne contenant n boules blanches et n boules noires dans laquelle on effectue des tirages successifs d’une boule, sans remise2. On désigne par T la variable