CHAPITRE IV VARIABLES ALEATOIRES IV.1. Définitions et exemples

(1)

CHAPITRE IV

VARIABLES ALEATOIRES IV.1. Définitions et exemples

Nous introduisons les notions de variable aléatoire, de fonction de répartition et de densité de probabilités. Soit Ω un ensemble fondamental et P une probabilité définie sur Ω.

IV.1.a. Variables aléatoires

Dans de nombreuses expériences stochastiques, on représente les résultats possibles par des nombres réels X(ω) pour tout ω dans l’ensemble fondamental. Pour étudier des grandeurs dépendant du hasard on est amené à introduire des fonctions définies sur des espaces probabilisés.

Exemple 1: On jette deux pièces équilibrées. On peut décrire l’ensemble fondamental de cette expérience par Ω ={(P,P), (P,F), (F,P),(F,F)}, la lettre F représentant « face » et P

représentant « pile ». Ici on s’intéresse au nombre X de piles qui apparaissent et on définit l’ensemble fondamental par l’image de X, i.e. E = {0 piles, 1 pile, 2 piles} ou simplement E

={0,1,2}. Alors, la distribution de probabilité de X est donnée par P(X = 0) = P(0 piles) = P({(P,P)}) = ¼

P(X = 1) = P(1 pile) = P({(P,F), (F,P)}) = ½ P(X = 2) = P(2 piles) = P({(F,F)}) = ¼.

Donc X associe à chaque résultat possible de l’expérience un nombre réel, i.e. X est une fonction à valeurs réelles définie sur l’ensemble fondamental Ω. Pour des raisons historiques X est appelé variable aléatoire ou plus précisément une variable aléatoire réelle.

Définition: Une variable aléatoire (réelle) X est une fonction X: Ω → E (E ⊂ R ou Z ou N), i.e. pour tout ω ∈ Ω , X(ω) ∈ E.

On peut interpréter X comme une observable dépendant du hasard. Si le résultat de l’expérience est ω, alors la variable aléatoire X prend la valeur X(ω). Souvent on prend directement l’ensemble E des valeurs comme l’ensemble fondamental de l’expérience.

Pour tout événement A dans Ω la variable aléatoire X peut être restreinte en une application de l’ensemble A dans la partie des nombres réels J = X(A) = {X(ω), ω ∈ A }. En particulier, l’ensemble fondamental Ω d’une expérience aléatoire correspond à l’ensemble E de tous les valeurs possibles de X, i.e. E = X(Ω). Pour des ensembles fondamentaux finis ou

dénombrables, E se confond avec un ensemble des entiers.

(2)

Exemple 1(suite) : On jette deux pièces équilibrées. On considère l’événement A = " au moins une pile apparaît". Alors, X a pour valeurs 1 ou 2 , i.e. X ∈ {1,2} ou encore 1 ≤ X ≤ 2.

Exemple 2 : On reconsidère les observables dans le schéma de Bernoulli.

Pour le i-ème essai on définit la variable aléatoire Xi par

X_i = 0 si le résultat est un échec, X_i = 1 si le résultat est un succès.

Donc pour chaque essai on a E = {0,1}.

Pour une suite de N essais, le vecteur X = (X₁,...,X_N) est à valeurs dans E = {0,1}^N. Dans le chapitre précédent on a déjà étudié les variables aléatoires suivantes :

Nombre de succès S_N: S_N = X₁ + ... + X_N SN prend ses valeurs dans E = {0,1,...,N}.

Temps du premier succès T: T désigne le premier index i tel que X_i = 1, i.e.

T = min(i, X_i = 1) = min(i, S_i = 1), T prend ses valeurs dans E = {1,2,3,...}.

Temps jusqu’aux r premiers succès Tr: Tr désigne le premier index i tel que Si = r, i.e.

T_r = min(i, S_i = r), T_r prend ses valeurs dans E = {r, r+1, r+2,...}.

Exemple 3: Pour tout événement A dans Ω on définit la variable indicatrice de A, noté IA , par I_A = 1 si A est réalisé,

IA = 0 si A^c est réalisé.

La variable aléatoire I_A est une variable de Bernoulli de paramètre p = P(A).

Exemple 4: On choisit un nombre au hasard dans l’intervalle [0,1]. Dans ce cas, pour tout e dans E = [0,1] la variable U définie par U(e) = e est une fonction continue sur [0,1]. U est appelé variable uniforme sur l’intervalle [0,1] et on écrit U ∼ U(0,1).

Parmi ces exemples de variables aléatoires considérés ci-dessus on a vu deux types de variables aléatoires : discret et continu. Les variables S_N et T_r sont des variables aléatoires discrètes, tandis U est une variable aléatoire continue. Cette distinction est purement

technique, car des quantités comme l’espérance ou la variance d’une variable aléatoire se ne calculent pas de la même façon pour une variable discrète que pour une variable continue.

Définition (variables aléatoires discrètes):

Une variable aléatoire X : Ω → E est dite discrète si E = {x1,x2,...} est un sous-ensemble discret (fini ou dénombrable) des nombres réels.

On donnera une définition précise des variables aléatoires continues dans Ch. IV.1.b.

(3)

IV.1.b. Distribution de probabilités : densité de probabilités et fonction de répartition Soit X une variable aléatoire réelle définie sur un espace probabilisé (Ω, P). On a défini dans le chapitre IV.1.a. un ensemble caractéristique de X , l’ensemble de ses valeurs possibles noté E = {X(ω), ω ∈ Ω}. Rappelons que E est un sous-ensemble des nombres réels. Maintenant il faut se donner sa distribution de probabilité. Pour une variable aléatoire discrète on peut définir une densité de probabilités fX(x) par

fX(x) = P(X = x).

Définition : Si X : Ω→ E est une variable aléatoire discrète, alors la distribution de

probabilité de X est la donnée des nombres : P(X = x_i). La fonction f_X(x) = P(X = x) est appelée fonction de masse.

Remarque : On utilise la même lettre P pour la probabilité sur l’ensemble E. Plus précisément on a : Pour ω ∈ Ω soit X(ω) = x. Alors P(X = x) := P({ω}) = P(X^-1(x)) = (P o X^-1)(x) où X^-1 désigne l’application réciproque de X.

Exemple 1 : On jette un dé équilibré. Soit X le nombre des points obtenu. La fonction de masse f_X(x) est donnée par

f_X(x) = P(X = x) = 1/6 pour x ∈ {1,2,3,4,5,6}

Pour une variable aléatoire continue, on a P(X = x) = 0 pour tout x réel. Par conséquent on ne peut pas définir une densité de probabilité par f_X(x) = P(X = x). Par contre on peut toujours définir des probabilités P(X ≤ t) pour tout t réel.

Définition : Soit X : Ω → E une variable aléatoire réelle. Sa fonction de répartition FX(t) est définie par

F_X(t) = P(X ≤ t) pour tout t réel.

La fonction de répartition détermine aussi la distribution. Si X et Y sont deux variables aléatoires telles que F_X(t) = F_Y(t), alors X et Y ont la même distribution de probabilités.

(4)

La fonction de répartition FX(t) vérifie les propriétés suivantes:

Proposition : Soit X : Ω → E une variable aléatoire et FX(t) sa fonction de répartition. Alors : a. lim t→-∞ FX(t) = 0,

b. lim _t_→₊_∞ F_X(t) = 1,

c. si s < t alors FX(s) ≤ FX(t)

d. F est continu à droite, i.e. pour tout t réel, FX(t+s) → FX(t) lorsque s → 0⁺. e. P(X > s) = 1 - F_X(s)

f. P(s < X ≤ t) = F_X(t) - F_X(s)

Exemple 1 (suite) : On jette un dé équilibré. Soit X le nombre des points obtenus. La fonction de répartition FX(t) est donnée par

0 si 1

( ) si 1 pour 1, 2, 3, 4, 5

6

1 si 6

X

t

F t k k t k k

t

 <

= ≤ < + =

 ≤



Etant donné une variable aléatoire discrète à valeurs dans E = {x1,x2,...}, sa fonction de répartition n’est pas continue dans les points x_i et elle constante entre x_i-1et x_i (plus

précisément sur l’intervalle [x_i-1, x_i [ ) pour tout i. Donc, en général, la fonction de répartition peut être représentée par une fonction en escalier élémentaire.

Les variables aléatoires continues sont caractérisées par une propriété de la fonction de répartition.

Définition : Une variable aléatoire X : Ω → E est une variable aléatoire continue si sa fonction de répartition s’écrit sous la forme

( ) ( )

t

X X

F t f x dx

−∞

=

∫

où fX(x) est une fonction non négative, appelée densité de X.

Remarque : Par conséquent, la fonction de répartition d’une variable aléatoire continue est une fonction (absolument) continue. Pour une variable aléatoire continue X, P(X = x) = 0 pour tout x réel.

(5)

Exemple 2 ( variable uniforme U(0,1) ) : La densité d’une variable U(0,1) est donnée par fU(x) = 1 si x ∈ [0,1] et fU(x) =0 sinon.

Sa fonction de répartition est

0 0

( ) 0 1

1 1

U

t

F t t si t

t

 <

= ≤ <

 ≤



Exemple 3 ( variable exponentielle ) : La densité d’une variable exponentielle de paramètre λ est donnée par

fX(x) = λ⋅exp(-λx) si x ≥ 0 et fX(x) =0 sinon.

0 0

( ) 1 exp( ) 0

X

F t t

t t

λ

 <

=  − − ≤

Exemple 4 : Soit X une variable aléatoire de densité fX(x) = ½ exp(-|x|). Sa fonction de répartition est donnée par

1 2 1 2

exp( ) 0

( ) 1 exp( ) 0

X

t t

F t t t

⋅ − <

=  − ⋅ − ≤

Exemple 5 ( variable gausienne ou normale) : La densité d’une variable normale de moyenne µ et de variance σ² , σ > 0, est donnée par

2

2 2

( )

2

1

( ) 2 exp( )

X

f x x_σ^µ

πσ ⁻

= − .

2

2 2

( )

2

1

( ) 2 exp( )

t X

F t _πσ x_σ^µ dx

−∞

=

∫

− −

(6)

Voici une variable aléatoire qui n’est ni continue ni discrète.

Exemple 6: On jette une pièce équilibrée. Si le résultat est pile on choisit un nombre au hasard dans l’intervalle [0,1]. L’ensemble fondamental Ω = {F} ∪ {(P, x): x ∈ [0,1]}. On définit une variable aléatoire X par X(F) = -1 et X(P, x) = x, alors X a des valeurs dans

E = {-1} ∪ [0,1]. La fonction de répartition de X est donnée par

1 2 1 2

0 1

1 0

( ) (1 ) 0 1

1 1

X

si x

F x

x si x

si x

< −

 − ≤ <

=  + ≤ <

 ≤



La fonction de répartition n’est pas continu au point –1, mais continue sur R \ {-1}.

(7)

IV.2. Couples de variables aléatoires

On considère des événements relatifs à deux variables aléatoires X et Y sur un espace probabilisé. Pour traiter de tels problèmes on va introduire les notions de fonctions de

répartitions conjointes et de lois conjointes d’un couple de variables aléatoires (X, Y). Souvent le couple (X, Y) est appelé vecteur aléatoire (à deux dimensions).

IV.2.a. Fonction de répartition conjointe

Définition : La fonction de répartition conjointe FX,Y (s,t) pour tout couple de variables aléatoires (X, Y) est définie par

F_X,Y(s,t) = P(X ≤ s, Y ≤ t) pour tout couple (s,t) de nombres réels.

IV.2.b. Fonction de répartition marginale

La fonction de répartition de X (respectivement de Y) peut être déduite de la fonction de répartition conjointe du couple (X, Y) comme suit :

FX(s) = P(X ≤ s) = P(X ≤ s, Y < ∞) = P(lim t→∞ {X ≤ s, Y ≤ t}).

Par la propriété de continuité de P on obtient :

FX(s) = lim _t→∞ P(X ≤ s, Y ≤ t) = lim t→∞ FX,Y(s,t) = FX,Y(s,∞).

De façon similaire on trouve la fonction de répartition de Y : FY(t) = FX,Y(∞, t).

Définition : Les fonctions FX(s) = FX,Y(s,∞) et FY(t) = FX,Y(∞, t) sont appelées fonctions de répartition marginales de X et Y.

(8)

IV.2.c. Propriétés de la fonction de répartition conjointe

Les probabilités de tous les événements peuvent s’exprimer à l’aide de la fonction de répartition conjointe du couple (X, Y). En particulier, on a

P(s₁ < X ≤ s2 , t₁ < Y≤ t2) = F_X,Y(s₂, t₂) + F_X,Y(s₁, t₁) – F_X,Y(s₁, t₂) – F_X,Y(s₂, t₁) pour s1 < s2 , t1 < t2.

IV.2.d. Loi discrète conjointe

Si X et Y sont des variables aléatoires discrètes, alors la distribution (ou la loi) de probabilité conjointe du couple (X, Y) est la donnée des nombres : P(X = x_i , Y = y_j). Si on définit

fX,Y(x,y) = P(X = x, Y = y), alors la loi de probabilité marginale de X s’en déduit ainsi :

,

, : ( , ) 0

( ) ( ) ( , )

X Y

X X Y

y f x y

f x P X x f x y

>

= = =

∑

et de manière similaire la loi de probabilité marginale de Y est

,

, : ( , ) 0

( ) ( ) ( , )

X Y

Y X Y

x f x y

f y P Y y f x y

>

= = =

∑

IV.2.e. Loi continue conjointe

Définition : Les variables aléatoires X et Y sont appelées conjointement continues , s’il existe une fonction f_X,Y(x,y) telle que pour tout sous-ensemble A du plan:

, ( , )

({( , ) }) _{X Y}( , )

x y A

P X Y A f x y dxdy

∈

∈ =

∫∫

^.

La fonction f_X,Y(x,y) est appelée densité conjointe du couple (X, Y).

Par conséquent pour un couple (X, Y) conjointement continu, la fonction de répartition conjointe s’écrit comme suit :

, ( , ) ( , ), , ( , )

s t t s

X Y X Y X Y

F s t dx dy f x y f x y dxdy

−∞ −∞ −∞ −∞

=

∫ ∫

=

∫ ∫

Donc

2

, ( , ) , ( , )

X Y X Y

f x y F x y

x y

= ∂

∂ ∂ .

(9)

Les fonctions de répartitions marginales s’écrivent comme

( ) ( )

s

X X

F s f x dx

−∞

=

∫

^et^{F t}^Y^{( )} ^t ^f^Y^{( )}^{y dy}

−∞

=

∫

où fX(x) et fY(y) sont des densités marginales sont données par

( ) , ( , )

X X Y

f x f x y dy

∞

−∞

=

∫

^et ^f^Y^{( )}^y ^∞ ^f^{X Y}^, ^{( , )}^{x y dx}

−∞

=

∫

^.

IV.2.f. Exemples

Exemple 1: Considérons un couple de variables aléatoires (X,Y) de densité conjointe

f_X,Y(x,y) = exp(– x – y) si 0 ≤ x,y < ∞ et fX,Y(x,y) = 0 sinon.

La fonction de répartition conjointe F_X,Y(s,t) s’écrit

F_X,Y(s,t) = (1 – exp(– s))⋅(1 – exp(– t)) si 0 ≤ s,t < ∞ et FX,Y(s,t) = 0 sinon. Les densités marginales sont données par

0 0

( ) exp( ) 0

X

f x x

x x

 <

=  − ≤ et 0 0

( ) exp( ) 0

Y

f y y

y y

 <

=  − ≤

Donc les lois marginales de X et Y sont des lois exponentielles de paramètre 1. Notons que fX,Y(x,y) = fX(x) ⋅ fY(y) et donc FX,Y(s,t) = FX(s) ⋅ FY(t). On dit dans ce cas que X et Y sont des variables aléatoires indépendantes (voir Ch. V.1.).

Exemple 2: Considérons un couple des variables aléatoires (X,Y) de densité conjointe

fX,Y(x,y) = 2⋅exp(– x – y) si 0 ≤ x ≤ y < ∞ et fX,Y(x,y) = 0 sinon.

La fonction de répartition conjointe FX,Y (s,t) s’écrit comme

min( , ) min( , )

2 min( , ) min( , )

,

0 0

( , ) 2 e 2 e ( e ) 1 2 (1 )

s t t s t

x y x x t s t t s t

X Y

x

F s t  ^{− −} dy dx ⁻ e⁻ ⁻ dx e⁻ e⁻ e⁻

=   = − = − − −

 

∫ ∫ ∫

si s,t > 0 et FX,Y(s,t) = 0 sinon. Par conséquent,

FX(s) = FX,Y(s,∞) = 1 – exp(-2s)

FY(t) = FX,Y(∞,t) = 1 + exp(-2t) – 2exp(-t) = (1 – exp(-t))².

(10)

IV.3. Espérance

IV.3.a. Définition

Soit X : Ω → E une variable aléatoire réelle définie sur un espace probabilisé (Ω, P).

L’espérance de X, notée E[X], est définie par

[ ] ( ) _X( )

x E x E

E X x P X x x f x

∈ ∈

=

∑

⋅ = =

∑

⋅

si X est une variable discrète, et

[ ] _X( )

E X x f x dx

∞

−∞

=

∫

⋅

si X est une variable continue.

La quantité E[X] est parfois aussi appelée valeur moyenne de X. Nous utilisons l’expression de valeur moyenne uniquement pour des quantités empiriques.

IV.3.b. Exemples

IV.3.b.1. Variable uniforme discrète

X prend ses valeurs dans {x₁,...,x_N} avec des probabilités P(X = x_i) = 1/N pour i = 1,...,N.

L’espérance de X correspond à la moyenne arithmétique des x_i. E[X] = (x1+ .. .+ xN)/N IV.3.b.2. Variables discrètes: cas fini

X prend des valeurs dans {x1,...,xN}. La loi de probabilités est données par P(X = xi) = pi pour i = 1,...,N. L’espérance de X correspond à la moyenne arithmétique des xi pondérée avec pi.

E[X] = (p₁x₁+ ... + p_Nx_N)

Il y a une analogie avec la notion du centre de gravité d’un groupe de masses, au sens de la mécanique classique: Soit xi la position de la i-ème particule de masse mi sur une ligne. La mass totale du système est alors m = m₁+...+m_N. Son centre de gravité se trouve à la position xc = (m1x1+...+mNxN)/m . Donc, en posant pi = mi/m, on voit que xc = E[X].

(11)

IV.3.b.3. Variable indicatrice d’un événement et variable de Bernoulli

Soit A un événement dans Ω. IA est une variable de Bernoulli de paramètre p = P(A).

L’espérance de sa variable indicatrice I_A est égale à la probabilité P(A) : E[IA] = P(A) .

IV.3.b.4. Variable uniforme continue

X prend ses valeurs dans [a,b] et X a pour densité f_X(x) = 1/(b-a) si x ∈ [a,b] et f_X(x) = 0 sinon. L’espérance de X est égale à la valeur moyenne de a et b :

E[X] = (a + b)/2.

IV.3.b.4. Variable binomiale

Soit X ∼ B(N, p), alors X a pour fonction de masse P(X = k) = C^kN·p^k·(1-p)^N-k pour k = 0,1,...,N.

L’espérance de X est donnée par

E[X] = Np.

IV.3.b.6. Variable géométrique

Soit X ∼ Geom(1, p), alors X a pour distribution P(X = k) = (1-p)^k-1p pour tout k = 1,2,3,...

L’espérance de X est donnée par

E[X] = 1/p.

IV.3.b.7. Variable exponentielle

X a pour densité de probabilité fX(x) = θexp(-θx) si x > 0 et fX(x) = 0 sinon. L’espérance de X est

E[X] = 1/θ. IV.3.b.8. Variable de Poisson

La distribution de X est donnée par P(X = k) = exp(-λ)λ^k/k! pour k = 0,1,2,…Son espérance est E[X] = λ.

IV.3.b.9. Variable normale standard

Soit X ∼ N(0, 1), donc X est de densité fX(x) = exp(-½ x²)/(2π)^½. Alors E[X] = 0.

(12)

IV.3.c. Propriétés élémentaires de l’espérance L’opérateur E[] vérifie les propriétés suivantes :

Linéarité : Soient X et Y deux variables aléatoires et a, b des nombres réels. Alors E[aX + bY]= aE[X] + bE[Y].

Positivité : Soit X une variable aléatoire telle que X ≥ 0. Alors E[X] ≥ 0.

Monotonie : Soient X et Y deux variables aléatoires telles que X ≥ Y. Par les propriétés de linéarité et positivité on a

E[X] ≥ E[Y].

Espérance d’une constante : Si X = c où c est une constante réelle, alors E[X] = E[c] = c.

La propriété de linéarité est souvent utilisée pour calculer l’espérance d’une loi de probabilité.

Exemple 1: Calcul de l’espérance d’une variable aléatoire binomiale

Une variable binomiale B(N,p), noté SN , s’écrit comme la somme de N variables de Bernoulli X₁ de paramètre p:

SN = X1 + … + XN. Donc E[SN] = N⋅E[X1] = Np.

Exemple 2: Calcul de l’espérance de la distribution de points fixes

On désigne M_N la variable aléatoire représentant le nombre de points fixes dans une

permutation aléatoire σ de {1,2,…,N}. On a calculé la loi M_N de dans le chapitre II. On peut calculer son espérance sans connaître explicitement sa loi de probabilité : comme dans le chapitre II soit A_i l’événement qu’il y a un point fixe à la position i, i.e. σ(i) = i. Evidemment P(Ai) = 1/N. On considère la variable indicatrice, notée Ii, de Ai. On a

M_N = I₁ + I₂ + … + I_N.

Par conséquent E[MN] = N⋅E[I1] = N⋅P(Ai) = 1. On s’attend en moyenne à un point fixe, indépendamment de N.

(13)

IV.3.d. Espérance d’une fonction d’une variable aléatoire

Considérons une variable aléatoire X , discrète ou continue, et sa distribution de probabilité.

Supposons qu’on veuille calculer l’espérance d’une fonction de X, disons ϕ(X). Remarquons que ϕ(X) est une variable aléatoire dont la distribution peut être calculer à partir de celle de X.

Si on a pu déterminer cette distribution, on trouve E[ϕ(X)] en appliquant la définition de l’espérance. Dans le théorème suivant nous montrons qu’il y a une façon de calculer E[ϕ(X)]

sans passer par la distribution de ϕ(X).

Théorème :

Si X est une variable aléatoire discrète à valeurs x_k, k ≥ 1, alors pour toute fonction réelle ϕon a

E[ϕ(X)] = Σk ϕ(xk)P(X = xk), sous la condition que la somme soit absolument convergente.

Si X est une variable aléatoire continue ayant pour densité f_X(x), alors pour toute fonction réelle ϕon a

E[ϕ(X)] = ∫ϕ(x)f_X(x)dx, sous la condition que l’intégral soit absolument convergente.

Nous présentons quelques choix de ϕ(X) importants.

Exemples:

1. Fonctions indicatrices

Pour ϕ(x) = 1[a,b](x), i.e. ϕ est la fonction indicatrice de [a,b], on a E[1[a,b](X)] = P(a≤X≤b) 2. Moments

L’espérance de ϕ(x) = x^k est appelée k-ième moment de X. La variance (voir Ch. IV.5.) contient le deuxième moment de X.

3. Fonction exponentielle

L’espérance de ϕ(x) = exp(tx) pour t réel (ou complexe), correspond à la transformée de Laplace (ou de Fourier) d’une loi de probabilité. Voir Ch. IV.5.

(14)

IV.3.e. Espérance : Inégalités Inégalité de Cauchy-Schwarz

Soient X et Y deux variables aléatoires réelles. Evidemment,

(X aY)2 0

a − ≥ ,

donc 2⋅XY ≤ X²/a + aY² pour tout réel positif a. Par les propriétés de linéarité et de positivité l’espérance du produit XY satisfait l’inégalité suivante:

2⋅E[XY] ≤ E[X²]/a + aE[Y²].

Si on optimise par rapport à la constante a on obtient l’inégalité de Cauchy-Schwarz : E[XY] ≤ (E[X²]E[Y²])^½.

Inégalité de Jensen

Si ϕ(x) est une fonction convexe, on a

ϕ(tx+(1-t)y) ≤ tϕ(x) + (1- t)ϕ(y)

pour tous x,y réels et pour tout t dans [0,1]. L’espérance d’une variable aléatoire X satisfait l’inégalité de Jensen:

ϕ(E[X]) ≤ E[ϕ(X)]

Inégalité de Markov

Soit X une variable aléatoire positive. Pour tout a > 0 P(X ≥ a) ≤ E[X]/a.

Preuve: Notons que 1[a,∞)(x) ≤ x/a. En utilisant les propriétés de monotonie et de linéarité de l’espérance on obtient

P(X ≥ a) = E[1_[a,_∞₎(X)] ≤ E[X/a] = E[X]/a.

(15)

IV.4. Variance et Covariance

IV.4.a. Définitions

La variance d’une variable aléatoire X nous permet de mesurer les variations de X autour de l’espérance.

Définition : Soit X une variable aléatoire d’espérance µ = E[X]. La variance de X est définie par

Var[X] = E[(X - µ)²].

En utilisant la propriété de linéarité de l’espérance on peut établir la formule suivant pour la variance qui est en général plus commode :

Var[X] = E[X ²] - µ².

Définition : L’écart type, noté σ, est défini comme la racine carré de la variance : σ = (Var[X])^1/2.

Définition : La covariance de deux variables aléatoires X et Y, notée Cov[X,Y], est définie comme suit :

Cov[X,Y] = E[(X – E[X])(Y – E[Y]] = E[XY] – E[X]E[Y].

Par définition, Cov[X,X] = Var[X]. Si Cov[X,Y] = 0 on dit que X et Y ne sont pas corrélés.

Dans le chapitre V nous montrons que des variables aléatoires indépendantes ne sont jamais corrélées. Pour mesurer la dépendance des deux variables aléatoires X et Y on définit la corrélation de X et Y par

ρ[X,Y] = Cov[X,Y]/(Var[X]Var[Y])^½.

(16)

IV.4.b. Exemples (Variance)

IV.4.b.1. Variable uniforme discrète

X prend ses valeurs dans {x1,...,xN}, et P(X = xi) = 1/N pour i = 1,...,N. La variance de X est donnée par

Var[X] = ((x1 - xc)²+...+ (xN - xc)²) /N où x_c= E[X].

IV.4.b.2. Variables discrètes: cas fini

X prend des valeurs dans {x1,...,xN}. La loi de probabilités est données par P(X = xi) = pi pour i = 1,...,N. La variance de X est donnée par

Var[X] = (p1(x1 - xc)²+...+ pN(xN - xc)²).

Dans l’analogie mécanique présentée dans IV.3.b.2 la variance correspond au moment d’inertie du système de particules.

IV.4.b.3. Variable indicatrice d’un événement et variable de Bernoulli

Soit A un événement dans Ω. IA est une variable de Bernoulli de paramètre p = P(A).

La variance de sa variable indicatrice I_A est donnée par : Var[IA] = P(A) (1 – P(A)).

IV.3.b.4. Variable uniforme continue

X prend ses valeurs dans [a,b] et a pour densité fX(x) = 1/(b-a) si x ∈ [a,b] et fX(x) = 0 sinon.

L’espérance de X est égale à E[X] = (a + b)/2. La variance est donnée par Var[X] = (a - b)²/12.

IV.3.b.4. Variable binomiale

Soit X ∼ B(N, p), alors X a pour fonction de masse P(X = k) = C^kN·p^k·(1-p)^N-k pour k = 0,1,...,N.

On a E[X] = Np. X a pour variance

Var[X] = Np(1 - p).

IV.3.b.6. Variable géométrique

Soit X ∼ Geom(1, p), alors X a pour distribution P(X = k) = (1-p)^k-1p for all k = 1,2,3,... Pour sa variance on trouve

Var[X] = (1 - p)/p².

(17)

IV.3.b.7. Variable exponentielle

X a pour densité de probabilité f_X(x) = θexp(-θx) si x > 0 et f_X(x) = 0 sinon. L’espérance de X est E[X] = 1/θ. X a pour variance

Var[X] = 1/θ².

IV.3.b.8. Variable de Poisson

La distribution de X est donnée par P(X = k) = exp(-λ)λ^k/k! pour k = 0,1,2,…Sa variance est Var[X] = λ.

IV.3.b.9. Variable normale standard

Soit X ∼ N(0, 1), donc X est de densité fX(x) = exp(-½ x²)/(2π)^½. La variance de X est Var[X] = 1.

(18)

IV.4.c. Propriétés élémentaires

L’opérateur Var[] a des propriétés suivantes : IV.4.c.1. Homogénéité

Pour tout λ réel

Var[λX] = λ²Var[X]

IV.4.c.2. Positivité

Var[X] ≥ 0,

et Var[X] = 0 si et seulement si X = E[X] , i.e. X est une variable aléatoire constante.

IV.4.c.3. Variance de la somme des deux variables aléatoires En général, la variance n’est pas additive. On a

Var[X+Y] = Var[X] + Var[Y] + 2Cov[X,Y].

Si les variables X et Y ne sont pas corrélées , i.e. Cov[X,Y] = 0, la variance est additive.

IV.4.c.4. (Bi-) Linéarité de la Covariance

La covariance Cov[X,Y] est linéaire en chaque composante, i.e.

Cov[a1X1+a2X2,Y] = a1Cov[X1,Y] + a2Cov[X2,Y]

IV.4.c.5. Borne sur la corrélation

En utilisant l’inégalité de Cauchy-Schwarz on obtient une borne sur la corrélation de deux variables aléatoires X et Y:

-1 ≤ρ(X,Y) ≤ 1 IV.4.c.5. Inégalité de Bienaymé - Tchebychev

Soit X une variable aléatoire d’espérance µ=E[X] et de variance σ²=Var[X] finies. Pour tout réel a > 0 :

( )

2²

P X a

a µ σ

− ≥ ≤

Preuve : On applique l’inégalité de Markov (voir IV.3.e.) avec a² à la variable (X - µ)².

(19)

IV.5. Moments et transformée de Laplace

IV.5.a. Moments

Pour tout entier positif k, on appelle moment d’ordre k de X et on note m_k mk = E[X^k].

Le moment centré d’ordre k de X noté mc,k est la valeur m_c,k = E[(X-m₁)^k].

Notons, que m_c,2 = Var[X].

Exemple: Variable aléatoire de Bernoulli de paramètre p

On a X^k = X et par conséquent E[X^k] = p tout k entier. Le moment centré d’ordre k de X est donné par

m_c,k = E[(X-p)^k] = (1-p)^kp + (1-p)(-p)^k.

IV.5.b. Définition de la transformée de Laplace

Soit X une variable aléatoire. On appelle transformé de Laplace de X la fonction L_X[t] définie par

LX[t] = E[exp(tX)]

pour les valeurs de t où L_X[t] est finie. La transformée de Laplace est un outil de calcul très utile. Elle caractérise la distribution de X, i.e. si LX[t] = LY[t] pour tout t sur un voisinage de 0, alors X et Y ont la même distribution. Alors, en particulier, pour tout t, FX(t) = FY(t).

IV.5.c. Relation avec les moments

La transformée de Laplace permet de calculer les moments simplement. Si L_X[t] < ∞ sur un voisinage de 0, alors LX[t] est indéfiniment dérivable. La dérivée de LX[t] par rapport à t, notée L'X[t], est donnée par L'X[t] = E[X ⋅ exp(tX)]. On trouve donc

E[X] = L'X[0],

Plus général, le moment d’ordre k de X est donné par la k-iéme derivée de L_X[t]

E[X^k] = L^(k)_X[0].

(20)

IV.5.d. Exemples

IV.5.d.1. Variable de Bernoulli

Soit X une variable de Bernoulli de paramètre p. Sa transformée de Laplace est donnée par LX[t] = p·exp(t) + 1 - p.

IV.5.d.2. Variable binomiale

Soit X une variable binomiale de paramètres p et N. On a L_X[t] = (p·exp(t) + 1 - p)^N. IV.5.d.3. Variable géométrique

Soit X une variable géométrique de paramètre p. On a [ ] 1 (1 )

t

X t

L t p e

p e

= ⋅

− − ⋅

IV.5.d.4. Variable de Poisson

Soit X une variable de Poisson de paramètre λ. On a

L_X[t] = exp[λexp(t)-1].

IV.5.d.5. Variable uniforme continue

Soit X une variable uniforme continue sur (a,b). On a

LX[t] = [exp(tb) - exp(ta)]/[t(b-a)].

IV.5.d.6. Variable exponentielle

Soit X une variable exponentielle de paramètre θ. La transformée de Laplace de X est définie pour t < θ, et donnée par

LX[t] = θ/[θ-t].

IV.5.d.7. Variable normale standard

Soit X ∼ N(0, 1), donc X est de densité f_X(x) = exp(-½ x²)/(2π)^½. La transformée de Laplace de X est donnée par

LX[t] = exp(½t²).

(21)

IV.6. Loi d’une fonction des variables aléatoires

IV.6.a. Changement de variables à une dimension

Soit X une variable aléatoire continue de densité f_X(x) et ϕ une fonction réelle inversible, l’inverse étant noté ϕ^-1, i.e. ϕ^-1(y) est égal à la valeur de x tel que ϕ(x) = y. Dans ce cas, Y =

ϕ(X) est de nouveau une variable aléatoire. Pour calculer la distribution de Y, on procède de la manière suivante:

FY(y) = P(Y ≤ y) = P(ϕ(X) ≤ y) = P(ϕ(X) ∈ (-∝,y]) = P(X ∈ϕ^-1(-∝,y]) =

1( , ) X( )

y

f x dx

ϕ⁻

∫

−∞

En particulier, si ϕ(x) est strictement monotone et continûment dérivable, alors la variable aléatoire Y = ϕ(X) est une variable aléatoire continue, dont la densité f_Y(y) est donnée par

1

1 ( )

( ( )) si ( ) pour un quelconque ( )

0 si ( ) pour tout

X Y

d y

f y y x x

f y dy

y x x

ϕ ϕ ϕ

ϕ

− −

 =

= 

 ≠



Exemple 1: Soit X ∼ U(0,1). On veut calculer la densité de Y = X². La fonction ϕ(x) = x² et une bijection de (0,1) sur (0,1) avec ϕ^-1(y) = y^½, donc (ϕ^-1)'(y) = ½y^-½ . Par conséquent

fY(y) = ½y^-½ si y ∈ (0,1) et fY(y)= 0 sinon.

Alors la fonction de répartition FY(y) est donnée par F_Y(y)= y^½ si y ∈ [0,1]

et F_Y(y) = 0 si y < 0 , F_Y(y) = 1 si y > 1.

Exemple 2: Soit de nouveau X ∼ U(0,1). On veut calculer la densité de Y = - ln(1 - X).

La fonction ϕ(x) = - ln(1 - X) et une bijection de (0,1) sur (0,∝) avec ϕ^-1(y) = 1 - exp(-y), donc (ϕ^-1)'(y) = exp(-y). Pour la densité de Y on obtient

fY(y)= exp(-y) si y ∈ (0,∝) et f_Y(y)= 0 sinon.

(22)

En conséquence, sa fonction de répartition F_Y(y) est donnée par F_Y(y)= 1 - exp(-y) si y ∈ (0,∝) et FY(y) = 0 si y < 0.

On voit que Y suit une loi exponentielle de paramètre 1.

Exemple 3: Soit X ∼ UN(0,1), i.e. X a pour densité la fonction fX(x) = exp(-½ x²)/(2π)^½. On veut calculer la densité de Y = X².

Notons que ϕ(x) = X² n’est pas inversible sur (-∝,∝). Par conséquent, on ne peut pas appliquer la formule pour calculer la densité de Y. Il faut exprimer l’événement X² ≤ y sous forme d’une condition où X appartient à un certain ensemble, comme décrit ci-dessus.

Evidemment FY(y) = 0 si y < 0. Pour tout y > 0, on trouve

F_Y(y) = P(Y ≤ y) = P(X²≤ y) = P(-y^½≤ X ≤ y^½) = FX(y^½) - FX(-y^½)

En dérivant par rapport à y on obtient la densité de Y :

f_Y(y)= ½y^-½ [f_X(y^½) + f_X(-y^½)], i.e.

fY(y)= (2πy)^-½ exp(-½y).

Donc Y suit une loi Gamma Γ(½,½) ou Chi-carré à un degré de liberté, notéeχ₁².

IV.6.b. Changement de variables multidimensionnelles

Considérons deux variables aléatoires X1 et X2 conjointement continues de densités

1, 2( ,1 2)

fX X x x . On veut calculer la densité conjointe de Y₁ et Y₂ , deux fonctions de X₁ et X₂ définies par

Y1 = ϕ1( X1, X2) Y2 = ϕ2( X1, X2) La distribution conjointe de Y₁ et Y₂ est donnée par

1 2 1 2

1 1 2 1

2 1 2 2

, 1 2 1 1 2 2 , 1 2 1 2

( , ) ( , )

( , ) ( ) ( , )

Y Y X X

x x y x x y

F y y P Y y Y y f x x dx dx

ϕϕ ≤

≤

= ≤ ≤ =

∫∫

Pour trouver une formule pour la densité conjointe de Y₁ et Y₂ supposons que les fonctions ϕ1

et ϕ2 satisfont les hypothèses suivantes :

L’application (ϕ1, ϕ2) : ( x1, x2) → ( y1, y2) =

(

ϕ1( x1, x2), ϕ2( x1, x2)

)

est une bijection continûment différentiable. Son inverse est noté par

(23)

(κ1, κ2) : ( y1, y2) → ( x1, x2) =

(

κ1( y1, y2), κ2( y1, y2)

)

et on note son jacobien

1 1

1 2 1 2 1 2

1 2

2 2 1 2 2 1

1 2

( , ) y y

J y y

y y y y

y y

κ κ

κ κ κ κ

κ κ

∂ ∂

∂ ∂ ∂ ∂ ∂ ∂

= = −

∂ ∂ ∂ ∂ ∂ ∂

∂ ∂

Alors, le couple ( Y₁, Y₂) a pour densité

( )

1,2( ,1 2) 1, 2 1( ,1 2), 2( ,1 2) ( ,1 2)

Y Y X X

f y y = f κ y y κ y y ⋅J y y .

Exemple1 : Soient X1 et X2 deux variables normales N(0,1) de densité conjointe donnée par

1 2 1 2

2 2

1 1

, 1 2 1 2

( , ) ( ) ( ) 1 exp( )

2 2

X X X X

x x

f x x f x f x

π

= ⋅ = − +

On cherche la densité conjointe de Y1 et Y2 donnée par Y1 = X1 – X2 et Y2 = X1 + X2 . L’application (ϕ1, ϕ2) définie par (ϕ1, ϕ2) : ( x₁, x₂) → ( y₁, y₂) =

(

x₁ – x₂ , x₁ + x₂

)

est une bijection continûment différentiable. La bijection inverse est donnée par

(κ1, κ2) : ( y₁, y₂) → ( x1, x₂) =

(

½⋅( y1+ y₂), ½⋅( y2 – y₁)

).

Alors, J( y₁, y₂) = ½ et Y₁ et Y₂ ont pour densité

( ) ( )

1 2 1 2

2 2

1 1

, 1 2 2 1 2 2 2 1 1 2

( , ) ( ) ( ) ( , ) 1 exp( )

4 4

Y Y X X

y y

f y y f y y f y y J y y

π

= + ⋅ − ⋅ = − + .

Y1 et Y2 sont deux variables normales N(0,2) indépendantes.