CHAPITRE IV
VARIABLES ALEATOIRES IV.1. Définitions et exemples
Nous introduisons les notions de variable aléatoire, de fonction de répartition et de densité de probabilités. Soit Ω un ensemble fondamental et P une probabilité définie sur Ω.
IV.1.a. Variables aléatoires
Dans de nombreuses expériences stochastiques, on représente les résultats possibles par des nombres réels X(ω) pour tout ω dans l’ensemble fondamental. Pour étudier des grandeurs dépendant du hasard on est amené à introduire des fonctions définies sur des espaces probabilisés.
Exemple 1: On jette deux pièces équilibrées. On peut décrire l’ensemble fondamental de cette expérience par Ω ={(P,P), (P,F), (F,P),(F,F)}, la lettre F représentant « face » et P
représentant « pile ». Ici on s’intéresse au nombre X de piles qui apparaissent et on définit l’ensemble fondamental par l’image de X, i.e. E = {0 piles, 1 pile, 2 piles} ou simplement E
={0,1,2}. Alors, la distribution de probabilité de X est donnée par P(X = 0) = P(0 piles) = P({(P,P)}) = ¼
P(X = 1) = P(1 pile) = P({(P,F), (F,P)}) = ½ P(X = 2) = P(2 piles) = P({(F,F)}) = ¼.
Donc X associe à chaque résultat possible de l’expérience un nombre réel, i.e. X est une fonction à valeurs réelles définie sur l’ensemble fondamental Ω. Pour des raisons historiques X est appelé variable aléatoire ou plus précisément une variable aléatoire réelle.
Définition: Une variable aléatoire (réelle) X est une fonction X: Ω → E (E ⊂ R ou Z ou N), i.e. pour tout ω ∈ Ω , X(ω) ∈ E.
On peut interpréter X comme une observable dépendant du hasard. Si le résultat de l’expérience est ω, alors la variable aléatoire X prend la valeur X(ω). Souvent on prend directement l’ensemble E des valeurs comme l’ensemble fondamental de l’expérience.
Pour tout événement A dans Ω la variable aléatoire X peut être restreinte en une application de l’ensemble A dans la partie des nombres réels J = X(A) = {X(ω), ω ∈ A }. En particulier, l’ensemble fondamental Ω d’une expérience aléatoire correspond à l’ensemble E de tous les valeurs possibles de X, i.e. E = X(Ω). Pour des ensembles fondamentaux finis ou
dénombrables, E se confond avec un ensemble des entiers.
Exemple 1(suite) : On jette deux pièces équilibrées. On considère l’événement A = " au moins une pile apparaît". Alors, X a pour valeurs 1 ou 2 , i.e. X ∈ {1,2} ou encore 1 ≤ X ≤ 2.
Exemple 2 : On reconsidère les observables dans le schéma de Bernoulli.
Pour le i-ème essai on définit la variable aléatoire Xi par
Xi = 0 si le résultat est un échec, Xi = 1 si le résultat est un succès.
Donc pour chaque essai on a E = {0,1}.
Pour une suite de N essais, le vecteur X = (X1,...,XN) est à valeurs dans E = {0,1}N. Dans le chapitre précédent on a déjà étudié les variables aléatoires suivantes :
Nombre de succès SN : SN = X1 + ... + XN SN prend ses valeurs dans E = {0,1,...,N}.
Temps du premier succès T: T désigne le premier index i tel que Xi = 1, i.e.
T = min(i, Xi = 1) = min(i, Si = 1), T prend ses valeurs dans E = {1,2,3,...}.
Temps jusqu’aux r premiers succès Tr: Tr désigne le premier index i tel que Si = r, i.e.
Tr = min(i, Si = r), Tr prend ses valeurs dans E = {r, r+1, r+2,...}.
Exemple 3: Pour tout événement A dans Ω on définit la variable indicatrice de A, noté IA , par IA = 1 si A est réalisé,
IA = 0 si Ac est réalisé.
La variable aléatoire IA est une variable de Bernoulli de paramètre p = P(A).
Exemple 4: On choisit un nombre au hasard dans l’intervalle [0,1]. Dans ce cas, pour tout e dans E = [0,1] la variable U définie par U(e) = e est une fonction continue sur [0,1]. U est appelé variable uniforme sur l’intervalle [0,1] et on écrit U ∼ U(0,1).
Parmi ces exemples de variables aléatoires considérés ci-dessus on a vu deux types de variables aléatoires : discret et continu. Les variables SN et Tr sont des variables aléatoires discrètes, tandis U est une variable aléatoire continue. Cette distinction est purement
technique, car des quantités comme l’espérance ou la variance d’une variable aléatoire se ne calculent pas de la même façon pour une variable discrète que pour une variable continue.
Définition (variables aléatoires discrètes):
Une variable aléatoire X : Ω → E est dite discrète si E = {x1,x2,...} est un sous-ensemble discret (fini ou dénombrable) des nombres réels.
On donnera une définition précise des variables aléatoires continues dans Ch. IV.1.b.
IV.1.b. Distribution de probabilités : densité de probabilités et fonction de répartition Soit X une variable aléatoire réelle définie sur un espace probabilisé (Ω, P). On a défini dans le chapitre IV.1.a. un ensemble caractéristique de X , l’ensemble de ses valeurs possibles noté E = {X(ω), ω ∈ Ω}. Rappelons que E est un sous-ensemble des nombres réels. Maintenant il faut se donner sa distribution de probabilité. Pour une variable aléatoire discrète on peut définir une densité de probabilités fX(x) par
fX(x) = P(X = x).
Définition : Si X : Ω→ E est une variable aléatoire discrète, alors la distribution de
probabilité de X est la donnée des nombres : P(X = xi). La fonction fX(x) = P(X = x) est appelée fonction de masse.
Remarque : On utilise la même lettre P pour la probabilité sur l’ensemble E. Plus précisément on a : Pour ω ∈ Ω soit X(ω) = x. Alors P(X = x) := P({ω}) = P(X-1(x)) = (P o X-1)(x) où X-1 désigne l’application réciproque de X.
Exemple 1 : On jette un dé équilibré. Soit X le nombre des points obtenu. La fonction de masse fX(x) est donnée par
fX(x) = P(X = x) = 1/6 pour x ∈ {1,2,3,4,5,6}
Pour une variable aléatoire continue, on a P(X = x) = 0 pour tout x réel. Par conséquent on ne peut pas définir une densité de probabilité par fX(x) = P(X = x). Par contre on peut toujours définir des probabilités P(X ≤ t) pour tout t réel.
Définition : Soit X : Ω → E une variable aléatoire réelle. Sa fonction de répartition FX(t) est définie par
FX(t) = P(X ≤ t) pour tout t réel.
La fonction de répartition détermine aussi la distribution. Si X et Y sont deux variables aléatoires telles que FX(t) = FY(t), alors X et Y ont la même distribution de probabilités.
La fonction de répartition FX(t) vérifie les propriétés suivantes:
Proposition : Soit X : Ω → E une variable aléatoire et FX(t) sa fonction de répartition. Alors : a. lim t→-∞ FX(t) = 0,
b. lim t→+∞ FX(t) = 1,
c. si s < t alors FX(s) ≤ FX(t)
d. F est continu à droite, i.e. pour tout t réel, FX(t+s) → FX(t) lorsque s → 0+. e. P(X > s) = 1 - FX(s)
f. P(s < X ≤ t) = FX(t) - FX(s)
Exemple 1 (suite) : On jette un dé équilibré. Soit X le nombre des points obtenus. La fonction de répartition FX(t) est donnée par
0 si 1
( ) si 1 pour 1, 2, 3, 4, 5
6
1 si 6
X
t
F t k k t k k
t
<
= ≤ < + =
≤
Etant donné une variable aléatoire discrète à valeurs dans E = {x1,x2,...}, sa fonction de répartition n’est pas continue dans les points xi et elle constante entre xi-1 et xi (plus
précisément sur l’intervalle [xi-1 , xi [ ) pour tout i. Donc, en général, la fonction de répartition peut être représentée par une fonction en escalier élémentaire.
Les variables aléatoires continues sont caractérisées par une propriété de la fonction de répartition.
Définition : Une variable aléatoire X : Ω → E est une variable aléatoire continue si sa fonction de répartition s’écrit sous la forme
( ) ( )
t
X X
F t f x dx
−∞
=
∫
où fX(x) est une fonction non négative, appelée densité de X.
Remarque : Par conséquent, la fonction de répartition d’une variable aléatoire continue est une fonction (absolument) continue. Pour une variable aléatoire continue X, P(X = x) = 0 pour tout x réel.
Exemple 2 ( variable uniforme U(0,1) ) : La densité d’une variable U(0,1) est donnée par fU(x) = 1 si x ∈ [0,1] et fU(x) =0 sinon.
Sa fonction de répartition est
0 0
( ) 0 1
1 1
U
t
F t t si t
t
<
= ≤ <
≤
Exemple 3 ( variable exponentielle ) : La densité d’une variable exponentielle de paramètre λ est donnée par
fX(x) = λ⋅exp(-λx) si x ≥ 0 et fX(x) =0 sinon.
Sa fonction de répartition est
0 0
( ) 1 exp( ) 0
X
F t t
t t
λ
<
= − − ≤
Exemple 4 : Soit X une variable aléatoire de densité fX(x) = ½ exp(-|x|). Sa fonction de répartition est donnée par
1 2 1 2
exp( ) 0
( ) 1 exp( ) 0
X
t t
F t t t
⋅ − <
= − ⋅ − ≤
Exemple 5 ( variable gausienne ou normale) : La densité d’une variable normale de moyenne µ et de variance σ2 , σ > 0, est donnée par
2
2 2
( )
2
1
( ) 2 exp( )
X
f x xσµ
πσ −
= − .
Sa fonction de répartition est
2
2 2
( )
2
1
( ) 2 exp( )
t X
F t πσ xσµ dx
−∞
=
∫
− −Voici une variable aléatoire qui n’est ni continue ni discrète.
Exemple 6: On jette une pièce équilibrée. Si le résultat est pile on choisit un nombre au hasard dans l’intervalle [0,1]. L’ensemble fondamental Ω = {F} ∪ {(P, x): x ∈ [0,1]}. On définit une variable aléatoire X par X(F) = -1 et X(P, x) = x, alors X a des valeurs dans
E = {-1} ∪ [0,1]. La fonction de répartition de X est donnée par
1 2 1 2
0 1
1 0
( ) (1 ) 0 1
1 1
X
si x
si x
F x
x si x
si x
< −
− ≤ <
= + ≤ <
≤
La fonction de répartition n’est pas continu au point –1, mais continue sur R \ {-1}.
IV.2. Couples de variables aléatoires
On considère des événements relatifs à deux variables aléatoires X et Y sur un espace probabilisé. Pour traiter de tels problèmes on va introduire les notions de fonctions de
répartitions conjointes et de lois conjointes d’un couple de variables aléatoires (X, Y). Souvent le couple (X, Y) est appelé vecteur aléatoire (à deux dimensions).
IV.2.a. Fonction de répartition conjointe
Définition : La fonction de répartition conjointe FX,Y (s,t) pour tout couple de variables aléatoires (X, Y) est définie par
FX,Y(s,t) = P(X ≤ s, Y ≤ t) pour tout couple (s,t) de nombres réels.
IV.2.b. Fonction de répartition marginale
La fonction de répartition de X (respectivement de Y) peut être déduite de la fonction de répartition conjointe du couple (X, Y) comme suit :
FX(s) = P(X ≤ s) = P(X ≤ s, Y < ∞) = P(lim t→∞ {X ≤ s, Y ≤ t}).
Par la propriété de continuité de P on obtient :
FX(s) = lim t→∞ P(X ≤ s, Y ≤ t) = lim t→∞ FX,Y(s,t) = FX,Y(s,∞).
De façon similaire on trouve la fonction de répartition de Y : FY(t) = FX,Y(∞, t).
Définition : Les fonctions FX(s) = FX,Y(s,∞) et FY(t) = FX,Y(∞, t) sont appelées fonctions de répartition marginales de X et Y.
IV.2.c. Propriétés de la fonction de répartition conjointe
Les probabilités de tous les événements peuvent s’exprimer à l’aide de la fonction de répartition conjointe du couple (X, Y). En particulier, on a
P(s1 < X ≤ s2 , t1 < Y≤ t2) = FX,Y(s2 , t2) + FX,Y(s1 , t1) – FX,Y(s1 , t2) – FX,Y(s2 , t1) pour s1 < s2 , t1 < t2.
IV.2.d. Loi discrète conjointe
Si X et Y sont des variables aléatoires discrètes, alors la distribution (ou la loi) de probabilité conjointe du couple (X, Y) est la donnée des nombres : P(X = xi , Y = yj). Si on définit
fX,Y(x,y) = P(X = x, Y = y), alors la loi de probabilité marginale de X s’en déduit ainsi :
,
, : ( , ) 0
( ) ( ) ( , )
X Y
X X Y
y f x y
f x P X x f x y
>
= = =
∑
et de manière similaire la loi de probabilité marginale de Y est
,
, : ( , ) 0
( ) ( ) ( , )
X Y
Y X Y
x f x y
f y P Y y f x y
>
= = =
∑
IV.2.e. Loi continue conjointe
Définition : Les variables aléatoires X et Y sont appelées conjointement continues , s’il existe une fonction fX,Y(x,y) telle que pour tout sous-ensemble A du plan:
, ( , )
({( , ) }) X Y( , )
x y A
P X Y A f x y dxdy
∈
∈ =
∫∫
.La fonction fX,Y(x,y) est appelée densité conjointe du couple (X, Y).
Par conséquent pour un couple (X, Y) conjointement continu, la fonction de répartition conjointe s’écrit comme suit :
, ( , ) ( , ), , ( , )
s t t s
X Y X Y X Y
F s t dx dy f x y f x y dxdy
−∞ −∞ −∞ −∞
=
∫ ∫
=∫ ∫
Donc
2
, ( , ) , ( , )
X Y X Y
f x y F x y
x y
= ∂
∂ ∂ .
Les fonctions de répartitions marginales s’écrivent comme
( ) ( )
s
X X
F s f x dx
−∞
=
∫
et F tY( ) t fY( )y dy−∞
=
∫
où fX(x) et fY(y) sont des densités marginales sont données par
( ) , ( , )
X X Y
f x f x y dy
∞
−∞
=
∫
et fY( )y ∞ fX Y, ( , )x y dx−∞
=
∫
.IV.2.f. Exemples
Exemple 1: Considérons un couple de variables aléatoires (X,Y) de densité conjointe
fX,Y(x,y) = exp(– x – y) si 0 ≤ x,y < ∞ et fX,Y(x,y) = 0 sinon.
La fonction de répartition conjointe FX,Y (s,t) s’écrit
FX,Y(s,t) = (1 – exp(– s))⋅(1 – exp(– t)) si 0 ≤ s,t < ∞ et FX,Y(s,t) = 0 sinon. Les densités marginales sont données par
0 0
( ) exp( ) 0
X
f x x
x x
<
= − ≤ et 0 0
( ) exp( ) 0
Y
f y y
y y
<
= − ≤
Donc les lois marginales de X et Y sont des lois exponentielles de paramètre 1. Notons que fX,Y(x,y) = fX(x) ⋅ fY(y) et donc FX,Y(s,t) = FX(s) ⋅ FY(t). On dit dans ce cas que X et Y sont des variables aléatoires indépendantes (voir Ch. V.1.).
Exemple 2: Considérons un couple des variables aléatoires (X,Y) de densité conjointe
fX,Y(x,y) = 2⋅exp(– x – y) si 0 ≤ x ≤ y < ∞ et fX,Y(x,y) = 0 sinon.
La fonction de répartition conjointe FX,Y (s,t) s’écrit comme
min( , ) min( , )
2 min( , ) min( , )
,
0 0
( , ) 2 e 2 e ( e ) 1 2 (1 )
s t t s t
x y x x t s t t s t
X Y
x
F s t − − dy dx − e− − dx e− e− e−
= = − = − − −
∫ ∫ ∫
si s,t > 0 et FX,Y(s,t) = 0 sinon. Par conséquent,
FX(s) = FX,Y(s,∞) = 1 – exp(-2s)
FY(t) = FX,Y(∞,t) = 1 + exp(-2t) – 2exp(-t) = (1 – exp(-t))2.
IV.3. Espérance
IV.3.a. Définition
Soit X : Ω → E une variable aléatoire réelle définie sur un espace probabilisé (Ω, P).
L’espérance de X, notée E[X], est définie par
[ ] ( ) X( )
x E x E
E X x P X x x f x
∈ ∈
=
∑
⋅ = =∑
⋅si X est une variable discrète, et
[ ] X( )
E X x f x dx
∞
−∞
=
∫
⋅si X est une variable continue.
La quantité E[X] est parfois aussi appelée valeur moyenne de X. Nous utilisons l’expression de valeur moyenne uniquement pour des quantités empiriques.
IV.3.b. Exemples
IV.3.b.1. Variable uniforme discrète
X prend ses valeurs dans {x1,...,xN} avec des probabilités P(X = xi) = 1/N pour i = 1,...,N.
L’espérance de X correspond à la moyenne arithmétique des xi. E[X] = (x1+ .. .+ xN)/N IV.3.b.2. Variables discrètes: cas fini
X prend des valeurs dans {x1,...,xN}. La loi de probabilités est données par P(X = xi) = pi pour i = 1,...,N. L’espérance de X correspond à la moyenne arithmétique des xi pondérée avec pi.
E[X] = (p1x1 + ... + pNxN)
Il y a une analogie avec la notion du centre de gravité d’un groupe de masses, au sens de la mécanique classique: Soit xi la position de la i-ème particule de masse mi sur une ligne. La mass totale du système est alors m = m1+...+mN. Son centre de gravité se trouve à la position xc = (m1x1+...+mNxN)/m . Donc, en posant pi = mi/m, on voit que xc = E[X].
IV.3.b.3. Variable indicatrice d’un événement et variable de Bernoulli
Soit A un événement dans Ω. IA est une variable de Bernoulli de paramètre p = P(A).
L’espérance de sa variable indicatrice IA est égale à la probabilité P(A) : E[IA] = P(A) .
IV.3.b.4. Variable uniforme continue
X prend ses valeurs dans [a,b] et X a pour densité fX(x) = 1/(b-a) si x ∈ [a,b] et fX(x) = 0 sinon. L’espérance de X est égale à la valeur moyenne de a et b :
E[X] = (a + b)/2.
IV.3.b.4. Variable binomiale
Soit X ∼ B(N, p), alors X a pour fonction de masse P(X = k) = CkN·pk·(1-p)N-k pour k = 0,1,...,N.
L’espérance de X est donnée par
E[X] = Np.
IV.3.b.6. Variable géométrique
Soit X ∼ Geom(1, p), alors X a pour distribution P(X = k) = (1-p)k-1p pour tout k = 1,2,3,...
L’espérance de X est donnée par
E[X] = 1/p.
IV.3.b.7. Variable exponentielle
X a pour densité de probabilité fX(x) = θexp(-θx) si x > 0 et fX(x) = 0 sinon. L’espérance de X est
E[X] = 1/θ. IV.3.b.8. Variable de Poisson
La distribution de X est donnée par P(X = k) = exp(-λ)λk/k! pour k = 0,1,2,…Son espérance est E[X] = λ.
IV.3.b.9. Variable normale standard
Soit X ∼ N(0, 1), donc X est de densité fX(x) = exp(-½ x2)/(2π)½. Alors E[X] = 0.
IV.3.c. Propriétés élémentaires de l’espérance L’opérateur E[] vérifie les propriétés suivantes :
Linéarité : Soient X et Y deux variables aléatoires et a, b des nombres réels. Alors E[aX + bY]= aE[X] + bE[Y].
Positivité : Soit X une variable aléatoire telle que X ≥ 0. Alors E[X] ≥ 0.
Monotonie : Soient X et Y deux variables aléatoires telles que X ≥ Y. Par les propriétés de linéarité et positivité on a
E[X] ≥ E[Y].
Espérance d’une constante : Si X = c où c est une constante réelle, alors E[X] = E[c] = c.
La propriété de linéarité est souvent utilisée pour calculer l’espérance d’une loi de probabilité.
Exemple 1: Calcul de l’espérance d’une variable aléatoire binomiale
Une variable binomiale B(N,p), noté SN , s’écrit comme la somme de N variables de Bernoulli X1 de paramètre p:
SN = X1 + … + XN. Donc E[SN] = N⋅E[X1] = Np.
Exemple 2: Calcul de l’espérance de la distribution de points fixes
On désigne MN la variable aléatoire représentant le nombre de points fixes dans une
permutation aléatoire σ de {1,2,…,N}. On a calculé la loi MN de dans le chapitre II. On peut calculer son espérance sans connaître explicitement sa loi de probabilité : comme dans le chapitre II soit Ai l’événement qu’il y a un point fixe à la position i, i.e. σ(i) = i. Evidemment P(Ai) = 1/N. On considère la variable indicatrice, notée Ii, de Ai. On a
MN = I1 + I2 + … + IN.
Par conséquent E[MN] = N⋅E[I1] = N⋅P(Ai) = 1. On s’attend en moyenne à un point fixe, indépendamment de N.
IV.3.d. Espérance d’une fonction d’une variable aléatoire
Considérons une variable aléatoire X , discrète ou continue, et sa distribution de probabilité.
Supposons qu’on veuille calculer l’espérance d’une fonction de X, disons ϕ(X). Remarquons que ϕ(X) est une variable aléatoire dont la distribution peut être calculer à partir de celle de X.
Si on a pu déterminer cette distribution, on trouve E[ϕ(X)] en appliquant la définition de l’espérance. Dans le théorème suivant nous montrons qu’il y a une façon de calculer E[ϕ(X)]
sans passer par la distribution de ϕ(X).
Théorème :
Si X est une variable aléatoire discrète à valeurs xk, k ≥ 1, alors pour toute fonction réelle ϕon a
E[ϕ(X)] = Σk ϕ(xk)P(X = xk), sous la condition que la somme soit absolument convergente.
Si X est une variable aléatoire continue ayant pour densité fX(x), alors pour toute fonction réelle ϕon a
E[ϕ(X)] = ∫ϕ(x)fX(x)dx, sous la condition que l’intégral soit absolument convergente.
Nous présentons quelques choix de ϕ(X) importants.
Exemples:
1. Fonctions indicatrices
Pour ϕ(x) = 1[a,b](x), i.e. ϕ est la fonction indicatrice de [a,b], on a E[1[a,b](X)] = P(a≤X≤b) 2. Moments
L’espérance de ϕ(x) = xk est appelée k-ième moment de X. La variance (voir Ch. IV.5.) contient le deuxième moment de X.
3. Fonction exponentielle
L’espérance de ϕ(x) = exp(tx) pour t réel (ou complexe), correspond à la transformée de Laplace (ou de Fourier) d’une loi de probabilité. Voir Ch. IV.5.
IV.3.e. Espérance : Inégalités Inégalité de Cauchy-Schwarz
Soient X et Y deux variables aléatoires réelles. Evidemment,
(X aY)2 0
a − ≥ ,
donc 2⋅XY ≤ X2/a + aY2 pour tout réel positif a. Par les propriétés de linéarité et de positivité l’espérance du produit XY satisfait l’inégalité suivante:
2⋅E[XY] ≤ E[X2]/a + aE[Y2].
Si on optimise par rapport à la constante a on obtient l’inégalité de Cauchy-Schwarz : E[XY] ≤ (E[X2]E[Y2])½.
Inégalité de Jensen
Si ϕ(x) est une fonction convexe, on a
ϕ(tx+(1-t)y) ≤ tϕ(x) + (1- t)ϕ(y)
pour tous x,y réels et pour tout t dans [0,1]. L’espérance d’une variable aléatoire X satisfait l’inégalité de Jensen:
ϕ(E[X]) ≤ E[ϕ(X)]
Inégalité de Markov
Soit X une variable aléatoire positive. Pour tout a > 0 P(X ≥ a) ≤ E[X]/a.
Preuve: Notons que 1[a,∞)(x) ≤ x/a. En utilisant les propriétés de monotonie et de linéarité de l’espérance on obtient
P(X ≥ a) = E[1[a,∞)(X)] ≤ E[X/a] = E[X]/a.
IV.4. Variance et Covariance
IV.4.a. Définitions
La variance d’une variable aléatoire X nous permet de mesurer les variations de X autour de l’espérance.
Définition : Soit X une variable aléatoire d’espérance µ = E[X]. La variance de X est définie par
Var[X] = E[(X - µ)2].
En utilisant la propriété de linéarité de l’espérance on peut établir la formule suivant pour la variance qui est en général plus commode :
Var[X] = E[X 2] - µ2.
Définition : L’écart type, noté σ, est défini comme la racine carré de la variance : σ = (Var[X])1/2.
Définition : La covariance de deux variables aléatoires X et Y, notée Cov[X,Y], est définie comme suit :
Cov[X,Y] = E[(X – E[X])(Y – E[Y]] = E[XY] – E[X]E[Y].
Par définition, Cov[X,X] = Var[X]. Si Cov[X,Y] = 0 on dit que X et Y ne sont pas corrélés.
Dans le chapitre V nous montrons que des variables aléatoires indépendantes ne sont jamais corrélées. Pour mesurer la dépendance des deux variables aléatoires X et Y on définit la corrélation de X et Y par
ρ[X,Y] = Cov[X,Y]/(Var[X]Var[Y])½.
IV.4.b. Exemples (Variance)
IV.4.b.1. Variable uniforme discrète
X prend ses valeurs dans {x1,...,xN}, et P(X = xi) = 1/N pour i = 1,...,N. La variance de X est donnée par
Var[X] = ((x1 - xc)2+...+ (xN - xc)2) /N où xc= E[X].
IV.4.b.2. Variables discrètes: cas fini
X prend des valeurs dans {x1,...,xN}. La loi de probabilités est données par P(X = xi) = pi pour i = 1,...,N. La variance de X est donnée par
Var[X] = (p1(x1 - xc)2+...+ pN(xN - xc)2).
Dans l’analogie mécanique présentée dans IV.3.b.2 la variance correspond au moment d’inertie du système de particules.
IV.4.b.3. Variable indicatrice d’un événement et variable de Bernoulli
Soit A un événement dans Ω. IA est une variable de Bernoulli de paramètre p = P(A).
La variance de sa variable indicatrice IA est donnée par : Var[IA] = P(A) (1 – P(A)).
IV.3.b.4. Variable uniforme continue
X prend ses valeurs dans [a,b] et a pour densité fX(x) = 1/(b-a) si x ∈ [a,b] et fX(x) = 0 sinon.
L’espérance de X est égale à E[X] = (a + b)/2. La variance est donnée par Var[X] = (a - b)2/12.
IV.3.b.4. Variable binomiale
Soit X ∼ B(N, p), alors X a pour fonction de masse P(X = k) = CkN·pk·(1-p)N-k pour k = 0,1,...,N.
On a E[X] = Np. X a pour variance
Var[X] = Np(1 - p).
IV.3.b.6. Variable géométrique
Soit X ∼ Geom(1, p), alors X a pour distribution P(X = k) = (1-p)k-1p for all k = 1,2,3,... Pour sa variance on trouve
Var[X] = (1 - p)/p2.
IV.3.b.7. Variable exponentielle
X a pour densité de probabilité fX(x) = θexp(-θx) si x > 0 et fX(x) = 0 sinon. L’espérance de X est E[X] = 1/θ. X a pour variance
Var[X] = 1/θ2.
IV.3.b.8. Variable de Poisson
La distribution de X est donnée par P(X = k) = exp(-λ)λk/k! pour k = 0,1,2,…Sa variance est Var[X] = λ.
IV.3.b.9. Variable normale standard
Soit X ∼ N(0, 1), donc X est de densité fX(x) = exp(-½ x2)/(2π)½. La variance de X est Var[X] = 1.
IV.4.c. Propriétés élémentaires
L’opérateur Var[] a des propriétés suivantes : IV.4.c.1. Homogénéité
Pour tout λ réel
Var[λX] = λ2Var[X]
IV.4.c.2. Positivité
Var[X] ≥ 0,
et Var[X] = 0 si et seulement si X = E[X] , i.e. X est une variable aléatoire constante.
IV.4.c.3. Variance de la somme des deux variables aléatoires En général, la variance n’est pas additive. On a
Var[X+Y] = Var[X] + Var[Y] + 2Cov[X,Y].
Si les variables X et Y ne sont pas corrélées , i.e. Cov[X,Y] = 0, la variance est additive.
IV.4.c.4. (Bi-) Linéarité de la Covariance
La covariance Cov[X,Y] est linéaire en chaque composante, i.e.
Cov[a1X1+a2X2,Y] = a1Cov[X1,Y] + a2Cov[X2,Y]
IV.4.c.5. Borne sur la corrélation
En utilisant l’inégalité de Cauchy-Schwarz on obtient une borne sur la corrélation de deux variables aléatoires X et Y:
-1 ≤ρ(X,Y) ≤ 1 IV.4.c.5. Inégalité de Bienaymé - Tchebychev
Soit X une variable aléatoire d’espérance µ=E[X] et de variance σ2=Var[X] finies. Pour tout réel a > 0 :
( )
22P X a
a µ σ
− ≥ ≤
Preuve : On applique l’inégalité de Markov (voir IV.3.e.) avec a2 à la variable (X - µ)2.
IV.5. Moments et transformée de Laplace
IV.5.a. Moments
Pour tout entier positif k, on appelle moment d’ordre k de X et on note mk mk = E[Xk].
Le moment centré d’ordre k de X noté mc,k est la valeur mc,k = E[(X-m1)k].
Notons, que mc,2 = Var[X].
Exemple: Variable aléatoire de Bernoulli de paramètre p
On a Xk = X et par conséquent E[Xk] = p tout k entier. Le moment centré d’ordre k de X est donné par
mc,k = E[(X-p)k] = (1-p)kp + (1-p)(-p)k.
IV.5.b. Définition de la transformée de Laplace
Soit X une variable aléatoire. On appelle transformé de Laplace de X la fonction LX[t] définie par
LX[t] = E[exp(tX)]
pour les valeurs de t où LX[t] est finie. La transformée de Laplace est un outil de calcul très utile. Elle caractérise la distribution de X, i.e. si LX[t] = LY[t] pour tout t sur un voisinage de 0, alors X et Y ont la même distribution. Alors, en particulier, pour tout t, FX(t) = FY(t).
IV.5.c. Relation avec les moments
La transformée de Laplace permet de calculer les moments simplement. Si LX[t] < ∞ sur un voisinage de 0, alors LX[t] est indéfiniment dérivable. La dérivée de LX[t] par rapport à t, notée L'X[t], est donnée par L'X[t] = E[X ⋅ exp(tX)]. On trouve donc
E[X] = L'X[0],
Plus général, le moment d’ordre k de X est donné par la k-iéme derivée de LX[t]
E[Xk] = L(k)X[0].
IV.5.d. Exemples
IV.5.d.1. Variable de Bernoulli
Soit X une variable de Bernoulli de paramètre p. Sa transformée de Laplace est donnée par LX[t] = p·exp(t) + 1 - p.
IV.5.d.2. Variable binomiale
Soit X une variable binomiale de paramètres p et N. On a LX[t] = (p·exp(t) + 1 - p)N. IV.5.d.3. Variable géométrique
Soit X une variable géométrique de paramètre p. On a [ ] 1 (1 )
t
X t
L t p e
p e
= ⋅
− − ⋅
IV.5.d.4. Variable de Poisson
Soit X une variable de Poisson de paramètre λ. On a
LX[t] = exp[λexp(t)-1].
IV.5.d.5. Variable uniforme continue
Soit X une variable uniforme continue sur (a,b). On a
LX[t] = [exp(tb) - exp(ta)]/[t(b-a)].
IV.5.d.6. Variable exponentielle
Soit X une variable exponentielle de paramètre θ. La transformée de Laplace de X est définie pour t < θ, et donnée par
LX[t] = θ/[θ-t].
IV.5.d.7. Variable normale standard
Soit X ∼ N(0, 1), donc X est de densité fX(x) = exp(-½ x2)/(2π)½. La transformée de Laplace de X est donnée par
LX[t] = exp(½t2).
IV.6. Loi d’une fonction des variables aléatoires
IV.6.a. Changement de variables à une dimension
Soit X une variable aléatoire continue de densité fX(x) et ϕ une fonction réelle inversible, l’inverse étant noté ϕ-1, i.e. ϕ-1(y) est égal à la valeur de x tel que ϕ(x) = y. Dans ce cas, Y =
ϕ(X) est de nouveau une variable aléatoire. Pour calculer la distribution de Y, on procède de la manière suivante:
FY(y) = P(Y ≤ y) = P(ϕ(X) ≤ y) = P(ϕ(X) ∈ (-∝,y]) = P(X ∈ϕ-1(-∝,y]) =
1( , ) X( )
y
f x dx
ϕ−
∫
−∞En particulier, si ϕ(x) est strictement monotone et continûment dérivable, alors la variable aléatoire Y = ϕ(X) est une variable aléatoire continue, dont la densité fY(y) est donnée par
1
1 ( )
( ( )) si ( ) pour un quelconque ( )
0 si ( ) pour tout
X Y
d y
f y y x x
f y dy
y x x
ϕ ϕ ϕ
ϕ
− −
=
=
≠
Exemple 1: Soit X ∼ U(0,1). On veut calculer la densité de Y = X2. La fonction ϕ(x) = x2 et une bijection de (0,1) sur (0,1) avec ϕ-1(y) = y½, donc (ϕ-1)'(y) = ½y-½ . Par conséquent
fY(y) = ½y-½ si y ∈ (0,1) et fY(y)= 0 sinon.
Alors la fonction de répartition FY(y) est donnée par FY(y)= y½ si y ∈ [0,1]
et FY(y) = 0 si y < 0 , FY(y) = 1 si y > 1.
Exemple 2: Soit de nouveau X ∼ U(0,1). On veut calculer la densité de Y = - ln(1 - X).
La fonction ϕ(x) = - ln(1 - X) et une bijection de (0,1) sur (0,∝) avec ϕ-1(y) = 1 - exp(-y), donc (ϕ-1)'(y) = exp(-y). Pour la densité de Y on obtient
fY(y)= exp(-y) si y ∈ (0,∝) et fY(y)= 0 sinon.
En conséquence, sa fonction de répartition FY(y) est donnée par FY(y)= 1 - exp(-y) si y ∈ (0,∝) et FY(y) = 0 si y < 0.
On voit que Y suit une loi exponentielle de paramètre 1.
Exemple 3: Soit X ∼ UN(0,1), i.e. X a pour densité la fonction fX(x) = exp(-½ x2)/(2π)½. On veut calculer la densité de Y = X2.
Notons que ϕ(x) = X2 n’est pas inversible sur (-∝,∝). Par conséquent, on ne peut pas appliquer la formule pour calculer la densité de Y. Il faut exprimer l’événement X2 ≤ y sous forme d’une condition où X appartient à un certain ensemble, comme décrit ci-dessus.
Evidemment FY(y) = 0 si y < 0. Pour tout y > 0, on trouve
FY(y) = P(Y ≤ y) = P(X2≤ y) = P(-y½≤ X ≤ y½) = FX(y½) - FX(-y½)
En dérivant par rapport à y on obtient la densité de Y :
fY(y)= ½y-½ [fX(y½) + fX(-y½)], i.e.
fY(y)= (2πy)-½ exp(-½y).
Donc Y suit une loi Gamma Γ(½,½) ou Chi-carré à un degré de liberté, notéeχ12.
IV.6.b. Changement de variables multidimensionnelles
Considérons deux variables aléatoires X1 et X2 conjointement continues de densités
1, 2( ,1 2)
fX X x x . On veut calculer la densité conjointe de Y1 et Y2 , deux fonctions de X1 et X2 définies par
Y1 = ϕ1( X1, X2) Y2 = ϕ2( X1, X2) La distribution conjointe de Y1 et Y2 est donnée par
1 2 1 2
1 1 2 1
2 1 2 2
, 1 2 1 1 2 2 , 1 2 1 2
( , ) ( , )
( , ) ( ) ( , )
Y Y X X
x x y x x y
F y y P Y y Y y f x x dx dx
ϕϕ ≤
≤
= ≤ ≤ =
∫∫
Pour trouver une formule pour la densité conjointe de Y1 et Y2 supposons que les fonctions ϕ1
et ϕ2 satisfont les hypothèses suivantes :
L’application (ϕ1, ϕ2) : ( x1, x2) → ( y1, y2) =
(
ϕ1( x1, x2), ϕ2( x1, x2))
est une bijection continûment différentiable. Son inverse est noté par(κ1, κ2) : ( y1, y2) → ( x1, x2) =
(
κ1( y1, y2), κ2( y1, y2))
et on note son jacobien
1 1
1 2 1 2 1 2
1 2
2 2 1 2 2 1
1 2
( , ) y y
J y y
y y y y
y y
κ κ
κ κ κ κ
κ κ
∂ ∂
∂ ∂ ∂ ∂ ∂ ∂
= = −
∂ ∂ ∂ ∂ ∂ ∂
∂ ∂
Alors, le couple ( Y1, Y2) a pour densité
( )
1,2( ,1 2) 1, 2 1( ,1 2), 2( ,1 2) ( ,1 2)
Y Y X X
f y y = f κ y y κ y y ⋅J y y .
Exemple1 : Soient X1 et X2 deux variables normales N(0,1) de densité conjointe donnée par
1 2 1 2
2 2
1 1
, 1 2 1 2
( , ) ( ) ( ) 1 exp( )
2 2
X X X X
x x
f x x f x f x
π
= ⋅ = − +
On cherche la densité conjointe de Y1 et Y2 donnée par Y1 = X1 – X2 et Y2 = X1 + X2 . L’application (ϕ1, ϕ2) définie par (ϕ1, ϕ2) : ( x1, x2) → ( y1, y2) =
(
x1 – x2 , x1 + x2)
est une bijection continûment différentiable. La bijection inverse est donnée par(κ1, κ2) : ( y1, y2) → ( x1, x2) =
(
½⋅( y1+ y2), ½⋅( y2 – y1)).
Alors, J( y1, y2) = ½ et Y1 et Y2 ont pour densité
( ) ( )
1 2 1 2
2 2
1 1
1 1
, 1 2 2 1 2 2 2 1 1 2
( , ) ( ) ( ) ( , ) 1 exp( )
4 4
Y Y X X
y y
f y y f y y f y y J y y
π
= + ⋅ − ⋅ = − + .
Y1 et Y2 sont deux variables normales N(0,2) indépendantes.