σ(Cn) sont ind´ependantes

(1)

cours 20, le lundi 4 avril 2011

Groupements de tribus ind´ependantes

Rappel. Soient (Ω,F,P) un espace de probabilité et C1, . . . ,Cn des classes de parties de Ω, stables par intersection finie et contenues dans F; si les classes C1, . . . ,Cn sont indépendantes, alors les tribus engendrées σ(C1), . . . , σ(Cn) sont indépendantes.

Lemme.Soit(Ω,F,P)un espace de probabilité ; si les sous-tribusA¹, . . . ,A^p,B¹, . . . ,B^q de F sont indépendantes, alors les tribus A1, . . . ,Ap, σ(B1, . . . ,Bq) sont indépendantes.

Preuve. — Consid´erons la classe C form´ee des ensembles C de la forme C = B1∩. . .∩Bq,

o`u les B_j varient dans Bj, j = 1, . . . , q; cette classe C contient toutes les tribus Bj

(prendre B_j ∈ Bj quelconque et les autres B_k, k 6= j, égaux à Ω), donc la tribu σ(C) contient la tribu engendrée par les B^j; mais inversement, toute tribu contenant les B^j contient les intersections telles que C, donc

σ(C) =σ(B1, . . . ,Bq).

La classe C est stable par intersection finie : si C⁰ =Tq

j=1B⁰_j est un autre ´el´ement de C, on a

C∩C⁰ = (B1∩B⁰₁)∩. . .∩(Bq∩B⁰_q)∈ C.

D’après l’hypothèse d’indépendance desp+q tribus, on a pour tous les A_i ∈ Ai et pour tout C =Tq

j=1B_j de la classeC,

P(A₁∩. . .∩A_p∩C) = P(A₁∩. . .∩A_p∩B₁∩. . .∩B_q)

= Y^p

i=1

P(A_i)Y^q

j=1

P(B_j)

= P(A₁). . .P(A_p)P(C) ;

ainsi, les classes A1, . . . ,Ap,C, stables par intersection finie, sont indépendantes (comme chacune de cesp+1 classes contient Ω comme élément, il n’est pas nécessaire de travailler avec les intersections indexées par tous les sous-ensembles I de{1,2, . . . , p, p+1}). D’après le rappel précédent, on déduit que A¹, . . . ,A^p, σ(C) sont indépendantes, ce qui prouve le lemme.

Corollaire. Si les sous-tribus A1, . . . ,AN de F sont indépendantes, alors les groupements par paquets disjoints sont indépendants : si J₁, . . . ,J_r sont des sous-ensembles de {1, . . . ,N}, deux à deux disjoints, les tribus ^hhregroupéesⁱⁱ

B¹ =σ(Aⁱ, i ∈J1), . . . ,B^r=σ(Aⁱ, i∈ Jr) sont ind´ependantes.

Preuve. — De proche en proche, en utilisant le lemme précédent : d’abord, Br et les Aⁱ, i /∈ Jr forment une famille de tribus indépendantes ; ensuite, B^r−1, B^r et les Aⁱ, i /∈J_r−1∪J_r sont indépendantes, etc.

(2)

Groupement de v.a. ind´ependantes Remarques.

1. Si (Ω,F,P) est un espace de probabilité, si les sous-tribus B1, . . . ,Bq de F sont indépendantes, si g₁, . . . , g_q sont des v.a. telles que g_j soit Bj-mesurable pour chaque j = 1, . . . , q, alors g₁, g₂, . . . , g_q sont indépendantes.

En effet, si A₁, . . . ,A_q sont des bor´eliens de R, l’ensemble {g_j ∈ A_j} est dans Bj

pour j = 1, . . . , q, et l’ind´ependance de ces tribus (B^j) implique P {g1 ∈A1}&. . .&{gq ∈Aq}

= Yq

j=1

P({gj ∈Aj}), ce qui signifie que les v.a. g₁, . . . , g_q sont ind´ependantes.

2. Si (Ω,F,P) est un espace de probabilité, si les X₁, . . . ,X_m sont des v.a. sur (Ω,F,P)et f une fonction borélienne sur R^m, alors la composée f(X₁, . . . ,X_m) est une fonction σ(X₁,X₂, . . . ,X_m)-mesurable.

En effet, si on pose A = σ(X1,X2, . . . ,Xm), chaque Xi est σ(Xi)-mesurable par d´efinition de la tribu engendr´ee par X_i, donc X_i est A-mesurable puisque σ(X_i) ⊂ A, donc −→X :ω ∈Ω→(X₁(ω), . . . ,X_m(ω))∈R^m

est une application mesurable de (Ω,A) dans l’espace mesurable produit (R^m,B⊗· · ·⊗B), qui co¨ıncide avec l’espace mesurable (R^m,BR^m). Finalement, la composition

f ◦−→X :ω ∈Ω→f(X₁(ω), . . . ,X_m(ω))∈R de ces deux applications mesurables −→X et f est A-mesurable.

3. Si des variables aléatoires V1,V2, . . . ,VN sont indépendantes, alors les fonctions ϕ_k(V_i : i ∈ J_k) dépendant de paquets disjoints J_k ⊂ {1, . . . ,N}, k = 1, . . . , r sont indépendantes : par exemple, si X1, . . . ,Xm,Y1, . . . ,Yn, Z1, . . . ,Zp sont indépendantes, et si f, g, hsont boréliennes, alors les trois variables aléatoires

f(X1, . . . ,Xm), g(Y1, . . . ,Yn) et h(Z1, . . . ,Zp) sont ind´ependantes.

D’après le groupement par paquets de tribus indépendantes, on sait que les trois tribus A=σ(X1, . . . ,Xm), B =σ(Y1, . . . ,Yn) et C =σ(Z1, . . . ,Zp) sont indépendantes.

Par le point 2, la fonction F = f(X₁, . . . ,X_m) est A-mesurable, G = g(Y₁, . . . ,Y_n) est B-mesurable et H = h(Z1, . . . ,Zp) est C-mesurable. Par le point 1, on d´eduit que F,G et H sont des v.a. ind´ependantes.

Ind´ependance et esp´erance : suite

On a déjà vu que si X et Y sont indépendantes et intégrables, alors XY est intégrable et E(XY) = (E X) (E Y).

Théorème.Si les variables aléatoiresX1, . . . ,Xnsont indépendantes et intégrables, alors le produit X₁X₂. . .X_n est intégrable et

E X1X2. . .Xn

= (E X1). . .(E Xn).

(3)

Preuve. — Par récurrence sur n ≥ 2, en utilisant le groupement par paquets disjoints et le cas n = 2 déjà traité. Faisons l’hypothèse de récurrence que le résultat est vrai pour n − 1 ≥ 2 ; on note que les deux v.a. X₁ et Y = X₂X₃. . .X_n sont indépendantes, comme fonctions des deux paquets disjoints {X₁} et {X₂,X₃, . . . ,X_n} de variables indépendantes. On a donc, par le cas de deux variables aléatoires, et par l’hypothèse de récurrence,

E X1X2. . .Xn

= E X1(X2. . .Xn)

= (E X1) E X2. . .Xn

= (E X1)(E X2). . .(E Xn),

hhce qu’il fallait d´emontrerⁱⁱ, comme on dit.

Dans l’énoncé qui suit, on a choisi pour fixer les idées de s’intéresser au cas de trois paquets de variables. Il va de soi que le résultat reste vrai pour quatre, cinq,. . . ou deux ! Le cas du groupement le plus général est facile à comprendre, mais serait un peu désagréable à écrire : on devrait découper l’ensemble d’indices {1, . . . ,N} en segments disjoints{1, . . . , n1},{n1+ 1, . . . , n2},{n2+ 1, . . . , n3}, jusqu’ànk = N. On a donc évité.

Corollaire 1. Si X₁, . . . ,X_m, Y₁, . . . ,Y_n, Z₁, . . . ,Z_p sont ind´ependantes, et si f, g, h sont bor´eliennes positives, alors

(∗) E f(X₁, . . . ,X_m)g(Y₁, . . . ,Y_n)h(Z₁, . . . ,Z_p)

= Ef(X₁, . . . ,X_m)

Eg(Y₁, . . . ,Y_n)

Eh(Z₁, . . . ,Z_p) .

On a le même résultat dans le cas intégrable : si f(X₁, . . . ,X_m), g(Y₁, . . . ,Y_n) et h(Z1, . . . ,Zp) sont intégrables, le produit des trois est intégrable, et son intégrale (ou espérance) se calcule par la même formule (∗).

Preuve. — D’après les remarques sur les groupements (point 3), les trois variables aléatoires F = f(X1, . . . ,Xm), G = g(Y1, . . . ,Yn) et H = h(Z1, . . . ,Zp) sont indépen- dantes ; on peut appliquer le théorème précédent.

Somme de variables al´eatoires ind´ependantes

Définition.Si µ et ν sont deux mesures finies sur (R,B), on appelle convolution de µ etν, notéeµ∗ν, l’image deµ⊗ν, mesure finie sur (R²,BR²), par l’application S :R² →R définie par S(x, y) =x+y.

D’après la formule d’intégration par rapport à une mesure image (^hhformule de transfertⁱⁱ), on a pour toute fonction ϕborélienne positive sur R

Z

R

ϕd(µ∗ν) = Z

R

ϕ◦S d(µ⊗ν) = Z

R²

ϕ(x+y) dµ(x)dν(y).

Lemme. Si la mesure finieµadmet une densitéf par rapport à la mesure de Lebesgue, la convolée µ∗ν admet la densitéf ∗ν définie par

f∗ν :x∈R→ Z

R

f(x−y) dν(y)∈[0,+∞] ;

la fonction f ∗ν est Lebesgue-int´egrable sur R, donc finie Lebesgue-presque partout.

Dans le cas où ν admet aussi une densité g, la convolée µ∗ ν admet pour densité la convolée f ∗g des densités, fonction Lebesgue-intégrable définie par

f ∗g:x∈R→ Z

R

f(x−y)g(y) dy∈[0,+∞].

(4)

Preuve. — Il suffit de montrer que les mesures finies µ∗ν et (f ∗ν)(x) dx donnent la mˆeme mesure `a tous les intervalles ]−∞, t]. On a par Fubini positif

(µ∗ν)(]−∞, t]) = Z

R

1_]_−∞,t]d(µ∗ν)

= Z

R²

1_x+y6tf(x)dxdν(y) = Z

R

Z

R

1_x+y6tf(x)dx dν(y)

= Z

R

Z

R

1_z6tf(z−y)dz

dν(y) = Z t

−∞

Z

R

f(z −y)dν(y) dz =

Z t

−∞

(f ∗ν)(z) dz, ce qui termine la preuve de la premi`ere assertion. Quand ttend vers +∞, on obtient par convergence monotone

Z +∞

−∞

(f ∗ν)(z) dz = (µ∗ν)(R) = (µ⊗ν)(R²) =µ(R)ν(R) <+∞.

Corollaire. Si X et Y sont deux variables aléatoires réelles indépendantes définies sur un espace (Ω,F,P), la loi de X + Y est la convolée P_X∗P_Y des lois de X et de Y. La fonction de répartition de X + Y est donnée par

FX+Y(t) = Z

R

FX(t−s) dPY(s) = Z

R

FY(t−s) dPX(s).

Si la loi de X admet la densit´e f, celle de X + Y admet la densit´e f ∗P_Y.

Preuve. — La variable X + Y est égale à la composition S◦ (X,Y), donc sa loi est l’image de la loi du couple par l’application somme S ; comme X et Y sont supposées indépendantes, la loi du couple est P_X⊗P_Y, donc celle de X + Y est la convolée.

Exemple.Soient T₁et T₂deux variables exponentielles de paramètreλ; la loi de T₁+T₂ admet la densité obtenue en convolant deux exemplaires de la densitéf(x) =λ1_x>0e^−λx,

x→

Z

R

f(x−y)f(y) dy= Z

R

λ1_x−y>0e^−λ(x−y)λ1_y>0e^−λy dy.

Le r´esultat est nul si x < 0 (aucun y ne v´erifie dans ce cas les deux conditions y ≥0 et x−y≥0), et quand x≥0 on trouve

λ²e^−λx Z x

0

dy =λ²xe^−λx, donc la densit´e de la loi de T₁+ T₂ est

λ²1_x>0xe^−λx.

(5)

VI.3. Techniques de Fourier

Définition.La fonction caractéristique ϕ_X d’une variable aléatoire réelle X est la fonction à valeurs complexes définie sur R par

∀t ∈R, ϕ_X(t) = E eⁱ^tX.

On verra que la loi P_X est déterminée par la fonction caractéristique ϕ_X (injectivité de la transformation de Fourier).

Exemple. Pour une variable aléatoire gaussienne centrée réduite G, on a, d’après un calcul fait précédemment,

∀t ∈R, ϕ_G(t) = Z

R

eⁱ^txe^−x²^/2 dx

√2π = e^−t²^/2.

Pour une mesureµpositive bornée sur (R,BR), on définit latransformée de Fourierµb de la mesure µ, qui est la fonction définie sur R par

∀t∈R, µ(t) =b Z

R

e⁻ⁱ^tx dµ(x) de sorte que

ϕ_X(t) =Pc_X(−t).

Si f est intégrable sur R, on définit sa transformée de Fourier fbpar

∀t∈R, fb(t) = Z

R

e⁻ⁱ^txf(x) dx,

ce qui est cohérent avec la définition donnée pour les mesures, dans le cas où on a d’un côté une fonction f ≥ 0 intégrable et de l’autre la mesure dµ(x) = f(x) dx dont la densité est la même fonction f,

fb(t) = Z

R

e⁻ⁱ^txf(x) dx= Z

R

e⁻^itx dµ(x) =µ(t).b Si f est nulle en dehors de ]−π, π], on voit que pour tout n∈Z,

fb(n) = Z

R

e^−inxf(x) dx= Z π

−π

e^−inxf(x) dx

est 2π fois le coefficient de Fourier cn(f0) de la fonction 2π-périodique f0 sur R qui co¨ıncide avec f sur ]−π, π]. Toutes ces transformations sont des formes d’une même technique, la transformation de Fourier. On va montrer un résultat d’inversion de Fourier pour les mesures, qu’on appliquera en particulier aux lois des variables aléatoires.

Th´eor`eme. Soit µune mesure finie sur (R,B); pour tous a < b, on a 1

2µ({a}) +µ(]a, b[) +1

2µ({b}) = lim

ε&0

Z b a

1 2π

Z

R

b

µ(t) e^−ε²^t²^/2eⁱ^tx dt dx.

Soit X une variable aléatoire ; la loi P_X est uniquement déterminée par la fonction caractéristique ϕX; précisément, pour tous a < b réels

P(X =a)

2 + P(a <X< b) + P(X =b)

2 = lim

ε&0

Z b a

1 2π

Z

R

ϕ_X(t) e^−ε²^t²^/2e^−itx dt dx.

(6)

L’apparition du noyau gaussien dans la formule n’est pas une fatalité : on aurait pu utiliser d’autres fonctions y → k(y) dont on aurait vérifié d’avance que la transformée de Fourier donne une densité de probabilité sur R, par exemple

k(y) = 1 2π e^−|y|

dont la transform´ee de Fourierbk est la densit´e de Cauchy

x ∈R → 1

π(1 +x²). On obtiendrait alors, par la mˆeme preuve, la formule

P(X =a)

2 + P(a <X < b) + P(X =b)

2 = lim

ε&0

Z b a

1 2π

Z

R

ϕ_X(t) e^−ε|t|e⁻ⁱ^tx dt dx.

Ce qui est nécessaire, c’est d’introduire un facteur, tel que e^−ε²^t²^/2 ou e^−ε^|t|, ε >0, qui fait converger les intégrales, qui ne seraient pas en général convergentes sinon.

Lemme. On donne a < b et on suppose que µ est une mesure finie sur R. On désigne par γ la probabilité gaussienne de densité (2π)^−1/2e^−x²^/2 sur R, et pour toutε > 0, on désigne par C_ε le domaine

Cε={(x, y) :a < x+εy ≤b} ⊂R². Quand ε&0, on a

ε&0lim(µ⊗γ)(Cε) = 1

2µ({a}) +µ(]a, b[) + 1

2µ({b}).

ε→0 ε→0

C_ε

a b

Le domaine oblique gris´e Cε

est form´e des points (x, y) tels que a < x+εy ≤ b. Quand ε→0, le domaine oblique Cε

tend vers le domaine C_∗ ob- tenu en ajoutant `a la bande verticale form´ee des (x, y) tels que a < x < bles deux demi- droites des (a, y) avec y > 0 et des (b, y) avec y≤0.

Preuve du lemme. — Introduisons aussi le domaine

C∗ ={(a, y) :y >0} ∪ {(x, y) :a < x < b} ∪ {(b, y) :y ≤0}.

(7)

On voit que quand ε &0,

1_Cε(x, y)→1_C_∗(x, y),

pour tout point (x, y) ∈ R², et la convergence est dominée par la fonction 1, qui est intégrable sur R² pour la mesure finie µ⊗γ. Par convergence dominée,

(µ⊗γ)(Cε) = Z

R²

1_C_εd(µ⊗γ)

tend vers (µ⊗γ)(C_∗). Mais l’ensemble C_∗ est la r´eunion disjointe de trois sous-ensembles de R² qui sont des produits,

{a}×]0,+∞[, ]a, b[×R, {b}×]−∞,0].

Il en r´esulte que

(µ⊗γ)(C∗) =µ({a})γ(]0,+∞[) +µ(]a, b[)γ(R) +µ({b})γ(]−∞,0])

= 1

2µ({a}) +µ(]a, b[) +1

2µ({b}).

Preuve du théorème. — On note d’abord que la formule d’inversion est vraie pour la densité gaussienne : en effet, le calcul de la transformée de Fourier de la densité gaussienne redonne un multiple de la densité gaussienne, et on peut écrire

(∗) ∀y ∈R, e^−y²^/2

√2π = 1 2π

Z

R

e^−u²^/2e^iuy du.

Posons ξ = µ⊗γ pour abréger. D’après le lemme précédent, il suffit de montrer que pour tout ε >0, on a

ξ(C_ε) = Z b

a

1 2π

Z

Rµ(v) eb ^−ε²^v²^/2e^ivz dv dz.

On ´ecrit d’abord que

ξ(Cε) = Z

R²

1{a<x+εy6b}

e^−y²^/2

√2π dydµ(x).

En injectant la repr´esentation (∗) de la densit´e gaussienne par Fourier, on obtient ξ(Cε) =

Z

R²

1{a<x+εy6b}

Z

R

1

2π e^−u²^/2e^iuy du

dydµ(x).

Cette intégrale en trois variables peut être traitée par Fubini, car la fonction de trois variables

h(x, y, u) =1_{a<x+εy₆_b}e^−u²^/2eⁱ^uy

est borélienne et intégrable sur R³ par rapport à la mesure considérée, Z

R³

1{a<x+εy6b}e^−u²^/2|eⁱ^uy|dydudµ(x) =

(8)

= Z

R

Z

R²

1{a<x+εy6b}e^−u²^/2 dydu

dµ(x) = b−a ε

√2π <+∞.

On ´ecrit par cons´equent avec Fubini ξ(Cε) = 1

2π Z

R

Z

R²

1{a<x+εy6b}e^−u²^/2eⁱ^uy dydu dµ(x),

et pour xfixé, par le changement de variables affine (y, u)∈R² →(z, v) = (εy+x, u/ε) de déterminant égal à 1, on a (z −x)v = yu, dzdv = dydu et on obtient, après ce changement dans l’intégrale double intérieure,

ξ(C_ε) = 1 2π

Z

R

Z

R²

1_{a<z6b}e^−ε²^v²^/2eⁱ^v(z−x) dzdv

dµ(x) ; puis, `a nouveau par un Fubini que le lecteur justifiera,

ξ(Cε) = 1 2π

Z

R²

1_{a<z6b}e^−ε²^v²^/2eⁱ^vzZ

R

e⁻^ivx dµ(x) dzdv

= Z b

a

1 2π

Z

R

e^−ε²^v²^/2eîvzµ(v) dvb dz, ce qui termine la preuve du théorème.

Remarque. On peut modifier la formule pour avoir directement la mesure de ]a, b], par exemple

µ(]a, b]) = lim

ε&0

Z b+√ ε

a+√ ε

₁ 2π

Z

R

b

µ(t) e^−ε²^t²^/2e^itx dt dx.

Pour le voir, il suffit de modifier la d´efinition des ensembles Cε, pour qu’ils tendent vers la bande ]a, b]×R, par exemple en consid´erant

1{a<x+εy−√

ε6_b} −→

ε→0

1_{a<x₆_b}.

On peut aussi prouver l’énoncé plus général suivant : si ψ est Lebesgue-intégrable sur R, bornée surR, siψadmet en tout point des limites à droite et à gauche notées respectivement ψ(x+ 0) etψ(x−0), et si on pose pour toutx réel

ψ_∗(x) = ψ(x+ 0) +ψ(x−0)

2 ,

alors pour toute mesure µfinie sur (R,B) on a Z

R

ψ_∗(x) dµ(x) = lim

ε&0

Z

R

ψ(x) ₁ 2π

Z

R

b

On peut préférer^hhlisserⁱⁱla formule, en introduisant ψ continue sur R et à support com- pact ; alorsψ_∗ =ψ et dans ce cas

Z

R

ψ(x) dµ(x) = lim

ε&0

Z

R

ψ(x) ₁ 2π

Z

R

b

Pour rapprocher cette formule du théorème qu’on a démontré, on prendra pour ψ une fonction continue égale à 1 sur [a, b] et nulle en dehors de [a−δ, b+δ], δ >0 ^hhpetitⁱⁱ.