cours 20, le lundi 4 avril 2011
Groupements de tribus ind´ependantes
Rappel. Soient (Ω,F,P) un espace de probabilit´e et C1, . . . ,Cn des classes de parties de Ω, stables par intersection finie et contenues dans F; si les classes C1, . . . ,Cn sont ind´ependantes, alors les tribus engendr´ees σ(C1), . . . , σ(Cn) sont ind´ependantes.
Lemme.Soit(Ω,F,P)un espace de probabilit´e ; si les sous-tribusA1, . . . ,Ap,B1, . . . ,Bq de F sont ind´ependantes, alors les tribus A1, . . . ,Ap, σ(B1, . . . ,Bq) sont ind´ependantes.
Preuve. — Consid´erons la classe C form´ee des ensembles C de la forme C = B1∩. . .∩Bq,
o`u les Bj varient dans Bj, j = 1, . . . , q; cette classe C contient toutes les tribus Bj
(prendre Bj ∈ Bj quelconque et les autres Bk, k 6= j, ´egaux `a Ω), donc la tribu σ(C) contient la tribu engendr´ee par les Bj; mais inversement, toute tribu contenant les Bj contient les intersections telles que C, donc
σ(C) =σ(B1, . . . ,Bq).
La classe C est stable par intersection finie : si C0 =Tq
j=1B0j est un autre ´el´ement de C, on a
C∩C0 = (B1∩B01)∩. . .∩(Bq∩B0q)∈ C.
D’apr`es l’hypoth`ese d’ind´ependance desp+q tribus, on a pour tous les Ai ∈ Ai et pour tout C =Tq
j=1Bj de la classeC,
P(A1∩. . .∩Ap∩C) = P(A1∩. . .∩Ap∩B1∩. . .∩Bq)
= Yp
i=1
P(Ai)Yq
j=1
P(Bj)
= P(A1). . .P(Ap)P(C) ;
ainsi, les classes A1, . . . ,Ap,C, stables par intersection finie, sont ind´ependantes (comme chacune de cesp+1 classes contient Ω comme ´el´ement, il n’est pas n´ecessaire de travailler avec les intersections index´ees par tous les sous-ensembles I de{1,2, . . . , p, p+1}). D’apr`es le rappel pr´ec´edent, on d´eduit que A1, . . . ,Ap, σ(C) sont ind´ependantes, ce qui prouve le lemme.
Corollaire. Si les sous-tribus A1, . . . ,AN de F sont ind´ependantes, alors les groupe- ments par paquets disjoints sont ind´ependants : si J1, . . . ,Jr sont des sous-ensembles de {1, . . . ,N}, deux `a deux disjoints, les tribus hhregroup´eesii
B1 =σ(Ai, i ∈J1), . . . ,Br=σ(Ai, i∈ Jr) sont ind´ependantes.
Preuve. — De proche en proche, en utilisant le lemme pr´ec´edent : d’abord, Br et les Ai, i /∈ Jr forment une famille de tribus ind´ependantes ; ensuite, Br−1, Br et les Ai, i /∈Jr−1∪Jr sont ind´ependantes, etc.
Groupement de v.a. ind´ependantes Remarques.
1. Si (Ω,F,P) est un espace de probabilit´e, si les sous-tribus B1, . . . ,Bq de F sont ind´ependantes, si g1, . . . , gq sont des v.a. telles que gj soit Bj-mesurable pour chaque j = 1, . . . , q, alors g1, g2, . . . , gq sont ind´ependantes.
En effet, si A1, . . . ,Aq sont des bor´eliens de R, l’ensemble {gj ∈ Aj} est dans Bj
pour j = 1, . . . , q, et l’ind´ependance de ces tribus (Bj) implique P {g1 ∈A1}&. . .&{gq ∈Aq}
= Yq
j=1
P({gj ∈Aj}), ce qui signifie que les v.a. g1, . . . , gq sont ind´ependantes.
2. Si (Ω,F,P) est un espace de probabilit´e, si les X1, . . . ,Xm sont des v.a. sur (Ω,F,P)et f une fonction bor´elienne sur Rm, alors la compos´ee f(X1, . . . ,Xm) est une fonction σ(X1,X2, . . . ,Xm)-mesurable.
En effet, si on pose A = σ(X1,X2, . . . ,Xm), chaque Xi est σ(Xi)-mesurable par d´efinition de la tribu engendr´ee par Xi, donc Xi est A-mesurable puisque σ(Xi) ⊂ A, donc −→X :ω ∈Ω→(X1(ω), . . . ,Xm(ω))∈Rm
est une application mesurable de (Ω,A) dans l’espace mesurable produit (Rm,B⊗· · ·⊗B), qui co¨ıncide avec l’espace mesurable (Rm,BRm). Finalement, la composition
f ◦−→X :ω ∈Ω→f(X1(ω), . . . ,Xm(ω))∈R de ces deux applications mesurables −→X et f est A-mesurable.
3. Si des variables al´eatoires V1,V2, . . . ,VN sont ind´ependantes, alors les fonctions ϕk(Vi : i ∈ Jk) d´ependant de paquets disjoints Jk ⊂ {1, . . . ,N}, k = 1, . . . , r sont ind´ependantes : par exemple, si X1, . . . ,Xm,Y1, . . . ,Yn, Z1, . . . ,Zp sont ind´ependantes, et si f, g, hsont bor´eliennes, alors les trois variables al´eatoires
f(X1, . . . ,Xm), g(Y1, . . . ,Yn) et h(Z1, . . . ,Zp) sont ind´ependantes.
D’apr`es le groupement par paquets de tribus ind´ependantes, on sait que les trois tribus A=σ(X1, . . . ,Xm), B =σ(Y1, . . . ,Yn) et C =σ(Z1, . . . ,Zp) sont ind´ependantes.
Par le point 2, la fonction F = f(X1, . . . ,Xm) est A-mesurable, G = g(Y1, . . . ,Yn) est B-mesurable et H = h(Z1, . . . ,Zp) est C-mesurable. Par le point 1, on d´eduit que F,G et H sont des v.a. ind´ependantes.
Ind´ependance et esp´erance : suite
On a d´ej`a vu que si X et Y sont ind´ependantes et int´egrables, alors XY est int´egrable et E(XY) = (E X) (E Y).
Th´eor`eme.Si les variables al´eatoiresX1, . . . ,Xnsont ind´ependantes et int´egrables, alors le produit X1X2. . .Xn est int´egrable et
E X1X2. . .Xn
= (E X1). . .(E Xn).
Preuve. — Par r´ecurrence sur n ≥ 2, en utilisant le groupement par paquets dis- joints et le cas n = 2 d´ej`a trait´e. Faisons l’hypoth`ese de r´ecurrence que le r´esultat est vrai pour n − 1 ≥ 2 ; on note que les deux v.a. X1 et Y = X2X3. . .Xn sont ind´ependantes, comme fonctions des deux paquets disjoints {X1} et {X2,X3, . . . ,Xn} de variables ind´ependantes. On a donc, par le cas de deux variables al´eatoires, et par l’hypoth`ese de r´ecurrence,
E X1X2. . .Xn
= E X1(X2. . .Xn)
= (E X1) E X2. . .Xn
= (E X1)(E X2). . .(E Xn),
hhce qu’il fallait d´emontrerii, comme on dit.
Dans l’´enonc´e qui suit, on a choisi pour fixer les id´ees de s’int´eresser au cas de trois paquets de variables. Il va de soi que le r´esultat reste vrai pour quatre, cinq,. . . ou deux ! Le cas du groupement le plus g´en´eral est facile `a comprendre, mais serait un peu d´esagr´eable `a ´ecrire : on devrait d´ecouper l’ensemble d’indices {1, . . . ,N} en segments disjoints{1, . . . , n1},{n1+ 1, . . . , n2},{n2+ 1, . . . , n3}, jusqu’`ank = N. On a donc ´evit´e.
Corollaire 1. Si X1, . . . ,Xm, Y1, . . . ,Yn, Z1, . . . ,Zp sont ind´ependantes, et si f, g, h sont bor´eliennes positives, alors
(∗) E f(X1, . . . ,Xm)g(Y1, . . . ,Yn)h(Z1, . . . ,Zp)
= Ef(X1, . . . ,Xm)
Eg(Y1, . . . ,Yn)
Eh(Z1, . . . ,Zp) .
On a le mˆeme r´esultat dans le cas int´egrable : si f(X1, . . . ,Xm), g(Y1, . . . ,Yn) et h(Z1, . . . ,Zp) sont int´egrables, le produit des trois est int´egrable, et son int´egrale (ou esp´erance) se calcule par la mˆeme formule (∗).
Preuve. — D’apr`es les remarques sur les groupements (point 3), les trois variables al´eatoires F = f(X1, . . . ,Xm), G = g(Y1, . . . ,Yn) et H = h(Z1, . . . ,Zp) sont ind´epen- dantes ; on peut appliquer le th´eor`eme pr´ec´edent.
Somme de variables al´eatoires ind´ependantes
D´efinition.Si µ et ν sont deux mesures finies sur (R,B), on appelle convolution de µ etν, not´eeµ∗ν, l’image deµ⊗ν, mesure finie sur (R2,BR2), par l’application S :R2 →R d´efinie par S(x, y) =x+y.
D’apr`es la formule d’int´egration par rapport `a une mesure image (hhformule de transfertii), on a pour toute fonction ϕbor´elienne positive sur R
Z
R
ϕd(µ∗ν) = Z
R
ϕ◦S d(µ⊗ν) = Z
R2
ϕ(x+y) dµ(x)dν(y).
Lemme. Si la mesure finieµadmet une densit´ef par rapport `a la mesure de Lebesgue, la convol´ee µ∗ν admet la densit´ef ∗ν d´efinie par
f∗ν :x∈R→ Z
R
f(x−y) dν(y)∈[0,+∞] ;
la fonction f ∗ν est Lebesgue-int´egrable sur R, donc finie Lebesgue-presque partout.
Dans le cas o`u ν admet aussi une densit´e g, la convol´ee µ∗ ν admet pour densit´e la convol´ee f ∗g des densit´es, fonction Lebesgue-int´egrable d´efinie par
f ∗g:x∈R→ Z
R
f(x−y)g(y) dy∈[0,+∞].
Preuve. — Il suffit de montrer que les mesures finies µ∗ν et (f ∗ν)(x) dx donnent la mˆeme mesure `a tous les intervalles ]−∞, t]. On a par Fubini positif
(µ∗ν)(]−∞, t]) = Z
R
1]−∞,t]d(µ∗ν)
= Z
R2
1x+y6tf(x)dxdν(y) = Z
R
Z
R
1x+y6tf(x)dx dν(y)
= Z
R
Z
R
1z6tf(z−y)dz
dν(y) = Z t
−∞
Z
R
f(z −y)dν(y) dz =
Z t
−∞
(f ∗ν)(z) dz, ce qui termine la preuve de la premi`ere assertion. Quand ttend vers +∞, on obtient par convergence monotone
Z +∞
−∞
(f ∗ν)(z) dz = (µ∗ν)(R) = (µ⊗ν)(R2) =µ(R)ν(R) <+∞.
Corollaire. Si X et Y sont deux variables al´eatoires r´eelles ind´ependantes d´efinies sur un espace (Ω,F,P), la loi de X + Y est la convol´ee PX∗PY des lois de X et de Y. La fonction de r´epartition de X + Y est donn´ee par
FX+Y(t) = Z
R
FX(t−s) dPY(s) = Z
R
FY(t−s) dPX(s).
Si la loi de X admet la densit´e f, celle de X + Y admet la densit´e f ∗PY.
Preuve. — La variable X + Y est ´egale `a la composition S◦ (X,Y), donc sa loi est l’image de la loi du couple par l’application somme S ; comme X et Y sont suppos´ees ind´ependantes, la loi du couple est PX⊗PY, donc celle de X + Y est la convol´ee.
Exemple.Soient T1et T2deux variables exponentielles de param`etreλ; la loi de T1+T2 admet la densit´e obtenue en convolant deux exemplaires de la densit´ef(x) =λ1x>0e−λx,
x→
Z
R
f(x−y)f(y) dy= Z
R
λ1x−y>0e−λ(x−y)λ1y>0e−λy dy.
Le r´esultat est nul si x < 0 (aucun y ne v´erifie dans ce cas les deux conditions y ≥0 et x−y≥0), et quand x≥0 on trouve
λ2e−λx Z x
0
dy =λ2xe−λx, donc la densit´e de la loi de T1+ T2 est
λ21x>0xe−λx.
VI.3. Techniques de Fourier
D´efinition.La fonction caract´eristique ϕX d’une variable al´eatoire r´eelle X est la fonc- tion `a valeurs complexes d´efinie sur R par
∀t ∈R, ϕX(t) = E eitX.
On verra que la loi PX est d´etermin´ee par la fonction caract´eristique ϕX (injectivit´e de la transformation de Fourier).
Exemple. Pour une variable al´eatoire gaussienne centr´ee r´eduite G, on a, d’apr`es un calcul fait pr´ec´edemment,
∀t ∈R, ϕG(t) = Z
R
eitxe−x2/2 dx
√2π = e−t2/2.
Pour une mesureµpositive born´ee sur (R,BR), on d´efinit latransform´ee de Fourierµb de la mesure µ, qui est la fonction d´efinie sur R par
∀t∈R, µ(t) =b Z
R
e−itx dµ(x) de sorte que
ϕX(t) =PcX(−t).
Si f est int´egrable sur R, on d´efinit sa transform´ee de Fourier fbpar
∀t∈R, fb(t) = Z
R
e−itxf(x) dx,
ce qui est coh´erent avec la d´efinition donn´ee pour les mesures, dans le cas o`u on a d’un cˆot´e une fonction f ≥ 0 int´egrable et de l’autre la mesure dµ(x) = f(x) dx dont la densit´e est la mˆeme fonction f,
fb(t) = Z
R
e−itxf(x) dx= Z
R
e−itx dµ(x) =µ(t).b Si f est nulle en dehors de ]−π, π], on voit que pour tout n∈Z,
fb(n) = Z
R
e−inxf(x) dx= Z π
−π
e−inxf(x) dx
est 2π fois le coefficient de Fourier cn(f0) de la fonction 2π-p´eriodique f0 sur R qui co¨ıncide avec f sur ]−π, π]. Toutes ces transformations sont des formes d’une mˆeme technique, la transformation de Fourier. On va montrer un r´esultat d’inversion de Fourier pour les mesures, qu’on appliquera en particulier aux lois des variables al´eatoires.
Th´eor`eme. Soit µune mesure finie sur (R,B); pour tous a < b, on a 1
2µ({a}) +µ(]a, b[) +1
2µ({b}) = lim
ε&0
Z b a
1 2π
Z
R
b
µ(t) e−ε2t2/2eitx dt dx.
Soit X une variable al´eatoire ; la loi PX est uniquement d´etermin´ee par la fonction caract´eristique ϕX; pr´ecis´ement, pour tous a < b r´eels
P(X =a)
2 + P(a <X< b) + P(X =b)
2 = lim
ε&0
Z b a
1 2π
Z
R
ϕX(t) e−ε2t2/2e−itx dt dx.
L’apparition du noyau gaussien dans la formule n’est pas une fatalit´e : on aurait pu utiliser d’autres fonctions y → k(y) dont on aurait v´erifi´e d’avance que la transform´ee de Fourier donne une densit´e de probabilit´e sur R, par exemple
k(y) = 1 2π e−|y|
dont la transform´ee de Fourierbk est la densit´e de Cauchy
x ∈R → 1
π(1 +x2). On obtiendrait alors, par la mˆeme preuve, la formule
P(X =a)
2 + P(a <X < b) + P(X =b)
2 = lim
ε&0
Z b a
1 2π
Z
R
ϕX(t) e−ε|t|e−itx dt dx.
Ce qui est n´ecessaire, c’est d’introduire un facteur, tel que e−ε2t2/2 ou e−ε|t|, ε >0, qui fait converger les int´egrales, qui ne seraient pas en g´en´eral convergentes sinon.
Lemme. On donne a < b et on suppose que µ est une mesure finie sur R. On d´esigne par γ la probabilit´e gaussienne de densit´e (2π)−1/2e−x2/2 sur R, et pour toutε > 0, on d´esigne par Cε le domaine
Cε={(x, y) :a < x+εy ≤b} ⊂R2. Quand ε&0, on a
ε&0lim(µ⊗γ)(Cε) = 1
2µ({a}) +µ(]a, b[) + 1
2µ({b}).
ε→0 ε→0
Cε
a b
Le domaine oblique gris´e Cε
est form´e des points (x, y) tels que a < x+εy ≤ b. Quand ε→0, le domaine oblique Cε
tend vers le domaine C∗ ob- tenu en ajoutant `a la bande verticale form´ee des (x, y) tels que a < x < bles deux demi- droites des (a, y) avec y > 0 et des (b, y) avec y≤0.
Preuve du lemme. — Introduisons aussi le domaine
C∗ ={(a, y) :y >0} ∪ {(x, y) :a < x < b} ∪ {(b, y) :y ≤0}.
On voit que quand ε &0,
1Cε(x, y)→1C∗(x, y),
pour tout point (x, y) ∈ R2, et la convergence est domin´ee par la fonction 1, qui est int´egrable sur R2 pour la mesure finie µ⊗γ. Par convergence domin´ee,
(µ⊗γ)(Cε) = Z
R2
1Cεd(µ⊗γ)
tend vers (µ⊗γ)(C∗). Mais l’ensemble C∗ est la r´eunion disjointe de trois sous-ensembles de R2 qui sont des produits,
{a}×]0,+∞[, ]a, b[×R, {b}×]−∞,0].
Il en r´esulte que
(µ⊗γ)(C∗) =µ({a})γ(]0,+∞[) +µ(]a, b[)γ(R) +µ({b})γ(]−∞,0])
= 1
2µ({a}) +µ(]a, b[) +1
2µ({b}).
Preuve du th´eor`eme. — On note d’abord que la formule d’inversion est vraie pour la densit´e gaussienne : en effet, le calcul de la transform´ee de Fourier de la densit´e gaussienne redonne un multiple de la densit´e gaussienne, et on peut ´ecrire
(∗) ∀y ∈R, e−y2/2
√2π = 1 2π
Z
R
e−u2/2eiuy du.
Posons ξ = µ⊗γ pour abr´eger. D’apr`es le lemme pr´ec´edent, il suffit de montrer que pour tout ε >0, on a
ξ(Cε) = Z b
a
1 2π
Z
Rµ(v) eb −ε2v2/2eivz dv dz.
On ´ecrit d’abord que
ξ(Cε) = Z
R2
1{a<x+εy6b}
e−y2/2
√2π dydµ(x).
En injectant la repr´esentation (∗) de la densit´e gaussienne par Fourier, on obtient ξ(Cε) =
Z
R2
1{a<x+εy6b}
Z
R
1
2π e−u2/2eiuy du
dydµ(x).
Cette int´egrale en trois variables peut ˆetre trait´ee par Fubini, car la fonction de trois variables
h(x, y, u) =1{a<x+εy6b}e−u2/2eiuy
est bor´elienne et int´egrable sur R3 par rapport `a la mesure consid´er´ee, Z
R3
1{a<x+εy6b}e−u2/2|eiuy|dydudµ(x) =
= Z
R
Z
R2
1{a<x+εy6b}e−u2/2 dydu
dµ(x) = b−a ε
√2π <+∞.
On ´ecrit par cons´equent avec Fubini ξ(Cε) = 1
2π Z
R
Z
R2
1{a<x+εy6b}e−u2/2eiuy dydu dµ(x),
et pour xfix´e, par le changement de variables affine (y, u)∈R2 →(z, v) = (εy+x, u/ε) de d´eterminant ´egal `a 1, on a (z −x)v = yu, dzdv = dydu et on obtient, apr`es ce changement dans l’int´egrale double int´erieure,
ξ(Cε) = 1 2π
Z
R
Z
R2
1{a<z6b}e−ε2v2/2eiv(z−x) dzdv
dµ(x) ; puis, `a nouveau par un Fubini que le lecteur justifiera,
ξ(Cε) = 1 2π
Z
R2
1{a<z6b}e−ε2v2/2eivzZ
R
e−ivx dµ(x) dzdv
= Z b
a
1 2π
Z
R
e−ε2v2/2eivzµ(v) dvb dz, ce qui termine la preuve du th´eor`eme.
Remarque. On peut modifier la formule pour avoir directement la mesure de ]a, b], par exemple
µ(]a, b]) = lim
ε&0
Z b+√ ε
a+√ ε
1 2π
Z
R
b
µ(t) e−ε2t2/2eitx dt dx.
Pour le voir, il suffit de modifier la d´efinition des ensembles Cε, pour qu’ils tendent vers la bande ]a, b]×R, par exemple en consid´erant
1{a<x+εy−√
ε6b} −→
ε→0
1{a<x6b}.
On peut aussi prouver l’´enonc´e plus g´en´eral suivant : si ψ est Lebesgue-int´egrable sur R, born´ee surR, siψadmet en tout point des limites `a droite et `a gauche not´ees respectivement ψ(x+ 0) etψ(x−0), et si on pose pour toutx r´eel
ψ∗(x) = ψ(x+ 0) +ψ(x−0)
2 ,
alors pour toute mesure µfinie sur (R,B) on a Z
R
ψ∗(x) dµ(x) = lim
ε&0
Z
R
ψ(x) 1 2π
Z
R
b
µ(t) e−ε2t2/2eitx dt dx.
On peut pr´ef´ererhhlisseriila formule, en introduisant ψ continue sur R et `a support com- pact ; alorsψ∗ =ψ et dans ce cas
Z
R
ψ(x) dµ(x) = lim
ε&0
Z
R
ψ(x) 1 2π
Z
R
b
µ(t) e−ε2t2/2eitx dt dx.
Pour rapprocher cette formule du th´eor`eme qu’on a d´emontr´e, on prendra pour ψ une fonction continue ´egale `a 1 sur [a, b] et nulle en dehors de [a−δ, b+δ], δ >0 hhpetitii.