Université Paris 13, Institut Galilée — MACS 1 Année universitaire 2015–2016
Intégration & Probabilités
Laurent Tournier
Intégration
Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016
0. Préliminaires sur les ensembles
1 Notations
SoitE un ensemble.
– SiA est une partie deE (c’est-à-direA⊂E), on noteAc=E\Ale complémentaire deA.
– On noteP(E)l’ensemble des parties deE.
– Si la famille(Ai)i∈I de parties deE est disjointe (c’est-à-dire que Ai∩Aj =∅ pour tous i6=j dans I), on peut noter]
i∈I
Ai leur réunion (le “+” rappelle que lesAi sont disjoints).
– Si la suite (An)n∈N de parties deE est croissante (c’est-à-dire queAn ⊂An+1 pour toutn ∈N), on peut noter [
%
n∈N
An leur réunion (la flèche rappelle que la suite est croissante).
– Si la suite(An)n∈N de parties de E est décroissante (c’est-à-dire queAn+1 ⊂An pour tout n∈N), on peut noter \
&
n∈N
An leur intersection (la flèche rappelle que la suite est décroissante).
– SiA est une partie deE, on note1A sa fonction indicatrice :
1A: E → {0,1}
x 7→ 1A(x) =
(1 six∈A 0 six /∈A.
– Si une suite réelle(un)n∈N est croissante, on peut noter lim↑nun sa limite (dans R).
– Si une suite réelle(un)n∈N est décroissante, on peut noter lim↓nun sa limite (dans R).
2 Dénombrabilité
Définition
Un ensemble E estdénombrablesiE =∅ou s’il existe une application ϕ:N→E surjective, c’est-à-dire que
E=ϕ(N) ={ϕ(n)|n∈N}={ϕ(0),ϕ(1),ϕ(2), . . .}.
Autrement dit,E est dénombrable si on peuténumérer ses éléments, en faire une liste (éventuellement infinie).
Exemples.
– les ensembles finis sont dénombrables (si E = {x1, . . . ,xn}, on a E = ϕ(N) pour ϕ : N → E définie par ϕ(i) =xi si1≤i≤net ϕ(i) =xn pour touti > n)
– Nest évidemment dénombrable :N={0,1,2,3, . . .}
– Zest dénombrable : par exemple,
Z={0,1,−1,2,−2,3,−3, . . .},
où on alterne entiers positifs et négatifs par ordre croissant de valeur absolue.
– N×N={(m,n)|m∈N,n∈N}est dénombrable : par exemple, N×N=
(0,0),(1,0),(0,1),(2,0),(1,1),(0,2), . . . ,
où on énumère les couples dont la somme vaut 0, puis 1, puis 2, etc. (à chaque fois, il y en a un nombre fini).
– Qest dénombrable : par exemple, (quitte à répéter certains rationnels plusieurs fois) Q=
0,1 1,−1
1,1 2,−1
2,2 1,−2
1,3 1,−3
1,1 3,−1
3,4 1,−4
1,3 2,−3
2,2 3,−2
3,1 4,−1
4, . . .
où on énumère les fractions dont la somme des valeurs absolues du numérateur et du dénominateur vaut 0, puis 1, puis 2, etc. (il y en a un nombre fini pour une somme donnée), en alternant positifs et négatifs.
– R n’est pas dénombrable : on peut le démontrer à l’aide de l’argument de la diagonale de Cantor. Il suffit de montrer que [0,1] n’est pas dénombrable (ceci est justifié par la propriété a) suivante). Supposons, par l’absurde, que ce soit le cas : on aurait[0,1] =ϕ(N) ={ϕ(0),ϕ(1), . . .} pour une fonctionϕ:N→[0,1]. Mais alors on peut facilement donner un réelx∈[0,1]différent deϕ(n)pour toutn∈N: il suffit que pour toutn, lan-ième décimale de x soit choisie différente de lan-ième décimale de ϕ(n), et différente de 0 et 9 (cette précision évite quexsoit un nombre décimal et n’ait pas une écriture unique : 0,4999. . .= 0,5000. . .). Ainsi pour toutn,xest différent deϕ(n)(comme leursn-ièmes décimales diffèrent, x6=ϕ(n)si le développement deϕ(n)est unique, etx6=ϕ(n)aussi sinon car alorsϕ(n)est décimal orxne l’est pas). On obtient donc une contradiction avec le fait que la suite précédente énumère tous les éléments de [0,1], d’où il résulte que[0,1]
n’est pas dénombrable.
Propriétés
a) Si E⊂F et F est dénombrable, alorsE est dénombrable aussi.
b) SiE etF sont dénombrables, alorsE×F sont dénombrables.
c) Si, pour toutn, En est dénombrable, alors[
n
En est dénombrable.
Démonstration : a) SiE ouF est vide, c’est vrai. Sinon, on choisitx0∈E, etϕtelle queF =ϕ(N). AlorsE=ψ(N) oùψ(n) =ϕ(n)siϕ(n)∈Eetψ(n) =x0 siϕ(n)∈/E, ce qui montre queEest dénombrable.
b) On a vu queN×Nest dénombrable : il existeϕ:N→N×Ntelle queN×N=ϕ(N). Si E ouF est vide,E×F aussi, donc est dénombrable. Sinon, il existeϕEetϕF telles queE=ϕE(N)etF=ϕF(N). On a alorsE×F=ψ(N)où
ψ:k7→(ϕE(ϕ1(k)),ϕF(ϕ2(k)))
en notant ϕ(k) = (ϕ1(k),ϕ2(k)) ∈ N×N. En effet, pour tousx ∈ E et y ∈F, il existe m,n tels quex =ϕE(m) et y=ϕF(n), et il existektel queϕ(k) = (m,n), d’où(x,y) = (ϕE(m),ϕF(n)) = (ϕE(ϕ1(k)),ϕF(ϕ2(k))) =ψ(k).
c) On utilise à nouveau la fonctionϕci-dessus, telle queN×N=ϕ(N). On peut supposer queEn6=∅pour toutncar les ensembles vides ne modifient pas la réunion. Pour toutn∈N, il existe alors ψn:N→En telle queEn=ψn(N). Et on aS
nEn=ξ(N), où
ξ:k7→ψϕ1(k)(ϕ2(k)).
En effet, pour toutx∈ S
nEn, il existen tel que x∈En, donc il existem tel que x=ψn(m), et il existe k tel que (n,m) =ϕ(k), d’oùx=ξ(k).
Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016
1. Espace mesurés
On définit ici les éléments qui nous serviront de cadre pour la théorie de l’intégration.
1 Tribus
Définition
SoitE un ensemble. Unetribu(ouσ-algèbre) surE est un ensembleAde parties deE telle que (i) ∅ ∈ A;
(ii) si A∈ A, alorsAc ∈ A(stabilité par passage au complémentaire) (iii) si(An)n∈N est une suite de parties dansA, alors [
n∈N
An∈ A;(stabilité par union dénombrable) (E,A)est unespace mesurable. Une partieA∈ Aest ditemesurable.
Les conséquences suivantes sont aussi importantes que la définition : Propriétés
a) E∈ A;
b) siA1, . . . ,An∈ A, alorsA1∪ · · · ∪An∈ A; c) si(An)n∈N est une suite de parties dansA, \
n∈N
An∈ A; (stabilité par intersection dénombrable) d) siA1, . . . ,An∈ A, alorsA1∩ · · · ∩An∈ A;
e) siA,B∈ AetA⊂B, alorsB\A∈ A.
Démonstration : a) résulte de (i) et (ii) carE=∅c. b) résulte de (i) et (iii) en prenantAk=∅pour toutk > n.
c) résulte de (i) et (iii) car
[
n
An=
\
n
(An)c c
. d) résulte de c) en prenantAk=E pour toutk > n.
e) résulte de (ii) et d) carB\A=B∩Ac.
Attention.Si(Ai)i∈I est une famille de parties mesurables, alors les ensembles[
i∈I
Ai et\
i∈I
Aisont mesurables à condition queIest dénombrable (car on peut écrireI={in|n∈N}et doncS
iAi=S
nAin) ; mais siIn’est pas dénombrable, alors ce n’est pas toujours vrai.
Exemples.
– P(E)est latribu discrètesurE.
– {∅,E}est latribu grossièresurE.
Définition-proposition
Soit C un ensemble de parties de E. Il existe une plus petite tribu qui contient C. On la note σ(C), et on l’appelle latribu engendrée par C.
Démonstration : Par la définition de tribu, on voit facilement que l’intersection d’une famille de tribus est une tribu (le vérifier en exercice). En particulier, l’intersection de toutes les tribus surEcontenantC est une tribu, et c’est la plus petite : par sa définition, elle est incluse dans toute tribu contenantC.
– surRd, la tribu borélienneest la tribu engendrée par les ouverts. On la note B(Rd). On peut vérifier que B(Rd)est aussi la tribu engendrée par les intervalles deRd. Ses éléments sont lesboréliens.
Ainsi, tout ensemble construit à partir d’intervalles à l’aide des opérations de passage au complémentaire, d’union dénombrable et d’intersection dénombrable, est un borélien.En pratique,tous les sous-ensembles deR que l’on manipule sont obtenus ainsi et sont donc boréliens.
2 Mesures
Soit(E,A)un espace mesurable.
Définition
Une mesuresur(E,A)est une applicationµ:A →[0,+∞]telle que (i) µ(∅) = 0
(ii) pour toute suite(An)n∈N de parties mesurablesdisjointes,µ
]
n∈N
An
=X
n∈N
An.
(E,A,µ)est unespace mesuré.µ(E)est lamasse totaledeµ. On dit queµestfiniesiµ(E)<∞.
Les conséquences suivantes sont aussi importantes que la définition : Propriétés
a) Si A1, . . . ,An ∈ Asont disjoints, alorsµ(A1] · · · ]An) =µ(A1) +· · ·+µ(An).
b) SiA,B∈ Aet A⊂B, alorsµ(A)≤µ(B)et, siµ(A)<∞, alorsµ(B\A) =µ(B)−µ(A).
c) Pour tousA,B∈ A, etµ(A∩B)<∞, alorsµ(A∪B) =µ(A) +µ(B)−µ(A∩B).
d) Si(An)n est une suite croissante de parties mesurables, alorsµ [
%
n
An
= lim↑
n
µ(An).
e) Si (An)n est une suite décroissante de parties mesurables, etµ(A0)<∞, alorsµ \
&
n
An
= lim↓
n
µ(An).
f) Pour toute suite(An)n de parties mesurables,µ [
n
An
≤X
n
µ(An).
Démonstration : a) résulte de (ii) et (i) en prenantAk=∅sik > n
b) On a la réunion disjointeB=A](B\A)donc par a)µ(B) =µ(A) +µ(B\A)≤µ(A)carµest à valeurs positives.
Siµ(A)<∞, on peut retrancher cette quantité à chaque membre de l’égalité précédente pour obtenir la formule.
c) On a la réunion disjointeA∪B=A](B\(A∩B))doncµ(A∪B) =µ(A) +µ(B\(A∩B))et siµ(A∩B)<∞, la formule se déduit alors de b).
d) Pour toutn,An⊂An+1donc par b)µ(An)≤µ(An+1): la suite(µ(An))nest croissante. On poseC0=A0 et, pour toutn≥1,Cn=An\An−1∈ Ade sorte que, pour toutn,An=C0] · · · ]Cn, et doncS
nAn=U
nCn. Alors µ
[
n
An
=µ
]
n
Cn
=X
n
µ(Cn) = lim↑
N N
X
n=0
µ(Cn) = lim↑
N
µ N
]
n=0
Cn
= lim↑
N
µ(AN).
e) En notantBn=A0\An, alors la suite(Bn)nest croissante etS
nBn=A0\T
nAn, ce qui permet de déduire e) de d) à l’aide de b) vu que pour toutn,An⊂A0donc µ(An)≤µ(A0)<∞.
f) On poseC0=A0 et, pour toutn≥1,Cn=An∩(A0∪ · · · ∪An−1)c∈ A, de sorte que les ensemblesCnsont disjoints et, pour toutn,A0∪ · · · ∪An=C0] · · · ]CndoncS
nAn=U
nCn. Alors µ
[
n
An
=X
n
µ(Cn),
maisCn⊂Andoncµ(Cn)≤µ(An), ce qui donne l’inégalité attendue.
Exemples.
– SoitE un ensemble. Sur(E,P(E)), lamesure de comptageµE est définie par : pour toutA⊂E, µE(A) =
(Card(A) siAest fini
∞ siAest infini.
Ainsi, «µE place un poids 1 en chaque point de E»
– Soit(E,A)un espace mesurable, et x∈E. Lamesure de Dirac en xest la mesureδx définie par : pour toutA∈ A, δx(A) =
(1 six∈A
0 six /∈A =1A(x).
Ainsi, «δ place un poids 1 au point x»
– Si(µn)n≥0 est une suite de mesures sur(E,A)et(αn)n≥0 une suite de réels positifs, alors on peut définir la mesureµ=P
n≥0αnµn par
pour toutA∈ A, µ(A) =X
n≥0
αnµn(A).
En particulier, si(xn)n≥0est une suite de points deE, on peut considérerµ=P
n≥0αnδxn qui, pour toutn,
« place un poidsαn enxn ».
Définition-théorème
Il existe une unique mesure λd sur(Rd,B(Rd))telle que, pour tout pavé fermé[a1,b1]× · · · ×[ad,bd], λd [a1,b1]× · · · ×[ad,bd]
=|b1−a1| · · · |bd−ad|.
On l’appelle mesure de Lebesgue sur Rd.
Démonstration : Un peu longue : voir document sur mon site internet.
– surR, la mesureλ=λ1 vérifieλ([a,b]) =b−apour tout segment[a,b]aveca≤b. Cette mesure correspond donc à lalongueur sur R. Le théorème signifie que l’on peut définir la longueur de n’importe quel borélien, et qu’elle vérifie la condition (ii).
– sur R2, la mesure λ2 vérifie λ2([a,b]×[c,d]) = (b−a)(d−c)pour tout rectangle [a,b]×[c,d] avec a≤b et c≤d. Cette mesure correspond donc à l’aire surR2.
– surR3, la mesureλ3 correspond de même auvolume.
Propriétés
a) λd estinvariante par translation: pour toutA∈ B(Rd)eta∈Rd, λd(a+A) =λd(A),
oùa+A={a+x|x∈A}.
b) λd esthomogène de degré d: pour toutA∈ B(Rd)et t∈R, λd(tA) =|t|dλd(A), oùtA={tx|x∈A}.
Pour montrer que deux mesures sont égales, il suffit de comparer leurs valeurs sur les pavés : Proposition
Soitµ,ν deux mesures sur(Rd,B(Rd)). Si, pour tout pavé ferméP,µ(P) =ν(P)<∞, alorsµ=ν. Définition
Soitµune mesure sur(E,A).
– Si A∈ Aest tel queµ(A) = 0, on dit queAest négligeable.
On peut préciser « µ-négligeable », ou « négligeable pour la mesureµ », si la mesureµ n’est pas claire d’après le contexte.
– Si une propriétéPx est vraie pour toutx∈A, où Ac est négligeable pour la mesureµ, on dit quePx est vraie pour presque toutx, ou encore queP est vraiepresque partout.
On peut préciser «µ-presque partout », ou « presque partout pour la mesureµ», si la mesureµn’est pas claire d’après le contexte.
Sans précision, surRd, « presque tout » fait référence à la mesure de Lebesgueλd.
3 Fonctions mesurables
Les démonstrations de cette partie se trouvent sur mon site internet.
Définition
Soit(E,A)et(F,B)des espaces mesurables. Une application f :E→F estmesurablesi pour toutB∈ B, f−1(B)∈ A.
Proposition
Les fonctions continues f :Rd →Rd0 sont mesurables (pour les tribus boréliennes).
On considèrera souvent des fonctions f sur (E,A) à valeurs dans R= R∪ {−∞,+∞}, c’est-à-dire que l’on pourra avoirf(x) = +∞ouf(x) =−∞pour certainsx∈E. La tribuB(R)est formée des boréliens deRet de tous les ensembles de la formeB∪ {+∞},B∪ {−∞}etB∪ {+∞,− ∞}, pourB∈ B(R).
Dire quef est mesurable signifie alors que, pour toutB∈ B(R),f−1(B)∈ A, et aussi que f−1({+∞})∈ Aet f−1({−∞})∈ A.
Propriétés
Si f,g:E→Rsont mesurables, et si(fn)n est une suite de fonctions mesurables de EdansR, alors a) la somme f+g est mesurable
b) le produitf gest mesurable
c) les fonctionssupnfn etinfnfn (à valeurs dansR) sont mesurables d) la valeur absolue|f|est mesurable
e) les fonctionslim infnfn etlim supnfn (à valeurs dansR) sont mesurables f) sifn(x)→h(x)∈Rpour toutx∈E, alorshest mesurable.
Un rappel surlim inf etlim supse trouve dans le chapitre suivant, page 12.
Ainsi, toute fonction de Rd dansR obtenue à partir de fonctions continues par ces opérations est mesurable.
En pratique, toutes les fonctions que l’on manipule sont obtenues ainsi et sont donc mesurables pour les tribus boréliennes.
Il en va de même pour les fonctions deRd dansRd0 par la proposition suivante : Proposition
Une fonctionf :Rd→Rd0 est mesurable si, et seulement si ses composantes le sont.
Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016
2. Intégration par rapport à une mesure
Soit(E,A,µ)un espace mesuré.
1 Intégrale de fonctions mesurables positives
Définition
Une fonction étagée sur (E,A) est une fonction mesurable g : (E,A) → (R,B(R)) qui ne prend qu’un nombre fini de valeurs. Autrement dit, il existeα1, . . . ,αn ∈R(les valeurs) etA1, . . . ,An∈ A disjoints tels que
pour toutx∈R, g(x) =
n
X
i=1
αi1Ai(x) =
α1 six∈A1
...
αn six∈An 0 sinon.
NB. Les fonctions en escalier surRsont étagées (c’est le cas où lesAisont des intervalles), mais il y a beaucoup plus de fonctions étagées, par exempleg=1Q.
Ces fonctions forment un espace vectoriel.
Définition
Si g est étagée et positive (autrement dit, αi≥0pour i= 1, . . . ,n) alors, avec l’écriture deg ci-dessus, on définit
Z gdµ=
n
X
i=1
αiµ(Ai)∈[0,+∞], avec la convention que, si αi= 0et µ(Ai) =∞, alorsαiµ(Ai) = 0.
On peut vérifier que cette définition ne dépend pas du choix de l’écriture de g sous la formeg=P
iαi1Ai, que les ensembles Ai soient disjoints ou non.
En particulier,
Z
1Adµ=µ(A). Propriétés
Soitg,h des fonctions étagées positives.
a) Pour tous réelsa,b≥0,R
(ag+bh)dµ=aR
gdµ+bR hdµ.
b) Sig≤h, alorsR
gdµ≤R hdµ.
Démonstration : Sig=P
iαi1Ai eth=P
jβj1Bj avec(Ai)i disjoints, et(Bj)j disjoints, alors en introduisant les ensemblesAij=Ai∩Bj, la fonctionaf+bhprend la valeuraαi+bβj surAij, ce qui permet d’obtenir a) ; et surAij
la fonctiongvaut αi ethvaut βj donc, siAij6=∅,αi≤βj, ce qui permet d’obtenir b).
Définition
Soitf :E→[0,+∞]mesurable. On note Z
f dµ= sup
hétagée, 0≤h≤f
Z
h dµ∈[0,+∞],
et cette quantité est appelée l’intégrale de f par rapport à µ.
NB. On utilise aussi les notations suivantes :R
f dµ=R
f(x)dµ(x) =R
f(x)µ(dx)et on peut spécifier R
E. Dans la suite, de même que dans cette définition, une fonction « mesurable positive » est supposée prendre ses valeurs dans[0,+∞].
Notons que par la propriété b) ci-dessous, sif =∞ ·1A (autrement dit,f(x) =∞six∈Aetf(x) = 0sinon) avecµ(A) = 0alorsR
f dµ=“∞·0” = 0. Ainsi, pourα∈R+∪{+∞},R
α1Adµ=αµ(A)avec “0·∞=∞·0 = 0”.
Propriétés
Soitf,g des fonctions mesurables positives.
a) Si f ≤g, alorsR
f dµ≤R gdµ.
b) Sif = 0presque partout (pour la mesureµ), alorsR
f dµ= 0.
Démonstration : Sif≤g, alors toute fonction étagéehtelle que0≤h≤fvérifie aussi0≤h≤g, d’où a) (le sup qui définit l’intégrale degporte sur un ensemble plus grand, donc est plus grand).
Sif= 0presque partout, et0≤h≤fest étagée, on ah=P
iαi1Ai (avecAidisjoints) et, siαi>0, on a, pourx∈Ai, f(x) ≥h(x) =αi >0, doncAi ⊂ {x∈R|f(x)6= 0}d’où µ(Ai) ≤µ({f 6= 0}) = 0et doncµ(Ai) = 0; on déduit que Rhdµ=P
iαiµ(Ai) = 0. D’où b).
Théorème (Théorème de convergence monotone (TCM))
Soit(fn)n une suitecroissantede fonctions mesurablespositives. Alors Z
lim↑
n
fndµ= lim↑
n
Z fndµ.
Démonstration : On notef= lim↑nfn, qui est une fonction mesurable positive.
Pour toutn,fn≤fn+1, d’oùR
fndµ≤R
fn+1dµ. Ainsi, la suite
Rfndµ
n est croissante et donc converge (dansR).
De même, pour toutn,fn≤f, d’oùR
fndµ≤R
f µ, et en passant à la limite on a lim↑
n
Z
fndµ≤ Z
f dµ.
Il reste à voir l’inégalité inverse.
Soithune fonction étagée telle que0≤h≤f. Soitε >0.
Pour tout x ∈ E, si h(x) > 0, on a lim↑nfn(x) = f(x) ≥ h(x) > (1−ε)h(x) donc il existe n (grand) tel que fn(x)≥(1−ε)h(x); et sih(x) = 0alorsfn(x) = 0pour toutndonc évidemmentfn(x)≥(1−ε)h(x). Autrement dit,
E=[
%
n
En, où En={x∈E|fn(x)≥(1−ε)h(x)} ∈ A.
Par définition deEn, on a pour toutx∈En,fn(x)≥(1−ε)h(x). Par conséquent, commefn≥0, on afn≥(1−ε)h1En. Commehest étagée, elle s’écrith=P
1≤i≤rαi1Ai, si bien queh1En=P
1≤i≤rαi1Ai∩En est étagée elle aussi et Z
fndµ≥ Z
(1−ε)h1Endµ= (1−ε)
r
X
i=1
αiµ(Ai∩En).
Soit1≤i≤r. La suite(Ai∩En)nest croissante (car(En)nest croissante) et sa réunion estAi(car la réunion desEn
estE) donc
lim↑
n
µ(Ai∩En) =µ(Ai).
En passant à la limite dans l’inégalité précédente, on a donc lim↑
n
Z
fndµ≥(1−ε)
r
X
i=1
αiµ(Ai) = (1−ε) Z
hdµ.
Pourε→0, ceci donne
lim↑
n
Z
fndµ≥ Z
hdµ.
Et ceci vaut pour toute fonctionhétagée telle que0≤h≤f, donc on a finalement lim↑
n
Z
fndµ≥ Z
f dµ, ce qui conclut la preuve.
Par le TCM, pour calculerR
f dµ, on peut considérerlim↑nR
fndµpour n’importe quelle suite croissante(fn)n
qui converge versf. Par exemple une suite de fonctions étagées : Lemme
Si f est mesurable positive, alors il existe une suite croissante (fn)n de fonctions étagées positives qui converge versf.
Démonstration : On peut prendre fn(x) =
(k
2n sif(x)∈k 2n,k+12n
etf(x)< n
n sif(x)≥n. .
La distinction permet de s’assurer quefnne prend qu’un nombre fini de valeurs même si f n’est pas bornée. Le choix de2n assure la croissance defn (la subdivision se raffine à chaque pas).
Propriétés
Pour f,g mesurables positives, eta,bréels positifs, Z
af+bg dµ=a
Z
f dµ+b Z
gdµ.
Démonstration : Le lemme fournit des suites croissantes(fn)n et(gn)n de fonctions étagées positives qui convergent versfetg. Pour toutn, par les propriétés de l’intégrale des fonctions étagées positives,
Z
(afn+bgn)dµ=a Z
fndµ+b Z
gndµ,
ce qui donne l’égalité annoncée en passant à la limite grâce au TCM.
Le théorème de convergence monotone admet une réécriture en termes de séries : Corollaire (Théorème de convergence monotone pour les séries positives)
Si (fn)n≥0est une suite de fonctions mesurables positives, alors Z ∞
X
n=0
fn
! dµ=
∞
X
n=0
Z fndµ.
Démonstration : On applique le TCM à la suite des sommes partielles Sn = Pn
k=0fk ≥ 0, qui est croissante (car fn≥0), et converge versS=P∞
k=0fk. On a ainsi Z
Sdµ= lim↑
n
Z Sndµ.
Or, par la propriété précédente, Z
Sndµ= Z n
X
k=0
fk
dµ=
n
X
k=0
Z
fkdµ−→
n
∞
X
k=0
Z fkdµ
d’où la conclusion.
Proposition (Inégalité de Markov)
Pour toute fonction mesurable positivef, et tout réel a >0, µn
x∈E
f(x)≥ao
≤ 1 a
Z f dµ.
Démonstration : L’ensembleA={x∈E|f(x)≥a}vérifief≥a1A(pour x∈A,f(x)≥a=a1A(x), et pourx /∈A, f(x)≥0 =a1A(x)). Par suite, en intégrant,
Z f dµ≥
Z
a1Adµ=aµ(A), ce qui donne l’inégalité.
Corollaire
Soitf,g des fonctions mesurablespositives.
a) Si R
f dµ <∞, alorsf <∞presque partout.
b) R
f dµ= 0si, et seulement sif = 0presque partout.
c) Si f =g presque partout, alors R
f dµ=R gdµ.
Démonstration : a) On supposeR
f dµ <∞. Pour toutn, on noteAn={f≥n}(={x∈E|f(x)≥n}, et A∞={f=∞}=\
&
n
An. Pour toutn, on aµ(An)≤n1R
f dµpar l’inégalité de Markov, doncµ(A1)<∞, etµ(An)→0. On a donc µ(A∞) =µ
&\
n
An
= lim↓
n
µ(An) = 0.
b) On suppose R
f dµ= 0. On a {f > 0}=S
%n{f ≥ n1}donc µ({f > 0}) = lim↑nµ({f ≥ n1}) = 0car l’inégalité de Markov donneµ({f≥n1})≤nR
f dµ= 0quel que soitn. La réciproque a déjà été vue.
c) On supposef =g presque partout. En particulier, la fonctionh = max(f,g)−min(f,g) est nulle presque partout etpositive(ce qui n’est peut-être pas le cas def−g), donc R
hdµ= 0. Par la propriété, on a alorsR
max(f,g)dµ= Rmin(f,g)dµ. Ormin(f,g)≤f ≤max(f,g) et de même pourg; en passant aux intégrales, on voit queR
f dµetR f dµ sont encadrées parR
min(f,g)dµetR
max(f,g)dµqui sont égales, et donc en particulierR
f dµ=R gdµ.
On rappelle que, pour une suite de réels(xn)n, on définit lim inf
n xn= sup
n
k≥ninf xk= lim↑
n
k≥ninf xk
et
lim sup
n
xn= inf
n sup
k≥n
xk= lim↓
n
sup
k≥n
xk.
On a les propriétés suivantes : lim supn(−xn) = −lim infnxn, et la suite (xn)n converge si, et seulement si lim infnxn= lim supnxn, et dans ce caslimnxn= lim infnxn= lim supnxn. De façon générale,lim infnxn est la plus petite limite d’une sous-suite de (xn)n (et lim supnxn la plus grande. On dit aussi que ce sont la plus petite valeur d’adhérence de la suite et la plus grande.
Pour une suite (fn)n de fonctionsE → R, on peut alors définir les fonctions lim infnfn et lim supnfn, par : pourx∈E,
lim inf
n fn
(x) = lim inf
n fn(x) et lim sup
n
fn
(x) = lim sup
n
fn(x).
Ces définitions ont aussi un sens si on autorise les valeurs−∞et+∞pour les suites et les fonctions.
Théorème (Lemme de Fatou)
Soit(fn)n≥0 une suite de fonction mesurables positives. On a Z
lim inf
n fn
dµ≤lim inf
n
Z fndµ.
Démonstration : On a, par TCM, Z
lim inf
n fndµ= Z
lim↑
n
k≥ninf fkdµ= lim↑
n
Z
k≥ninf fkdµ.
Or, pour toutn, pour toutm≥n,infk≥nfk≤fm, doncR
infk≥nfkdµ≤R
fmdµ, d’oùR
infk≥nfkdµ≤infm≥nR fmdµ.
En passant à la limite,
lim↑
n
Z
k≥ninffkdµ≤lim↑
n m≥ninf
Z
fmdµ= lim inf
n
Z fndµ,
ce qui donne le résultat vu la première égalité.
NB. Voici trois exemples de suites (fn)n telles que fn → 0 et R
fndµ 6→ 0 (on a même R
nfndµ = 1 pour toutn). On utiliseE=R, muni de la mesure de Lebesgueµ=λ1.
« bosse voyageuse » :fn=1[n,n+1]
« concentration en 0 » :fn=n1[1 n,2n1]
« écrasement » :fn= n11[−n
2,+n2].
2 Fonctions intégrables
Définition
Soitf :E→Rune fonction mesurable.f estintégrable par rapport à µsi Z
|f|dµ <∞.
On pose alors
Z
f dµ= Z
f+dµ− Z
f−dµ∈R,
oùf+= max(0,f)et f−= max(0,−f)sont les parties positive et négative de f. On note L1(E,A,µ)l’espace des fonctions intégrables par rapport àµ.
NB. On a|f| =f++f− ≥f−, ce qui justifie que R
f−dµ <∞et donne un sens à la soustraction ci-dessus.
De même,R
f+dµ <∞doncR
f dµest bien réel.
On abrège souventL1(E,µ), voireL1(E)ou mêmeL1 si le contexte précise(E,A,µ).
Propriétés
a) Pour toute f ∈ L1(E,A,µ), Z
f dµ
≤ Z
|f|dµ b) L1(E,A,µ)est un espace vectoriel, etf 7→R
f dµest une application linéaire deL1(E,A,µ)dansR.
c) Pour f,g∈ L1(E,A,µ), sif ≤g, alors Z
f dµ≤ Z
gdµ.
d) Pourf,g∈ L1(E,A,µ), sif =gpresque partout, alors R
f dµ=R gdµ.
Démonstration : a) On af=f+−f−et|f|=f++f−, donc par inégalité triangulaire,
Z
f dµ
= Z
f+dµ− Z
f−dµ
≤ Z
f+dµ
+ Z
f−dµ
= Z
f+dµ+ Z
f−dµ= Z
(f++f−)dµ= Z
|f|dµ.
b) Décomposer en parties positives et négatives... Exercice.
c)g=f+ (g−f)etg−f≥0doncR
(g−f)dµ≥0etR
gdµ=R
f dµ+R
(g−f)dµ≥R f dµ.
d) sif=gpresque partout, alorsf+=g+ presque partout etf−=g−presque partout (là oùf etgsont égales, leurs parties positives et négatives aussi), doncR
f+dµ=R
g+dµ, de même pourf−etg−d’oùR
f dµ=R gdµ.
Théorème (Théorème de convergence dominée (TCD))
Soit(fn)n une suite de fonctions mesurablesE→R, etf une fonction mesurableE→R. On suppose (i) fn(x)→f(x)pour presque partoutx∈E;
(ii) il existeϕ:E→R+ mesurable telle queR
ϕdµ <∞et
pour toutn, pour presque tout x∈E, |fn(x)| ≤ϕ(x). (hypothèse de domination) Alors, pour tout n,fn ∈ L1(E,A,µ), f ∈ L1(E,A,µ),
Z
fndµ−→
n
Z
f dµ et Z
|fn−f|dµ−→
n 0.
Démonstration : Le fait quefnetf soient intégrables vient des inégalités |fn| ≤ϕet, à la limite,|f| ≤ϕ. Elles sont vraie presque partout, dontR
|fn|dµ≤R
ϕdµ <∞et de même pourf.
Pour simplifier, supposons (i) et (ii) vrais partout. Les fonctionsϕ−fnetϕ+fnsont positives. On peut leur appliquer le lemme de Fatou. Pourϕ−fn :
Z lim inf
n (ϕ−fn)dµ≤lim inf
n
Z
(ϕ−fn)dµ (∗)
Orlim infn(ϕ−fn) =ϕ−f donc Z
lim inf
n (ϕ−fn)dµ= Z
ϕdµ− Z
f dµ.
Et
lim inf
n
Z
(ϕ−fn)dµ= Z
ϕdµ−lim sup
n
Z fndµ.
Ainsi, (∗) donne
lim sup
n
Z
fndµ≤ Z
f.
Les mêmes arguments pourϕ+fndonnent
lim inf
n
Z
fndµ≥inff, d’où finalement
Z
f dµ≤lim inf Z
fndµ≤lim sup
n
Z
fndµ≤ Z
f dµ, ce qui montre que tous les termes sont égaux, et en particulierR
fndµconverge versR f dµ.
On peut alors donner une formule « concrète » de calcul de R
f dµ par approximation, qui correspond à la définition évoquée lors de la présentation du cours :
Corollaire
Soitf une fonction intégrable positive. Pour toute suite de subdivisions 0 =`(n)0 < `(n)1 <· · ·< `(n)N(n)deR telle que
max
0≤i<N(n)`(n)i+1−`(n)i −→
n 0 et `(n)N(n)→+∞, on a
Z
f dµ= lim
n N(n)
X
i=1
`(n)i µ
f−1 [`(n)i ,`(n)i+1[ .
Démonstration : Il s’agit de montrer queR
f dµ= limnR
fndµ, où on a défini les fonctions étagées
fn:x7→
N(n)
X
i=1
`(n)i 1
f−1([`(n)i ,`(n)i+1[)(x) =
(`(n)i si`(n)i ≤f(x)< `(n)i+1, où0≤i < N(n) 0 sif(x)≥`(n)N(n).
Pour toutx∈E on a, pour toutnassez grand,f(x)< `(n)N(n) (par la deuxième condition sur la subdivision), et il existe alorsitel quefn(x) =`(n)i ≤f(x)< `(n)i+1d’où
0≤f(x)−fn(x)< `(n)i+1−`(n)i ≤max
j `(n)j+1−`(n)j −→
n 0
(par la première condition). Ceci montre que(fn)nconverge versf. Il reste à prouver une domination.
Or, sif(x)< `(n)N(n), on a aussi vu quefn(x)≤f(x). Et sif(x)≥`(n)N(n), alorsfn(x) = 0≤f(x). Donc on a, pour toutn, 0≤fn(x)≤f(x). Or on a suppose f intégrable. On peut donc appliquer le TCD à la suite(fn)n, dominée parϕ=f, ce qui conclut.
Notation. Pour A∈ A, on note Z
A
f dµ= Z
f1Adµl’intégrale de f sur A par rapport à µ, lorsqu’elle a un sens, c’est-à-dire sif1Aest positive ou intégrable. Ceci a d’ailleurs un sens même sif n’est pas définie hors deA(car1A vaut alors 0). On dit quef estintégrable sur Asi
Z
A
|f|dµ <∞.
Remarque importante. Toute cette partie s’étend aux fonctions à valeurs dansCetRden intégrant compo- sante par composante : par exemple, une fonction mesurable f :E→Cest intégrable siR
|f|dµ <∞et, dans ce cas,
Z
f dµ= Z
<e(f)dµ+i Z
=m(f)dµ.
Les résultats précédents restent alors vrais avec cette définition (linéarité, TCD).
3 Exemples principaux
3.1 Intégrale par rapport à une mesure atomique
(On dit quexest unatomedeµsi{x} ∈ Aetµ({x})>0) Proposition
Soitf :E→Rune fonction.
a) Soit x∈E.f est intégrable par rapport àδx et Z
f dδx=f(x).
b) Soit(xn)n≥0 une suite d’éléments deE et (αn)n≥0 une suite de réels≥0. On poseµ=X
n≥0
αnδxn. Sif est positive, on a
Z
f dµ=X
n≥0
αnf(xn)∈[0,+∞].
Pour f de signe quelconque, f est intégrable par rapport ൠsi, et seulement si P
nαn|f(xn)|<∞et, dans ce cas,
Z
f dµ=X
n≥0
αnf(xn)∈R.
Démonstration : a) On af=f(x)1{x}presque partout, car ces fonctions coïncident enx, etδx({x}c) = 0. Donc leurs intégrales sont égales :
Z
f dδx= Z
f(x)1{x}dδx=f(x)δx({x}) =f(x) (par la définition de l’intégrale d’une fonction étagée).
b) Soitf mesurable positive. Sig=f1F oùF ={xn|n∈N}, alors f=gpresque partout pour la mesureµ. En effet, f=gsurF, etµ(Fc) = 0. On a doncR
f dµ=R
gdµ. Or on ag= lim↑ngnoùgn=Pn
k=0f(xk)1{xk}donc, par TCM, Z
gdµ= lim↑
n
Z
gndµ= lim↑
n n
X
k=0
f(xk)µ({xk}) =
∞
X
k=0
f(xk)αk,
d’où l’égalité annoncée. Sif est de signe quelconque et intégrable, on applique ce qui précède àf+ etf− pour obtenir le résultat.
Ainsi, siµE est la mesure de comptage surE etf :E→R+, Z
f dµE=X
x∈E
f(x).
3.2 Intégrale par rapport à la mesure de Lebesgue (lien avec l’intégrale de Rie- mann)
On noteλ=λ1(mesure de Lebesgue surR). Soita < b.
Rappel. Une fonction f : [a,b]→Rest intégrable au sens de Riemann si, pour toutε >0, il existe des fonctions en escalierϕetψsur[a,b]telles que
ϕ≤f ≤ψ et
Z b a
(ψ−ϕ)< ε,
où l’intégrale de la fonction en escalierψ−ϕest définie élémentairement (comme pour les fonctions étagées : si ϕ=P
iαi1]xi,xi+1[ alorsRb aϕ=P
iαi(xi+1−xi)). Et dans ce cas on note Z b
a
f = sup
ϕen escalier, ϕ≤f
Z b a
ϕ= inf
ϕen escalier, f≤ψ
Z b a
ψ
Théorème
Si f est intégrable au sens de Riemann sur[a,b], alorsf est intégrable par rapport àλsur[a,b], et Z
[a,b]
f dλ= Z b
a
f.
Démonstration : Commeλ(]xi,xi+1[) =xi+1−xi (etλ({xi}) = 0), la formule est vraie pour les fonctions en escalier (en comparant à la formule pour l’intégrale des fonctions étagées).
Soitf une fonction intégrable au sens de Riemann.f est limite de fonctions en escalier, donc est mesurable. Soitε >0.
Il existeϕ,ψen escalier telles queϕ≤f≤ψ etRb
a(ψ−ϕ)< ε(où l’intégrale est au sens de Riemann ou de Lebesgue, par ce qui précède). En particulierf est bornée donc intégrable sur[a,b]: on a|f| ≤M (oùM =kϕk∞+kψk∞) donc R
[a,b]|f|dµ≤R
[a,b]M dµ= (b−a)M <∞. On a (par les propriétés de l’intégrale de Riemann) Z b
a
ϕ≤ Z b
a
f≤ Zb
a
ψ et aussi (par les propriétés de l’intégrale de Lebesgue)
Z
[a,b]
ϕdλ≤ Z
[a,b]
f dλ≤ Z
[a,b]
ψdλ.
Or Rb aϕ=R
[a,b]ϕdλ car ϕest en escalier, et de même pourψ. Ainsi les deux intégrales def appartiennent au même intervalle de largeur< ε, donc
Z b
a
f− Z
[a,b]
f dλ
< ε.
Ceci vaut pour toutε >0, d’où la conclusion.
Par suite, si I est un intervalle, pour f :I →Rmesurable positive, ou intégrable par rapport à λ, on pourra noter
Z
I
f = Z
I
f(x)dx= Z
I
f dλ, même sif n’est pas intégrable au sens de Riemann, sans confusion possible.
On pourra donc, pour des intégrales au sens de Riemann, appliquer les théorèmes précédents (convergence monotone, dominée, etc.) ; et pour des intégrales de Lebesgue de fonctions intégrables au sens de Riemann, utiliser les propriétés bien connues (intégration par parties, lien entre intégrale et primitive, etc.).
3.3 Intégrale par rapport à une mesure à densité
Soit(E,A)un espace mesurable.
On rappelle que, sif : E → R est mesurable, et A ∈ A, on note Z
A
f dµ= Z
f1Adµ l’intégrale de f sur A, lorsquef1Aest à valeurs positives, ou lorsque f1A est intégrable.
On vérifie facilement avec le TCM que, sif est positive,A7→R
Af dµest une mesure, d’où la définition : Définition
Sif est une fonction mesurableE→[0,+∞], etµune mesure surE, lamesure de densitéf par rapport à µest la mesuref·µ(aussi notéef(x)dµ(x)) définie par :
pour toutA∈ A, (f·µ)(A) = Z
A
f dµ= Z
f1Adµ.
NB.A est négligeable pourf·µdès queAest négligeable pourµou quef est nulle surA.
Proposition
Soitf une fonction mesurableE→[0,+∞], etµune mesure surE.
a) Pour toute fonction mesurable g:E→[0,+∞], on a Z
gd(f·µ) = Z
gf dµ= Z
g(x)f(x)dµ(x),
b) Une fonctiong:E→Rest intégrable par rapport àf·µsi, et seulement sif g est intégrable par rapport à µet, dans ce cas,
Z
gd(f·µ) = Z
gf dµ= Z
g(x)f(x)dµ(x).
Ceci justifie la notationf·µ=f(x)dµ(x). Pour la mesure de Lebesgue, vu le lien avec l’intégrale de Riemann, on notera aussif(x)dxpourf·λ. Par extension, vu que1·µ=µ, on pourra parfois noterdµ(x)pour désigner la mesureµ, et donc dxpour désigner la mesure de Lebesgueλ(ouλ ).
4 Intégrales dépendant d’un paramètre
Dans cette partie, on considère une famille(f(t,·))t∈I de fonctions, indexée par un intervalle réelI: plutôt qu’une suite, il s’agit d’un « continuum » de fonctions, que l’on peut aussi voir comme une fonctionf : I×E →R.
Lorsque les fonctionsf(t,·)sont intégrables, on peut considérer la fonction F :t7→F(t) =
Z
f(t,·)dµ= Z
f(t,x)dµ(x),
que l’on appelle une intégrale à paramètrecar elle dépend du réelt, appelé un paramètre. Le théorème de convergence dominée permet alors d’obtenir facilement des résultats de régularité surF.
Théorème (Théorème de continuité sous l’intégrale)
Soitf : (t,x)7→f(t,x)une fonction mesurable deI×E dansRd ouC(oùI est un intervalle deR).
On suppose que :
– (continuité par rapport au paramètre) pourµ-presque toutx∈E,t7→f(t,x)est continue surI; – (domination) il existe une fonction ϕ: E → R+ mesurable telle que R
ϕ dµ < ∞ et, pour toutt ∈ I, pour µ-presque toutx∈E,
f(t,x)
≤ϕ(x).
Alors la fonction
F :t7→F(t) = Z
f(t,x)dµ(x) est bien définie pour toutt∈I, et est continue surI.
Démonstration : Soitt∈I. On montre queF est continue ent. On utilise la caractérisation des limites par les suites : pour montrer queF(u)→F(t)quandu→t, il suffit de montrer que, pour toute suite(tn)ndansI qui converge verst, F(tn)→F(t).
Soit(un)n une suite dansI qui converge vers t. Appliquons le TCD à la suite des fonctionsfn :x7→f(tn,x). Par la première hypothèse, on a, pour presque toutx∈E,fn(x)→f(t,x). Par la seconde hypothèse, on a, pour toutn, pour presque toutx∈E,
|fn(x)| ≤ϕ(x), etR
ϕdµ <∞. Le TCD donne alors exactementF(tn)−→
n F(t), ce qui conclut.
Théorème (Théorème de dérivation sous l’intégrale)
Soitf : (t,x)7→f(t,x)une fonction deI×E dansRd ouC. On suppose que : – (existence de F)pour toutt∈I, x7→f(t,x)est intégrable ;
– (dérivabilité par rapport au paramètre) pourµ-presque toutx∈E,t7→f(t,x)est dérivable surI, de dérivée notée ∂f∂t;
– (domination de la dérivée)il existe une fonctionϕ:E→R+ mesurable telle queR
ϕ dµ <∞et, pour tout t∈I, pour µ-presque toutx∈E,
∂f
∂t(t,x)
≤ϕ(x).
Alors la fonction
F :t7→F(t) = Z
f(t,x)dµ(x) est dérivable surI et, pour toutt∈I,
F0(t) = Z ∂f
∂t(t,x)dµ(x).
Démonstration : Soitt∈I. Soit une suite(tn)nqui converge verstdansI\ {t}. Il faut montrer que F(tn)−F(t)
tn−t −→
n
Z ∂f
∂t(t,x)dµ(x).
Or par linéarité
F(tn)−F(t) tn−t =
Z f(tn,x)−f(t,x) tn−t dµ(x), donc on va appliquer le TCD à la suite(gn)ndéfinie par
gn:x7→f(tn,x)−f(t,x) tn−t .
Pour presque tout x∈ E, la deuxième hypothèse donnegn(x)→ ∂f∂t(t,x). Et l’inégalité des accroissements finis et la troisième hypothèse donnent : pour toutn, pour presque toutx∈E,
|gn(x)| ≤ sup
u∈[tn,t]
∂f
∂t(u,x)
≤ϕ(x), etR
ϕdµ <∞. Le TCD donne alorsR
gndµ→R ∂f
∂t(t,·)dµ, ce qui conclut.
Remarque :Si de plus la fonctiont7→ ∂f∂t(t,x)est continue pour presque toutx, alors le théorème de continuité montre queF0 est continue, et donc queF est de classeC1 surI.
Deuxième remarque :Pour montrer queF est de classeC2,C3, . . . , on peut appliquer le théorème plusieurs fois. Pour montrer queF est de classeC∞, on peut montrer par récurrence queF est de classeCnpour tout n.
Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016
3. Intégration sur un espace produit, changement de variables
Soit(E,A,µ)et (F,B,ν)deux espaces mesurés. On suppose dans ce chapitre queµet ν sontσ-finies: il existe une suite croissante(En)n de parties deEtelle que
E=[
n
En et pour toutn, µ(En)<∞, et de même pourν.
Pour une fonctionf :E×F →R, on peut considérer Z
E
Z
F
f(x,y)dν(y)
dµ(x). On va montrer que l’on peut voir cette double intégration comme une simple intégration sur l’espaceE×F. Ce point de vue aura l’avantage de mettre en évidence la symétrie des rôles de E et F, et donc de montrer que l’on peut intervertir l’ordre entre les intégrales précédentes. Il fournit de plus une façon de construire une mesure sur l’espaceE×F, qui permettrait de construire l’intégrale de Lebesgue surR2 à partir de l’intégrale de Lebesgue surR, et qui jouera aussi un rôle important dans la notion d’indépendance en probabilités.
1 Produit d’espaces mesurés
On souhaite faire de E×F(= {(x,y)|x∈ E, y ∈ F}) un espace mesuré, c’est-à-dire le munir d’une tribu et d’une mesure, déduites de celles deEet F.
Définition
Latribu produitdeAetBest la tribu A ⊗ Bengendrée par les pavésA×B oùA∈ Aet B∈ B: A ⊗ B=σ
A×B
A∈ A, B∈ B .
Dans le cas des boréliens deRd, cette opération redonne les tribus déjà connues : Proposition
Pour tousd,d0,B(Rd)⊗ B(Rd0) =B(Rd+d0).
Par suite,B(Rd) =B(R)⊗ · · · ⊗ B(R) =B(R)⊗d en définissant de même une mesure produit dedmesures.
Pour tout ensembleC⊂E×F, on définit ses « tranches » : pour toutx∈E, Cx={y∈F|(x,y)∈C} ⊂F
pour touty∈F,
Cy ={x∈E|(x,y)∈C} ⊂E.
On pourrait vérifier que, siC∈ A ⊗ B, alors les tranches sont mesurables.
Théorème
Il existe une unique mesure msur(E×F,A ⊗ B)telle que
pour tousA∈ AetB∈ B, m(A×B) =µ(A)ν(B), (avec ici∞ ·0 = 0· ∞= 0). On la notem=µ⊗ν. De plus, pour toutC∈ A ⊗ B,
µ⊗ν(C) = Z
E
ν(Cx)dµ(x) = Z
F
µ(Cy)dν(y).
Cette mesure s’appelle la mesure produit de µ par ν. La dernière formule décrit une intégration « par tranches » : la mesure deC est l’intégrale des mesures de tranches, horizontales ou verticales.
Dans le cas de la mesure de Lebesgue surRd, le produit redonne les mesures déjà connues : Proposition
Pour tousd,d0,λd⊗λd0 =λd+d0.
Par suite, en notantλ=λ1, on aλd=λ⊗ · · · ⊗λ=λ⊗d, en définissant par récurrence le produit dedmesures.
2 Théorèmes de Fubini
Les propriétés de la mesure produit se transfèrent aisément aux propriétés de l’intégrale et permettent de résoudre la question initiale.
Théorème (Théorème de Fubini-Tonelli)
Pour toute fonction mesurablef :E×F →[0,+∞], Z
E×F
f d(µ⊗ν) = Z
E
Z
F
f(x,y)dν(y)
dµ(x) = Z
F
Z
E
f(x,y)dµ(x)
dν(y).
Démonstration : La formule est vraie si f =1C oùC ∈ A ⊗ B : c’est le précédent théorème. Par suite, la linéarité de l’intégrale montre qu’elle est vraie pour toute fonction étagée positive. Finalement, sif est mesurable positive, alors f= lim↑nfnpour une suite croissante(fn)nde fonctions étagées positives (surE×F), ce qui donne en particulier pour toutx∈E,fx=f(x,·) = lim↑nfn(x,·)et donc, en appliquant deux fois le TCM,
lim↑
n
Z
E
Z
F
fn(x,·)dν
dµ(x) = Z
E
lim↑
n
Z
F
fn(x,·)dν
dµ(x) = Z
E
Z
F
lim↑
n
fn(x,·)dν
dµ(x) = Z
E
Z
F
f(x,·)dν
dµ(x) et, en appliquant une fois le TCM,
lim↑
n
Z
E×F
fnd(µ⊗ν) = Z
E×F
f d(µ⊗ν).
L’égalité pourfn donne alors l’égalité pourf en passant à la limite. L’autre égalité s’obtient de même en échangeant l’ordre d’intégration.
En conséquence de ce théorème, on pourra noter Z
E
Z
F
f(x,y)dν(y)dµ(x)sans parenthèses lorsquef est mesu- rable positive.
On déduit la mesure produit de deux mesures à densité en appliquant le théorème à(x,y)7→f(x)g(y): Proposition
Soitf :E→R+etg:F →R+mesurables. On a :(f·µ)⊗(g·ν) = (f⊗g)·(µ⊗ν), où(f⊗g)(x,y) =f(x)g(y).
Autrement dit,
f(x)dµ(x)
⊗ f(y)dν(y)
=f(x)g(y)d(µ⊗ν)(x,y).
Par ailleurs, le théorème précédent justifie la notation dµ(x)dν(y) pour la mesured(µ⊗ν)(x,y) =µ⊗ν et la proposition prend alors la forme naturelle suivante :
f(x)dµ(x)
g(y)dν(y)
=f(x)g(y)dµ(x)dν(y).
Dans le cas de R2 avec la mesure de Lebesgue, la mesure produit des mesures f(x)dx et g(y)dy est donc naturellementf(x)g(y)dxdy.
En décomposant une fonctionf de signe quelconque enf =f+−f−, on obtient facilement : Théorème (Théorème de Fubini-Lebesgue)
Pour toute fonction mesurablef surE×F à valeurs dansRd ouC, telle que Z
E×F
f(x,y)
d(µ⊗ν)(x,y)<∞,
on a Z
E×F
f(x,y)d(µ⊗ν)(x,y) = Z
E
Z
F
f(x,y)dν(y)
dµ(x) = Z
F
Z
E
f(x,y)dµ(x)
dν(y).
NB.Par le théorème de Fubini-Tonelli, la condition équivaut à Z
E
Z
F
f(x,y) dν(y)
dµ(x)<∞ ou
Z
F
Z
E
f(x,y) dµ(x)
dν(y)<∞.
3 Changements de variables
3.1 Mesure image
On définit ici une façon de « transporter » une mesure d’un espace à un autre, par une fonction. Cette opération sera notamment importante en probabilités pour définir la loi d’une variable aléatoire.
Soitϕ: (E,A)→(F,B)une application mesurable. On rappelle queµest une mesure sur(E,A).
Définition
Lamesure image de µ par ϕest la mesureϕ∗µsurF donnée par : pour toutB∈ B, ϕ∗µ(B) =µ ϕ−1(B)
.
C’est bien une mesure :ϕ∗µ(∅) =µ(ϕ−1(∅)) =µ(∅) = 0 et, si lesBn sont des parties mesurables disjointes de F, alors les images réciproquesϕ−1(Bn)sont disjointes et leur réunion est ϕ−1(U
nBn), donc ϕ∗µ
]
n
Bn
=µ
ϕ−1
]
n
Bn
=µ
]
n
ϕ−1(Bn)
=X
n
µ ϕ−1(Bn)
=X
n
ϕ∗µ(Bn).
Théorème (Théorème de transfert)
a) Pour toute fonction mesurable f :F →[0,+∞], Z
F
f(y)d(ϕ∗µ)(y) = Z
E
f(ϕ(x))dµ(x).
b) Pour toute fonction mesurablef surF à valeurs dansRd ouC,f est intégrable par rapport àϕ∗µsi, et seulement si f◦ϕest intégrable par rapport à µet, dans ce cas,
Z
F
f(y)d(ϕ∗µ)(y) = Z
E
f(ϕ(x))dµ(x).
Démonstration : a) La formule est vraie si f = 1B oùB ∈ B : c’est exactement la définition de ϕ∗µ. Par suite, la linéarité de l’intégrale montre qu’elle est vraie pour toute fonction étagée positive. Finalement, sifest mesurable positive, alorsf= lim↑nfnpour une suite croissante(fn)nde fonctions étagées positives (surF), ce qui donnef◦ϕ= lim↑nfn◦ϕ et donc, en appliquant le TCM, la formule pour la fonctionfnfournit à la limite la formule pourf.
b) Pourf à valeurs réelles de signe quelconque, appliquer le a) à|f|donne Z
|f|d(ϕ∗µ) = Z
|f◦ϕ|dµ,
ce qui montre quef est intégrable par rapport àϕ∗µsi, et seulement sif◦ϕest intégrable par rapport àµ. Supposons que c’est le cas. On a par définition de l’intégrale puis par a)
Z
f d(ϕ∗µ) = Z
f+d(ϕ∗µ)− Z
f−d(ϕ∗µ)a)= Z
f+◦ϕdµ− Z
f−◦ϕdµ= Z
(f+−f−)◦ϕdµ= Z
f◦ϕdµ.
Pourfà valeurs dansRdouC, on applique ce qui précède à chaque composante.
3.2 Changements de variables dans R
d•Cas linéaire Proposition
SoitM une application linéaireRd→Rd. On a, pourB∈ B(Rd), λd M(B)
=|detM|λd(B).
Autrement dit, siM est inversible,
M∗λd = 1
|detM|λd.