• Aucun résultat trouvé

LaurentTournier Intégration&Probabilités

N/A
N/A
Protected

Academic year: 2022

Partager "LaurentTournier Intégration&Probabilités"

Copied!
52
0
0

Texte intégral

(1)

Université Paris 13, Institut Galilée — MACS 1 Année universitaire 2014–2015

Intégration & Probabilités

Laurent Tournier

(2)
(3)

Intégration

(4)
(5)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

0. Préliminaires sur les ensembles

1 Notations

SoitE un ensemble.

– SiA est une partie deE (c’est-à-direA⊂E), on noteAc=E\Ale complémentaire deA.

– On noteP(E)l’ensemble des parties deE.

– Si la famille(Ai)i∈I de parties deE est disjointe (c’est-à-dire que Ai∩Aj =∅ pour tous i6=j dans I), on peut noter]

i∈I

Ai leur réunion (le “+” rappelle que lesAi sont disjoints).

– Si la suite (An)n∈N de parties deE est croissante (c’est-à-dire queAn ⊂An+1 pour toutn ∈N), on peut noter [

%

n∈N

An leur réunion (la flèche rappelle que la suite est croissante).

– Si la suite(An)n∈N de parties de E est décroissante (c’est-à-dire queAn+1 ⊂An pour tout n∈N), on peut noter \

&

n∈N

An leur intersection (la flèche rappelle que la suite est décroissante).

– SiA est une partie deE, on note1A sa fonction indicatrice :

1A: E → {0,1}

x 7→ 1A(x) =

(1 six∈A 0 six /∈A.

– Si une suite réelle(un)n∈N est croissante, on peut noter lim↑nun sa limite (dans R).

– Si une suite réelle(un)n∈N est décroissante, on peut noter lim↓nun sa limite (dans R).

2 Dénombrabilité

Définition

Un ensemble E estdénombrablesiE =∅ou s’il existe une application ϕ:N→E surjective, c’est-à-dire que

E=ϕ(N) ={ϕ(n)|n∈N}={ϕ(0), ϕ(1), ϕ(2), . . .}.

Autrement dit,E est dénombrable si on peuténumérer ses éléments, en faire une liste (éventuellement infinie).

Exemples.

– les ensembles finis sont dénombrables (si E = {x1, . . . , xn}, on a E = ϕ(N) pour ϕ : N → E définie par ϕ(i) =xi si1≤i≤net ϕ(i) =xn pour touti > n)

Nest évidemment dénombrable :N={0,1,2,3, . . .}

Zest dénombrable : par exemple,

Z={0,1,−1,2,−2,3,−3, . . .},

où on alterne entiers positifs et négatifs par ordre croissant de valeur absolue.

N×N={(m, n)|m∈N, nN}est dénombrable : par exemple, N×N=

(0,0),(1,0),(0,1),(2,0),(1,1),(0,2), . . . ,

où on énumère les couples dont la somme vaut 0, puis 1, puis 2, etc. (à chaque fois, il y en a un nombre fini).

Qest dénombrable : par exemple, (quitte à répéter certains rationnels plusieurs fois) Q=

0,1 1,−1

1,1 2,−1

2,2 1,−2

1,3 1,−3

1,1 3,−1

3,4 1,−4

1,3 2,−3

2,2 3,−2

3,1 4,−1

4, . . .

où on énumère les fractions dont la somme des valeurs absolues du numérateur et du dénominateur vaut 0, puis 1, puis 2, etc. (il y en a un nombre fini pour une somme donnée), en alternant positifs et négatifs.

Rn’est pas dénombrable : voir TD.

(6)

Propriétés

a) Si E⊂F et F est dénombrable, alorsE est dénombrable aussi.

b) SiE etF sont dénombrables, alorsE×F sont dénombrables.

c) Si, pour toutn, En est dénombrable, alors[

n

En est dénombrable.

Démonstration : a) SiE ouF est vide, c’est vrai. Sinon, on choisitx0∈E, etϕtelle queF =ϕ(N). AlorsE=ψ(N) oùψ(n) =ϕ(n)siϕ(n)∈Eetψ(n) =x0 siϕ(n)∈/E, ce qui montre queEest dénombrable.

b) On a vu queN×Nest dénombrable :N×N=ϕ(N). SiEouF est vide,E×F aussi, donc est dénombrable. Sinon, il existeϕE etϕF telles queE=ϕE(N)etF =ϕF(N). On a alorsE×F =ψ(N)où

ψ:n7→(ϕE(ϕ(n)1), ϕF(ϕ(n)2)

(en notantϕ(n) = (ϕ(n)1, ϕ(n)2)∈N×N). En effet, pour toutx∈E ety∈F, il existe m, ntels que x=ϕE(m)et y=ϕF(n), et il existektel queϕ(k) = (m, n), d’où(x, y) = (ϕE(m), ϕF(n)) = (ϕE(ϕ(k)1), ϕF(k)2) =ψ(k).

c) On utilise à nouveau la fonctionϕ(N)ci-dessus, telle que N×N=ϕ(N). On peut supposer queEn6=∅pour tout n car les ensembles vides ne modifient pas la réunion. Pour toutn∈N, il existe alorsψ(n,·)telle queEn=ψ(n,N). On a alorsS

nEn=ξ(N), où

ξ:n7→ψ(ϕ(n)1, ϕ(n)2).

En effet, pour toutx∈S

nEn, il existen tel quex∈En, donc il existem tel quex=ϕ(n, m), et il existek tel que (n, m) =ϕ(k), d’oùx=ξ(k).

(7)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

1. Espace mesurés

On définit ici les éléments qui nous serviront de cadre pour la théorie de l’intégration.

1 Tribus

Définition

SoitE un ensemble. Unetribu(ouσ-algèbre) surE est un ensembleAde parties deE telle que (i) ∅ ∈ A;

(ii) si A∈ A, alorsAc ∈ A(stabilité par passage au complémentaire) (iii) si(An)n∈N est une suite de parties dansA, alors [

n∈N

An∈ A;(stabilité par union dénombrable) (E,A)est unespace mesurable. Une partie A∈ Aest ditemesurable.

Les conséquences suivantes sont aussi importantes que la définition : Propriétés

a) E∈ A;

b) siA1, . . . , An∈ A, alorsA1∪ · · · ∪An∈ A; c) si(An)n∈N est une suite de parties dansA, \

n∈N

An∈ A; (stabilité par intersection dénombrable) d) siA1, . . . , An∈ A, alorsA1∩ · · · ∩An∈ A;

e) siA, B∈ Aet A⊂B, alorsB\A∈ A.

Démonstration : a) résulte de (i) et (ii) carE=∅c. b) résulte de (i) et (iii) en prenantAk=∅pour toutk > n.

c) résulte de (i) et (iii) car

[

n

An=

\

n

(An)c c

. d) résulte de c) en prenantAk=E pour toutk > n.

e) résulte de (ii) et d) carB\A=B∩Ac.

Attention.Si(Ai)i∈I est une famille de parties mesurables, alors les ensembles[

i∈I

Ai et\

i∈I

Aisont mesurables à condition queIest dénombrable (car on peut écrireI={in|n∈N}et doncS

iAi=S

nAin) ; mais siIn’est pas dénombrable, alors ce n’est pas toujours vrai.

Exemples.

– P(E)est latribu discrètesurE.

– {∅, E} est latribu grossièresurE.

Définition-proposition

Soit C un ensemble de parties de E. Il existe une plus petite tribu qui contient C. On la note σ(C), et on l’appelle latribu engendrée par C.

Démonstration : Par la définition de tribu, on voit facilement que l’intersection d’une famille de tribus est une tribu (le vérifier en exercice). En particulier, l’intersection de toutes les tribus surEcontenantC est une tribu, et c’est la plus petite : par sa définition, elle est incluse dans toute tribu contenantC.

– surRd, latribu borélienne est la tribu engendrée par les ouverts. On la noteB(Rd). On peut vérifier (voir TD) queB(Rd)est aussi la tribu engendrée par les intervalles deRd. Ses éléments sont lesboréliens.

Ainsi, tout ensemble construit à partir d’intervalles à l’aide des opérations de passage au complémentaire, d’union dénombrable et d’intersection dénombrable, est un borélien.En pratique,tous les sous-ensembles deR que l’on manipule sont obtenus ainsi et sont donc boréliens.

(8)

2 Mesures

Soit(E,A)un espace mesurable.

Définition

Une mesuresur(E,A)est une applicationµ:A →[0,+∞]telle que (i) µ(∅) = 0

(ii) pour toute suite(An)n∈N de parties mesurablesdisjointes,µ

]

n∈N

An

=X

n∈N

An.

(E,A, µ)est unespace mesuré.µ(E)est lamasse totaledeµ. On dit queµestfiniesiµ(E)<∞.

Les conséquences suivantes sont aussi importantes que la définition : Propriétés

a) Si A1, . . . , An∈ Asont disjoints, alorsµ(A1] · · · ]An) =µ(A1) +· · ·+µ(An).

b) SiA, B∈ AetA⊂B, alorsµ(A)≤µ(B)et, siµ(A)<∞, alorsµ(B\A) =µ(B)−µ(A).

c) Pour tousA, B∈ A, etµ(A∩B)<∞, alorsµ(A∪B) =µ(A) +µ(B)−µ(A∩B).

d) Si(An)n est une suite croissante de parties mesurables, alorsµ [

%

n

An

= lim↑

n

µ(An).

e) Si (An)n est une suite décroissante de parties mesurables, etµ(A0)<∞, alorsµ \

&

n

An

= lim↓

n

µ(An).

f) Pour toute suite(An)n de parties mesurables,µ [

n

An

≤X

n

µ(An).

Démonstration : a) résulte de (ii) et (i) en prenantAk=∅sik > n

b) On a la réunion disjointeB=A](B\A)donc par a)µ(B) =µ(A) +µ(B\A)≤µ(A)carµest à valeurs positives.

Siµ(A)<∞, on peut retrancher cette quantité à chaque membre de l’égalité précédente pour obtenir la formule.

c) On a la réunion disjointeA∪B=A](B\(A∩B))doncµ(A∪B) =µ(A) +µ(B\(A∩B))et siµ(A∩B)<∞, la formule se déduit alors de b).

d) Pour toutn,An⊂An+1donc par b)µ(An)≤µ(An+1): la suite(µ(An))nest croissante. On poseC0=A0 et, pour toutn≥1,Cn=An\An−1∈ Ade sorte que, pour toutn,An=C0] · · · ]Cn, et doncS

nAn=U

nCn. Alors µ

[

n

An

]

n

Cn

=X

n

µ(Cn) = lim↑

N N

X

n=0

µ(Cn) = lim↑

N

µ N

]

n=0

Cn

= lim↑

N

µ(AN).

e) En notantBn=A0\An, alors la suite(Bn)nest croissante etS

nBn=A0\T

nAn, ce qui permet de déduire e) de d) à l’aide de b) vu que pour toutn,An⊂A0donc µ(An)≤µ(A0)<∞.

f) On poseC0=A0 et, pour toutn≥1,Cn=An∩(A0∪ · · · ∪An−1)c∈ A, de sorte que les ensemblesCnsont disjoints et, pour toutn,A0∪ · · · ∪An=C0] · · · ]CndoncS

nAn=U

nCn. Alors µ

[

n

An

=X

n

µ(Cn),

maisCn⊂Andoncµ(Cn)≤µ(An), ce qui donne l’inégalité attendue.

Exemples.

– SoitE un ensemble. Sur(E,P(E)), lamesure de comptageµE est définie par : pour toutA⊂E, µE(A) =

(Card(A) siAest fini

∞ siAest infini.

Ainsi, «µE place un poids 1 en chaque point de E»

– Soit(E,A)un espace mesurable, etx∈E. Lamesure de Dirac enxest la mesureδxdéfinie par : pour toutA∈ A, δx(A) =

(1 six∈A

0 six /∈A =1A(x).

Ainsi, «δxplace un poids 1 au point x»

(9)

– Si(µn)n≥0est une suite de mesures sur(E,A)et (αn)n≥0une suite de réels positifs, alors on peut définir la mesureµ=P

n≥0αnµn par

pour toutA∈ A, µ(A) =X

n≥0

αnµn(A).

En particulier, si(xn)n≥0 est une suite de points deE, on peut considérerµ=P

n≥0αnδxn qui, pour tout n, « place un poidsαn enxn ».

Définition-théorème

Il existe une unique mesure λd sur(Rd,B(Rd))telle que, pour tout pavé fermé[a1, b1]× · · · ×[ad, bd], λd [a1, b1]× · · · ×[ad, bd]

=|b1−a1| · · · |bd−ad|.

On l’appelle mesure de Lebesgue sur Rd.

Démonstration : Un peu longue : voir document sur mon site internet.

– surR, la mesure λ=λ1 vérifieλ([a, b]) =b−apour tout segment[a, b] aveca≤b. Cette mesure correspond donc à lalongueur sur R. Le théorème signifie que l’on peut définir la longueur de n’importe quel borélien, et qu’elle vérifie la condition (ii).

– surR2, la mesureλ2 vérifie λ2([a, b]×[c, d]) = (b−a)(d−c)pour tout rectangle[a, b]×[c, d]aveca≤bet c≤d. Cette mesure correspond donc à l’aire surR2.

– surR3, la mesureλ3 correspond de même auvolume.

Propriétés

a) λd estinvariante par translation: pour toutA∈ B(Rd)eta∈Rd, λd(a+A) =λd(A),

oùa+A={a+x|x∈A}.

b) λd esthomogène de degré d: pour toutA∈ B(Rd)et t∈R, λd(tA) =|t|dλd(A), oùtA={tx|x∈A}.

Pour montrer que deux mesures sont égales, il suffit de comparer leurs valeurs sur les pavés : Proposition

Soitµ, ν deux mesures sur(Rd,B(Rd)). Si, pour tout pavé ferméP,µ(P) =ν(P)<∞, alorsµ=ν. Définition

Soitµune mesure sur(E,A).

– Si A∈ Aest tel queµ(A) = 0, on dit queAest négligeable.

On peut préciser « µ-négligeable », ou « négligeable pour la mesureµ », si la mesureµ n’est pas claire d’après le contexte.

– Si une propriété Px est vraie pour toutx∈Ac, oùAc est négligeable pour la mesureµ, on dit que Px est vraie pour presque toutx, ou encore queP est vraiepresque partout.

On peut préciser «µ-presque partout », ou « presque partout pour la mesureµ», si la mesureµn’est pas claire d’après le contexte.

Sans précision, surRd, « presque tout » fait référence à la mesure de Lebesgueλd.

(10)

3 Fonctions mesurables

Les démonstrations de cette partie se trouvent sur mon site internet.

Définition

Soit(E,A)et (F,B)des espaces mesurables. Une application f :E→F estmesurablesi pour toutB∈ B, f−1(B)∈ A.

Proposition

Les fonctions continues f :RdRd0 sont mesurables (pour les tribus boréliennes).

Propriétés

L’espace des fonctions mesurables de(E,A)dans(R,B(R))est stable par : a) addition (sif, g:E→Rsont mesurables, alorsf+g aussi)

b) multiplication (sif, g:E→Rsont mesurables, alorsf g aussi)

c) passage au sup et à l’inf (si, pour tout n, fn : E → R est mesurable, alors supnfn et infnfn sont mesurables)

d) valeur absolue (sif :E→Rest mesurable, alors|f|aussi)

e) passage à lalim inf,lim supet donc à la limite (si, pour toutn,fn :E→Rest mesurable, alorslim infnfn

et lim supnfn sont mesurables ; et sifn(x)→f(x)pour toutx∈E, alorsf est mesurable) Un rappel surlim inf etlim supse trouve dans le chapitre suivant, page 10.

Ainsi, toute fonction RdR obtenue à partir de fonctions continues par ces opérations est mesurable. En pratique, toutes les fonctions que l’on manipule sont obtenues ainsi et sont donc mesurables.

Il en va de même pour les fonctions deRd dansRd0 par la proposition suivante : Proposition

Une fonctionf :RdRd0 est mesurable si, et seulement si ses composantes le sont.

(11)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

2. Intégration par rapport à une mesure

Soit(E,A, µ)un espace mesuré.

1 Intégrale de fonctions mesurables positives

Définition

Une fonction étagée sur (E,A) est une fonction mesurableg : (E,A) → (R,B(R)) qui ne prend qu’un nombre fini de valeurs. Autrement dit, il existeα1, . . . , αnR(les valeurs) etA1, . . . , An∈ Adisjoints tels que

pour toutx∈R, g(x) =

n

X

i=1

αi1Ai(x) =









α1 six∈A1 ...

αn six∈An

0 sinon.

NB. Les fonctions en escalier surRsont étagées (c’est le cas où lesAisont des intervalles), mais il y a beaucoup plus de fonctions étagées, par exempleg=1Q.

Ces fonctions forment un espace vectoriel.

Définition

Si g est étagée et positive (autrement dit,αi≥0 pour i= 1, . . . , n) alors, avec l’écriture deg ci-dessus, on définit

Z gdµ=

n

X

i=1

αiµ(Ai)∈[0,+∞].

(avec0· ∞= 0).

On peut vérifier que cette définition ne dépend pas du choix de l’écriture de g sous la formeg=P

iαi1Ai. En particulier,

Z

1Adµ=µ(A). Propriétés

Soitg, hdes fonctions étagées positives.

a) Pour tous réelsa, b≥0,R

(ag+bh)dµ=aR

gdµ+bR hdµ.

b) Sig≤h, alorsR

gdµ≤R hdµ.

Démonstration : Sig=P

iαi1Ai eth=P

jβj1Bj avec(Ai)i disjoints, et(Bj)j disjoints, alors en introduisant les ensemblesAij=Ai∩Bj, la fonctionaf+bhprend la valeuraαi+bβj surAij, ce qui permet d’obtenir a) ; et surAij

la fonctiongvaut αi ethvaut βj donc, siAij6=∅,αi≤βj, ce qui permet d’obtenir b).

Définition

Soitf :E→[0,+∞]mesurable. On note Z

f dµ= sup

hétagée, 0≤h≤f

Z

h dµ∈[0,+∞],

et cette quantité est appelée l’intégrale de f par rapport à µ.

NB. On utilise aussi les notations suivantes :R

f dµ=R

f(x)dµ(x) =R

f(x)µ(dx)et on peut spécifier R

E. Dans la suite, de même que dans cette définition, une fonction « mesurable positive » est supposée prendre ses valeurs dans[0,+∞].

Notons que par la propriété b) ci-dessous, sif =∞ ·1A (autrement dit,f(x) =∞six∈Aetf(x) = 0sinon) avecµ(A) = 0alorsR

f dµ=“∞·0” = 0. Ainsi, pourα∈R+∪{+∞},R

α1Adµ=αµ(A)avec “0·∞=∞·0 = 0”.

(12)

Propriétés

Soitf, g des fonctions mesurables positives.

a) Si f ≤g, alorsR

f dµ≤R gdµ.

b) Sif = 0presque partout (pour la mesureµ), alorsR

f dµ= 0.

Démonstration : Sif≤g, alors toute fonction étagéehtelle que0≤h≤fvérifie aussi0≤h≤g, d’où a) (le sup qui définit l’intégrale degporte sur un ensemble plus grand, donc est plus grand).

Sif= 0presque partout, et0≤h≤fest étagée, on ah=P

iαi1Ai (avecAidisjoints) et, siαi>0, on a, pourx∈Ai, f(x) ≥h(x) =αi >0, doncAi ⊂ {x∈R|f(x)6= 0}d’où µ(Ai) ≤µ({f 6= 0}) = 0et doncµ(Ai) = 0; on déduit que Rhdµ=P

iαiµ(Ai) = 0. D’où b).

Théorème (Théorème de convergence monotone (TCM))

Soit(fn)n une suitecroissantede fonctions mesurablespositives. Alors Z

lim↑

n

fndµ= lim↑

n

Z fndµ.

Démonstration : On notef= lim↑nfn, qui est une fonction mesurable positive.

Pour toutn,fn≤fn+1, d’oùR

fndµ≤R

fn+1dµ. Ainsi, la suite R

fn

n est croissante et donc converge (dansR).

De même, pour toutn,fn≤f, d’oùR

fndµ≤R

f µ, et en passant à la limite on a lim↑

n

Z

fndµ≤ Z

f dµ.

Il reste à voir l’inégalité inverse.

Soithune fonction étagée telle que0≤h≤f. Soitε >0. Pour toutx∈E, si h(x)>0, on alim↑nfn(x) =f(x)≥ h(x)>(1−ε)h(x)donc il existen(grand) tel quefn(x)≥(1−ε)h(x); et sih(x) = 0alorsfn(x) = 0pour toutndonc évidemmentfn(x)≥(1−ε)h(x). Autrement dit,

E=[

%

n

En, où

En={x∈E|fn(x)≥(1−ε)h(x)} ∈ A.

Pour toutnon a, pour toutx∈En,fn(x)≥(1−ε)h(x); et donc, pour toutx∈E, on afn(x)≥(1−ε)h(x)1En(x). Si h(qui est étagée) s’écrith=P

1≤i≤rαi1Ai, alorsh1En=P

1≤i≤rαi1Ai∩En et ainsi Z

fndµ≥ Z

(1−ε)h1Endµ= (1−ε)

r

X

i=1

αiµ(Ai∩En).

Soit1≤i≤r. La suite(Ai∩En)nest croissante (car(En)nest croissante) et sa réunion estAi(car la réunion desEn

estEentier) donc

lim↑

n

µ(Ai∩En) =µ(Ai).

En passant à la limite dans l’inégalité précédente, on a donc lim↑

n

Z

fndµ≥(1−ε)

r

X

i=1

αiµ(Ai) = (1−ε) Z

hdµ.

Pourε→0, ceci donne

lim↑

n

Z

fndµ≥ Z

hdµ.

Et ceci vaut pour toute fonctionhétagée telle que0≤h≤f, donc on a finalement lim↑

n

Z

fndµ≥ Z

f dµ, ce qui conclut la preuve.

(13)

Par le TCM, pour calculerR

f dµ, on peut considérerlim↑nR

fndµpour n’importe quelle suite croissante(fn)n

qui converge versf. Par exemple une suite de fonctions étagées : Lemme

Si f est mesurable positive, alors il existe une suite croissante (fn)n de fonctions étagées positives qui converge versf.

Démonstration : On peut prendre fn(x) =

(k

2n sif(x)∈k 2n,k+12n

etf(x)< n

n sif(x)≥n. .

La distinction permet de s’assurer quefnne prend qu’un nombre fini de valeurs même si f n’est pas bornée. Le choix de2n assure la croissance defn (la subdivision se raffine à chaque pas).

Propriétés

Pour f, gmesurables positives, et a, bréels positifs, Z

af+bg dµ=a

Z

f dµ+b Z

gdµ.

Démonstration : Le lemme fournit des suites croissantes(fn)n et(gn)n de fonctions étagées positives qui convergent versfetg. Pour toutn, par les propriétés de l’intégrale des fonctions étagées positives,

Z

(afn+bgn)dµ=a Z

fndµ+b Z

gndµ,

ce qui donne l’égalité annoncée en passant à la limite grâce au TCM.

Le théorème de convergence monotone admet une réécriture en termes de séries : Corollaire (Théorème de convergence monotone pour les séries positives)

Si (fn)n≥0est une suite de fonctions mesurables positives, alors Z

X

n=0

fn

! dµ=

X

n=0

Z fndµ.

Démonstration : On applique le TCM à la suite des sommes partielles Sn = Pn

k=0fk ≥ 0, qui est croissante (car fn≥0), et converge versS=P

k=0fk. On a ainsi Z

Sdµ= lim↑

n

Z Sndµ.

Or, par la propriété précédente, Z

Sndµ= Z n

X

k=0

fk

dµ=

n

X

k=0

Z

fkdµ−→

n

X

k=0

Z fk

d’où la conclusion.

Proposition (Inégalité de Markov)

Pour toute fonction mesurable positivef, et tout réel a >0, µn

x∈E

f(x)≥ao

≤ 1 a

Z f dµ.

Démonstration : L’ensembleA={x∈E|f(x)≥a}vérifief≥a1A(pour x∈A,f(x)≥a=a1A(x), et pourx /∈A, f(x)≥0 =a1A(x)). Par suite, en intégrant,

Z f dµ≥

Z

a1Adµ=aµ(A), ce qui donne l’inégalité.

(14)

Corollaire

Soitf, g des fonctions mesurablespositives.

a) Si R

f dµ <∞, alorsf <∞presque partout.

b) R

f dµ= 0si, et seulement sif = 0presque partout.

c) Si f =g presque partout, alors R

f dµ=R gdµ.

Démonstration : a) On supposeR

f dµ <∞. Pour toutn, on noteAn={f≥n}(={x∈E|f(x)≥n}, et A={f=∞}=\

&

n

An. Pour toutn, on aµ(An)≤n1R

f dµpar l’inégalité de Markov, doncµ(A1)<∞, etµ(An)→0. On a donc µ(A) =µ

&\

n

An

= lim↓

n

µ(An) = 0.

b) On suppose R

f dµ= 0. On a {f > 0}=S

%n{f ≥ n1}donc µ({f > 0}) = lim↑nµ({f ≥ n1}) = 0car l’inégalité de Markov donneµ({f≥n1})≤nR

f dµ= 0quel que soitn. La réciproque a déjà été vue.

c) On suppose f =gpresque partout. En particulier, la fonction h= max(f, g)−min(f, g) est nulle presque partout etpositive(ce qui n’est peut-être pas le cas def−g), doncR

hdµ= 0. Par la propriété, on a alorsR

max(f, g)dµ= Rmin(f, g)dµ. Ormin(f, g)≤f≤max(f, g)et de même pourg; en passant aux intégrales, on voit queR

f dµetR f dµ sont encadrées parR

min(f, g)dµetR

max(f, g)dµqui sont égales, et donc en particulierR

f dµ=R gdµ.

On rappelle que, pour une suite de réels(xn)n, on définit lim inf

n xn= sup

n

k≥ninf xk= lim↑

n

k≥ninf xk

et

lim sup

n

xn= inf

n sup

k≥n

xk= lim↓

n

sup

k≥n

xk.

On a les propriétés suivantes : lim supn(−xn) = −lim infnxn, et la suite (xn)n converge si, et seulement si lim infnxn= lim supnxn, et dans ce caslimnxn= lim infnxn= lim supnxn. De façon générale,lim infnxn est la plus petite limite d’une sous-suite de (xn)n (et lim supnxn la plus grande. On dit aussi que ce sont la plus petite valeur d’adhérence de la suite et la plus grande.

Pour une suite (fn)n de fonctionsE → R, on peut alors définir les fonctions lim infnfn et lim supnfn, par : pourx∈E,

lim inf

n fn

(x) = lim inf

n fn(x) et lim sup

n

fn

(x) = lim sup

n

fn(x).

Ces définitions ont aussi un sens si on autorise les valeurs−∞et+∞pour les suites et les fonctions.

Théorème (Lemme de Fatou)

Soit(fn)n≥0 une suite de fonction mesurables positives. On a Z

lim inf

n fn

dµ≤lim inf

n

Z fndµ.

Démonstration : On a, par TCM, Z

lim inf

n fndµ= Z

lim↑

n

k≥ninf fkdµ= lim↑

n

Z

k≥ninf fkdµ.

Or, pour toutn, pour toutm≥n,infk≥nfk≤fm, doncR

infk≥nfkdµ≤R

fmdµ, d’oùR

infk≥nfkdµ≤infm≥nR fmdµ.

En passant à la limite,

lim↑

n

Z

k≥ninffkdµ≤lim↑

n m≥ninf

Z

fmdµ= lim inf

n

Z fndµ,

ce qui donne le résultat vu la première égalité.

NB. Voici trois exemples de suites (fn)n telles que fn → 0 et R

fndµ 6→ 0 (on a même R

nfndµ = 1 pour toutn). On utiliseE=R, muni de la mesure de Lebesgueµ=λ1.

« bosse voyageuse » :fn=1[n,n+1]

« concentration en 0 » :fn=n1[1 n,2n1]

« écrasement » :fn= n11[−n

2,+n2].

(15)

2 Fonctions intégrables

Définition

Soitf :E→Rune fonction mesurable.f estintégrable par rapport à µsi Z

|f|dµ <∞.

On pose alors

Z

f dµ= Z

f+dµ− Z

fdµ∈R,

oùf+= max(0, f)etf= max(0,−f)sont les parties positive et négative def. On note L1(E,A, µ)l’espace des fonctions intégrables par rapport àµ.

NB. On a|f| =f++f ≥f, ce qui justifie que R

fdµ <∞et donne un sens à la soustraction ci-dessus.

De même,R

f+dµ <∞doncR

f dµest bien réel.

On abrège souventL1(E, µ), voireL1(E)ou mêmeL1 si le contexte précise(E,A, µ).

Propriétés

a) Pour toute f ∈ L1(E,A, µ), Z

f dµ

≤ Z

|f|dµ b) L1(E,A, µ)est un espace vectoriel, etf 7→R

f dµest une application linéaire deL1(E,A, µ)dansR.

c) Pour f, g∈ L1(E,A, µ), sif ≤g, alors Z

f dµ≤ Z

gdµ.

d) Pourf, g∈ L1(E,A, µ), sif =g presque partout, alorsR

f dµ=R gdµ.

Démonstration : a) On af=f+−fet|f|=f++f, donc par inégalité triangulaire,

Z

f dµ

= Z

f+dµ− Z

f

≤ Z

f+

+ Z

f

= Z

f+dµ+ Z

fdµ= Z

(f++f)dµ= Z

|f|dµ.

b) Décomposer en parties positives et négatives... Exercice.

c)g=f+ (g−f)etg−f≥0doncR

(g−f)dµ≥0etR

gdµ=R

f dµ+R

(g−f)dµ≥R f dµ.

d) sif=gpresque partout, alorsf+=g+ presque partout etf=gpresque partout (là oùf etgsont égales, leurs parties positives et négatives aussi), doncR

f+dµ=R

g+dµ, de même pourfetgd’oùR

f dµ=R gdµ.

Théorème (Théorème de convergence dominée (TCD))

Soit(fn)n une suite de fonctions mesurablesE→R, etf une fonction mesurableE→R. On suppose (i) fn(x)→f(x)pour presque partoutx∈E;

(ii) il existeϕ:E→R+ mesurable telle queR

ϕdµ <∞et

pour toutn, pour presque toutx∈E, |fn(x)| ≤ϕ(x). (hypothèse de domination) Alors, pour tout n,fn ∈ L1(E,A, µ), f ∈ L1(E,A, µ),

Z

fndµ−→

n

Z

f dµ et Z

|fn−f|dµ−→

n 0.

Démonstration : Le fait quefnetf soient intégrables vient des inégalités |fn| ≤ϕet, à la limite,|f| ≤ϕ. Elles sont vraie presque partout, dontR

|fn|dµ≤R

ϕdµ <∞et de même pourf.

Pour simplifier, supposons (i) et (ii) vrais partout. Les fonctionsϕ−fnetϕ+fnsont positives. On peut leur appliquer le lemme de Fatou. Pourϕ−fn :

Z lim inf

n (ϕ−fn)dµ≤lim inf

n

Z

(ϕ−fn)dµ (∗)

Orlim infn(ϕ−fn) =ϕ−f donc Z

lim inf

n (ϕ−fn)dµ= Z

ϕdµ− Z

f dµ.

Et

lim inf

n

Z

(ϕ−fn)dµ= Z

ϕdµ−lim sup

n

Z fndµ.

Ainsi, (∗) donne

lim sup

n

Z

fndµ≤ Z

f.

(16)

Les mêmes arguments pourϕ+fndonnent

lim inf

n

Z

fndµ≥inff, d’où finalement

Z

f dµ≤lim inf Z

fndµ≤lim sup

n

Z

fndµ≤ Z

f dµ, ce qui montre que tous les termes sont égaux, et en particulierR

fndµconverge versR f dµ.

On peut alors donner une formule « concrète » de calcul de R

f dµpar approximation, qui donne la définition évoquée lors de la présentation du cours :

Corollaire

Soitf une fonction intégrable positive. Pour toute suite de subdivisions 0 =`(n)0 < `(n)1 <· · ·< `(n)N(n)deR telle que

max

0≤i<N(n)`(n)i+1−`(n)i −→

n 0 et `(n)N(n)→+∞, on a

Z

f dµ= lim

n N(n)

X

i=1

`(n)i µ

f−1 [`(n)i , `(n)i+1[ .

Démonstration : Il s’agit de montrer queR

f dµ= limnR

fndµ, où on a défini les fonctions étagées

fn:x7→

N(n)

X

i=1

`(n)i 1

f−1([`(n)i ,`(n)i+1[)(x) =

(`(n)i si`(n)i ≤f(x)< `(n)i+1, où0≤i < N(n) 0 sif(x)≥`(n)N(n).

Pour toutx∈E on a, pour toutnassez grand,f(x)< `(n)N(n) (par la deuxième condition sur la subdivision), et il existe alorsitel quefn(x) =`(n)i ≤f(x)< `(n)i+1d’où

0≤f(x)−fn(x)< `(n)i+1−`(n)i ≤max

j `(n)j+1−`(n)j −→

n 0

(par la première condition). Ceci montre que(fn)nconverge versf. Il reste à prouver une domination.

Or, sif(x)< `(n)N(n), on a aussi vu quefn(x)≤f(x). Et sif(x)≥`(n)N(n), alorsfn(x) = 0≤f(x). Donc on a, pour toutn, 0≤fn(x)≤f(x). Or on a suppose f intégrable. On peut donc appliquer le TCD à la suite(fn)n, dominée parϕ=f, ce qui conclut.

Notation. Pour A∈ A, on note Z

A

f dµ= Z

f1Adµl’intégrale de f sur A par rapport à µ, lorsqu’elle a un sens, c’est-à-dire sif1Aest positive ou intégrable. Ceci a d’ailleurs un sens même sif n’est pas définie hors deA(car1A vaut alors 0). On dit quef estintégrable sur Asi

Z

A

|f|dµ <∞.

Remarque importante. Toute cette partie s’étend aux fonctions à valeurs dansCetRden intégrant compo- sante par composante : par exemple, une fonction mesurable f :E→Cest intégrable siR

|f|dµ <∞et, dans ce cas,

Z

f dµ= Z

<(f)dµ+i Z

=(f)dµ.

Les résultats précédents restent alors vrais avec cette définition (linéarité, TCD).

(17)

3 Exemples principaux

3.1 Intégrale par rapport à une mesure atomique

(On dit quexest unatomedeµsi{x} ∈ Aetµ({x})>0) Proposition

Soitf :E→Rune fonction.

a) Soit x∈E.f est intégrable par rapport àδx et Z

f dδx=f(x).

b) Soit(xn)n une suite d’éléments deE(distincts) et(αn)n une suite de réels≥0. On poseµ=P

nαnδxn. Si f est positive, on a

Z

f dµ=X

n

αnf(xn)∈[0,+∞].

Pour f de signe quelconque, f est intégrable par rapport ൠsi, et seulement si P

nαn|f(xn)|<∞et, dans ce cas,

Z

f dµ=X

n

αnf(xn)∈R.

Démonstration : a) On af=f(x)1{x}presque partout, car ces fonctions coïncident enx, etδx({x}c) = 0. Donc leurs intégrales sont égales :

Z

f dδx= Z

f(x)1{x}x=f(x)δx({x}) =f(x) (par la définition de l’intégrale d’une fonction étagée).

b) Soitf mesurable positive. Sig=f1F oùF ={xn|n∈N}, alors f=gpresque partout pour la mesureµ. En effet, f=gsurF, etµ(Fc) = 0. On a doncR

f dµ=R

gdµ. Or on ag= lim↑ngnoùgn=Pn

k=0f(xk)1{xk}donc, par TCM, Z

gdµ= lim↑

n

Z

gndµ= lim↑

n n

X

k=0

f(xk)µ({xk}) =

X

k=0

f(xkk,

d’où l’égalité annoncée. Sif est de signe quelconque et intégrable, on applique ce qui précède àf+ etf pour obtenir le résultat.

En particulier, siµE est la mesure de comptage surE etf :E→R+, Z

f dµE=X

x∈E

f(x).

Ceci n’est vraiment un cas particulier que si E est dénombrable (il faut avoir E ={xn|n∈N}). Dans le cas contraire, en notant F ={x∈ E|f(x) >0}, on peut constater que, si F est dénombrable, on a R

Ef dµE = R

Ff dµE ce qui ramène au cas dénombrable. Et si F n’est pas dénombrable, alors il existe n tel que Fn = {x ∈ E|f(x) > 1n} est infini (en effet, F = ∪nFn) ce qui donne à la fois P

xf(x) ≥ n1CardFn = ∞ et Rf dµEn1µE(Fn) =n1CardFn=∞donc l’égalité est trivialement vraie.

3.2 Intégrale par rapport à la mesure de Lebesgue (lien avec l’intégrale de Rie- mann

On noteλ=λ1(mesure de Lebesgue surR).

Soita < b.

Remarque. Toute fonction mesurable bornéef : [a, b]→Rest intégrable sur[a, b]par rapport à la mesure de Lebesgue. En effet, si|f(x)| ≤M pour toutx∈[a, b], alors

Z

[a,b]

|f|dλ≤ Z

[a,b]

M dλ=M Z

[a,b]

dλ=M λ([a, b]) =M|b−a|<∞.

Rappel. Une fonctionf : [a, b]→Rest intégrable au sens de Riemannsi, pour toutε >0, il existe des fonctions en escalierϕetψtelles que

ϕ≤f ≤ψ et

Z b a

(ψ−ϕ)< ε,

(18)

où l’intégrale de la fonction en escalierψ−ϕest définie élémentairement (comme pour les fonctions étagées : si ϕ=P

iαi1]xi,xi+1[ alorsRb aϕ=P

iαi(xi+1−xi)). Et dans ce cas on note Z b

a

f = sup

ϕen escalier, ϕ≤f

Z b a

ϕ= inf

ϕen escalier, f≤ψ

Z b a

ψ

Théorème

Si f est intégrable au sens de Riemann sur[a, b], alorsf est intégrable par rapport àλsur[a, b], et Z

[a,b]

f dλ= Z b

a

f.

(l’intégrale de droite étant l’intégrale au sens de Riemann)

Démonstration : Commeλ(]xi, xi+1[) =xi+1−xi(etλ({xi}) = 0), la formule est vraie pour les fonctions en escalier (en comparant à la formule pour l’intégrale des fonctions étagées).

Soitf une fonction intégrable au sens de Riemann.f est limite de fonctions en escalier, donc est mesurable. Soitε >0.

Il existeϕ, ψen escalier telles queϕ≤f≤ψ etRb

a(ψ−ϕ)< ε(où l’intégrale est au sens de Riemann ou de Lebesgue, par ce qui précède). On a (par les propriétés de l’intégrale de Riemann)

Z b a

ϕ≤ Z b

a

f≤ Zb

a

ψ

et aussi (par les propriétés de l’intégrale de Lebesgue) Z

[a,b]

ϕdλ≤ Z

[a,b]

f dλ≤ Z

[a,b]

ψdλ.

Ainsi les deux intégrales defappartiennent au même intervalle de largeur < ε, donc

Z b a

f− Z

[a,b]

f dλ

< ε.

Ceci vaut pour toutε >0, d’où la formule.

Par suite, si I est un intervalle, pour f :I →Rmesurable positive, ou intégrable par rapport à λ, on pourra noter

Z

I

f = Z

I

f(x)dx= Z

I

f dλ, même sif n’est pas intégrable au sens de Riemann, sans confusion possible.

On pourra donc, pour des intégrales au sens de Riemann, appliquer les théorèmes précédents (convergence monotone, dominée, etc.) ; et pour des intégrales de Lebesgue de fonctions intégrables au sens de Riemann, utiliser les propriétés bien connues (intégration par parties, lien entre intégrale et primitive, etc.).

3.3 Intégrale par rapport à une mesure à densité

Soit(E,A)un espace mesurable.

On rappelle que, sif : E → R est mesurable, et A ∈ A, on note Z

A

f dµ= Z

f1Adµ l’intégrale de f sur A, lorsquef1Aest à valeurs positives (ou même dans[0,+∞]), ou lorsquef1Aest intégrable.

On vérifie facilement que, sif est positive,A7→R

Af dµest une mesure, d’où la définition : Définition

Sif est une fonction mesurableE→[0,+∞], etµune mesure surE, lamesure de densitéf par rapport à µest la mesuref·µ(aussi notéef(x)dµ(x)) définie par :

pour toutA∈ A, (f·µ)(A) = Z

A

f dµ= Z

f1Adµ.

NB.A est négligeable pourf·µdès queAest négligeable pourµou quef est nulle surA.

(19)

Proposition

Soitf une fonction mesurableE→[0,+∞], etµune mesure surE.

a) Pour toute fonction mesurable g:E→[0,+∞], on a Z

gd(f·µ) = Z

gf dµ= Z

g(x)f(x)dµ(x),

b) Une fonctiong:E→Rest intégrable par rapport àf·µsi, et seulement sif g est intégrable par rapport à µet, dans ce cas,

Z

gd(f·µ) = Z

gf dµ= Z

g(x)f(x)dµ(x).

Ceci justifie la notationf·µ=f(x)dµ(x). Pour la mesure de Lebesgue, vu le lien avec l’intégrale de Riemann, on notera aussif(x)dxpourf·λ. Par extension, vu que1·µ=µ, on pourra parfois noterdµ(x)pour désigner la mesureµ, et donc dxpour désigner la mesure de Lebesgueλ(ouλd).

Démonstration : a) La formule est évidente sig=1AoùA∈ A, car c’est exactement la définition def·µ: Z

1Ad(f·µ) = (f·µ)(A) = Z

1Af dµ.

Dans le cas des fonctions étagées positives, la formule découle de la précédente par linéarité. Et pour toute fonction mesurable positiveg, il existe une suite(gn)n de fonctions étagées positives qui croît versg, si bien quegnf croît vers gf et, vu que le cas des fonctions étagées positives donne, pour toutn,

Z

gnd(f·µ) = Z

gnf dµ,

on obtient à la limite, par convergence monotone, Z

gd(f·µ) = Z

gf dµ, comme annoncé.

b)gest intégrable par rapport àf·µsiR

|g|d(f·µ)<∞, mais cette intégrale est aussiR

|g|f dµpar le a), donc cela revient à dire quegfest intégrable par rapport àµ. Et dans ce cas, vu que(gf)+=g+fet(gf)=gf, on obtient directement la formule à partir du cas positif appliqué àg+ etget de la définition de l’intégrale d’une fonction intégrable.

4 Intégrales dépendant d’un paramètre

Dans cette partie, on considère une famille(f(t,·))t∈Ide fonctions, indexée par un intervalle réelI: plutôt qu’une suite, il s’agit d’un « continuum » de fonctions, que l’on peut aussi voir comme une fonctionf : I×E →R.

Lorsque les fonctionsf(t,·)sont intégrables, on peut considérer la fonction F :t7→F(t) =

Z

f(t,·)dµ= Z

f(t, x)dµ(x),

que l’on appelle une intégrale à paramètrecar elle dépend du réelt, appelé un paramètre. Le théorème de convergence dominée permet alors d’obtenir facilement des résultats de régularité surF.

Théorème (Théorème de continuité sous l’intégrale)

Soitf : (t, x)7→f(t, x)une fonction mesurable deI×EdansRd ouC(oùI est un intervalle deR).

On suppose que :

– (continuité par rapport au paramètre) pourµ-presque toutx∈E,t7→f(t, x)est continue sur I; – (domination) il existe une fonction ϕ: E → R+ mesurable telle que R

ϕ dµ < ∞ et, pour toutt ∈ I, pour µ-presque toutx∈E,

f(t, x)

≤ϕ(x).

Alors la fonction

F :t7→F(t) = Z

f(t, x)dµ(x) est bien définie pour toutt∈I, et est continue surI.

(20)

Démonstration : Soitt∈I. On montre queF est continue ent. On utilise la caractérisation des limites par les suites : pour montrer queF(u)→F(t)quandu→t, il suffit de montrer que, pour toute suite(tn)ndansI qui converge verst, F(tn)→F(t).

Soit(un)n une suite dansI qui converge verst. Appliquons le TCD à la suite des fonctions fn :x7→f(tn, x). Par la première hypothèse, on a, pour presque toutx∈E,fn(x)→f(t, x). Par la seconde hypothèse, on a, pour toutn, pour presque toutx∈E,

|fn(x)| ≤ϕ(x), etR

ϕdµ <∞. Le TCD donne alors exactementF(tn)−→

n F(t), ce qui conclut.

Théorème (Théorème de dérivation sous l’intégrale)

Soitf : (t, x)7→f(t, x)une fonction deI×E dansRd ouC. On suppose que : – (existence de F)pour toutt∈I, x7→f(t, x)est intégrable ;

– (dérivabilité par rapport au paramètre)pour µ-presque toutx∈E,t7→f(t, x)est dérivable surI, de dérivée notée ∂f∂t;

– (domination de la dérivée)il existe une fonctionϕ:E→R+ mesurable telle queR

ϕ dµ <∞et, pour tout t∈I, pour µ-presque toutx∈E,

∂f

∂t(t, x)

≤ϕ(x).

Alors la fonction

F :t7→F(t) = Z

f(t, x)dµ(x)

est dérivable surI et, pour toutt∈I,

F0(t) = Z ∂f

∂t(t, x)dµ(x).

Démonstration : Soitt∈I. Soit une suite(tn)nqui converge verstdansI\ {t}. Il faut montrer que F(tn)−F(t)

tn−t −→

n

Z ∂f

∂t(t, x)dµ(x).

Or par linéarité

F(tn)−F(t) tn−t =

Z f(tn, x)−f(t, x) tn−t dµ(x), donc on va appliquer le TCD à la suite(gn)ndéfinie par

gn:x7→ f(tn, x)−f(t, x) tn−t .

Pour presque tout x∈E, la deuxième hypothèse donne gn(x) → ∂f∂t(t, x). Et l’inégalité des accroissements finis et la troisième hypothèse donnent : pour toutn, pour presque toutx∈E,

|gn(x)| ≤ sup

u∈[tn,t]

∂f

∂t(u, x)

≤ϕ(x), etR

ϕdµ <∞. Le TCD donne alorsR

gndµ→R ∂f

∂t(t,·)dµ, ce qui conclut.

Remarque :Si de plus la fonctiont7→ ∂f∂t(t, x)est continue pour presque toutx, alors le théorème de continuité montre queF0 est continue, et donc queF est de classeC1 surI.

Deuxième remarque :Pour montrer queF est de classeC2,C3, . . . , on peut appliquer le théorème plusieurs fois. Pour montrer queF est de classeC, on peut montrer par récurrence queF est de classeCnpour tout n.

(21)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

3. Intégration sur un espace produit, changement de variables

Soit(E,A, µ)et(F,B, ν)deux espaces mesurés. On suppose dans ce chapitre queµetν sontσ-finies: il existe une suite croissante(En)n de parties deEtelle que

E=[

n

En et pour toutn, µ(En)<∞, et de même pourν.

Pour une fonctionf :E×F →R, on peut considérer Z

E

Z

F

f(x, y)dν(y)

dµ(x). On va montrer que l’on peut voir cette double intégration comme une simple intégration sur l’espaceE×F. Ce point de vue aura l’avantage de mettre en évidence la symétrie des rôles de E et F, et donc de montrer que l’on peut intervertir l’ordre entre les intégrales précédentes. Il fournit de plus une façon de construire une mesure sur l’espaceE×F, qui permettrait de construire l’intégrale de Lebesgue surR2 à partir de l’intégrale de Lebesgue surR, et qui jouera aussi un rôle important dans la notion d’indépendance en probabilités.

1 Produit d’espaces mesurés

On souhaite faire de E×F(= {(x, y)|x∈E, y ∈ F})un espace mesuré, c’est-à-dire le munir d’une tribu et d’une mesure, déduites de celles deEet F.

Définition

Latribu produitdeAetBest la tribu A ⊗ Bengendrée par les pavésA×B oùA∈ Aet B∈ B: A ⊗ B=σ

A×B

A∈ A, B∈ B .

Dans le cas des boréliens deRd, cette opération redonne les tribus déjà connues : Proposition

Pour tousd, d0,B(Rd)⊗ B(Rd0) =B(Rd+d0).

Par suite,B(Rd) =B(R)⊗ · · · ⊗ B(R) =B(R)⊗d en définissant de même une mesure produit dedmesures.

Pour tout ensembleC∈ A ⊗ B, ses « tranches » sont mesurables : Propriétés

a) Si C∈ A ⊗ B, alors

pour toutx∈E,Cx={y∈F|(x, y)∈C} ∈ B pour touty∈F,Cy={x∈E|(x, y)∈C} ∈ A.

b) Sif :E×F →Rest mesurable, alors

pour toutx∈E,fx:y7→f(x, y)est mesurable pour touty∈F,fy:x7→f(x, y)est mesurable.

Démonstration : a) Soitx∈E. L’ensembleG={C∈ A ⊗ B|Cx∈ B}est une tribu (le vérifier !) qui contient les pavés A×B oùA∈ AetB∈ B:

(A×B)x={y∈F|(x, y)∈A×B}={y∈F|x∈A, y∈B}=

(B six∈A

∅ six /∈A ∈ B.

Par définition,G contient doncA ⊗ B, d’oùG=A ⊗ B.

b) Soitx∈E. SiD∈ B(R), on a

(fx)−1(D) ={y∈F|fx(y)∈D}={y∈F|f(x, y)∈D}={y∈F|(x, y)∈f−1(D)}=

f−1(D)

x

donc(fx)−1(D)∈ Bpar le a) et par mesurabilité def. Ceci montre quefxest mesurable. De même pour toutfy.

(22)

Théorème

Il existe une unique mesure msur(E×F,A ⊗ B)telle que

pour tousA∈ AetB∈ B, m(A×B) =µ(A)ν(B), (avec ici∞ ·0 = 0· ∞= 0). On la notem=µ⊗ν. De plus, pour toutC∈ A ⊗ B,

µ⊗ν(C) = Z

E

ν(Cx)dµ(x) = Z

F

µ(Cy)dν(y).

La dernière formule décrit une intégration « par tranches » : la mesure de C est l’intégrale des mesures de tranches, horizontales ou verticales.

Démonstration : On admet l’unicité (de même que l’on a admis la propriété d’unicité pour la mesure de Lebesgue) ; c’est là que laσ-additivité deµetνest importante.

Pour l’existence, on s’inspire de la fin du théorème : pourC∈ A ⊗ B, on définit m(C) =

Z

E

ν(Cx)dµ(x),

et on vérifie que cela définit bien une mesure qui vérifie la propriété souhaitée. On a bienm(∅) = 0vu que∅x=∅pour toutxetν(∅) = 0. Si(Cn)nest une famille d’ensembles mesurables disjoints, on constate que, pour toutx,

]

n

Cn

x

=]

x

Cn

x,

d’où m

]

n

Cn

= Z

E

ν

]

x

Cn

x

dµ(x) =

Z

E

X

n

ν Cn

x

dµ(x)(TCM)= X

n

Z

E

ν Cn

x

dµ(x) =X

n

m(Cn).

mest donc bien une mesure, et pourA∈ AetB∈ B, on a A×B

x=

(B six∈A

∅ sinon, donc m(A×B) =

Z

E

ν

A×B

x

dµ(x) =

Z

A

ν(B)dµ(x) =µ(A)ν(B).

Cela conclut la preuve de l’existence. De même, on aurait pu définir, pourC∈ A ⊗ B, m0(C) =

Z

F

µ(Cy)dν(y),

et par symétrie cette autre mesure vérifie aussi la propriété. L’unicité montre alors quem=m0, ce qui prouve la dernière égalité (Remarque : comme l’unicité utilise laσ-additivité, cette égalité aussi).

Dans le cas de la mesure de Lebesgue surRd, cette opération redonne les mesures déjà connues : Proposition

Pour tousd, d0d⊗λd0d+d0.

Démonstration : Par la définition de la mesure de Lebesgue et de la mesure produit, les mesures de l’énoncé coïncident sur les pavés. Il en résulte qu’elles sont égales (par la proposition page 5).

Par suite, en notantλ=λ1, on aλd=λ⊗ · · · ⊗λ=λ⊗d, en définissant par récurrence le produit dedmesures.

(23)

2 Théorèmes de Fubini

Les propriétés de la mesure produit se transfèrent aisément aux propriétés de l’intégrale et permettent de résoudre la question initiale.

Théorème (Théorème de Fubini-Tonelli)

Pour toute fonction mesurablef :E×F →[0,+∞], Z

E×F

f d(µ⊗ν) = Z

E

Z

F

f(x, y)dν(y)

dµ(x) = Z

F

Z

E

f(x, y)dµ(x)

dν(y).

Démonstration : La formule est vraie si f =1C oùC ∈ A ⊗ B : c’est le précédent théorème. Par suite, la linéarité de l’intégrale montre qu’elle est vraie pour toute fonction étagée positive. Finalement, sif est mesurable positive, alors f= lim↑nfnpour une suite croissante(fn)nde fonctions étagées positives (surE×F), ce qui donne en particulier pour toutx∈E,fx=f(x,·) = lim↑nfn(x,·)et donc, en appliquant deux fois le TCM,

lim↑

n

Z

E

Z

F

fn(x,·)dν

dµ(x) = Z

E

lim↑

n

Z

F

fn(x,·)dν

dµ(x) = Z

E

Z

F

lim↑

n

fn(x,·)dν

dµ(x) = Z

E

Z

F

f(x,·)dν

dµ(x) et, en appliquant une fois le TCM,

lim↑

n

Z

E×F

fnd(µ⊗ν) = Z

E×F

f d(µ⊗ν).

L’égalité pourfn donne alors l’égalité pourf en passant à la limite. L’autre égalité s’obtient de même en échangeant l’ordre d’intégration.

En conséquence de ce théorème, on pourra noter Z

E

Z

F

f(x, y)dν(y)dµ(x)sans parenthèses lorsquef est mesu- rable positive.

On déduit la mesure produit de deux mesures à densité en appliquant le théorème à(x, y)7→f(x)g(y): Proposition

Soitf :E→R+etg:F →R+mesurables. On a :(f·µ)⊗(g·ν) = (f⊗g)·(µ⊗ν), où(f⊗g)(x, y) =f(x)g(y).

Autrement dit,

f(x)dµ(x)

⊗ f(y)dν(y)

=f(x)g(y)d(µ⊗ν)(x, y).

Par ailleurs, le théorème précédent justifie la notation dµ(x)dν(y)pour la mesure d(µ⊗ν)(x, y) =µ⊗ν et la proposition prend alors la forme naturelle suivante :

f(x)dµ(x)

g(y)dν(y)

=f(x)g(y)dµ(x)dν(y).

Dans le cas deR2, la mesure produit des mesuresf(x)dxetg(y)dyest doncf(x)g(y)dxdy.

En décomposant une fonctionf de signe quelconque enf =f+−f, on obtient facilement : Théorème (Théorème de Fubini-Lebesgue)

Pour toute fonction mesurablef surE×F à valeurs dansRd ouC, telle que Z

E×F

f(x, y)

d(µ⊗ν)(x, y)<∞,

on a Z

E×F

f(x, y)d(µ⊗ν)(x, y) = Z

E

Z

F

f(x, y)dν(y)

dµ(x) = Z

F

Z

E

f(x, y)dµ(x)

dν(y).

NB.Par le théorème de Fubini-Tonelli, la condition équivaut à Z

E

Z

F

f(x, y) dν(y)

dµ(x)<∞ ou

Z

F

Z

E

f(x, y) dµ(x)

dν(y)<∞.

Références

Documents relatifs

Donner une majoration de la probabilité qu'au moins 3 aient leur anniversaire le même jour.. ,X n des variables aléatoires réelles, de carré intégrables et indépendantes. La

Université Paris 13, Institut Galilée MACS 2 Probabilités Année universitaire 20172018.. Examen du 9

Soit (E,A) et (F,B) des espaces mesurables. En pratique, toutes les fonctions que l’on manipule sont obtenues ainsi et sont donc mesurables pour les tribus boréliennes. Quelle est

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2016-2017.. Examen du 4

Université Paris 13, Institut Galilée MACS 2 Probabilités Année universitaire 20162017.. Devoir maison n

Pour aller plus loin (démonstrations complètes) : Intégration et

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016.. où on énumère les fractions dont la somme des valeurs absolues

Définir et étudier une extension de la définition de l’intégrale d’une fonction (appelée intégrale de Lebesgue), et son application à la théorie