LaurentTournier Intégration&Probabilités

(1)

Université Paris 13, Institut Galilée — MACS 1 Année universitaire 2015–2016

Intégration & Probabilités

Laurent Tournier

(2)

(3)

Intégration

(4)

(5)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2015-2016

0. Préliminaires sur les ensembles

1 Notations

SoitE un ensemble.

– SiA est une partie deE (c’est-à-direA⊂E), on noteA^c=E\Ale complémentaire deA.

– On noteP(E)l’ensemble des parties deE.

– Si la famille(Ai)_i∈I de parties deE est disjointe (c’est-à-dire que Ai∩Aj =∅ pour tous i6=j dans I), on peut noter]

i∈I

A_i leur réunion (le “+” rappelle que lesA_i sont disjoints).

– Si la suite (A_n)_n∈N de parties deE est croissante (c’est-à-dire queA_n ⊂A_n+1 pour toutn ∈N), on peut noter [

%

n∈N

An leur réunion (la flèche rappelle que la suite est croissante).

– Si la suite(An)_n∈N de parties de E est décroissante (c’est-à-dire queAn+1 ⊂An pour tout n∈N), on peut noter \

&

n∈N

An leur intersection (la flèche rappelle que la suite est décroissante).

– SiA est une partie deE, on note1A sa fonction indicatrice :

1_A: E → {0,1}

x 7→ 1A(x) =

(1 six∈A 0 six /∈A.

– Si une suite réelle(un)n∈N est croissante, on peut noter lim↑_nun sa limite (dans R).

– Si une suite réelle(un)n∈N est décroissante, on peut noter lim↓_nun sa limite (dans R).

2 Dénombrabilité

Définition

Un ensemble E estdénombrablesiE =∅ou s’il existe une application ϕ:N→E surjective, c’est-à-dire que

E=ϕ(N) ={ϕ(n)|n∈N}={ϕ(0),ϕ(1),ϕ(2), . . .}.

Autrement dit,E est dénombrable si on peuténumérer ses éléments, en faire une liste (éventuellement infinie).

Exemples.

– les ensembles finis sont dénombrables (si E = {x1, . . . ,xn}, on a E = ϕ(N) pour ϕ : N → E définie par ϕ(i) =xi si1≤i≤net ϕ(i) =xn pour touti > n)

– Nest évidemment dénombrable :N={0,1,2,3, . . .}

– Zest dénombrable : par exemple,

Z={0,1,−1,2,−2,3,−3, . . .},

où on alterne entiers positifs et négatifs par ordre croissant de valeur absolue.

– N×N={(m,n)|m∈N,n∈N}est dénombrable : par exemple, N×N=

(0,0),(1,0),(0,1),(2,0),(1,1),(0,2), . . . ,

où on énumère les couples dont la somme vaut 0, puis 1, puis 2, etc. (à chaque fois, il y en a un nombre fini).

– Qest dénombrable : par exemple, (quitte à répéter certains rationnels plusieurs fois) Q=

0,1 1,−1

1,1 2,−1

2,2 1,−2

1,3 1,−3

1,1 3,−1

3,4 1,−4

1,3 2,−3

2,2 3,−2

3,1 4,−1

4, . . .

où on énumère les fractions dont la somme des valeurs absolues du numérateur et du dénominateur vaut 0, puis 1, puis 2, etc. (il y en a un nombre fini pour une somme donnée), en alternant positifs et négatifs.

(6)

– R n’est pas dénombrable : on peut le démontrer à l’aide de l’argument de la diagonale de Cantor. Il suffit de montrer que [0,1] n’est pas dénombrable (ceci est justifié par la propriété a) suivante). Supposons, par l’absurde, que ce soit le cas : on aurait[0,1] =ϕ(N) ={ϕ(0),ϕ(1), . . .} pour une fonctionϕ:N→[0,1]. Mais alors on peut facilement donner un réelx∈[0,1]différent deϕ(n)pour toutn∈N: il suffit que pour toutn, lan-ième décimale de x soit choisie différente de lan-ième décimale de ϕ(n), et différente de 0 et 9 (cette précision évite quexsoit un nombre décimal et n’ait pas une écriture unique : 0,4999. . .= 0,5000. . .). Ainsi pour toutn,xest différent deϕ(n)(comme leursn-ièmes décimales diffèrent, x6=ϕ(n)si le développement deϕ(n)est unique, etx6=ϕ(n)aussi sinon car alorsϕ(n)est décimal orxne l’est pas). On obtient donc une contradiction avec le fait que la suite précédente énumère tous les éléments de [0,1], d’où il résulte que[0,1]

n’est pas dénombrable.

Propriétés

a) Si E⊂F et F est dénombrable, alorsE est dénombrable aussi.

b) SiE etF sont dénombrables, alorsE×F sont dénombrables.

c) Si, pour toutn, En est dénombrable, alors[

n

En est dénombrable.

Démonstration : a) SiE ouF est vide, c’est vrai. Sinon, on choisitx0∈E, etϕtelle queF =ϕ(N). AlorsE=ψ(N) oùψ(n) =ϕ(n)siϕ(n)∈Eetψ(n) =x0 siϕ(n)∈/E, ce qui montre queEest dénombrable.

b) On a vu queN×Nest dénombrable : il existeϕ:N→N×Ntelle queN×N=ϕ(N). Si E ouF est vide,E×F aussi, donc est dénombrable. Sinon, il existeϕEetϕF telles queE=ϕE(N)etF=ϕF(N). On a alorsE×F=ψ(N)où

ψ:k7→(ϕE(ϕ1(k)),ϕF(ϕ2(k)))

en notant ϕ(k) = (ϕ1(k),ϕ2(k)) ∈ N×N. En effet, pour tousx ∈ E et y ∈F, il existe m,n tels quex =ϕE(m) et y=ϕF(n), et il existektel queϕ(k) = (m,n), d’où(x,y) = (ϕE(m),ϕF(n)) = (ϕE(ϕ1(k)),ϕF(ϕ2(k))) =ψ(k).

c) On utilise à nouveau la fonctionϕci-dessus, telle queN×N=ϕ(N). On peut supposer queEn6=∅pour toutncar les ensembles vides ne modifient pas la réunion. Pour toutn∈N, il existe alors ψn:N→En telle queEn=ψn(N). Et on aS

nEn=ξ(N), où

ξ:k7→ψϕ₁(k)(ϕ2(k)).

En effet, pour toutx∈ S

nEn, il existen tel que x∈En, donc il existem tel que x=ψn(m), et il existe k tel que (n,m) =ϕ(k), d’oùx=ξ(k).

(7)

1. Espace mesurés

On définit ici les éléments qui nous serviront de cadre pour la théorie de l’intégration.

1 Tribus

Définition

SoitE un ensemble. Unetribu(ouσ-algèbre) surE est un ensembleAde parties deE telle que (i) ∅ ∈ A;

(ii) si A∈ A, alorsA^c ∈ A(stabilité par passage au complémentaire) (iii) si(An)n∈N est une suite de parties dansA, alors [

n∈N

An∈ A;(stabilité par union dénombrable) (E,A)est unespace mesurable. Une partieA∈ Aest ditemesurable.

Les conséquences suivantes sont aussi importantes que la définition : Propriétés

a) E∈ A;

b) siA₁, . . . ,A_n∈ A, alorsA₁∪ · · · ∪A_n∈ A; c) si(A_n)_n∈N est une suite de parties dansA, \

n∈N

A_n∈ A; (stabilité par intersection dénombrable) d) siA₁, . . . ,A_n∈ A, alorsA₁∩ · · · ∩A_n∈ A;

e) siA,B∈ AetA⊂B, alorsB\A∈ A.

Démonstration : a) résulte de (i) et (ii) carE=∅^c. b) résulte de (i) et (iii) en prenantAk=∅pour toutk > n.

c) résulte de (i) et (iii) car

[

n

An=

\

n

(An)^c c

. d) résulte de c) en prenantAk=E pour toutk > n.

e) résulte de (ii) et d) carB\A=B∩A^c.

Attention.Si(A_i)_i∈I est une famille de parties mesurables, alors les ensembles[

i∈I

A_i et\

i∈I

A_isont mesurables à condition queIest dénombrable (car on peut écrireI={i_n|n∈N}et doncS

iA_i=S

nA_i_n) ; mais siIn’est pas dénombrable, alors ce n’est pas toujours vrai.

Exemples.

– P(E)est latribu discrètesurE.

– {∅,E}est latribu grossièresurE.

Définition-proposition

Soit C un ensemble de parties de E. Il existe une plus petite tribu qui contient C. On la note σ(C), et on l’appelle latribu engendrée par C.

Démonstration : Par la définition de tribu, on voit facilement que l’intersection d’une famille de tribus est une tribu (le vérifier en exercice). En particulier, l’intersection de toutes les tribus surEcontenantC est une tribu, et c’est la plus petite : par sa définition, elle est incluse dans toute tribu contenantC.

– surR^d, la tribu borélienneest la tribu engendrée par les ouverts. On la note B(R^d). On peut vérifier que B(R^d)est aussi la tribu engendrée par les intervalles deR^d. Ses éléments sont lesboréliens.

Ainsi, tout ensemble construit à partir d’intervalles à l’aide des opérations de passage au complémentaire, d’union dénombrable et d’intersection dénombrable, est un borélien.En pratique,tous les sous-ensembles deR que l’on manipule sont obtenus ainsi et sont donc boréliens.

(8)

2 Mesures

Soit(E,A)un espace mesurable.

Définition

Une mesuresur(E,A)est une applicationµ:A →[0,+∞]telle que (i) µ(∅) = 0

(ii) pour toute suite(A_n)_n∈N de parties mesurablesdisjointes,µ

]

n∈N

A_n

=X

n∈N

A_n.

(E,A,µ)est unespace mesuré.µ(E)est lamasse totaledeµ. On dit queµestfiniesiµ(E)<∞.

Les conséquences suivantes sont aussi importantes que la définition : Propriétés

a) Si A1, . . . ,An ∈ Asont disjoints, alorsµ(A1] · · · ]An) =µ(A1) +· · ·+µ(An).

b) SiA,B∈ Aet A⊂B, alorsµ(A)≤µ(B)et, siµ(A)<∞, alorsµ(B\A) =µ(B)−µ(A).

c) Pour tousA,B∈ A, etµ(A∩B)<∞, alorsµ(A∪B) =µ(A) +µ(B)−µ(A∩B).

d) Si(An)n est une suite croissante de parties mesurables, alorsµ [

%

n

An

= lim↑

n

µ(An).

e) Si (An)n est une suite décroissante de parties mesurables, etµ(A0)<∞, alorsµ \

&

n

An

= lim↓

n

µ(An).

f) Pour toute suite(An)n de parties mesurables,µ [

n

An

≤X

n

µ(An).

Démonstration : a) résulte de (ii) et (i) en prenantAk=∅sik > n

b) On a la réunion disjointeB=A](B\A)donc par a)µ(B) =µ(A) +µ(B\A)≤µ(A)carµest à valeurs positives.

Siµ(A)<∞, on peut retrancher cette quantité à chaque membre de l’égalité précédente pour obtenir la formule.

c) On a la réunion disjointeA∪B=A](B\(A∩B))doncµ(A∪B) =µ(A) +µ(B\(A∩B))et siµ(A∩B)<∞, la formule se déduit alors de b).

d) Pour toutn,An⊂An+1donc par b)µ(An)≤µ(An+1): la suite(µ(An))nest croissante. On poseC0=A0 et, pour toutn≥1,Cn=An\An−1∈ Ade sorte que, pour toutn,An=C0] · · · ]Cn, et doncS

nAn=U

nCn. Alors µ

[

n

An

=µ

]

n

Cn

=X

n

µ(Cn) = lim↑

N N

X

n=0

µ(Cn) = lim↑

N

µ ^N

]

n=0

Cn

= lim↑

N

µ(AN).

e) En notantBn=A0\An, alors la suite(Bn)nest croissante etS

nBn=A0\T

nAn, ce qui permet de déduire e) de d) à l’aide de b) vu que pour toutn,An⊂A0donc µ(An)≤µ(A0)<∞.

f) On poseC0=A0 et, pour toutn≥1,Cn=An∩(A0∪ · · · ∪An−1)^c∈ A, de sorte que les ensemblesCnsont disjoints et, pour toutn,A0∪ · · · ∪An=C0] · · · ]CndoncS

nAn=U

nCn. Alors µ

[

n

An

=X

n

µ(Cn),

maisCn⊂Andoncµ(Cn)≤µ(An), ce qui donne l’inégalité attendue.

Exemples.

– SoitE un ensemble. Sur(E,P(E)), lamesure de comptageµ_E est définie par : pour toutA⊂E, µ_E(A) =

(Card(A) siAest fini

∞ siAest infini.

Ainsi, «µ_E place un poids 1 en chaque point de E»

– Soit(E,A)un espace mesurable, et x∈E. Lamesure de Dirac en xest la mesureδ_x définie par : pour toutA∈ A, δ_x(A) =

(1 six∈A

0 six /∈A =1_A(x).

Ainsi, «δ place un poids 1 au point x»

(9)

– Si(µn)n≥0 est une suite de mesures sur(E,A)et(αn)n≥0 une suite de réels positifs, alors on peut définir la mesureµ=P

n≥0αnµn par

pour toutA∈ A, µ(A) =X

n≥0

α_nµ_n(A).

En particulier, si(xn)_n≥0est une suite de points deE, on peut considérerµ=P

n≥0αnδx_n qui, pour toutn,

« place un poidsαn enxn ».

Définition-théorème

Il existe une unique mesure λ_d sur(R^d,B(R^d))telle que, pour tout pavé fermé[a₁,b₁]× · · · ×[a_d,b_d], λ_d [a₁,b₁]× · · · ×[a_d,b_d]

=|b₁−a₁| · · · |b_d−a_d|.

On l’appelle mesure de Lebesgue sur R^d.

Démonstration : Un peu longue : voir document sur mon site internet.

– surR, la mesureλ=λ₁ vérifieλ([a,b]) =b−apour tout segment[a,b]aveca≤b. Cette mesure correspond donc à lalongueur sur R. Le théorème signifie que l’on peut définir la longueur de n’importe quel borélien, et qu’elle vérifie la condition (ii).

– sur R², la mesure λ2 vérifie λ2([a,b]×[c,d]) = (b−a)(d−c)pour tout rectangle [a,b]×[c,d] avec a≤b et c≤d. Cette mesure correspond donc à l’aire surR².

– surR³, la mesureλ3 correspond de même auvolume.

Propriétés

a) λ_d estinvariante par translation: pour toutA∈ B(R^d)eta∈R^d, λd(a+A) =λd(A),

oùa+A={a+x|x∈A}.

b) λd esthomogène de degré d: pour toutA∈ B(R^d)et t∈R, λd(tA) =|t|^dλd(A), oùtA={tx|x∈A}.

Pour montrer que deux mesures sont égales, il suffit de comparer leurs valeurs sur les pavés : Proposition

Soitµ,ν deux mesures sur(R^d,B(R^d)). Si, pour tout pavé ferméP,µ(P) =ν(P)<∞, alorsµ=ν. Définition

Soitµune mesure sur(E,A).

– Si A∈ Aest tel queµ(A) = 0, on dit queAest négligeable.

On peut préciser « µ-négligeable », ou « négligeable pour la mesureµ », si la mesureµ n’est pas claire d’après le contexte.

– Si une propriétéP_x est vraie pour toutx∈A, où A^c est négligeable pour la mesureµ, on dit queP_x est vraie pour presque toutx, ou encore queP est vraiepresque partout.

On peut préciser «µ-presque partout », ou « presque partout pour la mesureµ», si la mesureµn’est pas claire d’après le contexte.

Sans précision, surR^d, « presque tout » fait référence à la mesure de Lebesgueλ_d.

(10)

3 Fonctions mesurables

Les démonstrations de cette partie se trouvent sur mon site internet.

Définition

Soit(E,A)et(F,B)des espaces mesurables. Une application f :E→F estmesurablesi pour toutB∈ B, f⁻¹(B)∈ A.

Proposition

Les fonctions continues f :R^d →R^d⁰ sont mesurables (pour les tribus boréliennes).

On considèrera souvent des fonctions f sur (E,A) à valeurs dans R= R∪ {−∞,+∞}, c’est-à-dire que l’on pourra avoirf(x) = +∞ouf(x) =−∞pour certainsx∈E. La tribuB(R)est formée des boréliens deRet de tous les ensembles de la formeB∪ {+∞},B∪ {−∞}etB∪ {+∞,− ∞}, pourB∈ B(R).

Dire quef est mesurable signifie alors que, pour toutB∈ B(R),f⁻¹(B)∈ A, et aussi que f⁻¹({+∞})∈ Aet f⁻¹({−∞})∈ A.

Propriétés

Si f,g:E→Rsont mesurables, et si(fn)n est une suite de fonctions mesurables de EdansR, alors a) la somme f+g est mesurable

b) le produitf gest mesurable

c) les fonctionssup_nf_n etinf_nf_n (à valeurs dansR) sont mesurables d) la valeur absolue|f|est mesurable

e) les fonctionslim inf_nf_n etlim sup_nf_n (à valeurs dansR) sont mesurables f) sif_n(x)→h(x)∈Rpour toutx∈E, alorshest mesurable.

Un rappel surlim inf etlim supse trouve dans le chapitre suivant, page 12.

Ainsi, toute fonction de R^d dansR obtenue à partir de fonctions continues par ces opérations est mesurable.

En pratique, toutes les fonctions que l’on manipule sont obtenues ainsi et sont donc mesurables pour les tribus boréliennes.

Il en va de même pour les fonctions deR^d dansR^d⁰ par la proposition suivante : Proposition

Une fonctionf :R^d→R^d⁰ est mesurable si, et seulement si ses composantes le sont.

(11)

2. Intégration par rapport à une mesure

Soit(E,A,µ)un espace mesuré.

1 Intégrale de fonctions mesurables positives

Définition

Une fonction étagée sur (E,A) est une fonction mesurable g : (E,A) → (R,B(R)) qui ne prend qu’un nombre fini de valeurs. Autrement dit, il existeα1, . . . ,αn ∈R(les valeurs) etA1, . . . ,An∈ A disjoints tels que

pour toutx∈R, g(x) =

n

X

i=1

α_i1_A_i(x) =











α1 six∈A1

...

α_n six∈A_n 0 sinon.

NB. Les fonctions en escalier surRsont étagées (c’est le cas où lesAisont des intervalles), mais il y a beaucoup plus de fonctions étagées, par exempleg=1Q.

Ces fonctions forment un espace vectoriel.

Définition

Si g est étagée et positive (autrement dit, α_i≥0pour i= 1, . . . ,n) alors, avec l’écriture deg ci-dessus, on définit

Z gdµ=

n

X

i=1

αiµ(Ai)∈[0,+∞], avec la convention que, si α_i= 0et µ(A_i) =∞, alorsα_iµ(A_i) = 0.

On peut vérifier que cette définition ne dépend pas du choix de l’écriture de g sous la formeg=P

iα_i1_A_i, que les ensembles A_i soient disjoints ou non.

En particulier,

Z

1_Adµ=µ(A). Propriétés

Soitg,h des fonctions étagées positives.

a) Pour tous réelsa,b≥0,R

(ag+bh)dµ=aR

gdµ+bR hdµ.

b) Sig≤h, alorsR

gdµ≤R hdµ.

Démonstration : Sig=P

iαi1A_i eth=P

jβj1B_j avec(Ai)i disjoints, et(Bj)j disjoints, alors en introduisant les ensemblesAij=Ai∩Bj, la fonctionaf+bhprend la valeuraαi+bβj surAij, ce qui permet d’obtenir a) ; et surAij

la fonctiongvaut αi ethvaut βj donc, siAij6=∅,αi≤βj, ce qui permet d’obtenir b).

Définition

Soitf :E→[0,+∞]mesurable. On note Z

f dµ= sup

hétagée, 0≤h≤f

Z

h dµ∈[0,+∞],

et cette quantité est appelée l’intégrale de f par rapport à µ.

NB. On utilise aussi les notations suivantes :R

f dµ=R

f(x)dµ(x) =R

f(x)µ(dx)et on peut spécifier R

E. Dans la suite, de même que dans cette définition, une fonction « mesurable positive » est supposée prendre ses valeurs dans[0,+∞].

(12)

Notons que par la propriété b) ci-dessous, sif =∞ ·1A (autrement dit,f(x) =∞six∈Aetf(x) = 0sinon) avecµ(A) = 0alorsR

f dµ=“∞·0” = 0. Ainsi, pourα∈R+∪{+∞},R

α1Adµ=αµ(A)avec “0·∞=∞·0 = 0”.

Propriétés

Soitf,g des fonctions mesurables positives.

a) Si f ≤g, alorsR

f dµ≤R gdµ.

b) Sif = 0presque partout (pour la mesureµ), alorsR

f dµ= 0.

Démonstration : Sif≤g, alors toute fonction étagéehtelle que0≤h≤fvérifie aussi0≤h≤g, d’où a) (le sup qui définit l’intégrale degporte sur un ensemble plus grand, donc est plus grand).

Sif= 0presque partout, et0≤h≤fest étagée, on ah=P

iαi1A_i (avecAidisjoints) et, siαi>0, on a, pourx∈Ai, f(x) ≥h(x) =αi >0, doncAi ⊂ {x∈R|f(x)6= 0}d’où µ(Ai) ≤µ({f 6= 0}) = 0et doncµ(Ai) = 0; on déduit que Rhdµ=P

iαiµ(Ai) = 0. D’où b).

Théorème (Théorème de convergence monotone (TCM))

Soit(fn)n une suitecroissantede fonctions mesurablespositives. Alors Z

lim↑

n

fndµ= lim↑

n

Z fndµ.

Démonstration : On notef= lim↑_nfn, qui est une fonction mesurable positive.

Pour toutn,fn≤fn+1, d’oùR

fndµ≤R

fn+1dµ. Ainsi, la suite

Rfndµ

n est croissante et donc converge (dansR).

De même, pour toutn,fn≤f, d’oùR

fndµ≤R

f µ, et en passant à la limite on a lim↑

n

Z

fndµ≤ Z

f dµ.

Il reste à voir l’inégalité inverse.

Soithune fonction étagée telle que0≤h≤f. Soitε >0.

Pour tout x ∈ E, si h(x) > 0, on a lim↑_nfn(x) = f(x) ≥ h(x) > (1−ε)h(x) donc il existe n (grand) tel que fn(x)≥(1−ε)h(x); et sih(x) = 0alorsfn(x) = 0pour toutndonc évidemmentfn(x)≥(1−ε)h(x). Autrement dit,

E=[

%

n

En, où En={x∈E|fn(x)≥(1−ε)h(x)} ∈ A.

Par définition deEn, on a pour toutx∈En,fn(x)≥(1−ε)h(x). Par conséquent, commefn≥0, on afn≥(1−ε)h1E_n. Commehest étagée, elle s’écrith=P

1≤i≤rαi1A_i, si bien queh1En=P

1≤i≤rαi1A_i∩E_n est étagée elle aussi et Z

fndµ≥ Z

(1−ε)h1E_ndµ= (1−ε)

r

X

i=1

αiµ(Ai∩En).

Soit1≤i≤r. La suite(Ai∩En)nest croissante (car(En)nest croissante) et sa réunion estAi(car la réunion desEn

estE) donc

lim↑

n

µ(Ai∩En) =µ(Ai).

En passant à la limite dans l’inégalité précédente, on a donc lim↑

n

Z

fndµ≥(1−ε)

r

X

i=1

αiµ(Ai) = (1−ε) Z

hdµ.

Pourε→0, ceci donne

lim↑

n

Z

fndµ≥ Z

hdµ.

Et ceci vaut pour toute fonctionhétagée telle que0≤h≤f, donc on a finalement lim↑

n

Z

fndµ≥ Z

f dµ, ce qui conclut la preuve.

(13)

Par le TCM, pour calculerR

f dµ, on peut considérerlim↑_nR

fndµpour n’importe quelle suite croissante(fn)n

qui converge versf. Par exemple une suite de fonctions étagées : Lemme

Si f est mesurable positive, alors il existe une suite croissante (f_n)_n de fonctions étagées positives qui converge versf.

Démonstration : On peut prendre fn(x) =

(_k

2ⁿ sif(x)∈k 2ⁿ,^k+1₂n

etf(x)< n

n sif(x)≥n. .

La distinction permet de s’assurer quefnne prend qu’un nombre fini de valeurs même si f n’est pas bornée. Le choix de2ⁿ assure la croissance defn (la subdivision se raffine à chaque pas).

Propriétés

Pour f,g mesurables positives, eta,bréels positifs, Z

af+bg dµ=a

Z

f dµ+b Z

gdµ.

Démonstration : Le lemme fournit des suites croissantes(fn)n et(gn)n de fonctions étagées positives qui convergent versfetg. Pour toutn, par les propriétés de l’intégrale des fonctions étagées positives,

Z

(afn+bgn)dµ=a Z

fndµ+b Z

gndµ,

ce qui donne l’égalité annoncée en passant à la limite grâce au TCM.

Le théorème de convergence monotone admet une réécriture en termes de séries : Corollaire (Théorème de convergence monotone pour les séries positives)

Si (fn)n≥0est une suite de fonctions mesurables positives, alors Z ^∞

X

n=0

f_n

! dµ=

∞

X

n=0

Z f_ndµ.

Démonstration : On applique le TCM à la suite des sommes partielles Sn = Pn

k=0fk ≥ 0, qui est croissante (car fn≥0), et converge versS=P∞

k=0fk. On a ainsi Z

Sdµ= lim↑

n

Z Sndµ.

Or, par la propriété précédente, Z

Sndµ= Z n

X

k=0

fk

dµ=

n

X

k=0

Z

fkdµ−→

n

∞

X

k=0

Z fkdµ

d’où la conclusion.

Proposition (Inégalité de Markov)

Pour toute fonction mesurable positivef, et tout réel a >0, µn

x∈E

f(x)≥ao

≤ 1 a

Z f dµ.

Démonstration : L’ensembleA={x∈E|f(x)≥a}vérifief≥a1A(pour x∈A,f(x)≥a=a1A(x), et pourx /∈A, f(x)≥0 =a1A(x)). Par suite, en intégrant,

Z f dµ≥

Z

a1Adµ=aµ(A), ce qui donne l’inégalité.

(14)

Corollaire

Soitf,g des fonctions mesurablespositives.

a) Si R

f dµ <∞, alorsf <∞presque partout.

b) R

f dµ= 0si, et seulement sif = 0presque partout.

c) Si f =g presque partout, alors R

f dµ=R gdµ.

Démonstration : a) On supposeR

f dµ <∞. Pour toutn, on noteAn={f≥n}(={x∈E|f(x)≥n}, et A∞={f=∞}=\

&

n

An. Pour toutn, on aµ(An)≤_n¹R

f dµpar l’inégalité de Markov, doncµ(A1)<∞, etµ(An)→0. On a donc µ(A∞) =µ

&\

n

An

= lim↓

n

µ(An) = 0.

b) On suppose R

f dµ= 0. On a {f > 0}=S

%_n{f ≥ _n¹}donc µ({f > 0}) = lim↑_nµ({f ≥ _n¹}) = 0car l’inégalité de Markov donneµ({f≥_n¹})≤nR

f dµ= 0quel que soitn. La réciproque a déjà été vue.

c) On supposef =g presque partout. En particulier, la fonctionh = max(f,g)−min(f,g) est nulle presque partout etpositive(ce qui n’est peut-être pas le cas def−g), donc R

hdµ= 0. Par la propriété, on a alorsR

max(f,g)dµ= Rmin(f,g)dµ. Ormin(f,g)≤f ≤max(f,g) et de même pourg; en passant aux intégrales, on voit queR

f dµetR f dµ sont encadrées parR

min(f,g)dµetR

max(f,g)dµqui sont égales, et donc en particulierR

f dµ=R gdµ.

On rappelle que, pour une suite de réels(xn)n, on définit lim inf

n xn= sup

n

k≥ninf xk= lim↑

n

k≥ninf xk

et

lim sup

n

x_n= inf

n sup

k≥n

x_k= lim↓

n

sup

k≥n

x_k.

On a les propriétés suivantes : lim sup_n(−xn) = −lim infnxn, et la suite (xn)n converge si, et seulement si lim infnxn= lim sup_nxn, et dans ce caslimnxn= lim infnxn= lim sup_nxn. De façon générale,lim infnxn est la plus petite limite d’une sous-suite de (xn)n (et lim sup_nxn la plus grande. On dit aussi que ce sont la plus petite valeur d’adhérence de la suite et la plus grande.

Pour une suite (fn)n de fonctionsE → R, on peut alors définir les fonctions lim infnfn et lim sup_nfn, par : pourx∈E,

lim inf

n f_n

(x) = lim inf

n f_n(x) et lim sup

n

f_n

(x) = lim sup

n

f_n(x).

Ces définitions ont aussi un sens si on autorise les valeurs−∞et+∞pour les suites et les fonctions.

Théorème (Lemme de Fatou)

Soit(fn)n≥0 une suite de fonction mesurables positives. On a Z

lim inf

n fn

dµ≤lim inf

n

Z fndµ.

Démonstration : On a, par TCM, Z

lim inf

n fndµ= Z

lim↑

n

k≥ninf fkdµ= lim↑

n

Z

k≥ninf fkdµ.

Or, pour toutn, pour toutm≥n,infk≥nfk≤fm, doncR

infk≥nfkdµ≤R

fmdµ, d’oùR

infk≥nfkdµ≤infm≥nR fmdµ.

En passant à la limite,

lim↑

n

Z

k≥ninffkdµ≤lim↑

n m≥ninf

Z

fmdµ= lim inf

n

Z fndµ,

ce qui donne le résultat vu la première égalité.

NB. Voici trois exemples de suites (fn)n telles que fn → 0 et R

fndµ 6→ 0 (on a même R

nfndµ = 1 pour toutn). On utiliseE=R, muni de la mesure de Lebesgueµ=λ1.

« bosse voyageuse » :f_n=1_[n,n+1]

« concentration en 0 » :f_n=n1_[1 n,_2n¹]

« écrasement » :fn= _n¹1_[−ⁿ

2,+ⁿ₂].

(15)

2 Fonctions intégrables

Définition

Soitf :E→Rune fonction mesurable.f estintégrable par rapport à µsi Z

|f|dµ <∞.

On pose alors

Z

f dµ= Z

f+dµ− Z

f₋dµ∈R,

oùf+= max(0,f)et f−= max(0,−f)sont les parties positive et négative de f. On note L¹(E,A,µ)l’espace des fonctions intégrables par rapport àµ.

NB. On a|f| =f++f₋ ≥f₋, ce qui justifie que R

f₋dµ <∞et donne un sens à la soustraction ci-dessus.

De même,R

f+dµ <∞doncR

f dµest bien réel.

On abrège souventL¹(E,µ), voireL¹(E)ou mêmeL¹ si le contexte précise(E,A,µ).

Propriétés

a) Pour toute f ∈ L¹(E,A,µ), Z

f dµ

≤ Z

|f|dµ b) L¹(E,A,µ)est un espace vectoriel, etf 7→R

f dµest une application linéaire deL¹(E,A,µ)dansR.

c) Pour f,g∈ L¹(E,A,µ), sif ≤g, alors Z

f dµ≤ Z

gdµ.

d) Pourf,g∈ L¹(E,A,µ), sif =gpresque partout, alors R

f dµ=R gdµ.

Démonstration : a) On af=f+−f−et|f|=f++f−, donc par inégalité triangulaire,

Z

f dµ

= Z

f+dµ− Z

f−dµ

≤ Z

f+dµ

+ Z

f−dµ

= Z

f+dµ+ Z

f−dµ= Z

(f++f−)dµ= Z

|f|dµ.

b) Décomposer en parties positives et négatives... Exercice.

c)g=f+ (g−f)etg−f≥0doncR

(g−f)dµ≥0etR

gdµ=R

f dµ+R

(g−f)dµ≥R f dµ.

d) sif=gpresque partout, alorsf+=g+ presque partout etf−=g−presque partout (là oùf etgsont égales, leurs parties positives et négatives aussi), doncR

f+dµ=R

g+dµ, de même pourf−etg−d’oùR

f dµ=R gdµ.

Théorème (Théorème de convergence dominée (TCD))

Soit(fn)n une suite de fonctions mesurablesE→R, etf une fonction mesurableE→R. On suppose (i) fn(x)→f(x)pour presque partoutx∈E;

(ii) il existeϕ:E→R₊ mesurable telle queR

ϕdµ <∞et

pour toutn, pour presque tout x∈E, |fn(x)| ≤ϕ(x). (hypothèse de domination) Alors, pour tout n,f_n ∈ L¹(E,A,µ), f ∈ L¹(E,A,µ),

Z

fndµ−→

n

Z

f dµ et Z

|fn−f|dµ−→

n 0.

Démonstration : Le fait quefnetf soient intégrables vient des inégalités |fn| ≤ϕet, à la limite,|f| ≤ϕ. Elles sont vraie presque partout, dontR

|fn|dµ≤R

ϕdµ <∞et de même pourf.

Pour simplifier, supposons (i) et (ii) vrais partout. Les fonctionsϕ−fnetϕ+fnsont positives. On peut leur appliquer le lemme de Fatou. Pourϕ−fn :

Z lim inf

n (ϕ−fn)dµ≤lim inf

n

Z

(ϕ−fn)dµ (∗)

Orlim infn(ϕ−fn) =ϕ−f donc Z

lim inf

n (ϕ−fn)dµ= Z

ϕdµ− Z

f dµ.

Et

lim inf

n

Z

(ϕ−fn)dµ= Z

ϕdµ−lim sup

n

Z fndµ.

Ainsi, (∗) donne

lim sup

n

Z

fndµ≤ Z

f.

(16)

Les mêmes arguments pourϕ+fndonnent

lim inf

n

Z

fndµ≥inff, d’où finalement

Z

f dµ≤lim inf Z

fndµ≤lim sup

n

Z

fndµ≤ Z

f dµ, ce qui montre que tous les termes sont égaux, et en particulierR

fndµconverge versR f dµ.

On peut alors donner une formule « concrète » de calcul de R

f dµ par approximation, qui correspond à la définition évoquée lors de la présentation du cours :

Corollaire

Soitf une fonction intégrable positive. Pour toute suite de subdivisions 0 =`⁽ⁿ⁾₀ < `⁽ⁿ⁾₁ <· · ·< `⁽ⁿ⁾_N_(n)deR telle que

max

0≤i<N(n)`⁽ⁿ⁾_i+1−`⁽ⁿ⁾_i −→

n 0 et `⁽ⁿ⁾_N_(n)→+∞, on a

Z

f dµ= lim

n N(n)

X

i=1

`⁽ⁿ⁾_i µ

f⁻¹ [`⁽ⁿ⁾_i ,`⁽ⁿ⁾_i+1[ .

Démonstration : Il s’agit de montrer queR

f dµ= limnR

fndµ, où on a défini les fonctions étagées

fn:x7→

N(n)

X

i=1

`⁽ⁿ⁾_i 1

f⁻¹([`⁽ⁿ⁾_i ,`⁽ⁿ⁾_i+1[)(x) =

(`⁽ⁿ⁾_i si`⁽ⁿ⁾_i ≤f(x)< `⁽ⁿ⁾_i+1, où0≤i < N(n) 0 sif(x)≥`⁽ⁿ⁾_N(n).

Pour toutx∈E on a, pour toutnassez grand,f(x)< `⁽ⁿ⁾_N(n) (par la deuxième condition sur la subdivision), et il existe alorsitel quefn(x) =`⁽ⁿ⁾_i ≤f(x)< `⁽ⁿ⁾_i+1d’où

0≤f(x)−fn(x)< `⁽ⁿ⁾_i+1−`⁽ⁿ⁾_i ≤max

j `⁽ⁿ⁾_j+1−`⁽ⁿ⁾_j −→

n 0

(par la première condition). Ceci montre que(fn)nconverge versf. Il reste à prouver une domination.

Or, sif(x)< `⁽ⁿ⁾_N(n), on a aussi vu quefn(x)≤f(x). Et sif(x)≥`⁽ⁿ⁾_N(n), alorsfn(x) = 0≤f(x). Donc on a, pour toutn, 0≤fn(x)≤f(x). Or on a suppose f intégrable. On peut donc appliquer le TCD à la suite(fn)n, dominée parϕ=f, ce qui conclut.

Notation. Pour A∈ A, on note Z

A

f dµ= Z

f1_Adµl’intégrale de f sur A par rapport à µ, lorsqu’elle a un sens, c’est-à-dire sif1Aest positive ou intégrable. Ceci a d’ailleurs un sens même sif n’est pas définie hors deA(car1_A vaut alors 0). On dit quef estintégrable sur Asi

Z

A

|f|dµ <∞.

Remarque importante. Toute cette partie s’étend aux fonctions à valeurs dansCetR^den intégrant composante par composante : par exemple, une fonction mesurable f :E→Cest intégrable siR

|f|dµ <∞et, dans ce cas,

Z

f dµ= Z

<e(f)dµ+i Z

=m(f)dµ.

Les résultats précédents restent alors vrais avec cette définition (linéarité, TCD).

(17)

3 Exemples principaux

3.1 Intégrale par rapport à une mesure atomique

(On dit quexest unatomedeµsi{x} ∈ Aetµ({x})>0) Proposition

Soitf :E→Rune fonction.

a) Soit x∈E.f est intégrable par rapport àδx et Z

f dδx=f(x).

b) Soit(x_n)_n≥0 une suite d’éléments deE et (α_n)_n≥0 une suite de réels≥0. On poseµ=X

n≥0

α_nδ_x_n. Sif est positive, on a

Z

f dµ=X

n≥0

αnf(xn)∈[0,+∞].

Pour f de signe quelconque, f est intégrable par rapport àµ si, et seulement si P

nαn|f(xn)|<∞et, dans ce cas,

Z

f dµ=X

n≥0

α_nf(x_n)∈R.

Démonstration : a) On af=f(x)1{x}presque partout, car ces fonctions coïncident enx, etδx({x}^c) = 0. Donc leurs intégrales sont égales :

Z

f dδx= Z

f(x)1{x}dδx=f(x)δx({x}) =f(x) (par la définition de l’intégrale d’une fonction étagée).

b) Soitf mesurable positive. Sig=f1F oùF ={xn|n∈N}, alors f=gpresque partout pour la mesureµ. En effet, f=gsurF, etµ(F^c) = 0. On a doncR

f dµ=R

gdµ. Or on ag= lim↑_ngnoùgn=Pn

k=0f(xk)1{x_k}donc, par TCM, Z

gdµ= lim↑

n

Z

gndµ= lim↑

n n

X

k=0

f(xk)µ({xk}) =

∞

X

k=0

f(xk)αk,

d’où l’égalité annoncée. Sif est de signe quelconque et intégrable, on applique ce qui précède àf+ etf− pour obtenir le résultat.

Ainsi, siµE est la mesure de comptage surE etf :E→R+, Z

f dµE=X

x∈E

f(x).

3.2 Intégrale par rapport à la mesure de Lebesgue (lien avec l’intégrale de Rie- mann)

On noteλ=λ₁(mesure de Lebesgue surR). Soita < b.

Rappel. Une fonction f : [a,b]→Rest intégrable au sens de Riemann si, pour toutε >0, il existe des fonctions en escalierϕetψsur[a,b]telles que

ϕ≤f ≤ψ et

Z b a

(ψ−ϕ)< ε,

où l’intégrale de la fonction en escalierψ−ϕest définie élémentairement (comme pour les fonctions étagées : si ϕ=P

iα_i1_]x_i_,x_i+1_[ alorsRb aϕ=P

iα_i(x_i+1−x_i)). Et dans ce cas on note Z b

a

f = sup

ϕen escalier, ϕ≤f

Z b a

ϕ= inf

ϕen escalier, f≤ψ

Z b a

ψ

Théorème

Si f est intégrable au sens de Riemann sur[a,b], alorsf est intégrable par rapport àλsur[a,b], et Z

[a,b]

f dλ= Z b

a

f.

(18)

Démonstration : Commeλ(]xi,xi+1[) =xi+1−xi (etλ({xi}) = 0), la formule est vraie pour les fonctions en escalier (en comparant à la formule pour l’intégrale des fonctions étagées).

Soitf une fonction intégrable au sens de Riemann.f est limite de fonctions en escalier, donc est mesurable. Soitε >0.

Il existeϕ,ψen escalier telles queϕ≤f≤ψ etRb

a(ψ−ϕ)< ε(où l’intégrale est au sens de Riemann ou de Lebesgue, par ce qui précède). En particulierf est bornée donc intégrable sur[a,b]: on a|f| ≤M (oùM =kϕk∞+kψk∞) donc R

[a,b]|f|dµ≤R

[a,b]M dµ= (b−a)M <∞. On a (par les propriétés de l’intégrale de Riemann) Z b

a

ϕ≤ Z b

a

f≤ Zb

a

ψ et aussi (par les propriétés de l’intégrale de Lebesgue)

Z

[a,b]

ϕdλ≤ Z

[a,b]

f dλ≤ Z

[a,b]

ψdλ.

Or Rb aϕ=R

[a,b]ϕdλ car ϕest en escalier, et de même pourψ. Ainsi les deux intégrales def appartiennent au même intervalle de largeur< ε, donc

Z b

a

f− Z

[a,b]

f dλ

< ε.

Ceci vaut pour toutε >0, d’où la conclusion.

Par suite, si I est un intervalle, pour f :I →Rmesurable positive, ou intégrable par rapport à λ, on pourra noter

Z

I

f = Z

I

f(x)dx= Z

I

f dλ, même sif n’est pas intégrable au sens de Riemann, sans confusion possible.

On pourra donc, pour des intégrales au sens de Riemann, appliquer les théorèmes précédents (convergence monotone, dominée, etc.) ; et pour des intégrales de Lebesgue de fonctions intégrables au sens de Riemann, utiliser les propriétés bien connues (intégration par parties, lien entre intégrale et primitive, etc.).

3.3 Intégrale par rapport à une mesure à densité

Soit(E,A)un espace mesurable.

On rappelle que, sif : E → R est mesurable, et A ∈ A, on note Z

A

f dµ= Z

f1Adµ l’intégrale de f sur A, lorsquef1_Aest à valeurs positives, ou lorsque f1_A est intégrable.

On vérifie facilement avec le TCM que, sif est positive,A7→R

Af dµest une mesure, d’où la définition : Définition

Sif est une fonction mesurableE→[0,+∞], etµune mesure surE, lamesure de densitéf par rapport à µest la mesuref·µ(aussi notéef(x)dµ(x)) définie par :

pour toutA∈ A, (f·µ)(A) = Z

A

f dµ= Z

f1Adµ.

NB.A est négligeable pourf·µdès queAest négligeable pourµou quef est nulle surA.

Proposition

Soitf une fonction mesurableE→[0,+∞], etµune mesure surE.

a) Pour toute fonction mesurable g:E→[0,+∞], on a Z

gd(f·µ) = Z

gf dµ= Z

g(x)f(x)dµ(x),

b) Une fonctiong:E→Rest intégrable par rapport àf·µsi, et seulement sif g est intégrable par rapport à µet, dans ce cas,

Z

gd(f·µ) = Z

gf dµ= Z

g(x)f(x)dµ(x).

Ceci justifie la notationf·µ=f(x)dµ(x). Pour la mesure de Lebesgue, vu le lien avec l’intégrale de Riemann, on notera aussif(x)dxpourf·λ. Par extension, vu que1·µ=µ, on pourra parfois noterdµ(x)pour désigner la mesureµ, et donc dxpour désigner la mesure de Lebesgueλ(ouλ ).

(19)

4 Intégrales dépendant d’un paramètre

Dans cette partie, on considère une famille(f(t,·))t∈I de fonctions, indexée par un intervalle réelI: plutôt qu’une suite, il s’agit d’un « continuum » de fonctions, que l’on peut aussi voir comme une fonctionf : I×E →R.

Lorsque les fonctionsf(t,·)sont intégrables, on peut considérer la fonction F :t7→F(t) =

Z

f(t,·)dµ= Z

f(t,x)dµ(x),

que l’on appelle une intégrale à paramètrecar elle dépend du réelt, appelé un paramètre. Le théorème de convergence dominée permet alors d’obtenir facilement des résultats de régularité surF.

Théorème (Théorème de continuité sous l’intégrale)

Soitf : (t,x)7→f(t,x)une fonction mesurable deI×E dansR^d ouC(oùI est un intervalle deR).

On suppose que :

– (continuité par rapport au paramètre) pourµ-presque toutx∈E,t7→f(t,x)est continue surI; – (domination) il existe une fonction ϕ: E → R+ mesurable telle que R

ϕ dµ < ∞ et, pour toutt ∈ I, pour µ-presque toutx∈E,

f(t,x)

≤ϕ(x).

Alors la fonction

F :t7→F(t) = Z

f(t,x)dµ(x) est bien définie pour toutt∈I, et est continue surI.

Démonstration : Soitt∈I. On montre queF est continue ent. On utilise la caractérisation des limites par les suites : pour montrer queF(u)→F(t)quandu→t, il suffit de montrer que, pour toute suite(tn)ndansI qui converge verst, F(tn)→F(t).

Soit(un)n une suite dansI qui converge vers t. Appliquons le TCD à la suite des fonctionsfn :x7→f(tn,x). Par la première hypothèse, on a, pour presque toutx∈E,fn(x)→f(t,x). Par la seconde hypothèse, on a, pour toutn, pour presque toutx∈E,

|fn(x)| ≤ϕ(x), etR

ϕdµ <∞. Le TCD donne alors exactementF(tn)−→

n F(t), ce qui conclut.

Théorème (Théorème de dérivation sous l’intégrale)

Soitf : (t,x)7→f(t,x)une fonction deI×E dansR^d ouC. On suppose que : – (existence de F)pour toutt∈I, x7→f(t,x)est intégrable ;

– (dérivabilité par rapport au paramètre) pourµ-presque toutx∈E,t7→f(t,x)est dérivable surI, de dérivée notée ^∂f_∂t;

– (domination de la dérivée)il existe une fonctionϕ:E→R₊ mesurable telle queR

ϕ dµ <∞et, pour tout t∈I, pour µ-presque toutx∈E,

∂f

∂t(t,x)

≤ϕ(x).

Alors la fonction

F :t7→F(t) = Z

f(t,x)dµ(x) est dérivable surI et, pour toutt∈I,

F⁰(t) = Z ∂f

∂t(t,x)dµ(x).

Démonstration : Soitt∈I. Soit une suite(tn)nqui converge verstdansI\ {t}. Il faut montrer que F(tn)−F(t)

tn−t −→

n

Z ∂f

∂t(t,x)dµ(x).

Or par linéarité

F(tn)−F(t) tn−t =

Z f(tn,x)−f(t,x) tn−t dµ(x), donc on va appliquer le TCD à la suite(gn)ndéfinie par

gn:x7→f(tn,x)−f(t,x) tn−t .

(20)

Pour presque tout x∈ E, la deuxième hypothèse donnegn(x)→ ^∂f_∂t(t,x). Et l’inégalité des accroissements finis et la troisième hypothèse donnent : pour toutn, pour presque toutx∈E,

|gn(x)| ≤ sup

u∈[t_n,t]

∂f

∂t(u,x)

≤ϕ(x), etR

ϕdµ <∞. Le TCD donne alorsR

gndµ→R ∂f

∂t(t,·)dµ, ce qui conclut.

Remarque :Si de plus la fonctiont7→ ^∂f_∂t(t,x)est continue pour presque toutx, alors le théorème de continuité montre queF⁰ est continue, et donc queF est de classeC¹ surI.

Deuxième remarque :Pour montrer queF est de classeC²,C³, . . . , on peut appliquer le théorème plusieurs fois. Pour montrer queF est de classeC^∞, on peut montrer par récurrence queF est de classeCⁿpour tout n.

(21)

3. Intégration sur un espace produit, changement de variables

Soit(E,A,µ)et (F,B,ν)deux espaces mesurés. On suppose dans ce chapitre queµet ν sontσ-finies: il existe une suite croissante(En)n de parties deEtelle que

E=[

n

En et pour toutn, µ(En)<∞, et de même pourν.

Pour une fonctionf :E×F →R, on peut considérer Z

E

Z

F

f(x,y)dν(y)

dµ(x). On va montrer que l’on peut voir cette double intégration comme une simple intégration sur l’espaceE×F. Ce point de vue aura l’avantage de mettre en évidence la symétrie des rôles de E et F, et donc de montrer que l’on peut intervertir l’ordre entre les intégrales précédentes. Il fournit de plus une façon de construire une mesure sur l’espaceE×F, qui permettrait de construire l’intégrale de Lebesgue surR² à partir de l’intégrale de Lebesgue surR, et qui jouera aussi un rôle important dans la notion d’indépendance en probabilités.

1 Produit d’espaces mesurés

On souhaite faire de E×F(= {(x,y)|x∈ E, y ∈ F}) un espace mesuré, c’est-à-dire le munir d’une tribu et d’une mesure, déduites de celles deEet F.

Définition

Latribu produitdeAetBest la tribu A ⊗ Bengendrée par les pavésA×B oùA∈ Aet B∈ B: A ⊗ B=σ

A×B

A∈ A, B∈ B .

Dans le cas des boréliens deR^d, cette opération redonne les tribus déjà connues : Proposition

Pour tousd,d⁰,B(R^d)⊗ B(R^d⁰) =B(R^d+d⁰).

Par suite,B(R^d) =B(R)⊗ · · · ⊗ B(R) =B(R)^⊗d en définissant de même une mesure produit dedmesures.

Pour tout ensembleC⊂E×F, on définit ses « tranches » : pour toutx∈E, C_x={y∈F|(x,y)∈C} ⊂F

pour touty∈F,

C^y ={x∈E|(x,y)∈C} ⊂E.

On pourrait vérifier que, siC∈ A ⊗ B, alors les tranches sont mesurables.

Théorème

Il existe une unique mesure msur(E×F,A ⊗ B)telle que

pour tousA∈ AetB∈ B, m(A×B) =µ(A)ν(B), (avec ici∞ ·0 = 0· ∞= 0). On la notem=µ⊗ν. De plus, pour toutC∈ A ⊗ B,

µ⊗ν(C) = Z

E

ν(Cx)dµ(x) = Z

F

µ(C^y)dν(y).

Cette mesure s’appelle la mesure produit de µ par ν. La dernière formule décrit une intégration « par tranches » : la mesure deC est l’intégrale des mesures de tranches, horizontales ou verticales.

Dans le cas de la mesure de Lebesgue surR^d, le produit redonne les mesures déjà connues : Proposition

Pour tousd,d⁰,λd⊗λd⁰ =λd+d⁰.

Par suite, en notantλ=λ₁, on aλ_d=λ⊗ · · · ⊗λ=λ^⊗d, en définissant par récurrence le produit dedmesures.

(22)

2 Théorèmes de Fubini

Les propriétés de la mesure produit se transfèrent aisément aux propriétés de l’intégrale et permettent de résoudre la question initiale.

Théorème (Théorème de Fubini-Tonelli)

Pour toute fonction mesurablef :E×F →[0,+∞], Z

E×F

f d(µ⊗ν) = Z

E

Z

F

f(x,y)dν(y)

dµ(x) = Z

F

Z

E

f(x,y)dµ(x)

dν(y).

Démonstration : La formule est vraie si f =1C oùC ∈ A ⊗ B : c’est le précédent théorème. Par suite, la linéarité de l’intégrale montre qu’elle est vraie pour toute fonction étagée positive. Finalement, sif est mesurable positive, alors f= lim↑_nfnpour une suite croissante(fn)nde fonctions étagées positives (surE×F), ce qui donne en particulier pour toutx∈E,fx=f(x,·) = lim↑_nfn(x,·)et donc, en appliquant deux fois le TCM,

lim↑

n

Z

E

Z

F

fn(x,·)dν

dµ(x) = Z

E

lim↑

n

Z

F

fn(x,·)dν

dµ(x) = Z

E

Z

F

lim↑

n

fn(x,·)dν

dµ(x) = Z

E

Z

F

f(x,·)dν

dµ(x) et, en appliquant une fois le TCM,

lim↑

n

Z

E×F

fnd(µ⊗ν) = Z

E×F

f d(µ⊗ν).

L’égalité pourfn donne alors l’égalité pourf en passant à la limite. L’autre égalité s’obtient de même en échangeant l’ordre d’intégration.

En conséquence de ce théorème, on pourra noter Z

E

Z

F

f(x,y)dν(y)dµ(x)sans parenthèses lorsquef est mesurable positive.

On déduit la mesure produit de deux mesures à densité en appliquant le théorème à(x,y)7→f(x)g(y): Proposition

Soitf :E→R₊etg:F →R₊mesurables. On a :(f·µ)⊗(g·ν) = (f⊗g)·(µ⊗ν), où(f⊗g)(x,y) =f(x)g(y).

Autrement dit,

f(x)dµ(x)

⊗ f(y)dν(y)

=f(x)g(y)d(µ⊗ν)(x,y).

Par ailleurs, le théorème précédent justifie la notation dµ(x)dν(y) pour la mesured(µ⊗ν)(x,y) =µ⊗ν et la proposition prend alors la forme naturelle suivante :

f(x)dµ(x)

g(y)dν(y)

=f(x)g(y)dµ(x)dν(y).

Dans le cas de R² avec la mesure de Lebesgue, la mesure produit des mesures f(x)dx et g(y)dy est donc naturellementf(x)g(y)dxdy.

En décomposant une fonctionf de signe quelconque enf =f₊−f₋, on obtient facilement : Théorème (Théorème de Fubini-Lebesgue)

Pour toute fonction mesurablef surE×F à valeurs dansR^d ouC, telle que Z

E×F

f(x,y)

d(µ⊗ν)(x,y)<∞,

on a Z

E×F

f(x,y)d(µ⊗ν)(x,y) = Z

E

Z

F

f(x,y)dν(y)

dµ(x) = Z

F

Z

E

f(x,y)dµ(x)

dν(y).

NB.Par le théorème de Fubini-Tonelli, la condition équivaut à Z

E

Z

F

f(x,y) dν(y)

dµ(x)<∞ ou

Z

F

Z

E

f(x,y) dµ(x)

dν(y)<∞.

(23)

3 Changements de variables

3.1 Mesure image

On définit ici une façon de « transporter » une mesure d’un espace à un autre, par une fonction. Cette opération sera notamment importante en probabilités pour définir la loi d’une variable aléatoire.

Soitϕ: (E,A)→(F,B)une application mesurable. On rappelle queµest une mesure sur(E,A).

Définition

Lamesure image de µ par ϕest la mesureϕ_∗µsurF donnée par : pour toutB∈ B, ϕ_∗µ(B) =µ ϕ⁻¹(B)

.

C’est bien une mesure :ϕ_∗µ(∅) =µ(ϕ⁻¹(∅)) =µ(∅) = 0 et, si lesBn sont des parties mesurables disjointes de F, alors les images réciproquesϕ⁻¹(Bn)sont disjointes et leur réunion est ϕ⁻¹(U

nBn), donc ϕ∗µ

]

n

Bn

=µ

ϕ⁻¹

]

n

Bn

=µ

]

n

ϕ⁻¹(Bn)

=X

n

µ ϕ⁻¹(Bn)

=X

n

ϕ∗µ(Bn).

Théorème (Théorème de transfert)

a) Pour toute fonction mesurable f :F →[0,+∞], Z

F

f(y)d(ϕ_∗µ)(y) = Z

E

f(ϕ(x))dµ(x).

b) Pour toute fonction mesurablef surF à valeurs dansR^d ouC,f est intégrable par rapport àϕ_∗µsi, et seulement si f◦ϕest intégrable par rapport à µet, dans ce cas,

Z

F

f(y)d(ϕ_∗µ)(y) = Z

E

f(ϕ(x))dµ(x).

Démonstration : a) La formule est vraie si f = 1B oùB ∈ B : c’est exactement la définition de ϕ∗µ. Par suite, la linéarité de l’intégrale montre qu’elle est vraie pour toute fonction étagée positive. Finalement, sifest mesurable positive, alorsf= lim↑_nfnpour une suite croissante(fn)nde fonctions étagées positives (surF), ce qui donnef◦ϕ= lim↑_nfn◦ϕ et donc, en appliquant le TCM, la formule pour la fonctionfnfournit à la limite la formule pourf.

b) Pourf à valeurs réelles de signe quelconque, appliquer le a) à|f|donne Z

|f|d(ϕ∗µ) = Z

|f◦ϕ|dµ,

ce qui montre quef est intégrable par rapport àϕ∗µsi, et seulement sif◦ϕest intégrable par rapport àµ. Supposons que c’est le cas. On a par définition de l’intégrale puis par a)

Z

f d(ϕ∗µ) = Z

f+d(ϕ∗µ)− Z

f−d(ϕ∗µ)^a)= Z

f+◦ϕdµ− Z

f−◦ϕdµ= Z

(f+−f−)◦ϕdµ= Z

f◦ϕdµ.

Pourfà valeurs dansR^douC, on applique ce qui précède à chaque composante.

3.2 Changements de variables dans R

^d

•Cas linéaire Proposition

SoitM une application linéaireR^d→R^d. On a, pourB∈ B(R^d), λ_d M(B)

=|detM|λd(B).

Autrement dit, siM est inversible,

M_∗λ_d = 1

|detM|λ_d.