• Aucun résultat trouvé

Changements de variables dans R d

Dans le document LaurentTournier Intégration&Probabilités (Page 24-33)

3 Changements de variables

3.2 Changements de variables dans R d

•Cas linéaire

On aura besoin dans la suite du résultat suivant, qui est intéressant en soi : Lemme

Si µest une mesure sur(Rd,B(Rd))invariante par translation (pour tousA∈ B(Rd)et a∈Rd,µ(a+A) = µ(A)) et telle que µ([0,1]d)<∞, alors il existe une constanteC≥0 telle queµ=Cλd.

Démonstration : On écrit la preuve pourR2, mais le principe est général. Vu queλ2([0,1[2) = 1, posonsC=µ([0,1[2)(<

∞). Par un résultat (admis) du premier chapitre, il suffit de montrer que, pour tout pavé ferméPdeR2,µ(P) =Cλ2(P) ce qui, par l’invariance par translation, se ramène à montrer que, pour tousa, b >0,

µ [0, a]×[0, b]

=Cab.

Pour toutn≥1, le carré semi-ouvert[0,1[2 est l’union disjointe den2 carrés semi-ouverts disjoints de côté n1, qui ont tous la même mesure pourµdu fait de l’hypothèse d’invariance par translation, donc cette mesure est

µh 0,1

n h2

= C n2; alors, pour tous entiersk, l≥0,

µh 0,k

n h×h

0, l n

h

=klC n2 =Ck

n l n, en décomposant de même ce rectangle enklcarrés semi-ouverts disjoints de côté n1. Soit ensuitea, b >0. Pour toutn, on a l’encadrement

[0, an[×[0, bn[⊂ [0, a]×[0, b] ⊂ h

0, an+ 1 n

h×h

0, bn+1 n h

,

oùan=bnacn etbn=bnbcn (approximations deaetbde la forme kn, par en-dessous) d’où, en prenant la mesureµ, Canbn≤µ [0, a]×[0, b]

≤C an+1

n

bn+1 n

ce qui donne l’égalité annoncée en passant à la limite vu quean→aetbn→b.

Proposition

SoitM une application linéaireRdRd. On a, pourB∈ B(Rd), λd M(B)

=|detM|λd(B).

Autrement dit, siM est inversible,

Mλd = 1

|detM|λd.

En particulier, pour B = [0,1]d, on a l’interprétation suivante du déterminant de M : c’est le volume du parallélotope engendré par les vecteurs colonnes deM.

Et sif :RdRest intégrable par rapport àλd, le théorème de transfert donne Z

Rd

f(M(x))dx= Z

Rd

f(y)d Mλd)(y) = 1

|detM| Z

Rd

f(y)dy.

Démonstration : SiM n’est pas inversible, l’image deM est incluse dans un hyperplanH; or les hyperplans ont une mesure nulle pourλd, doncλd(M(B))≤λd(H) = 0pour toutB∈ B(Rd). PuisquedetM = 0dans ce cas, la formule est vraie.(On pourrait objecter queM(B)n’est pas toujours borélien, mais cela n’est pas un vrai problème car il est inclus dansHqui est négligeable et on peut décider dans ce cas d’étendre naturellementλdparλd(M(B)) = 0)

SupposonsM inversible. AlorsλM :A7→λM(A) =λd(M(A))est une mesure surRd(c’est la mesure image(M−1)λd), qui est invariante par translation (par linéarité de M et invariance par translation de λd). De plus, λM([0,1]d) <∞ puisqueM([0,1]d)est borné. En vertu du lemme précédent,λM est multiple de la mesure de Lebesgue.

Il existe donc une constanteCM ≥0telle que, pour toutA∈ B(Rd), λd M(A)

=CMλd(A).

Vu queλd([0,1]d) = 1, on aCMM([0,1]d). On note que, pour toutes applications linéairesM etP, CM P =CMCP.

En effet, pourA= [0,1]d,CM Pd(M P(A)) =λd(M(P(A))) =CMλd(P(A)) =CMCPλd(A) =CMCP.

Notons aussi que, siM est orthogonale (tM M =Id), alorsM etM−1 préservent les distances, donc M préserve les boules centrées en0: siBest la boule de rayon 1, alorsM(B) =B, d’où

λd(B) =CMλd(B), orλd(B)>0, donc on conclut queCM = 1siM est orthogonale.

De façon générale, si M est inversible, il existe une matrice orthogonale O et une matrice symétrique S telles que M =OS (c’est la décomposition polaire : siS est une racine carrée symétrique de la matrice symétrique définie positive

tM M, on vérifie queO=M S−1 est orthogonale). Il existe alorsP orthogonale etD diagonale telles queS=P DP−1 (diagonalisation deS en base orthonormale). Ainsi,M =OP DP−1 donc par le cas orthogonal

CM =COCPCDCP−1=CD.

CommedetM = det(OP DP−1) = detD, il reste seulement à voir que, dans le cas oùD est diagonale,CD=|detD|.

Mais si

D=

a1

0

a2

. ..

0

ad

 ,

alorsD([0,1]d) = [0, a1]×[0, a2]× · · · ×[0, ad]doncCDD([0,1]d) =|a1| · · · |ad|=|detD|. Ceci conclut la preuve.

•Cas des C1-difféomorphismes

On a vu que l’image deλd par une application linéaire bijectiveM est |det1M|λd.

Dans le cas de l’image par une applicationnon linéaire ϕ, on peut néanmoins vouloir appliquer localement le cas linéaire. En effet, une applicationϕ:U →D(oùU etDsont des ouverts deRd) estdifférentiablesi, près de chaque pointx∈U, elle peut s’approcher par une application linéaire dϕx appelée sa différentielle :

ϕ(x+h) =ϕ(x) +dϕx(h) + o

h→0(|h|).

L’application linéairedϕxa pour matrice lamatrice jacobienne deϕ=

 ϕ1

... ϕd

enx:

Jacϕ(x) = ∂ϕi

∂xj

(x)

1≤i,j≤d

,

et son déterminant est lejacobiendeϕenx:

Jϕ(x) = det Jacϕ(x) .

Par le cas linéaire, on s’attend à ce que l’image deλdparϕsoit, au voisinage dey=ϕ(x), proche de|J1

ϕ(x)|λd=

|Jϕ−1(y)|λd (à condition que Jϕ(x) 6= 0), ce qui suggère, puisque le facteur |Jϕ−1(y)| dépend du point y près duquel on considère la mesure, que la mesure image est (partout) la mesure à densité|Jϕ−1(z)|dλd(z)et donc, en intégrant, queR

f(ϕ(x))dx=R

f(y)|Jϕ−1(y)|dy.

Ceci est justifié siϕ:U →Dest unC1-difféomorphisme, c’est-à-dire queϕest de classeC1, bijective, et que ϕ−1 est aussi de classeC1 (la dernière condition revient aussi à dire queJϕ(x)6= 0pour toutx∈U) :

Théorème (Théorème de changement de variable dans Rd)

SoitU, D des ouverts deRd. Soitf :D→Rmesurable, etϕ:U →D unC1-difféomorphisme.

a) Si f est positive, alors

Z

D

f(y)dy= Z

U

f ϕ(x) Jϕ(x)

dx

et Z

U

f ϕ(x) dx=

Z

D

f(y)

Jϕ−1(y) dy.

b) Sif est intégrable surD, la première égalité précédente a un sens (autrement dit,u7→f(ϕ(u))|Jϕ(u)|

est intégrable surU) et est vraie. Sif◦ϕest intégrable surU, alors il en est de même de la deuxième.

c) En particulier, la mesure image de λd parϕest la mesure de densité|Jϕ−1|par rapport àλd : ϕd)|U =|Jϕ−1| ·(λd)|D.

(Ici,(λd)|D est la restriction deλd àD, puisqueϕn’est définie que surD)

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

4. Espaces L

1

et L

2

Soit(E,A, µ)un espace mesuré. On rappelle la définition L1(E,A, µ) =

f :E→Rmesurable

Z

|f|dµ <∞

,

et on peut définir de mêmeL1C(E,A, µ)pour les fonctions à valeurs dansC.

Plus généralement, sip >0, on note Lp(E,A, µ) =

f :E→Rmesurable

Z

|f|pdµ <∞

,

et

L(E,A, µ) =n

f :E →Rmesurable

il existeC >0tel que |f(x)| ≤C pourµ-presque toutx∈Eo (on dit queL(E,A, µ)est l’espace des fonctions « bornées presque partout » surE)

Comme pourL1, on abrège souvent Lp(E)et L(E)si la mesure est donnée par le contexte. En particulier, systématiquement,Lp(R) =Lp(Rd,B(Rd), λd).

1 Espace L

1

Pourf, g:E→Rmesurables, on rappelle quef =g presque partout (ouµ-presque partout) si µ {x∈E|f(x)6=g(x)}

= 0

et que, dans ce cas,f est intégrable si, et seulement sig est intégrable, et alors Z

f dµ= Z

gdµ.

On notekfk1= Z

|f|dµpourf ∈ L1(E). On déduit des propriétés de l’intégrale que : – pour toutλ∈R, pour toutf ∈ L1(E),kλfk1=|λ| kfk1

– pour tousf, g∈ L1(E),kf+gk1≤ kfk1+kgk1.

– pour toutf ∈ L1(E), kfk1= 0si, et seulement sif = 0presque partout.

À cause du dernier point, k · k1 n’est pas une norme : en général, il y a des fonctions non nullesf telles que kfk1= 0. Ceci mène aux définitions suivantes :

Définition

On note f ∼ g si f = g presque partout, et on définit L1(E,A, µ) = L1(E,A, µ)/∼, c’est-à-dire que l’on obtientL1(E,A, µ)enidentifiantentre elles les fonctions égales presque partout : les éléments deL1(E,A, µ) sont les classes de fonctions égales entre elles presque partout.

Par exemple, l’élément0∈L1(E,A, µ)est l’ensemble des fonctions nulles presque partout.

Puisque deux fonctions égales presque partout ont la même intégrale, on pourra sans ambiguïté noter R f dµ pour f ∈L1(E,A, µ)pour désigner l’intégrale de n’importe quelle fonction dans la classe f, et ainsi procéder comme si les éléments deL1(E,A, µ) étaient des fonctions, c’est-à-dire que l’on pourraconfondre un élément deL1 (une classe de fonctions) et l’un quelconque de ses représentants (l’une de ces fonctions), à ceci près que sif, g∈L1(E,A, µ)sont égales presque partout, alorsf =g par définition.

En particulier, si on définit kfk1 = Z

|f|dµpour f ∈ L1(E,A, µ), alors on a les mêmes propriétés qu’avant, etkfk1 = 0implique f = 0. Ainsi,k · k1 est une norme sur L1(E,A, µ) : par l’identification entre elles des fonctions égales presque partout, on s’est artificiellement ramené à ce qu’une seule « fonction » soit de norme nulle.

Si une suite(fn)n dansL1(E,A, µ)converge versf ∈L1(E,A, µ)pour cette norme, on noterafn L

1(E,A,µ)

−→n f, ou simplementfn −→L1

n f.

Théorème

L’applicationf 7→ kfk1est une norme surL1(E,A, µ)et, muni de cette norme, l’espace vectorielL1(E,A, µ) est complet. C’est donc un espace de Banach.

On rappelle qu’un espace estcompletsi toute suite de Cauchy dans cet espace converge : si(fn)n est une suite de fonctions dansL1telle que supp≥0kfn+p−fnk1−→

n 0, alors il existef ∈L1 telle quekfn−fk1−→

n 0.

Démonstration : Soit(fn)n≥0une suite de Cauchy dansL1. Il existe une suite strictement croissante d’entiers(nk)k≥0

(autrement dit une sous-suite(fnk)k≥0) telle que, pour toutk,

kfnk+1−fnkk1<2−k.

En effet, on peut définir(nk)kpar récurrence par n0= 0et, pour toutk≥0,nk+1= max(nk+ 1, Nn), où Nn= min{n≥0|sup

p≥n

kfp−fnk1<2−k},

qui est fini par définition d’une suite de Cauchy. Pour alléger l’écriture, on posegk=fnk. Par théorème de convergence monotone (pour les séries à termes positifs), on a

Z

donc la fonctionP

k≥0|gk+1−gk|est finie presque partout, ce qui implique que la sérieP

k≥0(gk+1(x)−gk(x))converge (absolument) pour presque toutx. On peut donc définir

h=g0+X

k≥0

(gk+1−gk),

en posant par exempleh(x) = 0si la série ne converge pas enx, ce qui n’a pas d’importance puisque de telsxforment un ensemble négligeable. Alorsh∈L1 car, par le lemme de Fatou,

Z

et par l’inégalité triangulaire, Z

Or (par somme téléscopique),

gK =g0+

K−1

X

k=0

(gk+1−gk) converge vershpresque partout et, pour toutK,

|gK| ≤ |g0|+

ϕdµ < ∞, donc le théorème de convergence dominée donne R

|h−gK|dµ →K 0, c’est-à-dire que

Ceci conclut la preuve.

Au cours de la preuve, on obtient un résultat intéressant en soi :

Corollaire

Si (fn)n converge versf dansL1, alors il existe une sous-suite(fnk)k qui converge vers f presque partout.

Démonstration : En effet, si(fn)nconverge versf dansL1,(fn)nest de Cauchy dansL1 donc on peut lui faire suivre la preuve précédente, oùh=f puisquehest (d’après la fin de la preuve) la limite de(fn)n dansL1. Et on a vu que la sous-suite de terme généralgK =fnK converge versh(=f)presque partout.

On donne quelques résultats utiles de densité : Proposition

a) Les fonctions étagées intégrables sont denses dansL1(E,A, µ).

b) Les fonctions en escalier sont denses dansL1(R).

c) Les fonctions de classeC à support compact sont denses dansL1(Rd).

2 Espace L

2

On note, pourf ∈ L2(E,A, µ),

kfk2= Z

|f|21/2

et, plus généralement, sif, g∈ L2(E,A, µ), la fonctionf gest intégrable puisque|f g| ≤ |f|2+|g|2 2 (cette inégalité s’obtient en développant(|f| − |g|)2≥0, ce qui est évident), et on note

hf, gi= Z

f g dµ.

h·,·iest bilinéaire symétrique positive : pour tousf, g, h∈ L2(E,A, µ), et toutλ∈R,

hλf+g, hi=λhf, hi+hg, hi, hf, gi=hg, fi, et hf, fi=kfk2≥0.

En revanche,h·,·i n’est pas définie positive :kfk2 = 0 implique f = 0 presque partout. Donc k · k2 n’est pas une norme, eth·,·in’est pas un produit scalaire surL2(E).

Comme précédemment, on définit L2(E,A, µ) = L2(E,A, µ)/∼, où f ∼ g lorsque f = g presque partout, c’est-à-dire que l’on identifie entre elles les fonctions deL2(E)qui sont égales presque partout. Alors :

Théorème

Sur l’espace L2(E,A, µ), l’application (f, g)7→ hf, giest un produit scalaire associé à la norme f 7→ kfk2

et, muni de ce produit scalaire, l’espace vectoriel L2(E,A, µ)est complet. C’est donc un espace de Hilbert.

Démonstration : La preuve s’adapte du cas deL1sans difficulté. Il faut seulement remplacer la normeL1par la norme L2 et utiliser l’inégalité triangulaire pourk · k2au lieu de certaines égalités. Par exemple, la première suite d’égalités et inégalités devient : par convergence monotone, puis inégalité triangulaire,

X

k≥0

|gk+1−gk| 2

= lim↑

K

K

X

k=0

|gk+1−gk| 2

≤lim↑

K K

X

k=0

kgk+1−gkk2=X

k≥0

kgk+1−gkk2≤X

k≥0

2−k<∞.

Signalons l’expression que prend l’inégalité de Cauchy-Schwarz : pour toutes fonctionsf, g∈L2(E), Z

f g dµ 2

≤ Z

f2dµ Z

g2dµ.

Les résultats de densité donnés pourL1sont aussi valables pour L2: Proposition

a) Les fonctions étagées intégrables sont denses dansL2(E,A, µ).

b) Les fonctions en escalier sont denses dansL2(R).

c) Les fonctions de classeC à support compact sont denses dansL2(Rd).

La remarque suivante sera très utile en probabilités : Proposition

Si µ(E)<∞, alorsL2(E)⊂L1(E).

Démonstration : Soit f ∈L2(E). Il faut montrer queR

|f|dµ <∞. On peut utiliser l’inégalité de Cauchy-Schwarz avecg= 1:

Z

|f|dµ 2

≤ Z

|f|2dµ Z

1dµ=kfk22µ(E) et le dernier terme est fini carf∈L2(E)etµ(E)<∞par l’hypothèse.

Probabilités

Université Paris 13, Institut Galilée MACS 1 – Intégration et probabilités Année universitaire 2014-2015

Dans le document LaurentTournier Intégration&Probabilités (Page 24-33)

Documents relatifs