cours 23, le lundi 2 mai 2011
Convergence en probabilit´e
On dit qu’une suite (Xn) de v.a. r´eelles d´efinies sur un espace de probabilit´e (Ω,F,P) converge en probabilit´e vers une v.a. r´eelle X d´efinie sur le mˆeme espace (Ω,F,P) si
∀ε >0, P |Xn−X|> ε
−→n 0.
Si (Xn) converge vers X dans Lp(Ω,F,P), pour un p tel que 1 ≤ p < +∞, alors Xn
converge vers X d’apr`es l’in´egalit´e de Markov : en effet, pour tout ε >0, on a P |Xn−X|> ε
= P |Xn−X|p > εp
≤ R
Ω|Xn−X|pdP
εp = kXn−Xkpp
εp qui tend vers 0 par hypoth`ese.
Proposition.Si la suite de variables al´eatoires r´eelles(Xn)converge en probabilit´e vers la variable al´eatoire X, la loi PXn converge ´etroitement vers la loi PX.
Preuve. — Si Y et Z sont deux variables al´eatoires d´efinies sur (Ω,F,P), on remarque que pour touty r´eel et tout ε >0, on a
{Y ≤y} ⊂ {Z≤y+ε} ∪ {|Z−Y|> ε}. Par cons´equent, pour tout x r´eel,
P Xn ≤x
≤P X≤x+ε
+ P |Xn−X|> ε ,
et de mˆeme pour l’in´egalit´e inf´erieure, cette fois avec y=x−ε, Y = X et Z = Xn, P X≤x−ε
≤P Xn≤x
+ P |Xn−X|> ε . Si Xn converge vers X en probabilit´e, on aura donc pour n assez grand
P X≤x−ε
−ε≤P Xn ≤x
≤P X≤x+ε +ε, ce qui est l’expression de la convergence ´etroite des lois.
Rappel-th´eor`eme.Pour une suite (Xn)de variables al´eatoires les conditions suivantes sont ´equivalentes :
1. — la suite des lois (PXn) converge ´etroitement vers la loi PX de la variable al´eatoire X;
2. — pour toute fonction f continue born´ee sur R, r´eelle ou complexe, on a
Ef(Xn)−→n Ef(X) ;
3. — il y a convergence simple sur R des fonctions caract´eristiques,
∀t ∈R, ϕXn(t)−→n ϕX(t).
D´erivabilit´e de la fonction caract´eristique d’une variable al´eatoire On rappelle que la fonction caract´eristique ϕX, d´efinie par
∀t ∈R, ϕX(t) = E eitX= Z
Ω
eitX(ω) dP(ω)
est une fonction continue et born´ee sur R. Pour voir si on peut d´eriver ϕX, on regarde la d´eriv´ee partielle de la fonction f(t, ω) d´efinie sur R×Ω par
f(t, ω) = eitX(ω)
`a savoir
∂f
∂t(t, ω) = iX(ω) eitX(ω); la majoration du module de cette d´eriv´ee partielle va de soi,
iX(ω) eitX(ω)
=|X(ω)|.
Le th´eor`eme de d´erivation de la th´eorie de Lebesgue donne : pour queϕX soit d´erivable, il suffit que X soit int´egrable ; dans ce cas,
ϕ0X(t) = i E X eitX
= i Z
Ω
X(ω) eitX(ω) dP(ω) = i Z
R
xeitx dPX(x).
En fait, la fonction caract´eristique est de classe C1 dans ce cas, car la d´eriv´ee partielle
∂f
∂t est continue par rapport `a t, donc ϕ0X est continue par le th´eor`eme de continuit´e.
On peut continuer `a d´eriver : si E|X|n<+∞ pour un entier n≥1, alors ϕX est de classe Cn; en particulier, quand X ∈L2,
ϕ00X(t) =−E X2eitX .
Quand X a des moments de tous les ordres n, la fonction ϕX est de classe C∞ et
∀n≥0, ϕ(n)X (0) = inE Xn.
Rappel-exemple : v.a. U uniforme sur [−1,1]. Dans ce cas tous les moments existent, et de plus la fonction caract´eristique ϕU est non seulement C∞, mais analytique, somme d’une s´erie enti`ere de rayon de convergence +∞; en effet, on a calcul´e
ϕU(t) = sint
t =
+∞X
n=0
(−1)n t2n (2n+ 1)!. On v´erifie que le d´eveloppement en s´erie de Taylor
ϕU(0) + ϕ00U(0)
2 t2 +· · ·= 1− t2 6 +· · · redonne E U = 0, E U2 =−ϕ00U(0) = 1/3.
Dans le cas de la loi gaussienne centr´ee r´eduite, ou de sa densit´e g(x) = e−x2/2
√2π , on a vu que
bg(t) = Z
R
e−itxe−x2/2 dx
√2π = e−t2/2.
Th´eor`eme de la limite centrale
Avant d’attaquer le th´eor`eme, rappelons que la fonction caract´eristiqueϕX d’une v.a. X est de classe C2 sur R quand E X2 <+∞ et que dans ce cas, on a
ϕ0X(0) = i E X et ϕ00X(0) =−E X2.
Th´eor`eme de la limite centrale, version 0. Soit (Yn) une suite de variables al´eatoires ind´ependantes, centr´ees, de mˆeme loi, et telles que E Yn2 = 1; la suite des variables al´eatoires
sn = Y1+· · ·+ Yn
√n
converge en loi vers la loi gaussienne centr´ee r´eduite N(0,1), c’est-`a-dire que pour tous a < b on a
P {a ≤sn ≤b}
−→n Z b
a
e−x2/2 dx
√2π.
Preuve. — Les variables al´eatoires (Yn) ayant toutes la mˆeme loi, elles ont la mˆeme fonction caract´eristique qu’on appellera ϕY (on a ϕY = ϕY1 = ϕYj, pour tout j > 1).
Comme Y1 est de carr´e int´egrable, la fonction caract´eristique ϕY est de classe C2, donc au voisinage de 0 on peut ´ecrire par Taylor-Young
ϕY(t) =ϕY(0) +tϕ0Y(0) + t2
2 ϕ00Y(0) +t2ε1(t), o`u ε1(t) tend vers 0 quand t→0. On a ici
ϕ0Y(0) = i E Y = 0, ϕ00Y(0) =−E Y2 =−1, donc, en rempla¸cant, on obtient le d´eveloppement limit´e
ϕY(t) = 1− t2
2 +t2ε1(t).
Par l’ind´ependance des v.a. (Yj), pour tout t ∈Rfix´e, on obtient ϕsn(t) = E eitsn = EYn
j=1
eitYj/√n
= Yn
j=1
E eitYj/√n
=
=
E ei (t/√n)Y1n
=ϕY(t/√ n)n. On a par ailleurs
ln(1 +u) =u+uε2(u)
au voisinage de 0, o`u ε2(u) tend vers 0 quand u→0. On a donc lnϕsn(t) =nlnϕY(t/√
n) =nln
1− t2 2n + t2
nε1(t/√ n)
. Posons
un=− t2 2n + t2
nε1(t/√ n),
qui tend vers 0 avec n, ce qui entraˆıne que ε2(un) tend vers 0 ; de plus nun=−t2/2 +t2ε1(t/√
n) tend vers −t2/2 quand n→+∞; on en d´eduit que
lnϕsn(t) =nln(1 +un) =nun+nunε2(un)
tend vers−t2/2. Donc pour touttr´eel,ϕsn(t) converge vers e−t2/2 =ϕG(t), en d´esignant par G une v.a. gaussienne centr´ee r´eduite. On conclut grˆace au rappel-th´eor`eme.
Th´eor`eme de la limite centrale. Soit (Xn)n>1 une suite de variables al´eatoires r´eelles ind´ependantes, centr´ees, de mˆeme loi, et avec un moment d’ordre deux E X2nfini ; posons σ2 = E(X1−E X1)2 = Var(X1) et supposons Var(X1)>0. La suite
sn = X1+· · ·+ Xn−nE X1 σ√
n = 1
√n Xn
j=1
Xj−E Xj σ converge en loi vers la loi gaussienne centr´ee r´eduite N(0,1).
Preuve. — Comme les Xi sont de carr´e int´egrable par rapport `a la mesure finie P sur Ω, elles sont aussi P-int´egrables ; comme elles ont la mˆeme loi, elles ont la mˆeme int´egrale m= E Xi = E X1. Posons
Yi = Xi−m
σ ;
ces variables sont ind´ependantes comme fonctions Yi =g(Xi) de variables ind´ependantes, o`u
g(x) = x−m σ ,
et les (Yi) ont la mˆeme loi (elles sont obtenues par la mˆeme fonction g `a partir de v.a.
de mˆeme loi). On a E Yi = E Xi−m
/σ= 0 et E Yi2 = 1
σ2 E(Xi−m)2 = 1
E(X1−E X1)2 E(Xi−E Xi)2 = 1.
Le r´esultat annonc´e d´ecoule de la version 0, appliqu´ee aux (Yi).
Lois des grands nombres
On peut penser que le fait de consid´erer la moyenne Zn(ω) = X1(ω) +· · ·+ Xn(ω)
n
des r´esultats ind´ependants successifs (Xn(ω)) d’une mˆeme exp´erience al´eatoire, pour n assez grand, a des chances de stabiliser le ph´enom`ene, en r´eduisant l’influence de l’al´ea.
C¸ a n’est pas toujours le cas, comme on l’a vu dans le cas des variables de Cauchy : dans ce cas la loi de Zn est constamment ´egale `a la loi de Cauchy.
Remarque 1.Si la suite (Xn) tend presque sˆurement vers X, alors (Xn) tend vers X en probabilit´e.
En effet, pour tout ε >0 donn´e, la suite des fonctions sur Ω fn(ω) =1{|Xn−X|>ε}(ω)
converge P-presque partout vers 0 en ´etant domin´ee par la fonction P-int´egrable fixe 1.
Il en r´esulte que Z
Ω
fn(ω) dP(ω) = P |Xn−X|> ε
−→n 0.
Loi faible des grands nombres
L’effet r´egularisant escompt´e aura lieu pour les lois qui ont un moment absolu d’ordre 1, autrement dit pour les variables al´eatoires int´egrables. On va commencer par un r´esultat assez simple qui est `a notre port´ee.
Th´eor`eme (loi faible des grands nombres). Si les variables al´eatoires (Xn)n>1 sont ind´ependantes, de mˆeme loi et int´egrables, la variable al´eatoire
X1+· · ·+ Xn n
converge en probabilit´e, donc en loi, vers la constante E X1. Preuve. — On recentre en posant
Yj = Xj−E Xj,
et il s’agit de montrer que Vn = (Y1 +· · ·+ Yn)/n tend en probabilit´e vers la varia- ble al´eatoire constante 0, partout ´egale `a 0 ; dans le cas de la limite constante 0, la convergence des lois suffit pour obtenir la convergence en probabilit´e : si ψ est une fonction continue telle que ψ(0) = 1 et
0≤ψ ≤1[−ε,ε],
la convergence de PVn vers δ0, la loi de la limite 0, implique P |Vn| ≤ε
≥ Z
R
ψ(t) dPVn(t)−→n Z
R
ψ(t) dδ0(t) =ψ(0) = 1, donc pour n assez grand, on a P |Vn| ≤ε
>1−ε et P |Vn|> ε
< ε, ce qui signifie que Vn converge en probabilit´e vers 0.
D’apr`es le rappel-th´eor`eme, on sait que la convergence ´etroite des lois PVn des v.a. Vn vers la mesure de Dirac δ0 au point 0 ´equivaut `a la convergence simple sur R des fonctions caract´eristiques. Or
ϕ0(t) = E eit.0 = 1, et
ϕY(t) = 1 +tϕ0Y(t) +tε(t) = 1 + itE Y +tε(t) = 1 +tε(t) ; il en r´esulte que
ϕVn(t) = E eitVn = EYn
j=1
ei (t/n)Yj
= Yn
j=1
E ei (t/n)Yj =
= Yn
j=1
ϕYj(t/n) = ϕY(t/n)n
= 1 + t
nε(t/n)n
−→n 1.
On v´erifie l’affirmation pr´ec´edente en prenant le logarithme, lnϕVn(t) =nln
1 + t
nε(t/n)
∼nt
nε(t/n)
=tε(t/n) −→n 0.
Le cas L2
Si les Yi sont des v.a. r´eelles dans L2, ind´ependantes et centr´ees, elles sont orthogonales ; en effet, pouri 6=j,
hYi,Yji= Z
Ω
Yi(ω)Yj(ω) dP(ω) = E YiYj = E YiE Yj = 0.
Il r´esulte de l’orthogonalit´e (hhth´eor`eme de Pythagoreii dans l’espace L2(Ω,F,P)) que pour des v.a. de carr´e int´egrable centr´ees et ind´ependantes (Yj), on a
EXn
j=1
Yj2
=
Xn
j=1
Yj
2 2 =
Xn
j=1
kYjk22 = Xn
j=1
E Yj2.
Proposition 1. Si les variables al´eatoires Xi sont ind´ependantes et sont dans l’espace L2(Ω,F,P), on a
VarXn
i=1
Xi
= Xn
i=1
Var(Xi).
Preuve. — Posons Yi = Xi − E Xi; les (Yj) sont ind´ependantes et centr´ees, ce qui ram`ene au cas pr´ec´edent : on a
VarXn
i=1
Xi
= EXn
i=1
Xi− Xn
i=1
E Xi2
= EXn
i=1
Yi2
= Xn
i=1
E Y2i = Xn
i=1
Var(Xi).
Avec l’in´egalit´e de Tchebychev, on obtient pour tout δ > 0 et tout n ≥ 1, lorsque les (Xj) sont ind´ependantes de mˆeme loi, de carr´e int´egrable
P
Pn i=1Xi
n −E X
≥δ
= P
Xn
i=1
Xi−EXn
i=1
Xi
≥nδ
≤ Var(Pn i=1Xi)
n2δ2 = Var(X) δ2n . On retrouve la loi faible, mais avec une estimation de la vitesse de convergence, alors qu’il n’y avait aucune information de vitesse dans le th´eor`eme pr´ec´edent.
Remarque. Si on arrivait `a gagner un ε >0, sous la forme P
Pn
i=1Xi
n −E X
≥δ
≤ C(X, δ) n1+ε ,
on aurait une s´erie convergente et on pourrait d´eduire la loi forte des grands nombres par Borel-Cantelli (voir la preuve donn´ee plus loin).
Le vrai th´eor`eme : la loi forte
Th´eor`eme(loi forte des grands nombres). Si les (Xn)n>1 sont ind´ependantes, de mˆeme loi et int´egrables, on a presque sˆurement
X1+· · ·+ Xn
n −→n E X.
La loi forte implique la faible d’apr`es la remarque 1. On ne montrera ici qu’un cas particulier simple, celui o`u E X4 <+∞.
Proposition. On suppose que les (Yi)i>1 sont ind´ependantes, centr´ees et que b4 = sup
i
E Y4i <+∞. Alors pour tout δ >0 et tout n≥1, on a
P
Y1+· · ·+ Yn n
≥δ
≤ 3b4 δ4n2. Preuve. — On pose Sn =Pn
j=1Yj et on d´eveloppe sauvagement E S4n = E
Y4 k=1
Xn
jk=1
Yjk
= X
(j1,j2,j3,j4)
E Yj1Yj2Yj3Yj4
.
Par l’ind´ependance et le centrage, l’esp´erance du produit de quatre est nulle d`es qu’un terme Yjk n’apparaˆıt qu’une seule fois, comme dans (j, i, j, j), avec i6=j. Il ne reste que les termes de la forme (i, i, i, i) ou bien les (i, i, j, j), (i, j, i, j), (i, j, j, i), o`u le deuxi`eme indice i a trois positions possibles. Il en r´esulte, en notant que (E Y2)2 ≤E Y4, que
E S4n = Xn
i=1
E Y4i + 3X
i6=j
E Yi2E Y2j ≤nb4+ 3(n2−n)b4 = (3n2−2n)b4 ≤3n2b4. On conclut avec Markov,
P |Sn|/n≥δ
= P(S4n ≥δ4n4)≤ E S4n
δ4n4 ≤ 3b4 δ4n2.
On peut aussi montrer par r´ecurrence que si les Yn sont ind´ependantes centr´ees, de mˆeme loi, et b4 = E Y4, c4 = E Y22
, alors
E S4n =nb4+ 3n(n−1)c4
(qui est donc≤3n2b4, comme on a vu). En effet, E S41 = E Y41 =b4 montre le pas n= 1, et le passage de n`a n+ 1 se d´emontre en ´ecrivant d’abord que
E S4n+1 = E(Sn+ Yn+1)4 = E S4n+ 4 E S3nYn+1+ 6 E S2nY2n+1+ 4 E SnY3n+1+ E Yn+14 ; ensuite, par l’ind´ependance, on a que E S3nYn+1 = E S3n E Yn+1 = 0, et de mˆeme, on voit que E SnY3n+1 = E SnE Y3n+1 = 0, donc
E S4n+1 = E S4n+ 6 E S2nE Y2n+1+ E Y4n+1
=nb4+ 3n(n−1)c4+ 6nc2c2+b4 = (n+ 1)b4+ 3(n+ 1)nc4, ce qu’il fallait obtenir au pas n+ 1.
Proposition. On suppose que les (Xi)i>1 sont ind´ependantes de mˆeme loi et que a4 = E X4i <+∞.
Il en r´esulte que presque sˆurement
X1+· · ·+ Xn
n −→n E X1.
Preuve. — On a pour les int´egrales par rapport `a une probabilit´e E|X| ≤(E X2)1/2 ≤(E X4)1/4
donc
|E Xj| ≤a, E X2j ≤a2,
puisque par hypoth`ese E X4j ≤ a4. Les variables Yi = Xi−E Xi sont centr´ees ind´epen- dantes et (E Y4i)1/4 ≤2a (in´egalit´e triangulaire dans L4). Avec b= 2a, on trouve
P
X1+· · ·+ Xn
n −E X
≥δ
= P
Y1+· · ·+ Yn n
≥δ
≤ 3b4 δ4n2. On a donc que la suite des ´ev´enements
An= An(δ) =nY1+· · ·+ Yn n
≥δo v´erifie P
P(An)<+∞, autrement dit Z
Ω
+∞X
n=1
1An(ω)
dP(ω) = X+∞
n=1
Z
Ω
1An(ω) dP(ω) =
+∞X
n=1
P(An)<+∞,
donc la fonction sous l’int´egrale est finie presque sˆurement. Cela veut dire qu’il existe un ensemble n´egligeable N(δ)∈ F tel que pour toutω /∈N(δ), il n’existe qu’un nombre fini de valeurs de n telles que ω ∈ An(δ). Quand ω /∈N(δ), on peut donc trouver un entier n0(ω) tel que
n≥n0(ω) ⇒
Y1(ω) +· · ·+ Yn(ω) n
< δ.
Pour chaque δ= 2−k, k ∈N, on dispose d’un ensemble n´egligeable N(2−k). Par r´eunion d´enombrable en k ∈ N de n´egligeables, on obtient N ∈ F tel que P(N) = 0 et tel que pour tout k ≥ 0, tout ω /∈ N, il existe un entier n0(k, ω) tel que pour n ≥n0(k, ω), on ait ω /∈ An(2−k). C’est la convergence presque sˆure ; pour tout ω /∈ N on a le r´esultat suivant : pour tout entier k, il existe un entier n0 =n0(k, ω) tel que pour tout n≥n0,
on ait
Y1(ω) +· · ·+ Yn(ω) n
<2−k.
Autrement dit, pour tout ω /∈N, c’est-`a-dire pour presque toutω ∈Ω, la suite Y1(ω) +· · ·+ Yn(ω)
n tend vers 0 = E Y quand n tend vers l’infini.
Approximation polynomiale de Weierstrass par les polynˆomes de Bernstein
Th´eor`eme d’approximation de Weierstrass. Si f est une fonction r´eelle ou complexe continue sur l’intervalle ferm´e [0,1], il existe une suite de fonctions polynomiales qui tend vers f uniform´ement sur [0,1].
Preuve. — Sur l’ensemble `a deux points {0,1} consid´erons, pour tout x ∈ [0,1], la probabilit´e µx d´efinie par
µx({1}) =x, µx({0}) = 1−x.
Sur Ωn = {0,1}n on regarde les fonctions coordonn´ees : pour ω = (ω1, . . . , ωn)∈Ωn et i= 1, . . . , n on pose
Xi(ω) =ωi ∈ {0,1} ⊂R. On introduit sur Ωn les probabilit´es (Px)x∈[0,1] produit, Px =µx⊗ · · · ⊗µx =µ⊗nx
produit tensoriel de n facteurs ´egaux `a µx. Comme Px est une mesure produit, on a quand Aj ⊂ {0,1}, j = 1, . . . , n,
(∗) Px(A1× · · · ×An) = Yn
j=1
µx(Aj).
Pour la probabilit´e Px, on a
Px(Xi = 1) =x,
r´esultat obtenu en prenant Ai ={1} et les Aj, j 6=i, ´egaux `a {0,1}, Px(Xi = 1) =µx({1})Y
j6=i
µx({0,1}) =µx({1}) =x.
Sous la loi Px, les (Xi) sont donc de mˆeme loi µx. L’´egalit´e (∗) peut se r´ecrire sous la forme
Px (X1 ∈A1) &. . .& (Xn ∈An)
= Yn
j=1
Px(Xj ∈Aj), qui montre que sous la loi Px, les variables (Xi) sont ind´ependantes.
Ces probabilit´es Px sont hhpolynomiales par rapport au param`etre x ∈ [0,1]ii, puisque pour tout singleton {(t1, . . . , tn)} contenu dans Ωn on a
Px({(t1, . . . , tn)}) =xk(1−x)n−k,
o`u k est le nombre de 1 dans la suite (t1, . . . , tn)∈Ωn; le r´esultat pr´ec´edent est obtenu en prenant Aj ={tj}, j = 1, . . . , n. On a par ailleurs
ExXi = 1.Px(Xi = 1) + 0.Px(Xi = 0) =x, et
VarxXi = Ex(Xi−x)2 = (1−x)2x+x2(1−x) =x(1−x)≤1/4.
Posons
Sn = Xn
j=1
Xj, Mn = Sn n . On v´erifie que
ExMn =x.
Par la proposition 1, on a VarxSn =nVarxX1 =nx(1−x), donc
Varx(Mn) = Varx(Sn/n) = Varx(Sn)/n2 =nx(1−x)/n2 ≤1/(4n).
Donc par Tchebychev,
Px(|Mn−x| ≥δ)≤ 1 4δ2n.
On retrouve le principe de la loi des grands nombres : il y a de grandes chances, pour la probabilit´e Px, que la valeur de Mn soit proche dex.
Sif est continue sur [0,1], il y aura aussi de grandes chances que la valeur def(Mn) soit proche de f(x), et en particulier que l’esp´erance Exf(Mn) soit proche def(x). Cela
´etant vrai pour tout x, on aura approch´e x → f(x) par x → Exf(Mn), qui se trouve ˆetre une fonction polynomiale. On aura ainsi une preuve du th´eor`eme d’approximation polynomiale de Weierstrass.
Il faut pr´eciser les choses ; siε > 0 est donn´e, il existeδ >0 tel que|f(y)−f(x)|< ε d`es que |x−y| < δ. On va voir que x → Exf(Mn) est polynomiale, et uniform´ement proche de x→f(x), ce qui d´emontre le th´eor`eme de Weierstrass dans le cas de [0,1].
D´eterminons la loi de Sn; il est clair que Sn prend des valeurs enti`eres qui peuvent varier de k = 0 `a k =n; pour ces valeurs de k, on a
Px(Sn =k) = n
k
xk(1−x)n−k.
C’est assez clair directement (pour que la somme de valeurs 0 ou 1 soit ´egale `a k, il faut qu’il y ait exactement k valeurs ´egales 1, chacune obtenue avec probabilit´e x, et ind´ependamment, ce qui donne le facteurxk, mais les k places avec des 1 sont n’importe o`u parmin, ce qui am`ene le coefficient du binˆome), mais on va le confirmer par r´ecurrence.
Le r´esultat est clair quand n= 1 : pour k = 0,1,
Px(S1 =k) = Px(X1 =k) =xk(1−x)1−k = 1
k
xk(1−x)1−k. Passons de n≥1 `a n+ 1. On a
Px(Sn+1 =k) = Px (Sn =k) & (Xn+1 = 0)
+ Px (Sn =k−1) & (Xn+1 = 1)
=
= Px(Sn =k) (1−x) + Px(Sn=k−1)x=
= n
k
xk(1−x)n−k(1−x) + n
k−1
xk−1(1−x)n−k+1x=
=
n+ 1 k
xk(1−x)n+1−k.
On v´erifie ainsi que Exf(Mn) =
Xn
k=0
fk n
P(Sn =k) = Xn
k=0
fk n
n k
xk(1−x)n−k,
polynˆome de Bernstein x→Pn(f, x) de degr´e n. D’un autre cˆot´e, en d´ecoupant suivant que |Mn−x|< δ ou non, on obtient
Exf(Mn)−f(x)
≤Ex
f(Mn)−f(x) ≤
≤εP(|Mn−x|< δ) + 2kfk∞P(|Mn−x| ≥δ) ≤ε+ kfk∞
2δ2n . Cela est valable pour tout x ∈[0,1], donc
(∗∗) kPn(f)−fkC([0,1])≤ε+ kfk∞
2δ2n.
Si on donne ε >0, on lui associe δ >0 (d´ependant de f), on peut ensuite choisir n0 tel que
kfk∞
2δ2n0 ≤ε.
Pour tout n≥n0, on aura alors
kPn(f)−fkC([0,1])≤2ε.
Remarque. Si f est 1-lipschitzienne on peut prendre δ = ε et la preuve indique, en supposant aussi kfk∞≤1, qu’il faut associer εetn de fa¸con que
1 ε2n ∼ε;
si on donnen≥1 et si on poseε=n−1/3, on trouve d’apr`es (∗∗) kPn(f)−fkC([0,1])≤2n−1/3.
Mais en fait la preuve se simplifie dans ce cas Lipschitz. On peut ´ecrire directement
|Exf(Mn)−f(x)|≤Ex|Mn−x| ≤(Ex(Mn−x)2)1/2=
rx(1−x)
n ≤ 1
2√ n. On ne peut pas faire mieux que n−1/2 comme vitesse de convergence dans le cas lip- schitzien, comme le montre l’exemplef(x) =|x−1/2|et une application du th´eor`eme de la limite centrale. Dans le cas o`u f est de classe C2, on peut ´ecrire avec Taylor-Lagrange
|f(y)−f(x)−(y−x)f0(x)|≤ kf00k∞(y−x)2 2 qui implique, comme ExMn =x, que
Ex(Mn−x)f0(x) = 0, donc
|E f(M )−f(x)|=|E (f(M )−f(x)−(M −x)f0(x))|≤
≤ kf00k∞Ex(Mn−x)2/2 =kf00k∞x(1−x)
2n ≤ kf00k∞ 8n .
On ne peut pas faire mieux que la vitesse 1/n, comme montre l’exemple f(x) = x2. En effet,
ExM2n = Ex((Mn−x) +x)2= Ex(Mn−x)2+x2,
donc l’´ecart entre la valeur Exf(Mn) = ExM2n donn´ee par Bernstein et la vraie valeur f(x) =x2 est
ExM2n−x2= Ex(Mn−x)2= x(1−x) n ,
de l’ordre de 1/n; pr´ecis´ement, on a pour le polynˆome d’approximation Pn(f), dans le cas pr´esent o`u f(x) =x2,
kPn(f)−fkC([0,1])= 1 4n.