Def : Une suite de v.a

(1)

Leçon 262 - Modes de convergence d’une suite de variables aléatoires.

Exemples et applications.

Cadre : Toutes les variables aléatoires sont définies sur un espace probabilisé (Ω, A, P) à valeurs dansR^dpour und≥1, muni de la tribu borélienne et de la mesure de Lebesgue.

1. Convergence presque sûre et convergence en probabilité. — 1. Autour de la convergence presque sûre. —

– Def : Une suite de v.a. (Xn)n converge P-presque sûrement vers une v.a. X si P({w∈Ω tqXn(w)9X(w)}) = 0.

On le noteX_n→P−p.sX.

– Pro : On a l’équivalence : i)X_n→_P−p.sX.

ii)P({w∈Ω tq sup_k≥n(kX_k(w)−X(w)k)90}) = 0 iii)P({w∈Ω tq lim sup_n(kXn(w)−X(w)k)90}) = 0.

iv)∀ε >0,P(S

n

T

m≥n{|Xn−X_m|< ε}) = 1.

– Pro : La limite P-presque sûre est unique modulo l’égalité P-presque partout.

– Pro : SiXn→P−p.s X et f :R^d→R^mest continue, alorsf(Xn)→P−p.sf(X).

– Pro : Soit (En) une suite de v.a. iid de loi de Bernouilli de paramètre ¹₂. Alors la suiteXn:=Pn

k=1 E_k

2^k converge P-p.s vers une v.a. de loiU_[0,1[. – Lemme de Borel-Cantelli : Soit (An)n une suite d’évènements de Ω.

i) SiP

nP(An)<+∞, alorsP(lim sup_n(An)) = 0.

ii) Si lesAn sont indépendants et siP

nP(An) = +∞, alorsP(lim sup_n(An)) = 1.

– Cor : Soient (Xn)n et X des variables aléatoires. On a : i) Si∀ε >0,P

nP(kXn−Xk ≥ε)<+∞, alorsXn →_P−p.sX. ii) Si lesXnsont indépendantes, alorsXn→_P−p.s 0 si et seulement siP

nP(kXnk ≥ ε)<+∞pour toutε >0.

– Pro : Soit (Xn)n une suite de v.a. iid de loi Exp(1) donnée par la densitéf(x) = χ_R₊(x)e^−x.

Alors ^max^1≤i≤n_ln(n)^(Xⁱ⁾→P−p.s1.

2. Convergence en probabilité. —

– Def : On dit que (Xn)n converge en probabilité P vers X si∀ε >0,P(kXn−Xk>

ε)→n 0, et on le noteXn→P X.

– Pro : La limite en probabilité est unique modulo égalité P-presque partout.

– Pro : Si (X_n)n converge P-p.s vers X, alors (X_n)n en probabilité vers X.

– Pro : SoitX_n→P X etf :R^d →R^m continue. Alorsf(X_n)→pf(X).

– Thm : Si une suite (X_n)_n converge en probabilité vers une v.a. X, alors il existe une sous-suite de (X_n)_n qui converge P-p.s vers X.

– Contre-ex : Pour X_n des v.a. indépendantes à valeurs dans{0,1}, avec P(X_n = 1) = _n¹,Xn converge en probabilité vers la v.a. constante 0, mais ne converge pas P-p.s vers 0 car les évènementsP(Xn= 1) sont indépendants et de somme infinie.

– Pro : (Critère de Cauchy de convergence en probabilité) (Xn)n converge en proba- bilité vers X ssi∀ε >0, la suite double de terme général P(kXn−Xmk> ε) tend vers 0.

– Pro : (Métrisabilité de la convergence en probabilité) Pourd(X, Y) =E[sup(kX− Yk,1)], d est une distance sur l’ensemble des v.a. Ω→R^d.

On a de plus : X_n→_P X ssid(X_n, X)→_n0.

3. Loi des grands nombres et applications. —

– Loi faible des grands nombres : Soit (Xn)nune suite de v.a. avec un moment d’ordre 2, telles queCov(Xi, Xj) = 0∀i6=j.

Si _n¹P

k≤nE[Xk]→met _n¹2

P

k≤nσ_X²

i →0, alors^X¹^+..+X_n ⁿ converge en probabilité vers m.

– Ex : Pour (Xn)nsuite de v.a. indépendantes de loi _2n_ln(n)¹ (δn+δ_−n)+(1−_2n_ln(n)¹ )δ0, la suite ^X¹^+..+X_n ⁿ ne converge pas P-p.s vers 0 par Borel-Cantelli, mais converge en probabilité vers 0.

– Théorème de Khintchine (Loi faible des grands nombres) : Soit (X_n)_n une suite de v.a. réelles indépendantes et de même loi, d’espérance finie. Alors la suite de v.a.

X₁+..+X_n

n converge en probabilité versE[X₁].

– App : PourX₁de loi de Bernouilli de paramètre p, ^X¹^+..+X_n ⁿ qui est de loiBin(n,_n^p) converge en probabilités vers la v.a. constante p.

– Théorème de Kolmogorov-Khintchine : Soit (Xn)nune suite de v.a. réelles indépen- dantes et de même loi. On a l’équivalence :

i)∃c∈Rtq ^X¹^+..+X_n ⁿ converge en probabilité vers c.

ii)X1 est intégrable.

– Loi forte des grands nombres : Soient (Xn) des v.a. réelles indépendantes admettant un moment d’ordre 2, telles queE[Xn]→m etP

k≥0f racσ²_X

kk²<+∞

Alors la suite de v.a. ^X¹^+..+X_n ⁿ convergeP-p.s versm.

– Rem : La moyenne empirique Xn := ^X¹^+..+X_n ⁿ permet ainsi d’estimer E[X1] de façon consistante.

– Dev: Approximation d’intégrale par la méthode de Monte-Carlo : Soitf : [0,1]^d→ Rintégrable. On noteI=R

[0,1]^df(x)dλ(x).

Pour X_n,k des v.a. réelles iid de loi U_[0,1], on construitY_n := (X_n,1, . . . , X_n,d) qui est une famille de v.a. iid de loi uniforme sur [0,1]^d. On note Sn = (f(Y1) +· · ·+ f(Yn))/n.

Alors, pour tout 0< ε≤(_kfk^kfk²

∞)²assez petit, on a : P(I−Sn> ε)≤2 exp(−n(^εkfk_kfk^∞

2 )²).

L’approximation de l’intégrale de f par le barycentre de n évaluations données par des v.a. uniformes a ainsi une probabilité de ne pas êtreε-proche de l’intégrale de f qui décroît exponentiellement en n.

2. Convergence en norme L^p, p≥1. —

– Def : Pour tout 1≤p <+∞, on définitL^p(Ω, A, P) comme le quotient de l’espace vectoriel des v.a. réelles X telles queX^p est intégrable par le sous-ev des v.a. réelles

1

(2)

nulles P-presque partout.

On définit l’applicationkXkp:= (E[|X|^p])^p¹.

– Thm : k.k_p est une norme surL^p(Ω, A, P), et (L^p(Ω, A, P),k.k_p) est complet.

– Cor : Une suite (X_n)_n deL^q(Ω, A, P) converge en norme L^q ssi elle est de Cauchy pour la normek.k_q.

– Pro : Pour tousq≥p≥1, on a :

i)L^q(Ω, A, P)⊂L^p(Ω, A, P)⊂L¹(Ω, A, P).

ii) Si une suite (Xn)n de L^q(Ω, A, P) converge vers X en norme k.kq, alors elle converge vers X en normek.kp, et converge aussi vers X en probabilité. (k.kq ⇒ k.kp

⇒P )

– Contre-ex : PourXn indépendantes avec P(Xn =n^c) = _n¹ et P(Xn = 0) = 1−¹_n pour un certainc >0,Xn→P 0, mais|Xnkp=n^c−¹^p diverge sic > ¹_p.

– Rem : Si (Xn)n converge vers X en norme L^q, alors il existe une extractrice de (Xn)n qui converge vers X P-p.s.

– Contre-ex : On se place sur ([0,1],B([0,1]), λ). Pour toutm≥0, on définit les v.a.

fm:=χ_[k

2n,^k+1₂_n[ pourm= 2ⁿ+k, 0≤k <2ⁿ.

Alorsfm→_k.k_p0 maisfmne converge pas vers 0 P-p.s.

– Def : Une famille de v.a. réelles (X_i)_i∈I est dite uniformément intégrable si : lim_c→+∞(sup_i∈I(R

|Xi|>c|X_i|dP)) = 0.

– Ex : Une famille finie est uniformément intégrable.

Une famille tq|Xi| ≤ |Y|, où Y est intégrable, est uniformément intégrable.

– Pro : Une famille (Xi)i est uniformément intégrable ssi on a :

i) ∀ε > 0, il existe η > 0 tq pour tout A ∈ A tq P(A) < η, on aR

A|Xi|dP < ε

∀i∈I. ii)supi(E[|Xi|])<+∞.

– Théorème de Vitali : Soit (Xn)n est une suite de v.a. réelles qui converge en probabilité vers une v.a. X.

La famille (X_n)n est uniformément intégrable ssiX ∈L¹(Ω, A, P) etX_n → k.k1X.

3. Convergence en loi. — 1. Définition et propriétés. —

– Def : Une suite de v.a. réellesXnconverge en loi vers une v.a. réelle X siE[f(Xn)]→ E[f(X)] pour toute fonctionf :R→Rcontinue bornée. On note alorsXn→_L X. – Pro : Xn →_L X ssi pour FX, FXn les fonctions de répartition des v.a., on a :

F_X_n(x)→F_X(x) pour tout x point de continuité deF_X.

– Ex : PourX_n de loiN(a_n, σ_n²) aveca_n→aet σ_n² →σ² >0, alorsX_n converge en loi versN(a, σ²).

– Pro : SiX_n→_P−p.s X, alorsX_n→_L X.

SiX_n →_P X, alorsX_n→_L X.

– Contre-ex : Pour X ∼ N(0,1), X_n = (−1)ⁿX est encore de loi N(0,1), donc converge en loi vers X. MaisXn ne converge ni P-p.s, ni en probabilité.

– Ex : SiXn converge en loi vers une v.a. constante c, alorsXn →P c.

– Lemme de Slutsky : Pour (Xn)n,(Yn)n des v.a. réelles telles que Xn →_L X et Xn−Yn →P 0, on aYn→_L X.

– Def+Pro : On appelle fonction caractéristique d’une v.a. X l’applicationϕ_X donnée par :

∀t∈R^d,ϕ_X(t) :=R

R^dexp(i < x, t > dP_X(x) =E[exp(i < X, t >)].

On montre que siϕ_X=ϕ_Y, alorsX ∼Y : ϕ_X caractérise la loi de X.

– Dev: Théorème de Lévy : X_n converge en loi vers X ssiϕ_X_n converge simplement versϕX.

– App : Théorème Central de la Limite : Soit Xn une suite de v.a. réelles iid ayant un moment d’ordre 2. Alors la suite ^X¹^+..+X√ ⁿ^−nE[X¹^]

var(X₁)n converge en loi vers une loi normale centrée réduiteN(0,1).

– Application à un intervalle de confiance.

– Thm : Soit (Sn)n une suite de v.a. de loi Bin(n, pn). Si n.pn converge vers un λ > 0, alors Sn converge en loi vers une v.a. de Poisson de paramètre λ, càd : P(Sn=m)→e^{−λ λ}_m!^m.

– Rem : Dans le cas où p est assez petit, on peut approximer une v.a. de loiBin(n, p) parPnp.

– Théorème des évènements rares de Poisson : Pour toutn≥0, soitMn ≥2 et soient An,1, .., An,Mn des évènements de Ω. On définitSn:=P

j≤MnχAn,j. SiP

j≤MnP(An,j converge vers unλ >0 et simaxj(P(An,j) converge vers 0, alors Sn converge en loi vers une v.a. de loi Poisson de paramètreλ.

– Ex : Illustration avec les clients d’une banque.

2. Applications en statistiques. —

– Application du TCL à la détermination d’un intervalle de confiance

– Application permettant d’oublier des variables inconnues pour former d’autres intervalles de confiance

– Pro : (δ-méthode)

Références

Ouvrard (Probas 2) : Contre-ex de convergence P-p.s. Contre-ex P et pas P-p.s. Loi faible des grands nombres, Th de Khintchine, Loi forte des grands nombres, exemple, Méthode de Monte Carlo.(Dev)(incomplet), Th de Glivenko-Cantelli. Th des évènements rares de Poisson, application aux clients d’une banque. Continuous mapping theorem, Th de Slutsky. Applications du TCL,δ-méthode.

Barbe, Ledoux : Convergence P-p.s, définitions équivalentes, critère de Cauchy, unicité p.s, exemple, image d’une suite P-p.s convergente par une fonction continue,P

n E_n 2ⁿ avec E_n ∼ B(¹₂) indép, Lemme de Borel-Cantelli, Lemme de Borel-Cantelli de convergence P-p.s, exemple. Convergence P, unicité p.s de la limite, P-p.s implique P, P donne P-p.s à extraction près, métrique associée, critère de Cauchy, image d’une suite P-convergente par une fonction continue, exemple. Def deL^p(Ω, A, P), normek.kp, espace complet, inclusions topologiques,L^p implique P,L^p donne P-p.s à extraction près, exemple, contre-exemple,

2

(3)

uniforme intégrabilité, def équivalente, exemple des familles finies/dominées, unif inté- grable et P-convergente ssiL¹-convergente. Convergence en loi, def équivalente, exemple, P-convergence implique CV en loi, contre-exemple, convergence L vers une constante, fonction caractéristique.

Zuily, Queffélec : Théorème de Lévy+TCL.(Dev)

Cadre, Vial : Application du TCL à la détermination d’un intervalle de confiance, Ap- plication permettant d’oublier des variables inconnues pour former d’autres intervalles de confiance, Intervalle de confiance asymptotique pour un jeu de pile ou face,δ-méthode.

June 2, 2017

Vidal Agniel,École normale supérieure de Rennes

3