• Aucun résultat trouvé

Convergence presque sûre et en probabilité

Dans le document Chapitre 1 Dénombrer et sommer (Page 167-174)

Théorèmes limites

6.1 Convergences de suites de v.a

6.1.1 Convergence presque sûre et en probabilité

Quand on envisage la question de la convergence d’une suite de v.a. (Yn) vers une v.a. Y, la première notion de convergence qui vienne à l’esprit est la convergence simple sur tout Ω, au sens de l’analyse1 :

∀ω ∈Ω, Yn(ω)−−−−→ n→+∞ Y(ω).

On voit immédiatement que cette notion n’est pas satisfaisante pour la convergence de la suite (Mn) donnée en (6.1). En effet considérons le modèle probabiliste infini le plus

simple possible, à savoir le jeu de pile ou face infini. On peut prendre ici Ω = {f,p}N

et ω est une suite infinie ω = (ui)i≥1, avec ui ∈ {f,p} pour tout i. En prenant pour Xi l’indicatrice de l’évènement obtention de pile au ie lancer, Mn est la fréquence d’appa-rition de pile au cours desn premiers lancers. Si la pièce est équilibrée, on s’attend à ce queMnconverge vers 1/2. Or il est clair qu’il y a une infinité d’évènements élémentaires

ω pour lesquels Mn(ω) ne converge pas vers 1/2. On peut même construire facilement une infinité de ω pour lesquels Mn(ω) n’a aucune limite2. Ce simple exemple montre que la notion de convergence simple n’est pas pertinente en théorie des probabilités. Pour dépasser ce problème, on introduit la notion de convergence presque sûre, i.e. la convergence simple de Yn vers Y sur un sous-ensembleΩ0 de probabilité 1 deΩ.

Définition 6.1 (convergence presque sûre). Soient (Yn)n≥1 et Y des variables aléa-toires définies sur le même espace probabilisé (Ω,F, P). On dit que Yn converge presque sûrement vers Y, notation Yn

p.s. −−−−→

n→+∞ Y, si P(Ω0) = 1, en notant0 :=ω ∈Ω; lim

n→+∞Yn(ω) =Y(ω) . (6.2) Cette définition soulève immédiatement une question. Pour que l’égalité P(Ω0) = 1 ait un sens, encore faut-il que Ω0 appartienne à la tribu F sur laquelle est définie la fonction d’ensembleP. Pour établir l’appartenance àF deΩ0, il est naturel de s’appuyer sur la mesurabilité des Yn et de Y dont héritent les v.a. positives |Yn−Y|. Pour cela, on commence par écrire avec des quantificateurs l’appartenance à Ω0 :

ω ∈Ω0 ⇔ ∀ε >0, ∃j =j(ω, ε)∈N, ∀k ≥j, |Yk(ω)−Y(ω)|< ε. (6.3) En utilisant la traduction automatique des quantificateurs en opérations ensemblistes, cf. p.2, on en déduit que

0 = ∩

ε>0

j∈N

k≥j {|Yk−Y|< ε}. (6.4)

En lisant (6.4) de droite à gauche, on obtient les appartenances successives àF, d’abord des ensembles {|Yk −Y| < ε} en raison de la mesurabilité des v.a. |Yn−Y|, puis de l’intersection dénombrable sur k, puis de l’union dénombrable sur j. Arrivés là, on est coincés car la dernière intersection sur ε a pour ensemble d’indexation ]0,+∞[ qui est infininon-dénombrable. On ne peut donc pas en déduire l’appartenance àFdeΩ0. Pour franchir cet obstacle, il suffit de revenir à (6.3) et d’écrire une version « discrétisée » de la convergence de Yn(ω) vers Y(ω). Pour cela on choisit une suite de réels strictement positifs(εi)i≥1, tendant vers 0et on écrit que

ω∈Ω0 ⇔ ∀i≥1, ∃j =j(ω, i)∈N, ∀k≥j, |Yk(ω)−Y(ω)|< εi. (6.5) La traduction automatique des quantificateurs nous donne maintenant

0 = ∩

i∈N

j∈N

k≥j{|Yk−Y|< εi}. (6.6) 2Pour approfondir cette question, voir la section « 6.5 Discussion » dans [ICP].

6.1. Convergences de suites de v.a.

Sous cette forme, il est maintenant clair que Ω0 appartient àF et ceci légitime la défini-tion 6.1. Nous avons établi au passage que

Yn−−−−→p.s.

n→+∞ Y ⇔ P

i∈N

j∈N

k≥j {|Yk−Y|< εi}= 1, (6.7) pour une suite de réels εi >0, tendant vers 0.

Pour l’instant, (6.7) n’est pas directement exploitable comme méthode pratique pour montrer une convergence presque sûre, mais on peut progresser dans cette direction en « faisant sortir le ∀i» de la probabilité. Cette opération est légitimée par le lemme suivant.

Lemme 6.2. Si (Bi)i≥1 est une suite d’évènements, on a l’équivalence P

i≥1Bi= 1 ⇔ ∀i≥1, P(Bi) = 1. (6.8) Preuve. L’implication «⇒» est évidente car pour tout j ≥1, on a ∩i≥1Bi ⊂Bj, d’où

1 =P

i≥1Bi≤P(Bj)≤1.

Pour la réciproque, on montre que si tous les P(Bi) valent 1, alors P (∩i≥1Bi)c = 0. Ceci s’obtient par sous-σ-additivité de P :

Pi≥1Bic=Pi≥1Bic+∞ X i=1 P(Bic) = 0,

puisque tous les termes de cette série sont nuls.

En appliquant le lemme 6.2 aux évènements Bi :=∪jNk≥j {|Yk−Y|< εi}, nous obtenons à partir de (6.7) l’équivalence entre la convergence presque sûre de Yn vers Y

et la condition

∀i∈N, P

j∈N

k≥j {|Yk−Y|< εi}= 1, (6.9) Maintenant que nous avons réussi à faire sortir le «∀ε» de la probabilité, on peut laisser tomber la discrétisation pour aboutir à la caractérisation suivante de la convergence presque sûre.

Proposition 6.3 (une c.n.s. de convergence p.s.). La suite de variables aléatoires (Yn)n≥1 converge presque sûrement vers la variable aléatoire Y si et seulement si

∀ε >0, P ∪ j∈Nk≥j {|Yk−Y|< ε}= 1, (6.10) ou encore ∀ε >0, Pj∈Nk≥j{|Yk−Y| ≥ε}= 0. (6.11)

Preuve. L’équivalence entre (6.10) et (6.11) est évidente par passage au complémentaire. Vérifions l’équivalence entre (6.10) et la c.n.s. (6.9) de convergence presque sûre. Il est clair que (6.10) implique (6.9). Pour la réciproque, il suffit de remarquer que la fonction

t7→P ∪jNk≥j{|Yk−Y|< t}

estcroissante. En effet sis < t, l’inclusion d’évènements {|Yk−Y| < s} ⊂ {|Yk−Y| < t} se propage à l’intersection sur k ≥j et l’union sur j. Supposons (6.9) vraie et fixons ε > 0 quelconque. Comme la suite (εi)i≥1 tend vers 0, on peut trouver un i0 tel que εi0 < ε et alors

1 =Pj∈Nk≥j {|Yk−Y|< εi0}≤Pj∈Nk≥j {|Yk−Y|< ε}≤1, d’où (6.10).

Intéressons nous maintenant à (6.11). En notant Ak :={|Yk−Y| ≥ε}, on aimerait trouver une condition qui nous assure queP(∩jN∪k≥jAk) = 0. En pratique, on a souvent une majoration des probabilités P(Ak) via une inégalité du type inégalité de Markov et il est donc naturel de chercher une condition portant sur les P(Ak). Ce problème a un intérêt propre, indépendant de la définition des Ak, provenant de l’interprétation suivante de l’évènement∩jNkjAk :

j∈N

k≥j Ak = {ω∈Ω; ω appartient à une infinité de Ak} = {ω∈Ω; ω réalise une infinité de Ak} = {réalisation d’une infinité de Ak}.

L’étude de la probabilité de cet évènement conduit aux deux lemmes de Borel Cantelli. Lemme 6.4 (Borel Cantelli I). Soit (An)nN une suite d’évènements telle que

+∞

X

n=0

P(An)<+∞. (6.12)

Alors

P réalisation d’une infinité de An= 0.

Preuve. Introduisons la notation3 A := {réalisation d’une infinité de An} et posons

Cj := ∪k≥jAk. La suite (Cj)jN est décroissante pour l’inclusion et d’intersection A. Par continuité séquentielle décroissante deP, on a donc

P(Cj)−−−−→

j→+∞ P(A). (6.13)

Par sous-σ-additivité deP, on a d’autre part ∀j ∈N, 0≤P(Cj)≤X

k≥j

P(Ak) =: r(j). (6.14) 3Cette écriture est commode, mais non standard, donc pensez à en expliciter la définition si vous êtes tenté de la réutiliser dans un exercice. Vous trouverez parfois dans la littérature la notation lim supn+An pour l’évènement « réalisation d’une infinité de An». Cette notation est proscrite de ce cours par choix pédagogique.

6.1. Convergences de suites de v.a.

Grâce à l’hypothèse (6.12), r(j) est le reste d’une série convergente, donc tend vers 0 quand j tend vers +∞. Cette convergence combinée avec la majoration (6.14) nous donne

P(Cj)−−−−→

j→+∞ 0. (6.15)

La conclusion P(A) = 0 découle alors de (6.13) et (6.15).

Le lemme de Borel Cantelli I est d’une portée très générale, puisqu’on obtient la conclusion P(A) = 0 sous la seule hypothèse de convergence de la série P

n∈NP(An), sans rien supposer sur la structure de dépendance de la suite (An). Pour les suites d’évènements indépendants, on a le résultat complémentaire suivant.

Lemme 6.5 (Borel Cantelli II). Soit (An)nN une suite d’évènements indépendants telle que +∞ X n=0 P(An) = +∞. (6.16) Alors

P réalisation d’une infinité de An= 1.

Preuve. Notons encoreA :={réalisation d’une infinité de An} et posons

Cj,l := ∪ j≤k≤lAk, Cj := ∪ k≥jAk, d’où A = ∩ j∈NCj.

Les Ack héritant de l’indépendance des Ak, cf. remarque 2.54, on a

P(Cj,l) = 1−P(Cj,lc ) = 1−Pl k=jAck= 1− l Y k=j 1−P(Ak) .

On utilise alors l’inégalité de convexité4 ex ≥ 1−x avec x = P(Ak) pour obtenir la minoration 1≥P(Cj,l)≥1− l Y k=j exp −P(Ak)= 1−expl X k=j P(Ak). (6.17) En laissant j fixe et faisant tendre l vers l’infini dans (6.17), on en déduit grâce à l’hypothèse (6.16) que P(Cj,l) tend vers 1. D’autre part Cj est limite croissante pour l’inclusion des Cj,l, donc par continuité croissante séquentielle deP,

P(Cj) = lim

l→+∞P(Cj,l) = 1.

4La représentation graphique de la fonction convexex7→ex est toujours au-dessus de sa tangente à l’origine d’oùex≥1−xpour toutx∈R.

Cette égalité étant vraie pour toutj ∈N, on en déduit par le lemme6.2 que

P

j∈NCj= 1.

Comme l’intersection de tous lesCj est l’évènement A, le lemme est démontré. Après cette longue, mais utile, digression sur les lemmes de Borel Cantelli, revenons à notre quête d’une condition pratique de convergence presque sûre. Le premier lemme de Borel Cantelli nous permet d’aboutir au résultat suivant.

Proposition 6.6 (condition suffisante de convergence p.s.). Soient Y et (Yn)n≥1 des variables aléatoires réelles définies sur le même espace probabilisé (Ω,F, P) et véri-fiant ∀ε >0, +∞ X n=1 P(|Yn−Y| ≥ε)<+∞. (6.18) Alors Yn converge presque sûrement vers Y.

On dit d’une suite (Yn)n≥1 vérifiant (6.18) qu’elle converge presque complètement vers Y.

Preuve. Fixonsε >0quelconque et posonsAn :={|Yn−Y| ≥ε}. Par le premier lemme de Borel-Cantelli, on déduit de (6.18) que la probabilité de réalisation d’une infinité de

An est nulle, ce qui s’écrit encore

P

j∈N

k≥j {|Yk−Y| ≥ε}= 0.

Ceci étant vérifié pour tout ε > 0, la c.n.s. (6.11) de la proposition 6.3 nous donne la convergence presque sûre de Yn vers Y.

Nous introduisons maintenant un nouveau mode de convergence de Yn vers Y, la convergence en probabilité. Cette notion nous sera utile pour la loi faible des grands nombres.

Définition 6.7. La suite Yn converge en probabilité vers Y (notation Yn −−−−→Pr n→+∞ Y) si ∀ε >0, P |Yn−Y| ≥ε−−−−→

n→+∞ 0.

Notons la différence de point de vue par rapport à la convergence presque sûre. Dans la convergence presque-sûre, on reste proche de la notion de convergence simple de l’analyse. Il s’agit de la convergence de la suite de réels (Yn(ω))n1, pour tous les

ω d’un même évènement de probabilité 1. La convergence en probabilité ne concerne pas le comportement asymptotique individuel de chaque suite (Yn(ω))n≥1, mais plutôt celui de la suite d’évènements Dn,ε :={|Yn−Y| < ε} dont la probabilité P(Dn,ε) doit tendre vers 1, pour toutε. En pratique, établir la convergence en probabilité deYn vers

6.1. Convergences de suites de v.a.

vers Y. En effet si on utilise la condition suffisante de convergence p.s. (6.18), pour que la série converge, il faut déjà que son terme général tende vers 0 et cette convergence vers 0 (pour tout ε) est précisément la convergence en probabilité de Yn vers Y. Bien sûr, comme (6.18) n’est qu’une condition suffisante, cette remarque ne nous permet pas d’affirmer que la convergence en probabilité est une notion plus faible que la convergence presque-sûre. Ce qui suit va nous montrer qu’il en est pourtant bien ainsi.

Proposition 6.8. La convergence presque-sûre implique la convergence en probabilité. Preuve. Fixons ε > 0. L’hypothèse de convergence presque sûre de Yn vers Y signifie que l’événement

0 :={ω ∈Ω; lim

n→+∞Yn(ω) = Y(ω)} a pour probabilité 1. Définissons

0ε:={ω ∈Ω; ∃k0 =k0(ω), ∀n ≥k0, |Yn(ω)−Y(ω)|< ε}.

C’est bien un évènement (i.e.0ε∈F) puisqu’il s’écrit Ω0ε= ∪

k∈N

n≥k{|Yn−Y|< ε}.

De plus Ω0ε contientΩ0, donc P(Ω0ε) = 1. Pour toutk ≥1, notons

Ak :={ω ∈Ω; ∀n ≥k, |Yn(ω)−Y(ω)|< ε}= ∩

n≥k{|Yn−Y|< ε}.

La suite (Ak)k≥1 est clairement croissante pour l’inclusion et sa réunion est Ω0ε. Par continuité séquentielle croissante de P, on a donc P(Ak) ↑P(Ω0ε) = 1 (k → +∞). Par conséquent,

∀δ >0, ∃k1, P(Ak1)>1−δ.

Pour tout n ≥k1, l’évènement {|Yn−Y|< ε}contient Ak1, d’où ∀n≥k1, P(|Yn−Y|< ε)>1−δ.

En passant à l’évènement complémentaire, on obtient finalement ∀δ >0,∃k1N,∀n≥k1, P(|Yn−Y| ≥ε)< δ.

Ceci établit la convergence vers 0 deP(|Yn−Y| ≥ε). Comme ε était quelconque, on a bien convergence en probabilité de Yn vers Y.

Remarque 6.9. La convergence en probabilité n’implique pas la convergence presque-sûre. Voici un contre exemple. On prend comme espace probabilisé (]0,1],Bor(]0,1]), λ), où λ est la restriction à ]0,1]de la mesure de Lebesgue sur R. On définit sur cet espace les Yn comme suit :

Y1 =1]0,1],

Y2 =1]0,1/2], Y3 =1]1/2,1],

Y4 =1]0,1/4], Y5 =1]1/4,1/2], Y6 =1]1/2,3/4], Y7 =1]3/4,1],

Y8 =1]0,1/8], Y9 =1]1/8,1/4], . . . , Y15 =1]7/8,1], Y16=1]0,1/16], . . . .

Le lecteur qui ne se satisferait pas de cette définition informelle peut toujours s’exercer à trouver une formule explicite pourYn. Sans entrer dans ces détails techniques, on peut facilement se convaincre de deux choses :

1. Pour toutω ∈]0,1], la suite de « bits »(Yn(ω))n≥1 est formée d’une infinité de0et d’une infinité de 1. Elle ne peut donc converger (sa limite inférieure vaut 0 et sa limite supérieure 1). Ainsi non seulement on n’a pas de convergence presque sûre deYn, mais en plusYn(ω) ne converge pouraucun ω ∈Ω.

2. Pour 0 < ε < 1, P(|Yn−0| > ε) = P(Yn = 1) = λ(In), en notant In l’intervalle dyadique dont Yn est l’indicatrice. La longueur λ(In) de cet intervalle tend vers zéro quand n tend vers l’infini (à la même vitesse que l’inverse du logarithme en base deux de n). Donc Yn converge vers 0en probabilité.

Remarque 6.10. Il est toutefois possible d’obtenir la convergence presque sûre à partir

Dans le document Chapitre 1 Dénombrer et sommer (Page 167-174)