Statistiques math´ematiques : cours 1

(1)

Statistiques math´ ematiques : cours 1

Guillaume Lecu´e

28 aoˆut 2018

(2)

2/54

Organisation

9 cours de 2h (18h) Guillaume Lecu´e

guillaume.lecue@ensae.fr

I mardi 28 à 10h15 ; mercredi 29 à 13h30 et 15h45 ; jeudi 30 à 10h15

I lundi 3 à 17h ; mercredi 5 à 10h15 ; jeudi 6 à 10h15

I mercredi 12 `a 10h15

I lundi 17 `a 17h

Slides du cours et recueil d’exos et annales téléchargeables à

http://lecueguillaume.github.io/2015/10/05/rappels-stats/

6 TD (12h)Lucas Gerin

vendredi 31 à 13h30 ; mercredi 5 et 12 à 8h30 ; mercredi 26 à 8h30 ; jeudi 27 à 17h.

Examen

Fin octobre/ d´ebut novembre

2/54

(3)

Pr´ esentation (succinte) du cours de stats math

I Echantillonnage et mod´elisation statistique. Fonction de r´epartition empirique(2 cours)

I M´ethodes d’estimation classiques (2 cours)

I Information statistique, th´eorie asymptotique pour l’estimation(1 cours)

I D´ecision statistique et tests(2 cours)

I Mod`ele de r´egression(1 cours)

I Statistiques Bay´esiennes(1 cours)

(4)

4/54

Aujourd’hui

Organisation du cours

Echantillonnage et mod´elisation statistique Donn´ees d’aujourd’hui

Exp´erience statistique Mod´ele statistique

Fonction de répartition empirique et théorème fondamentale de la statistique

Loi d’une variable al´eatoire Fonction de r´epartition empirique Approche non-asymptotique

4/54

(5)

Les donn´ ees d’aujourd’hui :

fichiers (en local).csvou.txt

Les chiffres du travail

Taux d’activit´e par tranche d’ˆage hommes vs. femmes

http://www.insee.fr/

(6)

6/54

Les donn´ ees d’aujourd’hui : s´ eries temporelles

Le monde de la finance

http://fr.finance.yahoo.com/

http://www.bloomberg.com/enterprise/data/

6/54

(7)

Les donn´ ees d’aujourd’hui : grandes matrices

Biopuces et analyse d’ADN

(8)

8/54

Les donn´ ees d’aujourd’hui : graphes

acteurs de s´eries

8/54

(9)

Les donn´ ees d’aujourd’hui :

^{le m´}etier en data science

Probl`ematique :

I stockage, requettage : expertise en base de donn´ees

I data “jujitsu”, data “massage”

I data-vizualization (Gephi, Tulip, widget python, power BI, etc.)

I math´ematiques :

? mod´elisation(statistiques)

? construction d’estimateurs impl´ementation d’algorithmes

I Python, R, H2O, TensorFlow, vowpal wabbit, spark,..., github,...

Pour s’entrainer aux m´etiers en “data science” :

• https://www.kaggle.com,https://www.datascience.net/

• notebooks python

• Coursera

(10)

10/54

Objectif du cours

“statistiques math´ematiques”

1. Construire des mod`eles statistiques pour des donn´ees classiques 2. Construire des estimateurs / tests classiques

3. Connaˆıtre leurs propriétés statistiques et les outils mathématiques qui permettent de les obtenir

10/54

(11)

Probl´ ematique statistique

1) Point de départ: données (ex. : des nombres réels) x₁, . . . ,x_n

2) Mod´elisation statistique:

I les donn´ees sont des r´ealisations

X1(ω), . . . ,Xn(ω) de variable al´eatoires r´eelles (v.a.r.) X1, . . . ,Xn.

(autrement dit, pour un certainω,X1(ω) =x1, . . . ,Xn(ω) =xn)

I LaloiP^(X¹^,...,Xⁿ⁾de (X1, . . . ,Xn)est inconnue, mais appartient `a une famille donn´ee (a priori)

Pⁿθ, θ∈Θ : le mod´ele

On pense qu’il existe θ∈Θ tel queP^(X¹^,...,Xⁿ⁾=Pⁿθ.

(12)

12/54

Probl´ ematique statistique (suite)

I θ est leparam`etreet Θl’ensembledes param`etres.

I Estimation: `a partir de X1, . . . ,Xn, construireϕn(X1, . . . ,Xn) qui

“approche au mieux”θ.

I Test: à partir des donnéesX₁, . . . ,X_n, établir unedécision Tn(X1, . . . ,Xn)∈ {ensemble de décisions} concernant une hypothèse surθ.

Definition

Unestatistiqueest une fonction mesurable des donn´ees

!ATTENTION !Une statistique ne peut pas dépendre du paramètre inconnu : une statistique se construit uniquement à partir des données !

12/54

(13)

Exemple du pile ou face

I On lance une pi`ece de monnaie 18 fois et on observe (P= 0,F = 1) 0,0,0,1,1,0,1,0,0,1,1,0,1,0,0,1,1,0

I Modéle statistique : on observen= 18 variables aléatoires (Xi)¹⁸_i=1 indépendantes, de Bernoulli de paramètreinconnuθ∈Θ = [0,1].

I Estimation. Estimateur ¯X18=₁₈¹ P18 i=1Xi

= 8/18 = 0.44. Quelleici

pr´ecision ?

I Test. Décision à prendre :la pièce est-elle équilibrée ?. Par exemple : on compare ¯X18à 0.5. Si|X¯18−0.5|estpetit, on accepte l’hypothèsela pièce est équilibrée. Sinon, on rejette.

Quel seuil choisir ? et avec quelles cons´equences (ex. probabilit´e de se tromper) ?

(14)

14/54

Echantillonnage = r´ ep´ etition d’une mˆ eme exp´ erience

I L’expérience statistique la plus centrale : on observe la réalisation de X1, . . . ,Xn, v.a. où lesXi sont indépendantes,identiquement distribuées (i.i.d.), de même loi communeP^X ∈ {Pθ:θ∈Θ}.

I problème : à partir des donnéesX1, . . . ,Xnque dire de la loiP^X communeauxXi? (moyenne, moments, symétrie, densité, etc.)

14/54

(15)

Exp´ erience statistique

Consiste `a d´eterminer :

I l’espace des observations

Z(ex. :Z={0,1}¹⁸) C’est l’espace o`u vivent les observations

I Unetribu:Z (ex. :Z=P(Z) = tous les sous-ensembles deZ)

I Une famille de lois = mod`ele

{Pθ, θ∈Θ} (ex. :Pθ=Pⁿθ= (θδ1+ (1−θ)δ0)^⊗18)

(16)

16/54

Exp´ erience statistique

Definition

Uneexp´erience statistiqueE est un triplet E = Z,Z,

Pθ, θ∈Θ o`u

I Z,Z

espace mesurable (ex. :(Rⁿ,B(Rⁿ))),

I {P^θ, θ∈Θ} famille de probabilités définiessimultanémentsur le même espace Z,Z

.

16/54

(17)

Mod´ eles statistiques (jargon)

I {Pθ, θ∈Θ} est appel´emod´ele

I quand il existek tel que Θ⊂R^k, on parle de mod´eleparam´etrique

I quandθ est un paramètre infini dimensionnel, on parle de modéle non-paramétrique(ex. : densité)

I quandθ= (f, θ0) oùf est infini dimensionnel (souvent, paramètre de nuisance) etθ0∈R^k (paramètre d’intérêt), on parle de modéle semi-paramétrique

I quandθ∈Θ7→Pθ est injectif, on dit que le mod´ele estidentifiable

(18)

18/54

Mod´ eles statistiques

Question centrale en statistiques : Quel mod´ ele est le plus adapt´ e ` a ces donn´ ees ?

Il existe deux manières équivalentes de définir un modéle : 1. soit en se donnant une famille de loi{Pθ, θ∈Θ}

2. soit en se donnant une ´equation

18/54

(19)

Exemple de mod´ ele/mod´ elisation (1)

On observe unn-uplet de variables al´eatoires r´eelles : Z = (X1, . . . ,Xn)

On peut modéliser ces observations de deux manières (équivalentes) :

I par une famille de lois : {Pθ:θ∈R}; par exemple, P^θ= N(θ,1)⊗n

I par une ´equation ; par exemple, pour touti∈1, . . . ,n, Xi =θ+gi

oùg1, . . . ,gn sontnvariables aléatoires Gaussiennes centrées réduites indépendantes.

(20)

20/54

Exemple de mod´ ele/mod´ elisation (2)

On observe unn-uplet de variables al´eatoires r´eelles : Z = (X1, . . . ,Xn).

On peut modéliser ces observations de deux manières (équivalentes) :

I Par une ´equation :X1=g1et pour touti ∈1, . . . ,n−1, Xi+1 =θXi+gi

o`ug1, . . . ,gn sont iidN(0,1).

I Famille de lois : {P^θ:θ∈R}o`u Pθ=fθ.λⁿ o`uλⁿ est la mesure de Lebesgue surRⁿet

f_θ(x₁, . . . ,x_n) =f(x₁)f(x₂−θx₁)· · ·f(x_n−θx_n−1) etf(x) = ^exp(−x^√ ²^/2)

2π .

20/54

(21)

Pourquoi mod´ eliser ?

Données Problème concrêt

Processus stochastique Probl`eme math´ematique

Mod´ elisation

Pourquoi modéliser ? : 1) Outils mathématiques 2) Résultats mathématiques 3) Algorithmes

(22)

22/54

3 mod` eles (non-param´ etriques) classiques

1. Modéle dedensité: on observe unn-échantillon

X1, . . . ,Xn de v.a.r. de densitéf tel quef ∈ C oùCest une classe de densités surR(Lebesgue).

2. Modéle derégression: on observe unn-échantillon de couples (X_i,Y_i)ⁿ_i=1 tel queY_i∈R,X_i ∈R^d et

Y_i =f(X_i) +ξ_i

o`uξi sont des v.a.r.i.i.d. ind´ependantes desXi etf ∈ C.

I quandf(Xi) = θ,Xi

: mod´ele de regressionlin´eaire,

I et quandξi ∼ N(0, σ²) : mod´elelin´eaire Gaussien

3. mod´ele declassification: on observe unn-´echantillon (Xi,Yi)ⁿ_i=1 tel queYi ∈ {0,1} etXi∈ X. Par ex. :

P[Yi = 1|Xi =x] =σ(

x, θ

) o`uσ(x) = (1 +e^−x)

22/54

(23)

Partie 2

Fonction de r´ epartition empirique et th´ eor` eme

fondamentale de la statistique

(24)

24/54

Question fondamentale

Considérons le modéle d’échantillonnage surR: on observe X1, . . . ,Xn

qui sont i.i.d. de loi communePX.

Rem. : Comme la loi de l’observation (X1, . . . ,Xn) estP^⊗nX , se donner un modéle est ici (pour le modéle d’échantillonnage) équivalent à se donner un modéle sur PX.

Par exemple :PX ∈ {N(θ,1) :θ∈R}

Question fondamentale

On considère le modéle “total” = PX ∈ {toutes les lois sur R}. Est-il possible de connaˆıtreexactementPX quand le nombrende données tends vers∞?

24/54

(25)

Rappel : loi d’une variable al´ eatoire r´ eelle

Definition

X : Ω,A,P

−→ R,B

Loi de X : mesure de probabilité sur(R,B), notéeP^X, définie par P^X

A

=P[X ∈A], ∀A∈ B.

Formule d’int´egration

E ϕ(X)

= Z

Ω

ϕ X(ω)

P(dω) = Z

R

ϕ(x)P^X(dx) pour toute fonction testϕ.

(26)

26/54

Loi d’une variable al´ eatoire (1/4)

Exemple 1 :X suit la loi de Bernoulli de param`etre 1/3

I La loi de X est d´ecrite par P

X = 1

=¹₃ = 1−P X = 0

I Ecriture de P^X :

P^X = ¹₃δ1+²₃δ0 I Formule de calcul(ϕfonction test)

E ϕ(X)

= Z

R

ϕ(x)P^X(dx)

= ¹₃ Z

R

ϕ(x)δ₁(dx) +²₃ Z

R

ϕ(x)δ₀(dx)

= ¹₃ϕ(1) +²₃ϕ(0)

26/54

(27)

Loi d’une variable al´ eatoire (2/4)

Exemple 2 :X ∼loi de Poisson de param`etre 2

X =k

= 2^k

k!e⁻², k = 0,1, . . .

I Ecriture de P^X :

P^X =e⁻²X

k∈N 2^k k!δk

I Formule de calcul(ϕfonction test) E

ϕ(X)

= Z

R

ϕ(x)P^X(dx) =e⁻²X

k∈N

ϕ(k)²_k!^k

(28)

28/54

Loi d’une variable al´ eatoire (3/4)

Exemple 3 :X ∼ N(0,1) (loi normale standard).

X ∈[a,b]

= Z

[a,b]

e^−x²^/2^√^dx

2π

I Ecriture de P^X :

P^X =f.λ o`uf(x) = ^√¹

2πe^−x²^/2 λ: mesure de Lebesgue

I Formule de calcul

E ϕ(X)

= Z

R

ϕ(x)P^X(dx) = Z

R

ϕ(x)e^−x²^/2^√^dx

2π

28/54

(29)

Loi d’une variable al´ eatoire (4/4)

Exemple 4 :X =min(Z,1), où la loi deZ a une densitéf par rapport à la mesure de Lebesgue surR.

I Ecriture de P^X :

P^X =g.λ+P Z ≥1

δ₁, o`ug(x) =f(x)I x <1

,∀x∈R.

I Formule de calcul

E ϕ(X)

= Z 1

−∞

ϕ(x)f(x)dx+P Z ≥1

ϕ(1)

(30)

30/54

Fonction de r´ epartition

Les lois sont des objets compliquées. On peut néanmoins les caractériser par des objets plus simples.

Definition

Soit X variable aléatoire réelle. La fonction de répartition de X est : F(x) :=P

X ≤x

, ∀x∈R.

I F est croissante, cont. `a droite, F(−∞) = 0, F(+∞) = 1

I F caract´erisela loi P^X : P^X

(a,b]

=P

a<X ≤b

=F(b)−F(a)

I SiF est d´erivable alorsP^X << λetfX =F⁰

I Désormais, laloi deX désignera indifféremmentF ouP^X.

30/54

(31)

Retour sur la question fondamentale

On “observe”

X₁, . . . ,X_n∼_i.i.d.F, F fonction de r´epartitionquelconque, inconnue.

Question : Est-il possible de retrouver exactementF quand ntends vers

∞?

Id´ee : On va chercher `a estimerF surR. Soitx∈R.F(x) =P[X ≤x]

est la probabilit´e queX soit plus petit quex. On va alors compter le nombres deXi qui sont plus petit quex et diviser parn:

1 n

n

X

i=1

I(Xi≤x).

(32)

32/54

Fonction de r´ epartition empirique

Definition

Fonction de répartition empiriqueassociée au n-échantillon(X₁, . . . ,X_n):

Fb_n(x) = 1 n

n

X

i=1

I X_i ≤x

, x ∈R.

(C’est une fonction al´eatoire)

32/54

(33)

Propri´ et´ es asymptotiques de F b

n

(x)

Pour toutx∈R:

Fb_n(x)−→^p.s. F(x) quandn→ ∞

C’est une conséquence de laloi forte des grands nombres appliquée à la suite de v.a.r.i.i.d. I(Xi≤x)

i.

On dit queFbn(x) est un estimateurfortement consistantde F(x).

(34)

34/54

Propri´ et´ es asymptotiques de F b

n

Theorem (Glivenko-Cantelli)

Fbn−F

∞

p.s.

−→0 quand n→ ∞ Aussi appeléThéorème fondamental de la statistique.

Interprétation : Avec un nombre infini de données dans le modèle d’échantillonnage, on peut donc reconstruire exactementF et donc déterminer exactement la loi des observations.

34/54

(35)

Notebooks

http://localhost:8888/notebooks/cdf_empirique.ipynb Glivenko-Cantelli

(36)

36/54

Autres propri´ et´ es asymptotiques de F b

n

(x)

Soitx ∈R. On sait que sin→ ∞alors Fbn(x)−→^p.s. F(x)

Question : Quelle est la vitesse de convergence deFn(x) versF(x) ? Outil :Théorème central-limiteappliqué à la suite de v.a.r.i.i.d.

I(X_i ≤x)

i :

√n Fb_n(x)−F(x) d

−→ N 0,F(x)(1−F(x))

On dit queFbn(x) estasymptotiquement normaldevariance asymptotique F(x)(1−F(x).

36/54

(37)

TCL et intervalle de confiance asymptotique

On a montr´e par le TCL que pour tout 0< α <1, quandn→ ∞, P

bFn(x)−F(x) ≥cα

σ(F)√ n

→ Z

|x|>cα

exp(−x²/2) dx

√2π =α o`uσ(F) =F(x)(1−F(x)) etcα= Φ⁻¹(1−α/2).

I Attention ! ceci ne fournitpasun intervalle de confiance : σ(F) =F(x)^1/2 1−F(x)1/2

est inconnu !

I Solution : remplacerσ(F) parσ(bFn) =Fbn(x)^1/2 1−Fbn(x)1/2

(qui est observable), grˆace au lemme de Slutsky.

(38)

38/54

TCL et intervalle de confiance asymptotique

Proposition

Pour toutα∈(0,1),

I_n,α^asymp=

"

Fbn(x)±Fbn(x)^1/2 1−Fbn(x)^1/2

√n Φ⁻¹(1−α/2)

#

est un intervalle de confiance asymptotique pour F(x)au niveau de confiance1−α:

P

F(x)∈ I_n,α^asymp

→1−α.

38/54

(39)

Notebooks

http://localhost:8888/notebooks/cdf_empirique.ipynb Glivenko-Cantelli

(40)

40/54

Vitesse de convergence dans le Th´eor`eme de Glivenko-Cantelli

Theorem (Th´ eor` eme de Kolmogorov-Smirnov)

Soit X une v.a.r. de fonction de r´epartition F qu’on suppose continue et (Xn)nune suite de v.a.r. i.i.d. de mˆeme loi que X alors :

√n

Fbn−F _∞

−→d K

o`u K est une variable al´eatoire telle que pour tout x∈R

P[K ≤x] = 1−2

∞

X

k=1

(−1)^k+1exp(−2k²x²)

I Utile pour letest de Kolmogorov-Smirnov

40/54

(41)

r´ esultats asymptotiques et non-asymptotiques

On classe les r´esultats statistiques en deux cat´egories :

1. Un r´esultat obtenu quand ntend vers l’infiniest un r´esultat dit asympotique

2. Un résultat obtenu ànfixéest un résultat ditnon-asympotique

(42)

42/54

Estimation non-asymptotique de F (x ) par F b

n

(x )

Soit0< α <1 donn´e(petit). On veuttrouverε, le plus petit possible, de sorte que

P

|bF_n(x)−F(x)| ≥ε

≤α.

On a(Tchebychev) P

|bF_n(x)−F(x)| ≥ε

≤ 1 ε²Var

Fb_n(x)

=F(x) 1−F(x) nε²

≤ 1 4nε²

≤α Conduit `a

ε= 1

2√ nα

42/54

(43)

Intervalle de confiance non-asymptotique

Conclusion : pour toutn≥1 et toutα >0, P

h|bFn(x)−F(x)| ≥ 1 2√

nα i≤α.

Terminologie

L’intervalle

In,α=

Fbn(x)± 1 2√

nα

est un intervalle de confiance non-asymptotique pour F(x)au niveau de confiance1−α.

(44)

44/54

In´ egalit´ e de Hoeffding

Proposition

Y1, . . . ,Yn v.a.r.i.i.d. telles que a≤Y1≤b p.s.. Alors

P

"

1 n

n

X

i=1

Yi−EY1

≥t

#

≤2 exp

− 2nt² (a−b)²

Application : on poseY_i =I(x_i ≤x) etp=F(x). On en d´eduit P

bF_n(x)−F(x) ≥ε

≤2 exp(−2nε²).

On r´esout en ε:

2 exp(−2nε²) =α, soit

ε= r 1

2nlog2 α .

44/54

(45)

Comparaison Tchebychev vs. Hoeffding

Nouvel intervalle de confiance

I_n,α^hoeffding=

"

Fbn(x0)± r 1

2nlog2 α

#

`a comparer avec

I_n,α^tchebychev=

Fbn(x0)± 1 2√

nα

I Mˆeme ordre de grandeur en n.

I Gain significatifdans la limiteα→0.

(46)

46/54

Observation finale

Comparaison des longueurs des 3 intervalles de confiance :

I Tchebychev (non-asymptotique) ^√²_n₂^√¹_α

I Hoeffding (non-asymptotique) ^√²_nq

1 2log_α²

I TCL (asymptotique) ^√²_nFbn(x0)^1/2 1−Fbn(x0)^1/2

Φ⁻¹(1−α/2).

I La longueur la plus petite est celle fournie par le TCL. Mais la longueur de l’intervalle de confiance fournie par l’inégalité de Hoeffding estcomparableà celle du TCL ennetα(dans la limite α→0).

46/54

(47)

Version non-asymptotique de Kolmogorov-Smirnov

X₁, . . . ,X_n i.i.d. de loiF continue,Fb_nleur fonction de r´epartition empirique.

Proposition (In´ egalit´ e de Dvoretsky-Kiefer-Wolfowitz)

Pour toutε >0.

P sup

x∈R

bF_n(x)−F(x) ≥ε

≤2 exp −2nε² .

I R´esultat difficile (th´eorie des processus empiriques).

I Permet de construire des r´egionsde confiance avec des r´esultats similaires au cadre ponctuel :

P

h∀x∈R,F(x)∈

Fbn(x)±q

1

2nlog_α²i

≥1−α

(48)

48/54

Rappels de probabilit´ es

48/54

(49)

Tribus et mesures de probabilit´ e

SoitZun ensemble.

1. UnetribuZ surZest un ensemble de parties deZtel que :

I Z est stable par union et intersection d´enombrable

I Z est stable par passage au compl´ementaire

I Z∈ Z

Les éléments deZ sont appelés desévénements.

2. Unemesure de probabilit´esur (Z,Z) est une appplication P:Z 7→[0,1] telle que

I P[Z] = 1

I Si (An) est une famille dénombrable d’événements disjoints alors P

∪nAn

=X

n

P[An]

Le dernier point est aussi ´equivalent `a : pour (An) une suite

↑ (∪A

(50)

50/54

Type de convergence de suite de variables al´ eatoires

Soit (Zn) une suite de variable aléatoires etZ une variable aléatoire à valeurs dans (R,B) (toutes définies sur un espace probabilisé (Ω,F,P)).

1. (Zn) converge enloivers Z, not´eZn

→d Z, quand pour pour toute fonction continue born´eef :R7→Ron a

Ef(Zn)→Ef(Z)

2. (Zn) converge enprobabilit´e, versZ, not´eZn→P Z, quand pour tout >0,

P

|Zn−Z| ≥

→0 3. (Zn) convergepresque surementversZ, not´eZn

p.s.→ Z, quand il existe un ´ev´enement Ω0∈ F tel queP[Ω0] = 1 et pour toutω∈Ω0

Zn(ω)→Z(ω)

50/54

(51)

Loi forte des grands nombres

Theorem

Soit(X_n)une suite de v.a.r.i.i.d. telle que E|X₁|<∞. Alors 1

n

X

i=1

X_i ^p.s.→EX₁

Il y a aussi une “équivalence” à ce résultat : si (Xn) est une suite de v.a.r.i.i.d. telle que

1 n

Pn i=1X_i

n

converge presque surement alors E|X1|<∞et elle converge presque surement versEX1.

(52)

52/54

Th´ eor` eme central-limite

Theorem

Soit(X_n)une suite de v.a.r.i.i.d. telle que EX₁²<∞. Alors

√n σ

1 n

n

X

i=1

Xi−EX1

_d

→ N(0,1)

I TCL :vitessedans la loi des grands nombres.

I Interpr´etation du TCL : 1

n

X

i=1

Y_i =µ+ σ

√nξ⁽ⁿ⁾, ξ⁽ⁿ⁾≈ N^d (0,1).

I Le mode de convergence estla convergence en loi. Ne peut pas avoir lieu en probabilit´e.

52/54

(53)

Lemme de Slutsky

I Le vecteur (Xn,Yn)→^d (X,Y) si E

ϕ(Xn,Yn)

→E

ϕ(X,Y) , pour ϕcontinue born´ee.

I Attention ! SiXn

→d X etYn

→d Y, onn’a pas en g´en´eral (X_n,Y_n)→^d (X,Y).

I Mais(lemme de Slutsky) siX_n→^d X etY_n→^P c (constante), alors (Xn,Yn)→^d (X,Y).

I Par suite, sous les hypoth`eses du lemme,pour toute fonction continueg, on a g(Xn,Yn)→^d g(X,Y).

(54)

54/54

Continuous map theorem

Soitf :R7→Rune fonction continue et (X_n) une suite de v.a.r.

1. si (Xn) converge enloivers X alorsf(Xn) converge en loi versf(X) 2. si (Xn) converge enprobabilit´eversX alorsf(Xn) converge en

probabilit´e versf(X)

3. si (X_n) convergep.s.vers X alorsf(X_n) converge p.s. vers f(X)

54/54