Probabilités et Statistiques

(1)

Année 2010/2011

laurent.carraro@telecom-st-etienne.fr olivier.roustant@emse.fr

(2)

Convergence vers la loi normale Retour sur Monte Carlo (calcul

d’intervalles de confiance)

Convergence d’une somme de loi B(p/n)

(3)

Loi d’une somme de v.a. i.i.d ?

Probas-Stats 1A 3

(4)

Loi d’une somme de v.a. i.i.d ?

Probas-Stats 1A 4

(5)

Théorème de la limite centrée

Probas-Stats 1A 5 5

• T^HEOREME. [de la limite centrée]

Soient X₁, …, X_n des v.a. i.i.d. On ne précise pas la loi.

On suppose seulement que var(X_i) existe.

Soit µ := E(X₁), σ² := Var(X₁) et M_n:= (X₁ + … + X_n)/n Alors pour n grand, M_n est approx. de loi N(µ, σ²/n)

(6)

Commentaires

Probas-Stats 1A 6

• Remarquer la généralité des hypothèses sur la loi des X_i !

• On peut même alléger l’hypothèse d’indépendance…

• Formulation rigoureuse avec la convergence en loi : Z_n -> Z en loi ssi F_Zn (x)  F_Z(x)

en tout point x pour lequel F_Z est continue.

• Contre-exemple si var(X_i) n’existe pas.

• Loi de Cauchy : f(t) = (1/π)×1/(1+t²)

• Proposition : si les X_isont i.i.d. et de loi de Cauchy, alors pour tout n, M_n est de loi de Cauchy.

(7)

Historique

Probas-Stats 1A 7

• De Moivre (1733) : cas de la loi B(p) avec p=1/2

• Laplace (1812) : cas de la loi B(p), p quelconque

• Lévy (≈1920) : cas général

(8)

Somme de v.a. – convolution

 Rappel : soient X et Y deux v.a. supposées

indépendantes et continues. Alors X+Y admet la densité :

Probas-Stats 1A 8

€

f

_X ₊_Y

( s) = f

_X

( s − y ) f

_Y

( y ) dy

−∞

+∞

∫ ⁼ ⁽ ^f

^X

^∗ ^f

^Y

⁾⁽ ^s)

(9)

Fonction caractéristique

 Qui dit convolution dit transformée de Fourier ! En proba., on a la fonction caractéristique

 Si X est continue, on reconnaît la forme de la transformée de Fourier :

Probas-Stats 1A 9

€

ϕ

_X

⁽ ^t ⁾ = e

^itx

f

_X

( t ) dt

−∞

+∞

€ ∫

ϕ

_X

⁽ ^t) = E e ( )

^itX

(10)

Fonction caractéristique

 Propriétés fondamentales :

 Si X et Y sont indépendantes,

-> Transforme les convolutions en produit

 X et Y ont même loi ssi

-> La fonction caractéristique caractérise la loi

 Théorème (Paul Lévy)

 Pour montrer que en loi, il suffit de montrer que

,

Probas-Stats 1A 10

€

ϕ_X _+Y = ϕ_Xϕ_Y

€

ϕ_X = ϕ_Y

€

ϕ_X_n ^(.) →ϕ_X ^(.)

€

X_n → X

(11)

Schéma de preuve du TLC

Probas-Stats 1A 11

€

ϕ_Z_n ⁽^t)

€

Z_n :=

X₁ +...+ X_n

n −µ σ / n

€

ϕ_N_(0,1)⁽^t⁾

Z de loi N(0,1)

Variables aléatoires Fonctions

€

P(Z_n <.) → P(Z <.) convergence

en loi

Convergence simple

€

ϕ_Z_n(.) →ϕ_Z(.)

(12)

Démo (sur un exemple)

 Exercice : montrer que

 Indication : montrer que φ_N(0,1) est solution de l’équa. diff.

z’(t)= - t z(t) avec z(0) = 1

 Soient X₁, …, X_n i.i.d de loi U([-a,a]), avec a=√3

 Remarque : a est choisi pour que var(X_i)=1

# Montrer que

 Démo générale

Probas-Stats 1A € 12

ϕ_Z_n ⁽^t) →ϕ_N_(0,1)⁽^t)

€

ϕ_N_(0,1)⁽^t⁾ = e⁻^t² ^{/ 2}

(13)

Application: intervalles de confiance

Probas-Stats 1A 13

€

X := X₁ +...+ X_n

n ≈ N µ^,σ ² n

⎛

⎝ ⎜ ⎞

⎠ ⎟

Loi normale N(0,1) Loi normale N(µ,σ²/n)

€

Z := X −µ

σ / n ≈ N(0,1)

-1.96 1.96

95%

€

P(−2 < Z < 2) ≈ 95%

€

P X −2 σ

n < µ < X +2 σ n

⎛

⎝ ⎜ ⎞

⎠ ⎟ ≈ 95%

En pratique, on remplace σ par l’écart-type des X_i

(14)

Méthode de Monte Carlo (MC)

 Nom donné au calcul de quantités probabilistes par simulation

 Probabilité, espérance, variance, quantile, …

 Base théorique : loi des grands nombres

 Exemple. Calcul de pi (voir TD)

 En utilisant un disque

 En utilisant la fonction g : x -> (1-x²)^1/2

Probas-Stats 1A 14

(15)

Calcul d’intégrale par Monte Carlo

Probas-Stats 1A 15

U₁ U₂

U₁₀ g(U₁)

g(U₂) g(U₁₀)

…

€

g(u)du

∫

€

g(U₁)+...+ g(U_n) n

g

€

n =10

(16)

Probas-Stats 1A 16

€

g(u)du

∫

€

g(U₁)+...+ g(U_n) n

g

€

n =100

g(U₁)

g(U₂)

…

… g(U₁₀)

U₁ U₂

U₁₀ … g(U₁₀₀)

U₁₀₀

Calcul d’intégrale par Monte Carlo

(17)

 Remarque de base : si U est uniforme sur [0,1],

#

 Loi des grands nombres :

# M_n = ( g(U₁)+…+g(U_n) ) / n ->

# avec U₁,…, U_n i.i.d. de loi unif. sur [0,1]

Probas-Stats 1A # 17

€

g( u ) du

∫ ⁼ ^E ⁽ ^g(U ⁾⁾

€

g( u ) du

∫

Calcul d’intégrale par Monte Carlo

(18)

 Variance d’une somme et vitesse de convergence

# Ici X_i = g(U_i)

# var(M_n) = σ² / n avec σ² = var(g(U_i)), donc

# # # σ (M_n) = σ (g(U)) / √n

 TLC et intervalle de confiance

# est un int. de conf. approché à 95% de

Probas-Stats 1A 18

€

g(u)du

∫

€

X −2 σ ˆ _X

n ;X + 2 σ ˆ _X n

⎡

⎣ ⎢ ⎤

⎦ ⎥

Calcul d’intégrale par Monte Carlo

(19)

Commentaires

 Une partie en 1/√n

 Une partie qui dépend de g -> on peut

réduire la variance en changeant g (de sorte que l’intégrale reste la même)

 Voir TD 9 et TD 10

Probas-Stats 1A 19

Calcul d’intégrale par Monte Carlo

(20)

Convergence de la loi B(p/n)

 Problème : loi du nb de spams reçus sur une période T ?

#

 Une solution

 On découpe [0, T] en n intervalles

 Sur chaque intervalle I_k:= [(k-1)T/n, kT/n], on suppose :

• Qu’il y a au plus 1 spam

• Que la probabilité de recevoir un spam est proportionnelle à la durée T/n

• Que les spams sont reçus de façon indépendantes

 Loi du nb de spams à n fixé ? Quand n -> + ∞ ?

Probas-Stats 1A 20

(21)

Schéma de raisonnement

Probas-Stats 1A 21

€

ϕ_Z_n ⁽^t)

€

Z_n := X₁ +...+ X_n

€

ϕ⁽^t⁾ = ϕ_LOI ⁽^t⁾

Z de loi LOI (à trouver)

Variables aléatoires Fonctions

€

P(Z_n <.) → P(Z <.)

avec X_i~ B(p/n)

Convergence simple

€

ϕ_Z_n(.) →ϕ_Z(.)

Probabilités et Statistiques

Loi d’une somme de v.a. i.i.d ?

Loi d’une somme de v.a. i.i.d ?

Théorème de la limite centrée

Commentaires

Historique

Somme de v.a. – convolution

€

f

( s) = f

( s − y ) f

( y ) dy

∫ = ( f

∗ f

)( s)

Fonction caractéristique

€

ϕ

( t ) = e

f

( t ) dt

€ ∫

ϕ

( t) = E e ( )

Fonction caractéristique

Schéma de preuve du TLC

Démo (sur un exemple)

Application: intervalles de confiance

Méthode de Monte Carlo (MC)

Calcul d’intégrale par Monte Carlo

∫

∫

Calcul d’intégrale par Monte Carlo

€

g( u ) du

∫ = E ( g(U ))

€

g( u ) du

∫

Calcul d’intégrale par Monte Carlo

∫

Calcul d’intégrale par Monte Carlo

Calcul d’intégrale par Monte Carlo

Convergence de la loi B(p/n)

Schéma de raisonnement

∫ ⁼ ⁽ ^f

^∗ ^f

⁾⁽ ^s)

⁽ ^t ⁾ = e

⁽ ^t) = E e ( )

∫ ⁼ ^E ⁽ ^g(U ⁾⁾