• Aucun résultat trouvé

Probabilit´es Chapitre 1 : In´egalit´es de concentration classiques et intervalles de confiance

N/A
N/A
Protected

Academic year: 2022

Partager "Probabilit´es Chapitre 1 : In´egalit´es de concentration classiques et intervalles de confiance"

Copied!
17
0
0

Texte intégral

(1)

Probabilit´ es

Chapitre 1 : In´egalit´es de concentration classiques et intervalles de confiance

Lucie Le Briquer

Sommaire

1 Introduction 2

2 Concentration `a travers les moments 3

3 Exemple concrets, In´egalit´e d’Hoeffding, Bennett, Bernstein 7 4 Lemme d’applatissement de Johnson-Lindenstrauss 12

5 Intervalles de confiance 14

5.1 Introduction . . . 14 5.2 Estimateurs . . . 14 5.3 Intervalles de confiance . . . 15

(2)

1 Introduction

Pour la loi normale N(0,1), en tra¸cant le graphe de la densit´e on s’aper¸coit que la masse se trouve concentr´ee autour de la moyenne, d`es que l’on s’en ´eloigne la masse d´ecroˆıt tr`es vite. En fait siX ∼ N(0,1) alorsP(|g|> t)∼e−t

2 2 .

En revanche si on regarde une Bernoulli ξ∼ B(1/2). P(ξ= 0) =P(ξ= 1) = 12, il n’y a pas de concentration (idem pour la loi uniforme).

Mais lorsque qu’on tensorise la loi (i.e. on prend des copies ind´ependantes de la mˆeme V.A.) ξ1, ..., ξn ind´ependantes, 1nPn

i=1ξi

n→∞E(ξ) =12 d’apr`es LFGN.

Quand ndevient grand, on s’attend `a revoir le ph´enom`ene de concentration i.e. la proportion de piles se concentre autour de la moyenne qui est 12. Le TCL va aussi dans ce sens.

But : quantifier cette convergence et savoir `a partir de combien de lancers on peut presque garantir d’avoir le mˆeme nombre de piles et de faces.

SoitX une v.a. de moyenne met de varianceσ2. Alors :

∀t >0, P(|X−m| ≥t)≤σ2 t2 Th´eor`eme 1 (Bienaym´e-Chebychev)

Remarque.

Reprenons notre exemple. ξ1, ..., ξn ∼ B(12) et posonsX =n1Pn i=1ξi. E(X) = 12 etV(X) = 4n1 alors d’apr`es B-CP(|X−12| ≥t)≤ 4nt12.

n≥ 12, on aProportion de piles ∈[12−ξ,12+ξ] avec une probabilit´e≥ 12. On a juste utilis´e que notre v.a. a un moment d’ordre 2.

Si X1, ..., Xn v.a. ind´ependantes tqE(Xi) =m∀i, M4= sup

1≤i≤nE((Xi−m)4). Alors :

∀t >0, P 1 n

n

X

i=0

Xi−m

≥t

!

≤3M4

n2t4 Propri´et´e 2

(3)

Preuve.

P 1 n

n

X

i=0

Xi−m

≥t

!

≤ 1 n4t4E

n

X

i=0

(Xi−m)

4

E

n

X

i=0

(Xi−m)

4

=E

n

X

i,j,k,l=1

(Xi−m)(Xj−m)(Xk−m)(Xl−m)

Toutes les expressions contenant un terme d’ordre 1 s’annulent. Il reste dans la somme les expressions de la forme une puissance de 4 ou un produit de deux carr´es.

Notons que :

E((Xi−m)2(Xj−m)2) ≤

C.S.

[E((Xi−m)4)]12[E((Xj−m)4)]12 ≤M4 et :

E((Xi−m)4)≤M4

Mais on antermes puissances de 4 et 3n(n−1) termes de la forme un produit de carr´es. Ainsi :

E

n

X

i=1

Xi−m

4

≤M4(n+ 3n(n−1)) =nM4(3n−2)≤3M4n2

P 1 n

n

X

i=1

Xi−m

≥t

!

≤ 1

n4t43M4n2= 3M4 n2 t4

2 Concentration ` a travers les moments

Sur l’exemple pr´ec´edent on a vu que si on ´etait plus r´egulier on pouvait obtenir une meilleure in´egalit´e de concentration. On va essayer de g´en´eraliser cette observation.

SoitX une v.a., sa fonction g´en´eratrice des moments est donn´ee parMX(λ) :=E(eλX) D´efinition 1(fonction g´en´eratrice des moments)

Remarque.

MX permet de calculer les moments :

MX0 (0) =E(X) MX00(0) =E(X2)

(4)

Exemple.

Fonction g´en´eratrice des moments de la loi normaleX ∼ N(0,1) MX(λ) =E(eλX) =

Z +∞

−∞

eλt 1

√2πet

2

2dt= 1

√2π Z +∞

−∞

e12(t2−2λt+λ2)eλ

2

2 dt=eλ

2 2

Fonction g´en´eratrice de laloi de Rademacher : X ∼ R(1/2) MX(λ) =eλP(X = 1) +e−λP(X =−1) = eλ+e−λ

2 =ch(λ)≤eλ2/2

SoitS une v.a r´eelle. Alors :

∀t∈R, P(S≥t)≤ inf

λ≥0{e−λtMS(λ)}

Lemme 3(Borne de Chernoff)

Preuve.

Soitλ≥0.

P(S≥t) =P(λS≥λt) =P eλS ≥eλt

≤e−λtE eλS

=e−λtMS(λ) D’o`u le r´esultat en passant `a l’infimum.

Exemple.

Si on regardeX ∼ N(0,1). Soitt∈R+. Alors : P(X≥t)≤ inf

λ≥0{e−λteλ2/2}=e−t2/2

On dit qu’une v.a centr´eeX est K-sous-Gaussienne si MX(λ)≤eλ2K2/2 D´efinition 2(K-sous-Gaussienne)

Exemple.

Ainsi une variable gaussienne est 1-sous-gaussienne.

(5)

Remarque.

On peut enlever centr´ee de la d´efinition car si MX(λ) ≤ exp(λ2K2/2) alors forc´ement X est centr´ee etE(X2)≤K2 :

MX(λ) =

+∞

X

n=0

λn

n!E(Xn)≤

+∞

X

n=0

λ2n 2nn!K2n d’o`u :

λE(X) +λ2

2 E(X2) +o(λ2)≤ K2λ2

2 +o(λ2) On fait tendreλvers 0+ et 0 pour obtenir les r´esultats.

SoitX une va centr´ee. Alors les assertions suivantes sont ´equivalentes : 1. ∃K tqX estK-sous-gaussienne.

2. ∃c >0, ∀t≥0, P(|X| ≥t)≤2e−ct2

3. ∃a >0, E(eaX2)≤2 (cette in´egalit´e est connue comme la condition Ψ2) Th´eor`eme 4 (Bienaym´e-Tchebychev)

Preuve.

(1) =⇒(2) : On sait que

MX(λ)≤e2K2)/2 ∀λ Le lemme de Chernoff donne alors :

∀t≥0, P(X ≥t)≤e−t2/2K2 On fait le mˆeme travail pour−X :

P(−X≥t)≤e−t2/(2K2) On en d´eduit :

P(|X| ≥t)≤P(X ≥t) +P(−X≥t)≤2e−t2/2K2 Et on obtient (2) avecc:= 1/2K2.

(2) =⇒(3) : On sait que

∀t≥0, P(|X| ≥t)≤2e−ct2 On aimerait trouveratel queE(eaX2)≤2. Or

E(eaX2) = Z

0

P(eaX2 ≥u)du= Z 1

0

P(eaX2 ≥u)du+ Z

1

P(eaX2 ≥u)du Soita < c:

E(eaX2)≤1 + Z

0

2ateat2P(|X| ≥t)dt≤1 + 2a Z

0

2te−(c−a)t2dt= 1 + 2a

c−a = 2 (pour a=c/3) On obtient (3) aveca=c/3.

(6)

(3) =⇒(1) :

On sait queE(eaX2)≤2 (?).

MX(λ) =E(eλX) = 1 + Z 1

0

(1−y)E[(λX)2eyλXdy]≤1 + λ2

2 E(X2e|λX|) Or|λX| ≤ λ2a2 +aX22 (IAG). On obtient alors :

MX(λ)≤1 +λ2

2 eλ2/2aE

X2eaX2/2

CS

1 +λ2 2 eλ2/2a

E X41/2h E

eaX2i1/2

On d´eduit du d´eveloppement de (?) queE X4

≤2/a2. Ainsi : MX(λ)≤1 + λ2

2 eλ2/2a r 2

a2

2 = 1 +λ2

a eλ2/2a

1 + λ2 a

eλ2/2a ≤eλ2/aeλ2/2a=eλ

2 2

3 a

DoncX est q

3

a-Sous-Gaussienne.

Remarque.

Les d´ependances par rapport `a K sont (2)c=2K12 et (3)a= 6K12

Soitξsous gaussienne de param`etreκ. Si on noteη=ξ2. Alors

∀l∈N, E(ηl)≤2l!(6κ2)l= 1

2l!(6K2)l−2(12K2)2 Corollaire 5

Remarque.

Seconde forme utile pour appliquer Bernstein.

Preuve.

D’apr`es le th´eor`eme 4 (2), on a que E(eξ

2 2)≤2 Donc E(eη2)≤2 Alors E( η

2)l≤2l! ∀l en d´eveloppant l’exponentielle, (interversionX

−E)

(7)

Si (ξ1, . . . , ξn) v.a sous-gaussiennes ind´ependantes, de param`etres κi chacune. Alors P ξi

sous gaussienne de param`etrepP (κi)2. En particulier,

∀t≤0, P

n

X

i=1

ξi≥t

!

≤exp

− t2 2Pn

i=1κ2i Propri´et´e 6

Preuve.

Soitλ∈R, on a par d´efinition puis par ind´ependance.

MPξi(λ) =E(eλPξi) =

n

Y

i=1

E(eλξi)≤

n

Y

i=1

eλ

2κi 2

Ainsi

MPξi(λ)≤eλ

2 2

Pn i=1κ2i

Et donc en utilisant le th´eor`eme 4, on obtient que P

ξi est sous-gaussienne de param`etre pPn

i=1κi.

De plus, siξsous-gaussienne de param`etreκalors P(ξ≥t)≤exp

−t 2κ2

Ce qui ach`eve la d´emonstration.

3 Exemple concrets, In´ egalit´ e d’Hoeffding, Bennett, Bern- stein

On va d´ej`a donner un exemple de v.a sous gaussienne.

Si X v.a `a valeur dans [a, b]. AlorsX−E(X) est sous gaussienne de param`etre b−a2 . Lemme 7(Hoeffding)

Preuve.

On va supposer queX est centr´ee. On doit calculerMX(λ) =E(eλX).

Par convexit´e,

∀x∈[a, b], eλx≤ b−x

b−aeλa+x−a b−aeλb

(8)

Commex= b−xb−aa+x−ab−ab, on a alors MX(λ)≤ b

b−aeλa− a

a−beλb car X centr´ee On pose alorsu= (b−a)λ, Φ(u) = ln(f(λ)) etp= −a

b−a. Alors, 1−p= b b−a et Φ(u) =−pu+ ln(1−p+peu)

On a Φ(0) = Φ0(0) = 0 et

Φ00(u) = (1−p)peu

(1−p+peu)2 = αβ (α+β)2 ≤1

4 D’apr`es la formule de Taylor-Lagrange :

Φ(u)≤ 1 4

u2 2 ce qui termine la preuve.

SoitX1, . . . , Xn v.a ind´ependantes telles queXi∈[ai, bi] presque sˆurement. Alors

∀t≥0, P

n

X

i=1

(Xi−E(Xi))≥t

!

≤exp

−2t2 Pn

i=1(bi−ai)2

(1)

P

n

X

i=1

(Xi−E(Xi))≤ −t

!

≤exp

−2t2 Pn

i=1(bi−ai)2

(2)

P

n

X

i=1

(Xi−E(Xi))

≥t

!

≤2 exp

−2t2 Pn

i=1(bi−ai)2

(3) Th´eor`eme 8 (Hoeffding)

Preuve.

On a grˆace au lemme 7 que, pour tout i,Xi−E(Xi) est sous-gaussienne de param`etre (bi−a2 i). Et d’apr`es la propri´et´e 6 on a quePn

i=1(Xi−E(Xi)) sous-gaussienne de param`etre qP

(bi−a2 i)2. Et donc en utilisant la th´eor`eme 4, les majorations en d´ecoulent.

Remarque.

Le th´eor`eme pr´ec´edent ne tient pas compte des lois des variables al´eatoires en question. Par exemple il traite de la mˆeme mani`ere des Bernoulli standards et des Bernoulli de param`etres tr`es petits.

(9)

– En particulier, si l’on prend ξ v.a telle que P(ξ = 0) = 0,99 et P(ξ = 1010) = 0,01, on constate que le 1010fait exploser la majoration dans Hoeffding la rendant alors inutile.

– Si ξ1, ..., ξn ind´ependantes ∼ B(p), on sait que S =Pn

i=1ξi ∼ B(n, p). Or sip fix´e et n devient grand, on aS approch´e parB(np, np(1−p)). On doit donc s’attendre `a avoir

P

n

X

i=1

i−np)

≥t

!

≤2 exp

−t2 2np(1−p)

Alors que Hoeffding (th´eor`eme 8) nous donne uniquement

P

n

X

i=1

i−np)

≥t

!

≤2 exp −t2

n

Qui est moins bien carp(1−p)≤1/4.

– En prenant cette fois-ci pqui d´ecroit avec n, ie np →λ quand n→ ∞, alors S est bien approch´e parP(λ) et on a (cf TD 2 exo 2)

P(ξ−λ≥t)≤exp

−λH(t λ)

O`uH(x) = (1 +x) ln(1 +x)−xet ξ∼ P(λ).

Soitb≥0 etξune v.a centr´ee avecE(ξ2)≤σ2 (σ≥0). Alors 1. Si|ξ| ≤b p.s, alors

Mξ(λ)≤exp σ2

b2(eλb−λb−1)

2. Si∀k≥3, E(ξk)≤12k!σ2bk−2alors Mξ(λ)≤exp

λ2σ2 2(1−λb)

, ∀λ < b Lemme 9

Remarque.

Siξ v´erifie Lemme 9(1), alors elle v´erifie (2) car|ξ| ≤b, alors E(ξk)≤E(ξ2ξk−2)≤bk−2E(ξ2)

| {z }

≤σ2

Ainsi (2) est beaucoup plus souple. On dit que c’est une condition de croissance exponentielle des moments.

Siξ sous gaussienne de param`etreκ, alorsξ2 v´erifie (2) avecσ= 2√

6κet b= 6κ2.

(10)

Preuve.

1. On a

Mξ(λ) =E(eλξ) =E

X

k=0

λk k!ξk

!

≤1 +

(car variable centr´ee)

z}|{0 +λ2σ2

2 +

X

k=3

λk k!E(ξk)

≤1 +λ2σ2

2 +

X

k=3

λk k!bk−2σ2

≤1 +λ2σ2 2 +σ2

b2

X

k=3

λkbk k!

≤1 +σ2

b2(eλb−λb−1) Puis on utilise le fait queex−(x+ 1)≥0.

2. On a

Mξ(λ) =

X

k=0

λk

k!E(ξk)≤1 + λ2σ2 2 +1

2 X

k≥3

λkσ2bk−2

= 1 +λ2σ2

2 +λ2σ2 2

X

k=3

(λb)k−2

= 1 +λ2σ2

2 +λ2σ2 2

λb

1−λb si|λb|<1

= 1 + λ2σ2 2(1−λb)

Soientξ1, . . . , ξn v.a centr´ees ind´ependantes telles que pour touti,E(ξi2)≤σi2, et

∃b≥0,∀k≥3, E(|ξi|k)≤1

2k!σi2bk−2 Alors,

∀t≥0, P

n

X

i=1

ξi

≥t

!

≤2 exp

− t2 2(σ2+tb)

O`uσ2=Pn i=1σ2i.

Th´eor`eme 10(in´egalit´e de Bernstein)

(11)

Remarque.

– Si t≤ σb2 alorsP(|Pn

i=1ξi| ≥t)≤2 exp(−t22) et on voit le comportement sous-gaussien.

– Si t > σb2 alorsP(|Pn

i=1ξi| ≥t)≤2 exp(−4bt) et on voit le comportement exponentiel.

Preuve.

SoitS=Pn

i=1ξiet soitλ≥0. Par ind´ependance, on aMS(λ) =Qn

i=1Mξi(λ).

Mais on sait que

Mξi(λ)≤exp

λ2σi2 2(1−λb)

, ∀λ≤ 1 b On a alors

MS(λ)≤exp

λ2σ2 2(1−λb)

La borne de Chernoff (lemme 3) nous donne que P(S≥t)≤inf

λ≥0

exp

−λt+ λ2σ2 2(1−λb)

On prendλ= σ2t+tb, et donc

P(S≥t)≤exp −t2 σ2+tb+

t σ2+tb

2 σ2 2(1−σ2tb+tb)

!

Puis tout se simplifie dans l’exponentielle. On obtient la majoration voulue en prenant la valeur absolue deS, nous donnant le facteur 2.

Soientξ1, . . . , ξn v.a centr´ees ind´ependantes telles que pour touti,E(ξi2)≤σi2, et|ξi| ≤b.

∀t≥0, P

n

X

i=1

ξi

≥t

!

≤2 exp

−σ2 b H

tb σ2

O`uH(x) = (1 +x) ln(1 +x)−x.

Th´eor`eme 11(in´egalit´e de Bennett)

Preuve.

On sait que

∀i≤n, Mξi(λ)≤exp σi2

b2(eλb−λb−1)

Donc,

Mξ(λ)≤exp σ2

b2(eλb−λb−1)

(12)

Chernoff (lemme 3) nous donne

P(S ≥t)≤ inf

λ≥0

λt+σ2

b2(eλb−λb−1)

Et on prendλ= 1

bln(1+σtb2)

Remarque.

– On a H(x)≥2(1+x2x

3), ainsi Bennett est une meilleure majoration par Bernstein.

– On a aussi deux r´egimes : quand x petit alors H(x) ∼ x=⇒ r´egime sous-gaussien. Et quand xgrand alorsH(x)∼xln(x) =⇒r´egime un peu mieux que l’exponentielle.

– On sait que|P

ξi| ≤nbp.s. Ainsi, l’in´egalit´e de concentration a un sens quandt≤nb.

4 Lemme d’applatissement de Johnson-Lindenstrauss

On a un ensemble T de n points dans un espace d’Hilbert, on peut naturellement les plonger dansRn

But : on aimerait compresser l’espace i.e. placer ces points dans un espace de dimension beaucoup plus petite tout en gardant presque la disposition des points (c’est-`a-dire les distances qui les s´eparent).

On aimerait trouver :

A:Rn −→RN avecN << ntel que∀ x, y∈T, kA(x)−A(y)k2∼ kx−yk2 o`u k.k2est la norme Euclidienne.

On va trouver unA lin´eaire.

On ne construira pas un A ”d´eterministe” mais on prendra plutˆot A al´eatoire et on montrera qu’il va bien, avec une grande probabilit´e, effectuer la compression. Aest une matrice de taille N×n. On va remplir la matrice par des v.a. ind´ependantes sous-Gaussienne (par exemple des Bernouilli).

Soitn∈Netε∈[0,1] etT un ensemble `anpoints dansRn Alors∃N =N(n, ε)∼logε2n et∃ A:Rn−→RN tel que

∀x, y∈T, (1−ε)kx−yk2≤ kA(x)−A(y)k2≤(1 +ε)kx−yk2 Th´eor`eme 12(Johnson-Lindenstrauss)

(13)

Preuve.

SoitN que l’on trouvera `a la fin de la preuve.

SoitB= (ξi,j)1≤i,j≤nune matriceN×n`a entr´ees ind´ependantes sous-Gaussiennes de param`etre K (`a sp´ecifier apr`es). SoitL=E(ξ2)≤K2

Soitu∈Sn−1, o`uSn−1est la sph`ere unit´e deRn. kBuk22=

N

X

i=1

< lignei(B), u >2=

N

X

i=1

ηi

o`u ηi=< lignei(B), u >2

On a que lesηi sont ind´ependantes

E(ηi) =E(< lignei(B), u >2) =E

n

X

j=1

ξi,juj

2

=E

n

X

j,k=1

ξi,jξi,kujuk

=E

n

X

j=1

ξi,j2 u2j

=L

< lignei(B), n >=Pn

j=1ξi,juj est sous-Gaussienne de param`etreK (car c’est la somme de v.a.

sous-Gaussiennes ind´ependantes)

Doncηi est le carr´e d’une sous-Gaussienne alors par le corollaire (juste apr`es les propri´et´es de ss-Gauss)

∀L, E(ηil)≤ 1

2l!(6K2)l−2(12K2)2 Bernstein avecσ= 12K2et b= 6K2 :

∀t >0, P

N

X

i=1

i−E(ηi))

> t

!

≤2 exp

− t2

2(144K4+ 6K2t)

maisPN

i=1ηi=kBuk22, PN

i=1E(ηi) =N L

On vient de montrer que∀u∈Sn−1et ∀ε >0 on a : P(| kBuk22−N L|> N Lε)≤2 exp

− N2L2ε2

2(144K4N+ 6K2N Lε)

≤2 exp

− N2L2ε2 4×144K4N

On aurait du prendreK= 1 d`es le d´ebut. Ainsi on a montr´e que∀u∈Sn−1, ∀ε >0 : P

1

N LkBuk22∈/[1−ε,1 +ε]

≤2 exp

− N ε2 4×144

∀x, y∈T Ex,y = (

ω | 1 N L

kB(x−y)k22

kx−yk2 ∈/ (1−ε,1 +ε) )

P(Ex,y)≤2 exp

− N ε2 4×144

(14)

On veut queP T

x,y∈T

Ex,yC

!

soit grande.

P

 [

x,y∈T

Ex,y

≤ X

x,y∈T

P(Ex,y)≤2|T|2

|{z}

n2

exp

− N ε2 4×144

= exp

ln(2n2)− N ε2 4×144

On choisitN =ln(2nε22)8×144 ⇐ P S

x,y∈T

Ex,y

!

est tr`es petite.

Il suffit de prendre une r´ealisationA=1

NB(w) pour w∈ T

x,y∈T

Ex,yC

5 Intervalles de confiance

5.1 Introduction

On se trouve avec loi inconnue que l’on observe sur des ´echantillons. Le but est de pouvoir estimer certains param`etres de cette loi `a travers l’´etude d’´echantillons. Par exemple, estimer l’esp´erance et la variance.

On consid`ere un caract`ereX : ”avoir un accident”

Xi= 1 si l’individu ia un accident, 0 sinon.

Sur un ´echantillon denpersonnes, on an1Pn

i=1Xiproportion d’accidents. Il est naturel d’estimer l’esp´erance par la moyenne empirique n1Pn

i=1Xi. On cherche un intervalle de confiance dont on peut s’assurer (avec une petite erreur) que l’esp´erance est dedans).

5.2 Estimateurs

Unn-´echantillon al´eatoire issu d’une v.a. r´eelleX est un ensemble (X1, ..., Xn) dencopies ind´ependantes deX.

D´efinition 3(n-´echantillon al´eatoire)

On a un param`etreθ associ´e `a X et on aimerait l’estimer.

(15)

Un estimateurbθn deθest une fonction qui d´epend dun-´echantillon (X1, ..., Xn).

– On dit que l’estimateurθbn estconvergent ouconsistant s’il est proche deθau sens de la convergence en probabilit´e i.e. :

∀ε >0,P(|bθn−θ|> ε) −→

n→∞0 – fortement consistant sicθn converge presque sˆurement versθi.e.

P(lim

n |cθn−θ|= 0) = 1 D´efinition 4(estimateur)

On appelle le biais la quantit´eE(bθn−θ)

On dit que l’estimateur estsans biais si le biais est nul, sinon qu’il estbiais´e.

D´efinition 5(biais)

Exemple.

La moyenne empirique est un estimateur fortement consistant sans biais de l’esp´erance.

On peut aussi regarder l’´ecart quadratique E((bθn−θ)2) =V ar(bθn) + (biais)2

Pour r´eduire l’´ecart quadratique on a int´erˆet `a trouver un estimateur sans biais et `a faible variance.

5.3 Intervalles de confiance

Soitα∈[0,1] Un intervalle de confiance 1−αest un couple d’estimateur (θn, θn) tel que : P θ∈[θn ; θn]

≥1−α D´efinition 6(intervalle de confiance 1−α)

Soit α ∈ [0,1] Un intervalle de confiance asymptotique 1−α est un couple d’estimateur (θn, θn) tel que :

n→∞limP θ∈[θn ; θn]

= 1−α D´efinition 7(intervalle de confiance asymptotique 1−α)

Exemple.

Prenons l’exemple de la mesure Gaussienne (avec variance connue). (X1, ..., Xn) unn-´echantillon de noiN(µ, σ2)

(16)

Xn =n1Pn

i=1Xi est un estimateur sans biais deµ

√n

Xn−µ σ

∼ N(0,1)

⇒P

−z1−α

2 ≤√ n

Xn−µ σ

≤z1−α

2

= 1−α o`u zp est le quantile tel queF(zp) =p=P( G

|{z}

∼N(0,1)

≤zp) Ainsi, on a:

P(Xn− σ

√nz1−α

2 ≤µ≤Xn+ σ

√nz1−α

2) = 1−α On pose (θn, θn) = (Xnσnz1−α

2, Xn+σnz1−α

2) (θn, θn) est ainsi un intervalle de confiance 1−α.

Si lavariance est inconnue :

Lavariance empirique d’un n-´echantilon est Sn2= 1

n−1

n

X

i=1

(Xi−X¯n)2 D´efinition 8(variance empirique)

SoitY1, ..., Yn∼N(0,1).

Laloi du chi-deux `a n degr`es de libert´e est la loi de la v.a. Pn

i=1Yi2. On la noteχ2(n).

D´efinition 9(loi du chi-deux)

Faits.

Sn2 est un estimateur convergent deσ2 sans biais. n−1σ2 Sn2 suit la loi du χ2(n−1).

On ne peut plus estimer µen consid´erant√

nXnσ−µ. Au lieu ¸ca, on consid`ere √ nXSn−µ

n . Mais celle ci ne suit pas une loi normale mais une loi dite de student `an−1 degr´es de libert´es que l’on noteτn−1 (sa densit´e est une fonction paire et on a aussi une table comme pour la loi normale).

Ainsi, comme pr´ec´edement : P

−t1−α

2 6√

n

Xn−µ σ

6t1−α

2

= 1−α On pose :

θn =Xn− Sn

√nt1−σ

2, θn =Xn+ Sn

√nt1−σ

2

n, θn) est un intervalle de confiance 1−α.

(17)

Cours du 24 f´evrier

Regardons siXi sont des Bernouilli ind´ependantes de param`etreθ TCL⇒

n

θ(1−θ)( \θn

|{z}

moyenne empirique

−θ)−→ N(0,1)

Ceci se traduit par la convergence des fonctions de r´epartition.

n→+∞lim P

√n

pθ(1−θ)(cθn−θ)≤zα

!

= 1−α Cela nous donne un intervalle de confiance asymptotique 1−αqui est :

cθn−zα/2 s

n(1−θcn)

n ; cθn+zα/2 s

θcn(1−cθn) n

Si on veut un intervalle de confiance non-asymptotique on utilisera les in´egalit´es de concentration.

SiXi Bernouilli de param`etreθ,Sn=Pn

i=1Xi alors d’apr`es Hoeffding :

⇒ P(|Sn−nθ| ≥t)≤2 exp −2t2

n

On veut que cette probabilit´e soit≤α. Prenonst=q

n

2ln(α2), on aurait : P |Sn−nθ| ≥

s n 2 ln

2 α

!

≤α

Ainsi on a un intervalle de confiance 1−αqui est :

"

n− r 1

2nln 2 α ; cθn+

r 1 2nln2

α

#

Références

Documents relatifs

MASTER 1 GSI- Mentions ACCIE et RIM La Citadelle - ULCO Mesures et analyses statistiques de donn´ ees - Probabilit´ es.. Novembre 2012 - Contrˆ ole Continu, Semestre

Néanmoins, pour cet échantillon comme pour les autres, on constate que les trois estimateurs de o sont cohérents et leurs différences sont inférieures à .2013.. Cet

Définition Soit X une variable aléatoire continue ayant pour densité la fonction f.. Autrement dit, on ne change pas la probabilité en ajoutant les bornes de l’intervalle [a; b]

Propriété Soit k un réel quelconque et X une variable aléatoire continue.. Autrement dit, on ne change pas la probabilité en ajoutant les bornes de l’intervalle [a; b]

Soit X une variable al´ eatoire de loi N (0, 1), c’est-` a-dire une variable al´ eatoire admettant pour densit´ e la

Expliquer (math´ ematiquement) cette propri´ et´ e.. Solution: Pour tous r´ eels t et

X est la variable al´eatoire continue sur [0; 4] dont la loi a pour densit´e de probabilit´e la fonction f.. D´efinir la fonction f de densit´e de probabilit´e de la

Lorsque l’on connaît ou lorsque l’on fait une hypothèse sur la proportion p d’individus ayant une caractéristique donnée dans une population et que l’on effectue un nombre n