Probabilit´ es
Chapitre 1 : In´egalit´es de concentration classiques et intervalles de confiance
Lucie Le Briquer
Sommaire
1 Introduction 2
2 Concentration `a travers les moments 3
3 Exemple concrets, In´egalit´e d’Hoeffding, Bennett, Bernstein 7 4 Lemme d’applatissement de Johnson-Lindenstrauss 12
5 Intervalles de confiance 14
5.1 Introduction . . . 14 5.2 Estimateurs . . . 14 5.3 Intervalles de confiance . . . 15
1 Introduction
Pour la loi normale N(0,1), en tra¸cant le graphe de la densit´e on s’aper¸coit que la masse se trouve concentr´ee autour de la moyenne, d`es que l’on s’en ´eloigne la masse d´ecroˆıt tr`es vite. En fait siX ∼ N(0,1) alorsP(|g|> t)∼e−t
2 2 .
En revanche si on regarde une Bernoulli ξ∼ B(1/2). P(ξ= 0) =P(ξ= 1) = 12, il n’y a pas de concentration (idem pour la loi uniforme).
Mais lorsque qu’on tensorise la loi (i.e. on prend des copies ind´ependantes de la mˆeme V.A.) ξ1, ..., ξn ind´ependantes, 1nPn
i=1ξi →
n→∞E(ξ) =12 d’apr`es LFGN.
Quand ndevient grand, on s’attend `a revoir le ph´enom`ene de concentration i.e. la proportion de piles se concentre autour de la moyenne qui est 12. Le TCL va aussi dans ce sens.
But : quantifier cette convergence et savoir `a partir de combien de lancers on peut presque garantir d’avoir le mˆeme nombre de piles et de faces.
SoitX une v.a. de moyenne met de varianceσ2. Alors :
∀t >0, P(|X−m| ≥t)≤σ2 t2 Th´eor`eme 1 (Bienaym´e-Chebychev)
Remarque.
Reprenons notre exemple. ξ1, ..., ξn ∼ B(12) et posonsX =n1Pn i=1ξi. E(X) = 12 etV(X) = 4n1 alors d’apr`es B-CP(|X−12| ≥t)≤ 4nt12.
n≥ 2ξ12, on aProportion de piles ∈[12−ξ,12+ξ] avec une probabilit´e≥ 12. On a juste utilis´e que notre v.a. a un moment d’ordre 2.
Si X1, ..., Xn v.a. ind´ependantes tqE(Xi) =m∀i, M4= sup
1≤i≤nE((Xi−m)4). Alors :
∀t >0, P 1 n
n
X
i=0
Xi−m
≥t
!
≤3M4
n2t4 Propri´et´e 2
Preuve.
P 1 n
n
X
i=0
Xi−m
≥t
!
≤ 1 n4t4E
n
X
i=0
(Xi−m)
4
E
n
X
i=0
(Xi−m)
4
=E
n
X
i,j,k,l=1
(Xi−m)(Xj−m)(Xk−m)(Xl−m)
Toutes les expressions contenant un terme d’ordre 1 s’annulent. Il reste dans la somme les expressions de la forme une puissance de 4 ou un produit de deux carr´es.
Notons que :
E((Xi−m)2(Xj−m)2) ≤
C.S.
[E((Xi−m)4)]12[E((Xj−m)4)]12 ≤M4 et :
E((Xi−m)4)≤M4
Mais on antermes puissances de 4 et 3n(n−1) termes de la forme un produit de carr´es. Ainsi :
E
n
X
i=1
Xi−m
4
≤M4(n+ 3n(n−1)) =nM4(3n−2)≤3M4n2
P 1 n
n
X
i=1
Xi−m
≥t
!
≤ 1
n4t43M4n2= 3M4 n2 t4
2 Concentration ` a travers les moments
Sur l’exemple pr´ec´edent on a vu que si on ´etait plus r´egulier on pouvait obtenir une meilleure in´egalit´e de concentration. On va essayer de g´en´eraliser cette observation.
SoitX une v.a., sa fonction g´en´eratrice des moments est donn´ee parMX(λ) :=E(eλX) D´efinition 1(fonction g´en´eratrice des moments)
Remarque.
MX permet de calculer les moments :
MX0 (0) =E(X) MX00(0) =E(X2)
Exemple.
Fonction g´en´eratrice des moments de la loi normaleX ∼ N(0,1) MX(λ) =E(eλX) =
Z +∞
−∞
eλt 1
√2πe−t
2
2dt= 1
√2π Z +∞
−∞
e−12(t2−2λt+λ2)e−λ
2
2 dt=eλ
2 2
Fonction g´en´eratrice de laloi de Rademacher : X ∼ R(1/2) MX(λ) =eλP(X = 1) +e−λP(X =−1) = eλ+e−λ
2 =ch(λ)≤eλ2/2
SoitS une v.a r´eelle. Alors :
∀t∈R, P(S≥t)≤ inf
λ≥0{e−λtMS(λ)}
Lemme 3(Borne de Chernoff)
Preuve.
Soitλ≥0.
P(S≥t) =P(λS≥λt) =P eλS ≥eλt
≤e−λtE eλS
=e−λtMS(λ) D’o`u le r´esultat en passant `a l’infimum.
Exemple.
Si on regardeX ∼ N(0,1). Soitt∈R+. Alors : P(X≥t)≤ inf
λ≥0{e−λteλ2/2}=e−t2/2
On dit qu’une v.a centr´eeX est K-sous-Gaussienne si MX(λ)≤eλ2K2/2 D´efinition 2(K-sous-Gaussienne)
Exemple.
Ainsi une variable gaussienne est 1-sous-gaussienne.
Remarque.
On peut enlever centr´ee de la d´efinition car si MX(λ) ≤ exp(λ2K2/2) alors forc´ement X est centr´ee etE(X2)≤K2 :
MX(λ) =
+∞
X
n=0
λn
n!E(Xn)≤
+∞
X
n=0
λ2n 2nn!K2n d’o`u :
λE(X) +λ2
2 E(X2) +o(λ2)≤ K2λ2
2 +o(λ2) On fait tendreλvers 0+ et 0− pour obtenir les r´esultats.
SoitX une va centr´ee. Alors les assertions suivantes sont ´equivalentes : 1. ∃K tqX estK-sous-gaussienne.
2. ∃c >0, ∀t≥0, P(|X| ≥t)≤2e−ct2
3. ∃a >0, E(eaX2)≤2 (cette in´egalit´e est connue comme la condition Ψ2) Th´eor`eme 4 (Bienaym´e-Tchebychev)
Preuve.
(1) =⇒(2) : On sait que
MX(λ)≤e(λ2K2)/2 ∀λ Le lemme de Chernoff donne alors :
∀t≥0, P(X ≥t)≤e−t2/2K2 On fait le mˆeme travail pour−X :
P(−X≥t)≤e−t2/(2K2) On en d´eduit :
P(|X| ≥t)≤P(X ≥t) +P(−X≥t)≤2e−t2/2K2 Et on obtient (2) avecc:= 1/2K2.
(2) =⇒(3) : On sait que
∀t≥0, P(|X| ≥t)≤2e−ct2 On aimerait trouveratel queE(eaX2)≤2. Or
E(eaX2) = Z ∞
0
P(eaX2 ≥u)du= Z 1
0
P(eaX2 ≥u)du+ Z ∞
1
P(eaX2 ≥u)du Soita < c:
E(eaX2)≤1 + Z ∞
0
2ateat2P(|X| ≥t)dt≤1 + 2a Z ∞
0
2te−(c−a)t2dt= 1 + 2a
c−a = 2 (pour a=c/3) On obtient (3) aveca=c/3.
(3) =⇒(1) :
On sait queE(eaX2)≤2 (?).
MX(λ) =E(eλX) = 1 + Z 1
0
(1−y)E[(λX)2eyλXdy]≤1 + λ2
2 E(X2e|λX|) Or|λX| ≤ λ2a2 +aX22 (IAG). On obtient alors :
MX(λ)≤1 +λ2
2 eλ2/2aE
X2eaX2/2
≤
CS
1 +λ2 2 eλ2/2a
E X41/2h E
eaX2i1/2
On d´eduit du d´eveloppement de (?) queE X4
≤2/a2. Ainsi : MX(λ)≤1 + λ2
2 eλ2/2a r 2
a2
√
2 = 1 +λ2
a eλ2/2a≤
1 + λ2 a
eλ2/2a ≤eλ2/aeλ2/2a=eλ
2 2
3 a
DoncX est q
3
a-Sous-Gaussienne.
Remarque.
Les d´ependances par rapport `a K sont (2)c=2K12 et (3)a= 6K12
Soitξsous gaussienne de param`etreκ. Si on noteη=ξ2. Alors
∀l∈N, E(ηl)≤2l!(6κ2)l= 1
2l!(6K2)l−2(12K2)2 Corollaire 5
Remarque.
Seconde forme utile pour appliquer Bernstein.
Preuve.
D’apr`es le th´eor`eme 4 (2), on a que E(eξ
2 6κ2)≤2 Donc E(e6κη2)≤2 Alors E( η
6κ2)l≤2l! ∀l en d´eveloppant l’exponentielle, (interversionX
−E)
Si (ξ1, . . . , ξn) v.a sous-gaussiennes ind´ependantes, de param`etres κi chacune. Alors P ξi
sous gaussienne de param`etrepP (κi)2. En particulier,
∀t≤0, P
n
X
i=1
ξi≥t
!
≤exp
− t2 2Pn
i=1κ2i Propri´et´e 6
Preuve.
Soitλ∈R, on a par d´efinition puis par ind´ependance.
MPξi(λ) =E(eλPξi) =
n
Y
i=1
E(eλξi)≤
n
Y
i=1
eλ
2κi 2
Ainsi
MPξi(λ)≤eλ
2 2
Pn i=1κ2i
Et donc en utilisant le th´eor`eme 4, on obtient que P
ξi est sous-gaussienne de param`etre pPn
i=1κi.
De plus, siξsous-gaussienne de param`etreκalors P(ξ≥t)≤exp
−t 2κ2
Ce qui ach`eve la d´emonstration.
3 Exemple concrets, In´ egalit´ e d’Hoeffding, Bennett, Bern- stein
On va d´ej`a donner un exemple de v.a sous gaussienne.
Si X v.a `a valeur dans [a, b]. AlorsX−E(X) est sous gaussienne de param`etre b−a2 . Lemme 7(Hoeffding)
Preuve.
On va supposer queX est centr´ee. On doit calculerMX(λ) =E(eλX).
Par convexit´e,
∀x∈[a, b], eλx≤ b−x
b−aeλa+x−a b−aeλb
Commex= b−xb−aa+x−ab−ab, on a alors MX(λ)≤ b
b−aeλa− a
a−beλb car X centr´ee On pose alorsu= (b−a)λ, Φ(u) = ln(f(λ)) etp= −a
b−a. Alors, 1−p= b b−a et Φ(u) =−pu+ ln(1−p+peu)
On a Φ(0) = Φ0(0) = 0 et
Φ00(u) = (1−p)peu
(1−p+peu)2 = αβ (α+β)2 ≤1
4 D’apr`es la formule de Taylor-Lagrange :
Φ(u)≤ 1 4
u2 2 ce qui termine la preuve.
SoitX1, . . . , Xn v.a ind´ependantes telles queXi∈[ai, bi] presque sˆurement. Alors
∀t≥0, P
n
X
i=1
(Xi−E(Xi))≥t
!
≤exp
−2t2 Pn
i=1(bi−ai)2
(1)
P
n
X
i=1
(Xi−E(Xi))≤ −t
!
≤exp
−2t2 Pn
i=1(bi−ai)2
(2)
P
n
X
i=1
(Xi−E(Xi))
≥t
!
≤2 exp
−2t2 Pn
i=1(bi−ai)2
(3) Th´eor`eme 8 (Hoeffding)
Preuve.
On a grˆace au lemme 7 que, pour tout i,Xi−E(Xi) est sous-gaussienne de param`etre (bi−a2 i). Et d’apr`es la propri´et´e 6 on a quePn
i=1(Xi−E(Xi)) sous-gaussienne de param`etre qP
(bi−a2 i)2. Et donc en utilisant la th´eor`eme 4, les majorations en d´ecoulent.
Remarque.
Le th´eor`eme pr´ec´edent ne tient pas compte des lois des variables al´eatoires en question. Par exemple il traite de la mˆeme mani`ere des Bernoulli standards et des Bernoulli de param`etres tr`es petits.
– En particulier, si l’on prend ξ v.a telle que P(ξ = 0) = 0,99 et P(ξ = 1010) = 0,01, on constate que le 1010fait exploser la majoration dans Hoeffding la rendant alors inutile.
– Si ξ1, ..., ξn ind´ependantes ∼ B(p), on sait que S =Pn
i=1ξi ∼ B(n, p). Or sip fix´e et n devient grand, on aS approch´e parB(np, np(1−p)). On doit donc s’attendre `a avoir
P
n
X
i=1
(ξi−np)
≥t
!
≤2 exp
−t2 2np(1−p)
Alors que Hoeffding (th´eor`eme 8) nous donne uniquement
P
n
X
i=1
(ξi−np)
≥t
!
≤2 exp −t2
n
Qui est moins bien carp(1−p)≤1/4.
– En prenant cette fois-ci pqui d´ecroit avec n, ie np →λ quand n→ ∞, alors S est bien approch´e parP(λ) et on a (cf TD 2 exo 2)
P(ξ−λ≥t)≤exp
−λH(t λ)
O`uH(x) = (1 +x) ln(1 +x)−xet ξ∼ P(λ).
Soitb≥0 etξune v.a centr´ee avecE(ξ2)≤σ2 (σ≥0). Alors 1. Si|ξ| ≤b p.s, alors
Mξ(λ)≤exp σ2
b2(eλb−λb−1)
2. Si∀k≥3, E(ξk)≤12k!σ2bk−2alors Mξ(λ)≤exp
λ2σ2 2(1−λb)
, ∀λ < b Lemme 9
Remarque.
Siξ v´erifie Lemme 9(1), alors elle v´erifie (2) car|ξ| ≤b, alors E(ξk)≤E(ξ2ξk−2)≤bk−2E(ξ2)
| {z }
≤σ2
Ainsi (2) est beaucoup plus souple. On dit que c’est une condition de croissance exponentielle des moments.
Siξ sous gaussienne de param`etreκ, alorsξ2 v´erifie (2) avecσ= 2√
6κet b= 6κ2.
Preuve.
1. On a
Mξ(λ) =E(eλξ) =E
∞
X
k=0
λk k!ξk
!
≤1 +
(car variable centr´ee)
z}|{0 +λ2σ2
2 +
∞
X
k=3
λk k!E(ξk)
≤1 +λ2σ2
2 +
∞
X
k=3
λk k!bk−2σ2
≤1 +λ2σ2 2 +σ2
b2
∞
X
k=3
λkbk k!
≤1 +σ2
b2(eλb−λb−1) Puis on utilise le fait queex−(x+ 1)≥0.
2. On a
Mξ(λ) =
∞
X
k=0
λk
k!E(ξk)≤1 + λ2σ2 2 +1
2 X
k≥3
λkσ2bk−2
= 1 +λ2σ2
2 +λ2σ2 2
∞
X
k=3
(λb)k−2
= 1 +λ2σ2
2 +λ2σ2 2
λb
1−λb si|λb|<1
= 1 + λ2σ2 2(1−λb)
Soientξ1, . . . , ξn v.a centr´ees ind´ependantes telles que pour touti,E(ξi2)≤σi2, et
∃b≥0,∀k≥3, E(|ξi|k)≤1
2k!σi2bk−2 Alors,
∀t≥0, P
n
X
i=1
ξi
≥t
!
≤2 exp
− t2 2(σ2+tb)
O`uσ2=Pn i=1σ2i.
Th´eor`eme 10(in´egalit´e de Bernstein)
Remarque.
– Si t≤ σb2 alorsP(|Pn
i=1ξi| ≥t)≤2 exp(−4σt22) et on voit le comportement sous-gaussien.
– Si t > σb2 alorsP(|Pn
i=1ξi| ≥t)≤2 exp(−4bt) et on voit le comportement exponentiel.
Preuve.
SoitS=Pn
i=1ξiet soitλ≥0. Par ind´ependance, on aMS(λ) =Qn
i=1Mξi(λ).
Mais on sait que
Mξi(λ)≤exp
λ2σi2 2(1−λb)
, ∀λ≤ 1 b On a alors
MS(λ)≤exp
λ2σ2 2(1−λb)
La borne de Chernoff (lemme 3) nous donne que P(S≥t)≤inf
λ≥0
exp
−λt+ λ2σ2 2(1−λb)
On prendλ= σ2t+tb, et donc
P(S≥t)≤exp −t2 σ2+tb+
t σ2+tb
2 σ2 2(1−σ2tb+tb)
!
Puis tout se simplifie dans l’exponentielle. On obtient la majoration voulue en prenant la valeur absolue deS, nous donnant le facteur 2.
Soientξ1, . . . , ξn v.a centr´ees ind´ependantes telles que pour touti,E(ξi2)≤σi2, et|ξi| ≤b.
∀t≥0, P
n
X
i=1
ξi
≥t
!
≤2 exp
−σ2 b H
tb σ2
O`uH(x) = (1 +x) ln(1 +x)−x.
Th´eor`eme 11(in´egalit´e de Bennett)
Preuve.
On sait que
∀i≤n, Mξi(λ)≤exp σi2
b2(eλb−λb−1)
Donc,
Mξ(λ)≤exp σ2
b2(eλb−λb−1)
Chernoff (lemme 3) nous donne
P(S ≥t)≤ inf
λ≥0
λt+σ2
b2(eλb−λb−1)
Et on prendλ= 1
bln(1+σtb2)
Remarque.
– On a H(x)≥2(1+x2x
3), ainsi Bennett est une meilleure majoration par Bernstein.
– On a aussi deux r´egimes : quand x petit alors H(x) ∼ x=⇒ r´egime sous-gaussien. Et quand xgrand alorsH(x)∼xln(x) =⇒r´egime un peu mieux que l’exponentielle.
– On sait que|P
ξi| ≤nbp.s. Ainsi, l’in´egalit´e de concentration a un sens quandt≤nb.
4 Lemme d’applatissement de Johnson-Lindenstrauss
On a un ensemble T de n points dans un espace d’Hilbert, on peut naturellement les plonger dansRn
But : on aimerait compresser l’espace i.e. placer ces points dans un espace de dimension beaucoup plus petite tout en gardant presque la disposition des points (c’est-`a-dire les distances qui les s´eparent).
On aimerait trouver :
A:Rn −→RN avecN << ntel que∀ x, y∈T, kA(x)−A(y)k2∼ kx−yk2 o`u k.k2est la norme Euclidienne.
On va trouver unA lin´eaire.
On ne construira pas un A ”d´eterministe” mais on prendra plutˆot A al´eatoire et on montrera qu’il va bien, avec une grande probabilit´e, effectuer la compression. Aest une matrice de taille N×n. On va remplir la matrice par des v.a. ind´ependantes sous-Gaussienne (par exemple des Bernouilli).
Soitn∈Netε∈[0,1] etT un ensemble `anpoints dansRn Alors∃N =N(n, ε)∼logε2n et∃ A:Rn−→RN tel que
∀x, y∈T, (1−ε)kx−yk2≤ kA(x)−A(y)k2≤(1 +ε)kx−yk2 Th´eor`eme 12(Johnson-Lindenstrauss)
Preuve.
SoitN que l’on trouvera `a la fin de la preuve.
SoitB= (ξi,j)1≤i,j≤nune matriceN×n`a entr´ees ind´ependantes sous-Gaussiennes de param`etre K (`a sp´ecifier apr`es). SoitL=E(ξ2)≤K2
Soitu∈Sn−1, o`uSn−1est la sph`ere unit´e deRn. kBuk22=
N
X
i=1
< lignei(B), u >2=
N
X
i=1
ηi
o`u ηi=< lignei(B), u >2
On a que lesηi sont ind´ependantes
E(ηi) =E(< lignei(B), u >2) =E
n
X
j=1
ξi,juj
2
=E
n
X
j,k=1
ξi,jξi,kujuk
=E
n
X
j=1
ξi,j2 u2j
=L
< lignei(B), n >=Pn
j=1ξi,juj est sous-Gaussienne de param`etreK (car c’est la somme de v.a.
sous-Gaussiennes ind´ependantes)
Doncηi est le carr´e d’une sous-Gaussienne alors par le corollaire (juste apr`es les propri´et´es de ss-Gauss)
∀L, E(ηil)≤ 1
2l!(6K2)l−2(12K2)2 Bernstein avecσ= 12K2et b= 6K2 :
∀t >0, P
N
X
i=1
(ηi−E(ηi))
> t
!
≤2 exp
− t2
2(144K4+ 6K2t)
maisPN
i=1ηi=kBuk22, PN
i=1E(ηi) =N L
On vient de montrer que∀u∈Sn−1et ∀ε >0 on a : P(| kBuk22−N L|> N Lε)≤2 exp
− N2L2ε2
2(144K4N+ 6K2N Lε)
≤2 exp
− N2L2ε2 4×144K4N
On aurait du prendreK= 1 d`es le d´ebut. Ainsi on a montr´e que∀u∈Sn−1, ∀ε >0 : P
1
N LkBuk22∈/[1−ε,1 +ε]
≤2 exp
− N ε2 4×144
∀x, y∈T Ex,y = (
ω | 1 N L
kB(x−y)k22
kx−yk2 ∈/ (1−ε,1 +ε) )
P(Ex,y)≤2 exp
− N ε2 4×144
On veut queP T
x,y∈T
Ex,yC
!
soit grande.
P
[
x,y∈T
Ex,y
≤ X
x,y∈T
P(Ex,y)≤2|T|2
|{z}
n2
exp
− N ε2 4×144
= exp
ln(2n2)− N ε2 4×144
On choisitN =ln(2nε22)8×144 ⇐ P S
x,y∈T
Ex,y
!
est tr`es petite.
Il suffit de prendre une r´ealisationA=√1
NB(w) pour w∈ T
x,y∈T
Ex,yC
5 Intervalles de confiance
5.1 Introduction
On se trouve avec loi inconnue que l’on observe sur des ´echantillons. Le but est de pouvoir estimer certains param`etres de cette loi `a travers l’´etude d’´echantillons. Par exemple, estimer l’esp´erance et la variance.
On consid`ere un caract`ereX : ”avoir un accident”
Xi= 1 si l’individu ia un accident, 0 sinon.
Sur un ´echantillon denpersonnes, on an1Pn
i=1Xiproportion d’accidents. Il est naturel d’estimer l’esp´erance par la moyenne empirique n1Pn
i=1Xi. On cherche un intervalle de confiance dont on peut s’assurer (avec une petite erreur) que l’esp´erance est dedans).
5.2 Estimateurs
Unn-´echantillon al´eatoire issu d’une v.a. r´eelleX est un ensemble (X1, ..., Xn) dencopies ind´ependantes deX.
D´efinition 3(n-´echantillon al´eatoire)
On a un param`etreθ associ´e `a X et on aimerait l’estimer.
Un estimateurbθn deθest une fonction qui d´epend dun-´echantillon (X1, ..., Xn).
– On dit que l’estimateurθbn estconvergent ouconsistant s’il est proche deθau sens de la convergence en probabilit´e i.e. :
∀ε >0,P(|bθn−θ|> ε) −→
n→∞0 – fortement consistant sicθn converge presque sˆurement versθi.e.
P(lim
n |cθn−θ|= 0) = 1 D´efinition 4(estimateur)
On appelle le biais la quantit´eE(bθn−θ)
On dit que l’estimateur estsans biais si le biais est nul, sinon qu’il estbiais´e.
D´efinition 5(biais)
Exemple.
La moyenne empirique est un estimateur fortement consistant sans biais de l’esp´erance.
On peut aussi regarder l’´ecart quadratique E((bθn−θ)2) =V ar(bθn) + (biais)2
Pour r´eduire l’´ecart quadratique on a int´erˆet `a trouver un estimateur sans biais et `a faible variance.
5.3 Intervalles de confiance
Soitα∈[0,1] Un intervalle de confiance 1−αest un couple d’estimateur (θn, θn) tel que : P θ∈[θn ; θn]
≥1−α D´efinition 6(intervalle de confiance 1−α)
Soit α ∈ [0,1] Un intervalle de confiance asymptotique 1−α est un couple d’estimateur (θn, θn) tel que :
n→∞limP θ∈[θn ; θn]
= 1−α D´efinition 7(intervalle de confiance asymptotique 1−α)
Exemple.
Prenons l’exemple de la mesure Gaussienne (avec variance connue). (X1, ..., Xn) unn-´echantillon de noiN(µ, σ2)
Xn =n1Pn
i=1Xi est un estimateur sans biais deµ
√n
Xn−µ σ
∼ N(0,1)
⇒P
−z1−α
2 ≤√ n
Xn−µ σ
≤z1−α
2
= 1−α o`u zp est le quantile tel queF(zp) =p=P( G
|{z}
∼N(0,1)
≤zp) Ainsi, on a:
P(Xn− σ
√nz1−α
2 ≤µ≤Xn+ σ
√nz1−α
2) = 1−α On pose (θn, θn) = (Xn−√σnz1−α
2, Xn+√σnz1−α
2) (θn, θn) est ainsi un intervalle de confiance 1−α.
Si lavariance est inconnue :
Lavariance empirique d’un n-´echantilon est Sn2= 1
n−1
n
X
i=1
(Xi−X¯n)2 D´efinition 8(variance empirique)
SoitY1, ..., Yn∼N(0,1).
Laloi du chi-deux `a n degr`es de libert´e est la loi de la v.a. Pn
i=1Yi2. On la noteχ2(n).
D´efinition 9(loi du chi-deux)
Faits.
Sn2 est un estimateur convergent deσ2 sans biais. n−1σ2 Sn2 suit la loi du χ2(n−1).
On ne peut plus estimer µen consid´erant√
nXnσ−µ. Au lieu ¸ca, on consid`ere √ nXSn−µ
n . Mais celle ci ne suit pas une loi normale mais une loi dite de student `an−1 degr´es de libert´es que l’on noteτn−1 (sa densit´e est une fonction paire et on a aussi une table comme pour la loi normale).
Ainsi, comme pr´ec´edement : P
−t1−α
2 6√
n
Xn−µ σ
6t1−α
2
= 1−α On pose :
θn =Xn− Sn
√nt1−σ
2, θn =Xn+ Sn
√nt1−σ
2
(θn, θn) est un intervalle de confiance 1−α.
Cours du 24 f´evrier
Regardons siXi sont des Bernouilli ind´ependantes de param`etreθ TCL⇒
√n
√
θ(1−θ)( \θn
|{z}
moyenne empirique
−θ)−→ N(0,1)
Ceci se traduit par la convergence des fonctions de r´epartition.
n→+∞lim P
√n
pθ(1−θ)(cθn−θ)≤zα
!
= 1−α Cela nous donne un intervalle de confiance asymptotique 1−αqui est :
cθn−zα/2 s
cθn(1−θcn)
n ; cθn+zα/2 s
θcn(1−cθn) n
Si on veut un intervalle de confiance non-asymptotique on utilisera les in´egalit´es de concentration.
SiXi Bernouilli de param`etreθ,Sn=Pn
i=1Xi alors d’apr`es Hoeffding :
⇒ P(|Sn−nθ| ≥t)≤2 exp −2t2
n
On veut que cette probabilit´e soit≤α. Prenonst=q
n
2ln(α2), on aurait : P |Sn−nθ| ≥
s n 2 ln
2 α
!
≤α
Ainsi on a un intervalle de confiance 1−αqui est :
"
cθn− r 1
2nln 2 α ; cθn+
r 1 2nln2
α
#