Chapitre 4 : Vecteurs gaussiens

(1)

Probabilités

Chapitre 4 : Vecteurs gaussiens

Lucie Le Briquer 23 novembre 2017

1 Lois gaussiennes réelles

d= 1, loi de probabilité sur R.

• N(0,1): loi de ^e

−x2

√2

2π

• N(m, σ²): loi dem+σZ oùZ ∼ N(0,1) (par conventionN(m,0) =δm)

On a l’équivalence :

X ∼ N(m, σ²)⇔X =

loim+σZ avecZ ∼ N(0,1)

⇔φX(λ) =e^iλme⁻^σ

2λ2 2

⇔X ∼e^−(x−m)²^/2σ² σ√

2π dx siσ6= 0

−4 −2 2 4 6 8

0.1 0.2 0.3 0.4 0.5

σ= 1

σ= 2

On retrouve des courbes centrées surmd’étalementσ. On aE[X] =m et Var(X) =σ².

(2)

2 Gaussiennes en dimension d > 2

SoitX = (X1, ..., Xd)v.a. dansR^d. On dit que c’est un vecteur gaussien si toute combinaison linéaire (ou affine) desXi a une loi gaussienne sur R.

C’est-à-dire∀λ∈R^d,hλ|Xi=Pd

i=1λiXi∼ N(mλ, σ²_λ)pour des certainsmλ etσλ. Définition 1(vecteur gaussien)

Remarque.C’est équivalent de demander linéaire ou affine.

N_Rd(0_Rd, I_d)la loi de Z = (Z₁, ..., Z_d) oùZ₁, ..., Z_d v.a. indépendantes de loiN(0,1). On a :

Z∼ e⁻

x2 1

√ 2

2π...e⁻

x2 d

√ 2

2πdx₁...dx_d =e^−kxk²²

√2πⁿ dx

|{z}

Lebesgue surR^d

Définition 2

SoitX = (X1, ..., Xd)à valeurs dans(R^d,B(R^d)),m∈R^d, A∈M_d×d(R),Σ =AA^T. On a l’équivalence :

X =

loim+AZ avecZ ∼ N(0,1)

⇔φX( λ

∈R^d) =e^ihλ|mie^−(λ^T^)Σ^λ²

⇔X vecteur gaussien etE[X] =met ΓX = (Cov(Xi, Xj))16i,j6d= Σ

⇔X ∼e^−((x.m)^T^)Σ⁻¹^x.m² (2π)^d²√

det Σ dx (siΣinversible) Propriété 1

SiX vérifie une de ces propriétés, on dit queX est un vecteur gaussien de loiN(m,Σ). Où mest son espérance etΣsa matrice de covariance.

Définition 3(vecteur gaussien)

Remarque.Σjoue le rôle deσ². Preuve.(de la propriété)

1. Première équivalence :

En général. φm+AY(λ) =e^ihλ|miφ(A^Tλ) Raison.

E

îei<λ|m+AY >ó

=e^ihλ|miE[e^iλAY] =ei<λ|m>

E[e^i(A^T^λ)^T^Y]

| {z }

φY(A^Tλ)

(3)

Si Z= (Z1, ..., Zd)∼ Nd(0, Id),

φZ(λ) =

indépφZ₁(λ1)...φZ_d(λd)

=

Zi∼N(0,1)

e⁻

λ2 1 2 ...e⁻

λ2 d 2

=e⁻^{λT λ}² Donc,

φm+AZ(λ) =eîhλ|mie^−(A^T^λ)^TÂ^T^λ/2=eîhλ|mie^−λ^T^Σ^λ² D’où :

φX(λ) =e^ihλ|mie^−λ^T^Σ^λ² ⇔ φX =φm+AZ ⇔

φinjectif X =

loim+AZ

2. ? ? : Il suffit de vérifier quem+AZa une loi de densité qui suit cette formule siAinversible.

E[φ(m+AZ)] =

transfert

Z

R^d

φ Ö

m+A Öx1

... xd

èè

dµZ(x1...xd)

| {z }

e−kxk2 2 2 (2π)

d 2

dx1...dxd

Effectuons le changement de variable affine (doncC1, inversible carAinversible) : Öy₁

... yd

è

=m+A Öx₁

... xd

è

On obtient :

E[φ(m+AZ)] = Z

R^d

ϕ(y)e^−(y−m)^T^Σ⁻¹^y−m² dy

(2π)^d² detA⁻¹

| {z }

1 detA=√¹

det Σ

x=A⁻¹(y−m),kxk²₂=x^Tx= (y−m)^T(A⁻¹)^TA⁻¹(y−m) = (y−m)Σ⁻¹(y−m). Ok.

3. (i⇒iii) Fait général.

• E[m+AY] =m+AE[Y]

• Γm+AY =AΓY(A^T) En effet,

• (E[m+AY])i=E[mi+Pd

j=1AijYj] =mi+Pd

j=1AijE[Yj] = (m+AE[Y])i

•

(Γm+AY)ij =Cov((m+AY)i,(m+AY))

=

d

X

k=1 d

X

l=1

A_ikA_jlCov(Y_k, Y_l)

=

d

X

k=1 d

X

l=1

Aik(ΓY)kl(A^T)lj T

(4)

SiZ ∼ N_Rd(0, Id),E[Z] = 0,ΓZ =Id. SiX =

loim+AZ, alors∀λ∈R^d,hλ|Xi=

loihλ|m+

AZiqui est une combinaison affine de Zi, gaussienne car c’est une famille stable par application affine et convolution. DoncX vecteur gaussien etE[X] =m+AE[Z] =m, ΓX=AΓZ(A^T) =AA^T = Σ.

4. iii ⇒ ii : On veut la fonction caractéristique de X. Soit λ ∈ R^d, on sait que hλ|Xi ∼ N(m_λ, σ²_λ)et :

m_λ=E[hλ|Xi] =E[

d

X

i=1

λ_iX_i] =

d

X

i=1

λ_im_i=hλ|mi

σ₂²=Var[

d

X

i=1

λ_iX_i] =

d

X

i=1 d

X

j=1

λ_iλ_jCov(X_i, X_j)

| {z }

Σ_ij

=λ^TΣλ

(X ∼ N(m,E)⇒ hλ|Xi ∼ N(hm|λi, λ^TΣλ)).

Alors :

φ_X(∈Rd)(λ) =E[eîhλ|Xi] =φ_hλ|Xi(∈_R₎(1) =eî.1.m^λe^−1σ²^λ¹² =eîhλ|mie^−λ^T^Σ^λ²

SoitX =

ÅX₁∈R^p X2∈R^q ã

avec :

X∼ N

ÅÅm₁∈R^p m₂∈R^q ã

=

ÅΣ₁₁ Σ₁₂ Σ₂₁ Σ₂₂

ãã

avecΣ11∈Mp×p etΣ22∈Mq×q, etc. Alors : 1. X₁∼ N(m₁,Σ₁₁)

2. X₁ indépendante deX₂ ⇔ Σ₁₂= 0 Proposition 1(conséquences)

Preuve.

1. trivial,X₁ vecteur gaussien etE[X₁] =m₁,Γ_X₁ = Σ₁₁

2. • ⇒: s’ils sont indépendants alors les covariances entre coordonnées de X1 et X2 sont nulles

•

φ_(X₁_,X₂₎( λ1

|{z}

∈R^p

, λ2

|{z}

∈R^q

) =e^i(hλ¹^,m¹^i+hλ²^,m²ⁱ⁾exp Å

−(λ1|λ2)

ÅΣ11 0 0 Σ22

ã Åλ1

λ2

ã

×1 2 ã

=...

=φX₁(λ1)φX₂(λ2)

(5)

Contre-exemple. Si X ∼ N(0,1)indépendante deZ∼ U {−1,+1}, posonsY =ZX.

• X et Y ne sont pas indépendants (car |Y| = |X| mais P(|X| < 1∩ |Y| > 1) = 0 et P(|X|>1)P(|Y|>1)>0car gaussienne a une densité>0).

• MaisX ∼ N(0,1),

P(Y ∈A) =P(X∈A∩(Z= 1)) +P(X ∈ −A∩Z=−1)

=1

2P(X∈A) +1

2P(X∈A)

=P(X∈A) DoncY ∼ N(0,1). Or :

Cov(X, Y) =E[XY]−E[X]E[Y]

| {z }

0

=E[ZX²] =E[Z]

| {z }

0

E[X²] = 0

Cela montre que Cov(X, Y) = 0 n’implique pas X indépendant de Y, et montre que les coor- données sont gaussiennes n’implique pas que c’est un vecteur gaussien.