• Aucun résultat trouvé

σ dans le cas où la variable parente est normale.

N/A
N/A
Protected

Academic year: 2022

Partager "σ dans le cas où la variable parente est normale. "

Copied!
5
0
0

Texte intégral

(1)

LE COIN FORMATION

Théorème de FISHER : distribution de

²

² nS

σ dans le cas où la variable parente est normale.

I. Résultats préliminaires :

Soient • X une variable aléatoire réelle,

• (X

1

, X

2

, …,X

n

) un échantillon aléatoire simple de X de taille n, X n et S n 2

respectivement sa moyenne et sa variance empiriques.

SCE

n

= ( )

= n

i

n

i X

X

1

2 la somme des carrés des écarts à la moyenne empirique

• (X

1

, X

2

, …,X

n+1

) l’échantillon aléatoire simple de X de taille n+1, X n + 1 et

2 + 1

S n respectivement sa moyenne et sa variance empiriques.

SCE

n+1

= + ( )

= 1 − +

1

2 1 n

i

n

i X

X la somme des carrés des écarts à la moyenne 1. Relation entre X n et X n + 1

(n+1) X n + 1 = ∑ +

= 1

1 n

i

X i

= 1

1

= +

n + n

i

i X

X

d’où (n+1) X n + 1 = n X n + X

n+1

2. Relation entre SCE

n+1

et SCE

n

.

D’après le théorème de KOENIG on a : SCE

n+1

= 2 1

1

1

2 1 +

+

=

+

nn

i

i ( n ) X

X

SCE

n+1

=

2

1

1 2

1 2

1 1 1

∑ = + + ⎥⎦ ⎤

⎢⎣ ⎡ +

+ +

n +

i

n n n

i ( n X X )

) n n ( X X

= 1

1

2 1 2

2

1 2 1

1 1

1 +

= + − +

− + + +

nn n

i

n n

i X X

n X n

n ) ( n X

² X n

= 1

1

2 1 2

2

1 2 1

1 1

= + − + +

+ + +

− +

n n n

i

n n

i X X

n X n

n X n n

n ) n ( X n

= 1

1

2 1 2

2 2

1 2 1

1 +

= + − +

+ + + +

nn n

i

n n

n

i X X

n X n

n

X n

n

X n

n

X

(2)

D’après KOENIG : SCE

n

= 2

1 2

n n

i

i n X

X

∑ =

d’où

SCE

n+1

= SCE

n

+ ( 1 2 1 )

2 2

1 − + + +

+ X n X n X n X n n

n

= SCE

n

+ ( 1 ) 2

1 − +

+ X n X n n

n

= SCE

n

+

2 1 2

1

1 ⎟

⎜ ⎞

⎛ + + + −

+ n +

n X

n

X ...

X X n

n

= SCE

n

+ ( 1 2 1 ) 2

1 1

− +

+ +

+ X + X ... X n nX n )

n ( n

D’où SCE

n+1

= SCE

n

+

2 1 2

1

1 ⎟ ⎟

⎜ ⎜

+

− + +

+ +

) n ( n

nX X

...

X

X n n (1)

II. Distribution d’échantillonnage de

² nS n

σ

2

. Théorème de FISHER

Soit • X une variable aléatoire réelle de loi normale N( μ , σ ),

• (X

1

, X

2

, …, X

n

) l’échantillon aléatoire simple de X de taille n,

S n 2 sa variance empirique d’échantillon.

² nS n

σ

2

est distribuée selon la loi du chi-deux à n-1 degrés de liberté

1. Relation entre

² nS n

σ

2

et ²

S ) n

( n

σ + 1 2 + 1

.

En divisant les deux membres de la relation (1) par σ ² et en remarquant que SCE

n+1

= (n+1)

2 + 1

S n et SCE

n

= n S n 2 on obtient :

² S ) n

( n

σ + 1 2 + 1

= ² nS n

σ

2

+

2 1 2

1

1 ⎟ ⎟

⎜ ⎜

σ

× +

− + +

+ +

) n ( n

nX X

...

X

X n n

(2).

X

1

, X

2

, …, X

n+1

sont n+1 variables indépendantes ayant même loi que X donc sont distribuées selon la loi normale N( μ , σ ).

E(X

1

+ X

2

+ …+X

n

− n X

n+1

) = E(X

1

) + E(X

2

) + …+E(X

n

) − nE(X

n+1

)

= μ + μ + …+ μ − n μ

= 0

Les n+1 variables X

1

, X

2

, …, X

n+1

sont indépendantes donc

V(X

1

+ X

2

+ …+X

n

− n X

n+1

) = V(X

1

) + V(X

2

) + …+V(X

n

) + n²V(X

n+1

)

= σ ² + σ ² + …+ σ ² + n ² σ ²

= n σ ² + n ² σ ²

(3)

X

1

+ X

2

+ …+X

n

− n X

n+1

, combinaison linéaire de n+1 variables normales indépendantes, est distribuée selon la loi normale N ( 0 , n ( n + 1 ) × σ ) . La variable U

n

, définie par U

n

=

σ

× +

− + +

+ +

) n ( n

nX X

...

X

X n n

1

1 2

1 , est donc distribuée selon la loi normale N(0 ; 1).

En remplaçant dans (2)

σ

× +

− + +

+ +

) n ( n

nX X

...

X

X n n

1

1 2

1 par U

n

on obtient

² S ) n

( n

σ + 1 2 + 1

= ² nS n

σ

2

+ ( ) U n 2 (3)

2. Récurrence.

• Si

² nS n

σ

2

est la somme des carrés de n−1 variables normales centrée réduites (hypothèse de

récurrence) alors il résulte de (3) que

² S ) n

( n

σ + 1 2 + 1

est la somme des carrés de n variables normales centrées réduites.

• Vérifions que cette propriété est vraie pour n=2 on a :

SCE

2

= ( ) ( 2 2 ) 2

2 2

1 X X X

X − + −

=

2 2 1 2 2

2 1

1 2 2 ⎟

⎜ ⎞

⎛ − +

⎟ +

⎜ ⎞

⎛ − + X X

X X X X

=

2 1 2 2

2 1

2

2 ⎟

⎜ ⎞

⎛ −

⎟ +

⎜ ⎞

XX X X

=

2 2 1

2 2 ⎟

⎜ ⎞

XX

SCE

2

=

2 2 1

2 ⎟

⎜ ⎞

XX

or SCE

2

= 2S 2 2 d’où

² S σ

2

2 2

=

2 2 1

2 ⎟

⎜ ⎞

⎛ σ

X X

Considérons la variable aléatoire U

1

définie par U

1

=

2

2 1

σ

X

X .

U

1

est normale car X

1

et X

2

sont normales. On vérifie facilement que E(U

1

) = 0

V(U

1

) = 1 (car X

1

et X

2

sont indépendantes).

La variable U

1

est normale centrée réduite et l’on a

² S σ

2

2 2

= U

1

²

² S σ

2

2 2

est le carré d’une variable normale centrée réduite.

La propriété est vraie pour n=2, donc elle est vraie pour tout n , n≥ 2.

(4)

Pour tout entier n, n ≥ 2,

² nS n

σ

2

est la somme des carrés de n−1 variables normales centrées réduites.

² nS n

σ

2

= ∑

= 1

1 2 n

k

U k avec

σ

× +

− + +

= + +

) k ( k

kX X

...

X

U k X k k

1

1 2

1

3. Indépendance des variables normales U

k

, 1 ≤ k ≤ n−1

Pour montrer que les n−1 variables U

k

sont indépendantes nous allons utiliser la définition et une propriété remarquable des vecteurs gaussiens :

• Un vecteur est gaussien si toute combinaison linéaire de ses composantes est de loi normale.

• Les composantes d’un vecteur gaussien sont indépendantes si et seulement si elles sont non corrélées.

Soient Y

k

définies, pour 1 ≤ k ≤ n−1, par Y k = X 1 + X 2 + ... + X kkX k + 1

Pour que les n−1 variables U

k

soient indépendantes il suffit que les n−1 variables Y

k

le soient.

Pour tout entier k, 1 ≤ k ≤ n−1, la variable Y

k

est combinaison linéaire des variables normales indépendantes X

1

, X

2

, ..., X

k

, X

k+1

, elle est donc de loi normale. De plus, toute combinaison linéaire des Y

k

, 1 ≤ k ≤ n−1, est elle même combinaison linéaire des variables normales indépendantes X

1

, X

2

, …, X

n

,et donc, est aussi de loi normale.

Il en résulte que le vecteur ayant pour composantes les n−1 variables normales Y

1

, Y

2

, …, Y

n-1

est gaussien par définition.

Pour que les composantes d’un vecteur gaussien soient indépendantes il suffit qu’elles soient non corrélées.

Il reste à montrer que Y

1

, Y

2

, …, Y

n-1

sont deux à deux non corrélées.

Soit deux entiers h et k tels que 1 ≤ h < k ≤ n−1 A = Cov(Y

h

, Y

k

)

= Cov ( X 1 + X 2 + ... + X hhX h + 1 , X 1 + X 2 + ... + X kkX k + 1 )

= Cov ⎟ ⎟

⎜ ⎜

⎛ − − +

+ =

= ∑

1

1 1 1

k k

j j h

h

i

i hX , X kX

X

= ( X , X ) h ( X , X ) k ( X , X k )

h

i

i j

k

j

h h

i k

j

j

i 1

1 1

1 1 1

Cov Cov

Cov +

=

= +

= = ∑ ∑

∑∑ +hkCov(X

h+1

,X

k+1

)

Les variables X

1

, X

2

, …,X

n

sont indépendantes donc pour i ≠ j Cov(X

i

,X

j

) = 0.

A = ( X , X ) h ( X h , X h )

h

i

i

i 1 1

1

Cov

Cov + +

=

∑ −

Pour tout i, 1≤ i ≤ n Cov(X

i

, X

i

) = V(X

i

) = σ ²

Il en résulte que 2

1

Cov = σ

∑ =

h ) X , X (

h

i

i

i et h Cov ( X h + 1 , X h + 1 ) = h σ ² d’où A = 0.

Pour tous les entiers h et k tels que 1 ≤ h < k ≤ n−1 Cov(Y

h

, Y

k

) = 0

n−1 variables normales Y

(5)

4. Conclusion

Pour tout entier n, n≥2,

² nS n

σ

2

est la somme des carrés de n−1 variables normales centrées réduites et indépendantes, donc :

² nS n

σ

2

est distribuée selon la loi du Chi-deux à n−1 degrés de liberté.

≈≈≈≈≈≈≈≈≈≈

Références

Documents relatifs

4.40 – Zone 8 : Vraisemblance des donn´ees utilis´ees pour le calcul du seuil de d´etection, compar´e au seuil th´eorique Gaussien (pour l’OGD) et au seuil th´eorique du

Exercice 4.– On veut déterminer le taux de glycémie dans une population de cobayes.. Pour cela, on effectue un dosage du glucose sanguin sur un lot de

Un plan peut être décrit par un point O, appelé l’origine, et deux vecteurs non colinéaires, qui en constituent une base (O, ~u x , ~u y ).. C’est un nombre

Nous avons r´ ealis´ e cette ´ evaluation du gain de codage en utilisant plusieurs images de notre base de donn´ ees initiales (en nous servant des diff´ erentes sous-bandes

Ainsi, seules les m´ethodes d’ACI spatiale sont consid´er´ees dans ce contexte pour des raisons de complexit´e num´erique.. Les neuro- scientifiques seraient toutefois

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Lorsqu’il utilise le vélo, on modélise son temps de parcours, exprimé en minutes, entre son domicile et son lycée par une variable aléatoire T qui suit le loi normale d’espérance

Dans cette catégorie de méthodes, nous citons d’abord la méthode classique FOOBI [Cardoso 1991] qui permet sans blanchiment des observations d’identifier la matrice de mélange