Estimation des paramètres

(1)

1/214

Coefficient de corrélation simple Le cas bidimensionnel Le cas général(n>2) Corrélation multiple Corrélation partielle

Association de variables quantitatives

Cas paramétrique gaussien

Frédéric Bertrand¹

1IRMA, Université de Strasbourg Strasbourg, France

Master 1 14-03-2012

(2)

1 Coefficient de corrélation simple Introduction

2 Le cas bidimensionnel

Loi normale bidimensionnelle Estimation des paramètres Procédure de test

Remarques sur les liaisons

(3)

3/214

Sommaire

3 Le cas général(n>2) Loi multinormale Estimation

Test de l’hypothèseρ_ij =0

Test de l’hypothèseρ_ij =ρ₀,ρ₀6=0

(4)

4 Corrélation multiple Définition

Estimation Asymptotique

Test de l’hypothèseR(X₁,X₂) =0

Test de l’hypothèseR(X₁,X₂) =R₀,R₀6=0

(5)

5/214

Sommaire

5 Corrélation partielle Définition

Estimation Asymptotique

Test de l’hypothèseρi,j|q+1,...,m=0

Test de l’hypothèseρi,j|q+1,...,m=ρ₀,ρ₀6=0 Cas de trois variables réelles

(6)

1 Coefficient de corrélation simple Introduction

(7)

7/214

Introduction

Le coefficient de corrélation simpleρ(X,Y)mesure le degré d’association linéaire entre deux variables aléatoiresX etY.

ρ(X,Y) =Cor(X,Y) = Cov[X,Y] (Var[X]×Var[Y])¹²

.

On a toujours−16ρ(X,Y)61.

(8)

Introduction

Lorsqueρ(X,Y) =0, on dit que les deux variables aléatoiresX etY sont non corrélées. Attention, ne pas être corrélés ne signifie pas généralement être indépendants. Mais

l’indépendance implique toujours l’absence de corrélation.

Exemple

PrenonsX ∼ N(0,1)etY =X², on sait alors queY ∼χ²₁une loi duχ²à un degré de liberté. Ainsi les propriétés classiques d’une loi duχ²impliquent queE[Y] =1 etVar[Y] =2.

(9)

9/214

Introduction

Exemple

Remarquez que nous ne sommes donc pas dans le cas qui sera développé plus tard où le couple(X,Y)suit une loi normale bidimensionnelle. On a alors :

ρ(X,Y) = Cor(X,Y) = Cov[X,Y] (Var[X]×Var[Y])¹²

= E

(X−0)(X²−1) (1×2)¹²

= 1

√ 2E

X³−X

= 1

√ 2 E

X³

−E[X]

=0−0=0,

carX suit une loi normale centrée donc symétrique par rapport à 0. Pourtant il est clair que les deux variables aléatoiresX et Y =X²ne sont pas indépendantes !

(10)

(11)

11/214

Introduction

Exemple

En bleu la relation entre les deux variables aléatoiresX et Y =X², en rouge 50 points qui sont autant de réalisations du couple(X,X²). On calculera page 27 la valeur de la statistique de corrélation linéaire à partir de l’échantillon formé des points en rouge.

(12)

Propriétés

Il faut donc toujours garder en mémoire que le coefficient de corrélation ne mesure que ledegré d’association linéaire entre deux variables aléatoires. Nous verrons dans les sections suivantes quels outils utiliser lorsque l’on suspecte que

l’association n’est pas nécessairement linéaire.

Lorsque|ρ(X,Y)|=1 alors, avec une probabilité de 1,

Y =aX+bpour des constantes réellesa, du même signe que ρ(X,Y), etb.

(13)

13/214

Introduction

Le coefficient de corrélation est invariant par transformation linéaire. SiCor(X,Y) =ρ(X,Y)et que l’on pose :

X⁰ = aX +b, Y⁰ = cY +d, alorsCor(X⁰,Y⁰) =Cor(X,Y) =ρ(X,Y).

Ceci a une conséquence extrêmement importante : on peut aussi bien travailler avec les variables brutes qu’avec les variables centrées réduites pour l’étude de la corrélation.

(14)

2 Le cas bidimensionnel

Loi normale bidimensionnelle Estimation des paramètres Procédure de test

Remarques sur les liaisons

(15)

15/214

Loi normale bidimensionnelle Estimation des paramètres Procédure de test Remarques sur les liaisons

Supposons que l’on dispose d’un vecteur aléatoire(X,Y) gaussien.

Nous verrons dans la suite, au moment de tester cette hypothèse, qu’un vecteur aléatoire(X,Y)n’est pas

nécéssairement gaussien siX etY suivent des lois normales^a.

a. Voir l’ouvrage de J.-Y. Ouvrard [5], exercice 13.1 page 276, pour un contre-exemple.

(16)

L’hypothèse que l’on fait porte sur le couple et est de ce fait plus délicate à tester que simplement tester la normalité de l’échantillonx issu deX et celle de l’échantillony issu deY. Commençons par rappeler ce que l’on entend par la loi d’un vecteur aléatoire gaussien à deux dimensions.

(17)

17/214

Définition

Loi normale bidimensionnelle

La densité de la loi normale à deux dimensions est : f(x,y) = Kexp

−1

2P(x,y)

où :

K = 1

2πσ_Xσ_Yp

1−ρ(X,Y)², P(x,y) = 1

1−ρ(X,Y)² ×

"

(x−m_X)²

σ_X² −2ρ(X,Y)(x−m_X) (y −m_Y)

σ_Xσ_Y +(y−m_Y)² σ_Y²

# .

(18)

Définition

Loi normale bidimensionnelle

Cette loi dépend donc des cinq paramètres : m_X, m_Y,σ_X,σ_Y et ρ(X,Y).

Les quatre premiers sont les moyennes et les écarts types des deux lois marginales, la loi deX et celle deY, qui sont des lois normales,X ∼ N m_X, σ_X²

etY ∼ N m_Y, σ_Y² .

(19)

19/214

Les lois liées, c’est-à-dire la probabilité d’obtenir une valeur Y =y sachant que l’on a obtenuX =x ou d’obtenir une valeur X =x sachant que l’on a obtenu une valeurY =y sont

également des lois normales dont les paramètres respectifs

m_Y_|X_=x, σ²_Y_|X=x et

m_X_|Y_=y, σ_X²_|Y_=y

s’expriment ainsi :

(20)

m_Y_|X_=x = m_Y +ρ(X,Y)σ_Y

σ_X (x−m_X), σ_Y²_|X_=x = σ_Y²

1−ρ(X,Y)²

. m_X|Y_=y = m_X+ρ(X,Y)σX

σ_Y (y−m_Y), σ_X|Y² _=y = σ_X²

1−ρ(X,Y)²

.

(21)

21/214

On remarque que :

• La variance de chacune des lois liées est constante : elle ne dépend pas de la valeur deX ou deY prise en compte pour la calculer, c’est-à-dire du nombrex, qui intervient dansσ_Y|X=x, respectivementy, qui intervient dansσ_X_|Y_=y, pour lequel elle est calculée.

(22)

• La moyenne de chacune des lois liées varie linéairement avec la variable liée. On peut donc parler de deux droites de régression :

D_YX : y−m_Y = ρ(X,Y)σY

σ_X (x −m_X), D_XY : x−m_X = ρ(X,Y)σ_X

σ_Y (y −m_Y).

(23)

23/214

• ρ(X,Y)est le coefficient de corrélation linéaire : ρ(X,Y) = Cov[X,Y]

(Var[X]×Var[Y])¹²

= E[(X −m_X)×(Y −m_Y)]

h E

h

(X−m_X)² i

×E h

(Y−m_Y)² ii¹

2

.

(24)

ρ(X,Y) =0 est une conditionnécessaire et suffisante pour que les deux variables aléatoiresX etY soient indépendantes car ici on a unehypothèsede normalité bidimensionnellesupplémentaire, voir page 7 pour la situation générale.

(25)

25/214

Siρ(X,Y) =±1, les deux droites sont confondues et il y a une relation fonctionnelle entreX etY. Plus précisement, (X−m_X)et(Y −m_Y)sont colinéaires, c’est-à-dire qu’il existeλetµdeux nombres réels tels que

λ(X−m_X) +µ(Y −m_Y) =0. On reconnaît dans la formule précédente l’équation d’une droite. Ainsi si

ρ(X,Y) =±1, les deux variablesX etY sont liées par une relation fonctionnelle linéaire.

(26)

La valeur absolue deρ(X,Y)est toujours inférieure ou égale à 1. Plusρ(X,Y)est proche de cette valeur, plus la liaison entreX etY est serrée. Si l’on considère un échantillon((x₁,y₁), . . . ,(x_n,y_n))de réalisations du couple (X,Y), la dispersion des couples de points(x_i,y_i)autour des droites est d’autant plus faible que les deux droites sont plus proches l’une de l’autre.

• ρ(X,Y)²est égal au coefficient de déterminationR²que l’on trouve dans le contexte de la régression linéaire simple.

(27)

27/214

Estimation des paramètres

On considère unn−échantillon(X₁,Y₁), . . . ,(Xn,Yn)

indépendant et identiquement distribué suivant la loi de(X,Y), qui est une loi normale bidimensionnelle.

Les estimateurs des moyennesm_X etm_Y et des écarts types σ_X etσ_Y que nous allons utiliser sont :

(28)

dm_X = X = 1 n

n

X

i=1

X_i,

dm_Y = Y = 1 n

n

X

i=1

Y_i,

σc_X² = 1 n−1

n

X

i=1

X_i−X2

,

(29)

29/214

σc_Y² = 1 n−1

n

X

i=1

Y_i−Y2

,

σc_X = v u u t

1 n−1

n

X

i=1

X_i−X2

= q

σc²_X,

σc_Y = v u u t

1 n−1

n

X

i=1

Y_i−Y2

= q

σc_Y².

(30)

Par convention et par soucis d’alléger les notations, on noteX à la place dedm_X.

Les quatre premiers estimateurs ci-dessus sont des estimateurssans biaiset convergents :

E dm_X

= m_X Var dm_X

= σ_X² n , E

dm_Y

= m_Y Var dm_Y

= σ²_Y n ,

(31)

31/214

E h

σc²_Xi

= σ_X² Varh σc²_Xi

= 2σ_X⁴ n−1, E

h σc_Y²

i

= σ_Y² Var h

σc²_Y i

= 2σ⁴_Y n−1.

(32)

Les deux derniers sontbiaiséset convergents :

E[σc_X] =

r 2 n−1

Γn 2 Γ

n−1 2

σ_X =

1− 3 4n +o

1 n

σ_X,

Var[σcX] = 1 n−1







n−1−

2Γn 2

2

Γ

n−1 2

2





 σ²_X,

(33)

33/214

E[σc_Y] =

r 2 n−1

Γ n

2 Γ

n−1 2

σ_Y =

1− 3 4n +o

1 n

σ_Y,

Var[σc_Y] = 1 n−1







n−1−

2Γn 2

2

Γ

n−1 2

2





 σ_Y²,

(34)

oùo(1/n)est une fonction qui tend vers 0 plus vite que 1/net Γ (x)est une fonction mathématique définie à l’aide d’une intégrale !

Il serait possible de corriger le biais de l’estimateurσc_X, en posant :σc_Xcorrigé=

rn−1 2

Γ

n−1 2

Γn

2

σc_X.

(35)

35/214

Néanmoins l’obtention d’un intervalle de confiance reste délicate puisque la loi de cet estimateur n’est pas classique.

P. Chapouille, dans son livre [2], propose la formule approximative :

σc_Xcorrigé ≈σc_X

r2n−2 2n−3 ≈σc_X

1+ 1

4n−6

.

(36)

La situation est beaucoup plus compliquée que pour les estimateurs ci-dessus.

On comprend ainsi pourquoi on préfère estimer la variance d’une loi normale à la place de son écart type.

« Heureusement », les deux paramètres qui ont été choisis pour définir une loi normale sont sa moyenne et sa variance.

(37)

37/214

Au passage on remarque que la racine carrée d’un estimateur sans biais n’est pas nécessairement sans biais.

Le coefficient de corrélation linéaireρ(X,Y)est un rapport.

Pour estimer ce rapport nous allons estimer le numérateur Cov[X,Y]et le dénominateur(Var[X]×Var[Y])¹².

(38)

En ce qui concerne le dénominateur, nous verrons qu’il suffit d’utiliser les estimateursσc_X etσc_Y ci-dessus. Un estimateur du numérateur peut être défini par la quantité :

Cov\[X,Y] = 1 n−1

n

X

i=1

X_i−X

Y_i−Y

= 1

n−1

n

X

i=1

(X_i×Y_i)− n

n−1X×Y.

(39)

39/214

C’est un estimateur sans biais et convergent deCov[X,Y]: E

h

Cov\[X,Y] i

=Cov[X,Y].

Notez la similitude avec l’estimateur corrigé de la variance. Ici aussi apparaît au dénominateur le nombren−1.

(40)

L’estimateur du coefficient de corrélationρ(X,Y), que nous allons utiliser, estρ(X,\Y)défini par :

ρ(X\,Y) = 1 n−1

n

X

i=1

X_i−X

× Y_i−Y

σc²_X ×σc_Y² ¹₂

= 1 n−1

n

X

i=1

X_i−X

× Y_i−Y σc_X ×σc_Y

(41)

41/214

=

1 n−1

n

X

i=1

X_i−X

× Y_i−Y 1

n−1

n

X

i=1

X_i−X2

× 1 n−1

n

X

i=1

Y_i−Y2

!¹₂

=

1 n−1

n

X

i=1

X_i−X

× Y_i−Y 1

n−1

n

X

i=1

X_i−X2

×

n

X

i=1

Y_i−Y2

!¹₂

(42)

=

n

X

i=1

X_i−X

× Y_i−Y

n

X

i=1

X_i−X2

×

n

X

i=1

Y_i−Y2

!¹₂

=

n

X

i=1

(X_i×Y_i)−X ×Y

n

X

i=1

X_i²−X²

!¹₂ _n X

i=1

Y_i²−Y²

!¹₂ .

(43)

43/214

L’étude des propriétés de cet estimateur est plus complexe puisqu’il s’agit d’un rapport de variables aléatoires qui ne sont pas indépendantes. Il s’agit d’un estimateurbiaiséet

convergent deρ(X,Y): E

h

ρ(X\,Y)i

= ρ(X,Y)−ρ(X,Y)(1−ρ(X,Y)²) 2n

Varh

ρ(X\,Y)i

= (1−ρ(X,Y)²)²

n +o

1 n

,

oùo(1/n)est une fonction qui tend vers 0 lorsquentend vers +∞plus vite que 1/n.

(44)

La distribution asymptotique deρ(X,Y)est :

√n(ρ(X\,Y)−ρ(X,Y))≈ N

0,

1−ρ(X,Y)²2 . Ce résultat n’est pas assez précis pour permettre de résoudre les problèmes qui nous intéressent généralement. On l’utilisera uniquement si l’on ne peut pas faire autrement et sin>30.

(45)

45/214

Ainsi lorsque l’on dispose d’un échantillon(x₁,y₁), . . . ,(x_n,y_n) de réalisations du couple(X,Y)on obtient les estimations des paramètres de la loi normale bidimensionnelle suivie par(X,Y) en utilisant les formules ci-dessous qui sont les réalisations des estimateurs ci-dessus sur notre échantillon. On notex

l’échantillon(x₁, . . . ,xn),y l’échantillon(y₁, . . . ,yn)et(x,y) l’échantillon(x₁,y₁), . . . ,(x_n,y_n).

(46)

Les estimations des moyennesm_X etm_Y et des écarts types σ_X etσ_Y sont :

dm_X(x) = x = 1 n

n

X

i=1

x_i,

dm_Y(y) = y = 1 n

n

X

i=1

y_i,

σc_X²(x) = 1 n−1

n

X

i=1

(x_i−x)²,

(47)

47/214

σc²_Y(y) = 1 n−1

n

X

i=1

(y_i−y)²,

σc_X(x) = v u u t

1 n−1

n

X

i=1

(x_i−x)²,

σc_Y(y) = v u u t

1 n−1

n

X

i=1

(y_i−y)².

(48)

On notex bien qu’il s’agisse de la moyenne de l’échantillonx et que de ce fait on pourrait également écrirex. Il s’agit là aussi d’une convention mais si l’on voulait être cohérent avec les notations utilisées pour les autres estimateurs on devrait écrire dm_X(x).

(49)

49/214

L’estimation de la covarianceCov[X,Y]est donnée par : Cov\[X,Y](x,y) = 1

n−1

n

X

i=1

(x_i−x)×(y_i−y).

(50)

L’estimation du coefficient de corrélationρ(X,Y)est donnée par :

ρ(X\,Y)(x,y) = 1 n−1

n

X

i=1

(x_i−x)×(y_i−y)

σc_X²(x)×σc_Y²(y)¹₂

= 1 n−1

n

X

i=1

(x_i−x)×(y_i−y) σc_X(x)×σc_Y(y)

(51)

51/214

=

n

X

i=1

(x_i−x)×(y_i−y)

n

X

i=1

(x_i−x)²×

n

X

i=1

(y_i−y)²

!¹₂

=

n

X

i=1

(x_i×y_i)−x×y

n

X

i=1

x_i²−x²

!¹₂

×

n

X

i=1

y_i²−y²

!¹₂ .

(52)

Exemple

On évalue la formule ci-dessus pour l’échantillon représenté en rouge page 7 :

Pearson correlation of Y and X = 0,006

(53)

53/214

Sous l’hypothèse nulleH₀: «X etY sont indépendantes », la variable :

√

n−2 ρ(X\,Y) q

1−ρ(X\,Y)²

suit une loi de StudentT_n−2àn−2 degrés de liberté.

(54)

Ceci permet de réaliser le test suivant : H₀:ρ(X,Y) =0

contre H₁:ρ(X,Y)6=0.

Pour prendre une décision associée à un test de niveau

(1−α) %, il suffit donc de trouver la valeur critique d’une loi de Student àn−2 degrés de liberté pourα/2.

(55)

55/214

Il est également possible, en réalisant un test unilatéral, de tester les hypothèses suivantes :

H₀:ρ(X,Y) =0 contre H₁:ρ(X,Y)>0.

(56)

ou encore

H₀:ρ(X,Y) =0 contre H₁:ρ(X,Y)<0.

(57)

57/214

Notons que, siρ₀6=0, la propriété ci-dessus ne permet pas de tester des hypothèses du type :

H₀:ρ(X,Y) =ρ₀ contre H₁:ρ(X,Y)6=ρ0.

Pour procéder à ces types de test, on utilise la transformation de Fisher

(58)

Il existe d’autres transformations pour obtenir des intervalles de confiance pourρ(X,Y), par exemple l’approximation de Ruben qui semble être plus précise mais encore plus complexe que celle de Fisher.

On peut par exemple montrer que, quelque soit la valeur du coefficient de corrélationρ(X,Y), la variable aléatoire (R−ρ(X,Y))

q

(n−2)/

(1−R²)(1−ρ(X,Y)²) suit

approximativement une loiT_n−2de Student àn−2 degrés de liberté. On retrouve le résultat de la page 53 établi lorsque ρ(X,Y) =0. Pour plus de détails voir [1] et [4].

(59)

59/214

En effet, Fisher, le premier, a démontré que si l’on introduit les deux variables :

Z(X,Y) = 1 2ln

1+ρ(X,Y) 1−ρ(X,Y)

= tanh⁻¹(ρ(X,Y)),

(60)

Z\(X,Y) = 1

2ln 1+ρ(X\,Y) 1−ρ(X\,Y)

!

= tanh⁻¹

ρ(X\,Y) ,

alors la différenceZ\(X,Y)−Z(X,Y)suit une loi voisine de la loi normale de moyenneρ(X,Y)/(2(n−1))et de variance proche de 1/(n−3).

(61)

61/214

On approximera donc dans le cas général la loi de cette

différence par une loiN(ρ(X,Y)/(2(n−1)),1/(n−3))et sous une hypothèse d’indépendance entreX etY, qui implique donc ρ(X,Y) =0, par une loiN(0,1/(n−3)).

Pour passer des résultats obtenus pourZ(X,Y)à des résultats concernantρ(X,Y), on utilise la transformation inverse de celle de Fisher :

(62)

ρ(X,Y) = exp(2Z(X,Y))−1 exp(2Z(X,Y)) +1 ρ(X,Y) = tanh(Z(X,Y)).

La plupart des logiciels de statistique permettent de calculer les estimations par intervalles deρ(X,Y). Certains proposent même des intervalles de confiance exacts.

(63)

63/214

• L’existence de deux droites de régression dans les études de corrélation est embarassante car elle amène à la question suivante : laquelle des deux droites

représente-t-elle le mieux la réalité ? On ne peut trancher sans utiliser la notion de causalité : si l’on pense queX est la cause deY, on retiendra la droiteD_YX qui est la

régression de la variable dépendante par rapport à la variable cause.

(64)

Dans les cas où l’on ne peut établir une relation de cause à effet, il n’y a pas lieu de fixer son attention sur l’une des droites de régression plutôt que sur l’autre. Le coefficient de corrélation linéaireρ(X,Y)est alors le paramètre le plus intéressant ; quelque soit sa valeur, positive ou négative, il ne préjuge en rien d’un quelconque rapport de cause à effet entre les variables étudiées.

(65)

65/214

Dans tous les cas, l’interprétation de toute étude de liaison mérite beaucoup de réflexions, et seules les raisons physiques ou biologiques et non statistiques pourront permettre de porter des jugements de cause à effet.

• Lorsque l’on trouve une courbe de régression qui serre de près le phénomène étudié, il faut se garder de conclure que cette formule traduit la loi exacte qui gouverne le phénomène.

(66)

• Enfin signalons que souvent deux variablesX etY sont fortement corrélées avec une troisièmeZ, le temps par exemple, et on peut conclure à une corrélation significative entreX etY, alors qu’à priori il n’y a aucune relation entre ces deux grandeurs si ce n’est leur liaison avecZ. On sent alors la nécessité d’introduire une mesure de liaison qui permettra de connaître l’association deX etY en éliminant l’influence deZ : il s’agit de la notion de corrélation partiellequi sera étudiée aux paragraphes vignette 125,??et??.

(67)

67/214

Loi multinormale Estimation

Test de l’hypothèseρ_ij=0 Test de l’hypothèseρ_ij=ρ₀,ρ₀6=0

Sommaire

3 Le cas général(n>2) Loi multinormale Estimation

Test de l’hypothèseρij =0

Test de l’hypothèseρ_ij =ρ₀,ρ₀6=0

(68)

On considère un vecteur gaussien de dimensionp>1 : X = (X₁, . . . ,X_p).

Un tel vecteur est entièrement déterminé par la connaissance de

sa moyenneµ(X)

et de sa matrice de variance-covarianceΣ(X).

Il s’agit d’une extension de ce que nous venons de voir pour le cas bidimensionnel.

(69)

69/214

En termes plus clairs, il suffit de connaître :

µ(X) = (µ₁, . . . , µp) = (E[X₁], . . . ,E[Xp]), Σ(X) = σ_i,j =Cov

X_i,X_j

16i,j6p

=







Var[X₁] . . . Cov[X₁,Xp] ... . .. ... Cov[Xp,X₁] · · · Var[Xp]





.

(70)

On introduit alors la matrice des corrélationsρ(X)entre les composantesX_i, 16i6pdeX :

ρ(X) = ρ_i,j =Cor

X_i,X_j

16i,j6p

=







1 . . . Cov[X₁,X_p]

(Var[X₁]Var[X_p])¹²

... . .. ...

Cov[X_p,X₁] (Var[Xp]Var[X₁])¹²

· · · 1





 .

(71)

71/214

Afin de construire un estimateur simple de la matriceρ(X)on doit disposer d’unn−échantillon(X₁, . . . ,X_n)indépendant et identiquementdistribué du vecteurX.

(72)

Cen−échantillon est donc composé denéléments, qui sont des vecteurs de taillep, que l’on note

(X_1,1, . . . ,X_p,1), . . . ,(X_1,n, . . . ,Xp,n).X_i,j est la variable aléatoire associée à la valeur prise par lai−ème composanteX_i lors de la réalisation de laj−ème expérience. Par exempleX_1,3serait la variable aléatoire associée à la valeur prise parX₁lors de la troisième expérience etX_5,2serait la variable aléatoire

associée à la valeur prise parX₅lors de la seconde expérience.

(73)

73/214

Un estimateurµb de la moyenneµest : µb = X₁+· · ·+Xn

n

=

n

X

i=1

X_i n .

On note, comme d’habitude,µb parx. Il s’agit d’un estimateur sans biais et convergent, comme à la page 27 :

(74)

E[µ]b = E

X₁+· · ·+X_n n

= E

" _n X

i=1

X_i

#

n

=

n

X

i=1

E[X_i]

n =

n

X

i=1

µ n =µ.

Var[µ]b = Σ n·

(75)

75/214

Un estimateurρ(X[)de la matrice des corrélationsρ(X)est alors donné par :

ρ(X[) =

ρbi,j =ρci,j =Cor\ X_i,X_j

16i,j6p

(76)

=







1 . . .

1 n−1

n X i=1

X_1,i−X₁

× X_p,i−X_p

σc₁× σcp ..

.

...

.. . 1

n−1 n X i=1

X_p,i−X_p

× X_1,i−X₁

cσp×cσ₁ · · · 1





 .

(77)

77/214

On obtient alors la forme explicite suivante :







1 . . .

n X i=1

X_1,i−X₁

× X_p,i−X_p



 n X i=1

X_1,i−X₁₂

× n X i=1

X_i,p−X_p₂



 1 2

.. .

...

.. . n

X i=1

X_p,i−Xp ×

X_1,i−X₁



 n X i=1

X_p,i−Xp 2

× n X i=1

X_1,i−X₁2



 1 2

· · · 1





 .

(78)

La distribution asymptotique deρ_ij est :

√n(ρb_ij−ρ_ij)≈ N

0,

1−ρ²_ij 2

.

Ce résultat n’est pas assez précis pour permettre de résoudre les problèmes qui nous intéressent généralement. On l’utilisera uniquement si l’on ne peut pas faire autrement et sin>30.

(79)

79/214

On a donc une estimationρ(X[)(x)deρ(X)à l’aide d’un échantillonx denréalisations deX. En notantx₁l’échantillon formé par lesnréalisations,(x_1,1, . . . ,x_1,n), deX₁,. . . ,x_p l’échantillon formé par lesnréalisations,(x_p,1, . . . ,x_p,n), deX_p on a :

ρ(X[)(x) =

ρ(X[)(x)_i,j =ρc_i,j(xi,xj) =Cor\[Xi,Xj](xi,xj)

16i,j6p

(80)

=







1 . . .

1 n−1

n X i=1

x_1,i−x₁

× x_p,i−x_p

σc₁(x₁)× cσp(xp) ..

.

...

.. . 1

n−1 n X i=1

x_p,i−x_p

× x_1,i−x₁

σcp(xp)×σc₁(x₁) · · · 1





 .

(81)

81/214

L’estimationbρ(X)(x)deρ(X)est alors :







1 . . .

n X i=1

x_1,i−x₁

× x_p,i−x_p



 n X i=1

x_1,i−x₁2× n X i=1

x_i,p−x_p2



 1 2

.. .

.. . n

X i=1

x_p,i−xp

× x_1,i−x₁



 n X i=1

x_p,i−xp 2

× n X i=1

x_i,1−x₁2



 1 2

· · · 1





 .

(82)

On peut maintenant s’intéresser au test d’indépendance des composantes d’un vecteur gaussien.

H₀:ρ_ij =0 contre H₁:ρ_ij 6=0.