• Aucun résultat trouvé

Universit´ e de Nice L1MASS, ann´ ee 2015-2016

N/A
N/A
Protected

Academic year: 2022

Partager "Universit´ e de Nice L1MASS, ann´ ee 2015-2016"

Copied!
2
0
0

Texte intégral

(1)

Universit´ e de Nice L1MASS, ann´ ee 2015-2016

D´ epartement de Math´ ematiques Statistique

Cours 07

Variance, covariance, corr´ elation

1 efinitions et propri´ et´ es ´ el´ ementaires

efinition : Soient x = (x

1

, x

2

, . . . , x

n

) et y = (y

1

, y

2

, . . . , y

n

) deux ´ echantillons de mˆ eme taille n et de moyenne respective ¯ x =

n1

n

i=1

x

i

et ¯ y =

n1

n i=1

.

On appelle covariance (estim´ ee

1

) de x avec y et on note cov (x, y) le nombre cov (x, y) = 1

n 1

n i=1

(x

i

x)(y ¯

i

y). ¯

On appelle variance (estim´ ee) de x et on note Var (x) le nombre Var (x) = cov (x, x) = 1

n 1

n i=1

(x

i

x) ¯

2

,

et √

Var (x) s’appelle l’´ ecart-type de l’´ echantillon x. On appelle corr´ elation de x avec y et on note cor (x, y) le nombre

ρ = cor (x, y) = cov(x, y)

√ Var (x) √

Var (y) .

Proposition 1 Soient x,, x

, x

′′

, y, y

, et y

′′

des ´ echantillons de mˆ eme taille n. Notons x ¯ =

n1

n i=1

x

i

et

¯

y =

n1

n

i=1

la moyenne de x et de y. Soient λ, λ

et λ

′′

des nombres. Les relations suivantes sont satisfaites : 1. cov

x

+ λ

′′

x

′′

, y) = λ

cov (x

, y) + λ

′′

cov (x

′′

, y) (Bilin´ earit´ e : lin´ earit´ e ` a gauche) 2. cov (x, λ

y

+ λ

′′

y

′′

) = λ

cov (x, y

) + λ

′′

cov (x, y

′′

) (Bilin´ earit´ e : lin´ earit´ e ` a droite)

3. cov (y, x) = cov (x, y) (Sym´ etrie)

4. Var (λx) = λ

2

Var (x) 0 (Homog´ en´ eit´ e de degr´ e 2)

5. Formules de Huygens :

cov (x, y) = 1 n 1

n i=1

x

i

y

i

n

n 1 ¯ y ,et Var (x) = 1 n 1

n i=1

x

2i

n n 1 x ¯

2

. 6. In´ egalit´ e de Cauchy-Schwarz : (cov (x, y))

2

Var (x)Var (y), et donc ρ

2

1.

2 Relation avec la r´ egression lin´ eaire, interpr´ etation g´ eom´ etrique

Lors du cours 06 nous avons d´ etermin´ e l’´ equation y = ax+b de la droite de r´ egression lin´ eaire de l’´ echantillon y sur l’´ echantillon de mˆ eme taille x. Les valeurs de la pente a de cette droite et son ordonn´ ee ` a l’origine b sont donn´ es par a =

n

i=1

x

i

y

i

y

n

i=1

x

2i

x

2

et b = ¯ y x, o` u ¯ x et ¯ y d´ esignent la moyenne de x et y. En divisant par n 1 le num´ erateur et le d´ enominateur de l’expression donn´ ee de a et en appliquant la formule de Hygens, on voit que a = cov

(x,y)

Var

(x)

.

Vision g´ eom´ etrique : Var (x) mesure l’inertie ∑

n

i=1

(x

i

x) ¯

2

des n points x

i

par rapport au point ¯ x, l’inertie

n

i=1

(x

i

x

)

2

par rapport ` a tout autre point x

´ etant n´ ecessairement sup´ erieure. Cette inertie n’est nulle que si tous les x

i

sont ´ egaux, et ce qu’il est convenu d’appeler l’´ echantillon centr´ e

c

x = x x ¯ caract´ erise la dispersion de x, alors que la moyenne ¯ x est le nombre unique r´ esumant le mieux l’´ echantillon. L’´ ecart-type √

Var (x) mesure la dispersion

c

x de l’´ echantillon, de fa¸ con homog` ene par rapport au choix de l’unit´ e utilis´ ee pour former x, puisque pour tout λ > 0, √

Var (λx) = λ

Var (x) (en passant du m` etre au centim` etre, l’´ ecart-type est multipli´ e par le mˆ eme nombre, 100, que les mesures relev´ ees). On se d´ ebarrasse de la question du choix de l’unit´ e en consid´ erant l’´ echantillon centr´ e-r´ eduit

cr

x =

c

x/

Var (x) : c’est une direction dans R

n

ind´ ependante des unit´ es choisies, et ρ = cor (x, y) = cor (

cr

x,

cr

y) est le cosinus de l’angle que font les deux direction

cr

x et

cr

y dans le plan de R

n

qu’elles d´ eterminent. Si ρ = 1 c’est que ces deux variabilit´ es ont des directions parfaitement ´ egales (et ρ = 1 c’est que ces deux variabilit´ es ont des directions parfaitement oppos´ ees). Dans les deux cas la connaissance de x ´ equivaut ` a la connaissance de y : les r´ esidus ϵ

i

= y

i

ax

i

b pour la r´ egression de y sur x sont tous nuls !

1. Nous adoptons ici les d´efinitions pratiqu´ees par les commandesvar,sd, etcovdeRfond´ee sur l’estimateur sans biais de ces grandeurs pour un ´echantillon dont l’esp´erance (estim´ee parmean) n’est pas connue `a priori. Ceci explique que le lecteur pourra aussi trouver parfois unn`a la place du d´enominateurn−1 des d´efinitions adopt´ees ici.

1

(2)

3 Matrice de variance-covariance

On appelle matrice de variance-covariance de x et y la matrice sym´ etrique

( Var (x) cov (x, y) cov (y, x) Var (y)

) . On appelle matrice de corr´ elation de x et y la matrice sym´ etrique

( 1 cor (x, y)

cor (y, x) 1 )

.

Si on a m ´ echantillons x

1

, . . ., x

m

de mˆ eme taille on d´ efinit leur matrice de variance-covariance Σ et leur matrice de corr´ elation R par

Σ =

 

 

 

Var (x

1

) · · · cov (x

1

, x

k

) · · · cov (x

1

, x

m

)

.. . . . . .. . .. .

cov (x

k

, x

1

) · · · Var (x

k

) · · · cov (x

k

, x

m

)

.. . .. . . . . .. .

cov (x

m

, x

1

) · · · cov (x

m

, x

k

) · · · Var (x

m

)

 

 

 

et R =

 

 

 

1 · · · cor (x

1

, x

k

) · · · cor (x

1

, x

m

)

.. . . . . .. . .. .

cor (x

k

, x

1

) · · · 1 · · · cor (x

k

, x

m

)

.. . .. . . . . .. .

cor (x

m

, x

1

) · · · cor (x

m

, x

k

) · · · 1

 

 

 

.

2

Références

Documents relatifs

Calculer le polynôme caractéristique de A et en déduire les valeurs propres de A tout en précisant la multiplicité algébrique de chacune d’entre elles.. Déterminer les

Proposez une m´ethode num´erique la plus pr´ecise possible pour calculer g ′ (1) `a partir uniquement de valeurs de g. Donnez une estimation de l’erreur commise par

Dire et montrer si les affirmations suivantes sont vraies ou fausses

D´eterminer toutes les implications vraies entre deux propri´et´es parmi les pro- pri´et´es suivantes des suites r´eelles :.

[r]

Formuler le fait qu’une suite n’est pas p´eriodique `a partir d’un certain rang.. Formules avec

Si non, donner un contre-exemple et proposer une version

Voir la figure 2 pour le dessin des