• Aucun résultat trouvé

UNIVERSITE DE BRETAGNE OCCIDENTALE

N/A
N/A
Protected

Academic year: 2022

Partager "UNIVERSITE DE BRETAGNE OCCIDENTALE"

Copied!
2
0
0

Texte intégral

(1)

UNIVERSITE DE BRETAGNE OCCIDENTALE

Année 2019-2020

Licence EURIA

Analyse de données, TD1

On note

X =

x1,1 · · · x1,p ... . .. ... xn,1 · · · xn,p

un tableau des n observations desp variables. On noteraXi,. la ième ligne du tableau (c’est à dire le ième individu) et X.,j la jème colonne du tableau (c’est à dire la jème variable). On rappelle les définitions suivantes, pour j ∈ {1, ..., p}.

— x¯j = n1Pn

i=1xi,j est la moyenne empirique de la jme variable.

— vj =var(X.,j) = 1nPn

i=1(xi,j −x¯j)2 est la variance empiriquede la jme variable.

— sj =√

vj est l’écart-type empirique de la jme variable.

— vj,k =cov(X.,j, X.,k) = n1Pn

i=1(xi,j −x¯j)(xi,k −x¯k) est la covariance empirique entre les variablesj et k.

— la matrice de covariance V est la matrice carré de dimension pqui contient les covariances empiriques V = (vj,k)

— rj,k =cor(X.,j, X.,k) = svj,k

jsk est la corrélation empirique entre les variables j etk.

— la matrice de corrélation R est la matrice carré de dimension p qui contient les corrélations empiriques R= (rj,k)

Exercice 1

1. Montrer quevj = n1 Pn i=1x2i,j

−(¯xj)2.

2. Montrer quex¯j =argminµ∈R(F(µ)) avecF(µ) = Pn

i=1(xi,j−µ)2. Interprétation ?

3. On considère le tableau de donnéesY = (yi,j)avec yi,j =xi,j −x¯j. Calculer

¯

yj etvar(Y ., j). On appelle Y le tableau de données centré. Pourquoi ? 4. On considère le tableau de donnéesZ = (zi,j) avec zi,j = (xi,j−x¯j)/sj.

Calculer z¯j etvar(Z., j). On appelle Z le tableau de données centré-réduit.

Pourquoi ?

5. Vérifier que V =Y0Y etR=Z0Z.

6. Vérifier que rj,k = kY(Y.,j,Y.,k)

.,jkkY.,kk = (Z.,j, Z.,k) avec(., .)le produit scalaire euclidien.

1

(2)

7. En déduire que rj,k ∈[−1,1] avec les cas extrêmes

— si rj,k = 1 alors il existe λ >0 tel que xi,j =λxi,k

— si rj,k =−1alors il existe λ <0 tel que xi,j =λxi,k

8. Proposer un exemple de couple de variables(X.,1, X.,2) tel que xi,2 =f(xi,1) avecf :R→R mais cor(X.,1, X.,2) = 0

Exercice 2

Soit v ∈Rp tel que kv k= 1 ety=Xv la nouvelle variable associée.

1. On pose w=U0v. Montrer quekwk= 1 2. Montrer quevar(y) =Pp

i,j=1viVi,jvj =Pp

i=1λiw2i 3. En déduire que λp ≤var(y)≤λ1

Exercice 3

1. Simuler un jeu de données X avecn = 100individus et p= 2 variables de telle manière que

— la première variable est simulée selon une loi N(0,1)

— la deuxième variable est simulée selon le modèle xi,2 =xi,2 +i avec i une réalisation d’un échantillon iid de la loi N(0,0.1).

Les variables seront centrées avant de continuer l’exercice.

2. Tracer le nuage de point. Caluler les vecteur propres u1 etu2 de la matrice de covariance et représenter les espaces vectoriels vect(u1) etvect(u2)sur la même figure.

3. Quelle est l’inertie totaleI du nuage de points ? Que vaut Ivect(u1)? Vérifier que I =Ivect(u1)+Ivect(u2).

4. Ecrire une fonction R Itheta=function(theta,X)qui calcule Ivect(uθ) avec uθ = (cos(θ), sin(θ))0.

5. Tracer la fonctionθ 7→Ivect(uθ) et vérifier que cette fonction atteint son maximum lorsque uθ =u1 et atteint son minimum lorsqueuθ =u2

2

Références

Documents relatifs

Dès lundi matin nou s nous m ettons li ce travail et cela nous demandera plus de deux semaines: ce fut une situation mathématique très riche.. les débats à ce

[r]

Source : Article 7 de l’Arrêté ministériel du 20/11/2017 relatif au suivi en service des équipements sous pression et des récipients à pression simple.

(e) Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

A quoi doit être égal chacun de ces produits, si l’on veut que l’ensemble du tableau soit un tableau de proportionnalité.. Colonnes 3 et 4

Il y a donc une forte corr´ elation lin´ eaire entre x et y, ou de mani` ere ´ equivalente un lien de d´ ependance lin´ eaire tr` es significatif entre ces deux variables.. On

[r]

[r]