• Aucun résultat trouvé

Méthode STATIS

N/A
N/A
Protected

Academic year: 2022

Partager "Méthode STATIS"

Copied!
18
0
0

Texte intégral

(1)

N. Niang Keita niang@cnam.fr

Tableaux multiples Données Evolutives 1 Et

Méthode STATIS

SOMMAIRE

Introduction

La méthode STATIS

La méthode STATIS DUALE

Application au contrôle des procédés à temps variable Exemple: 1er tour scrutins élections présidentielles

(2)

Introduction

• Cadre général: méthodes d’analyse simultanée de plusieurs tableaux de données

• Diverses situations:

– pt variables mesurées sur nt individus à différentes dates: données évolutives – pt variables mesurées sur nt individus à

différentes occasions (non temporel) – Plusieurs tableaux de contingence ou de

proximités

Introduction

• Plusieurs méthodes:

– STATIS, STATIS DUALE – AFM

– DACP

– + AUTRES ANGLO SAXONS

(3)

Méthodes STATIS

• Structuration de Tableaux A Trois Indices de la Statistique (Escoufier et L’Hermier des plantes (1976) + C.Lavit)

• permet l’exploration simultanée de plusieurs tableaux de données quantitatives:

• n individus et pt var différentes

Î

STATIS

– Privilégie la position des individus

• p var et nt individus différents

Î

STATIS DUALE

– Privilégie les relations entre variables

L’approche de la m éthode:

• Etude classique d’un tableau: l’analyse factorielle associe au tableau un ensemble de représentation graphiques (cercle de corrélations, plans factoriels)

• Plusieurs tableaux: études séparéesÎ trop de représentations indépendantes, pas pertinent; d’où:

• Recherche d’unensemble unique de représentation, un résumé global, un compromis des tableaux

(4)

Méthode STATIS

• Idée essentielle de la méthode:

• recherche d’une réponse à la question: les distances entre individus sont elles stables d’un tableaux à un autre ?

• Nécessité de trouver une structure commune aux études appelée intrastructure

4 étapes:

• Interstructure: étude globale des différences entre tableaux

• Compromis: résumer les tableaux en un seul représentatif selon certains critères

• Intrastructure: étude fine des différences entre tableaux

• Trajectoires : évolution des individus ou variables suivant les tableaux

(5)

Notations

• On dispose de N tableauxXt à ptvariables quantitatives décrivant les mêmes nindividus

11 21 1

12 22 2

1 2

1 X 2

Pt

Pt t

n n Ptn

X X X

X X X

X X X

n

=

Rappels ACP

• ACP classique : triplet (X ,

M , D)

– facteurs principaux : MVu = λu = (1) – composantes principales : c = Xu

MX’DXu= λu

XMX’DXu= λXu X* (1)

WDc= λc

W =matrice des produits scalaires entre individus Composantes principalesWDc = λc

(6)

Etude de l’interstructure : analyse globale

• ACP particulière: 3 phases

• Définir un objet représentatif

• Définir une métrique pour distances entre objets

• Trouver une image des objets représentatifs

Interstructure : objet représentatif W

t

• Individu de l’ACP = objet représentatif d’un tableau X

t

• W

t

= X

t

M

t

X’

t

caractérise (X

t

, M

t

, D)

Wt contient les produits scalaires entre individus = tous les liens inter individus

(7)

Interstructure objet représentatif W

t

• On représente chaque étude (Xt,, Mt , D )t=1, .…, N par Wt

Même nombre d’individus

par

• On associe un poids à chaque Wt

11 21 1

12 22 2

1 2

1 X 2

P

P t

n n Pn

X X X

X X X

X X X

n

=

t = t t t

W X M X

1 0

0 N

π

π

Δ = ⎢

πt

D= Matrice de poids des individus

Interstructure : métrique pour distances entre objets

• Metrique de l’ACP:

définir une distance entre objets

Produit scalaire de Hilbert Schmidt:

Si les objets Wt ont des normes très différentes:

( )

' ' '

tt = t t HS =Tr t t

S W W DW DW

( ) ( )2 ( )2

' ' / [ ] [ ' ]

t t HS =Tr t t Tr t Tr t

W W DW DW DW DW

(8)

Interstructure métrique pour distances entre objets

On reconnaît le coefficient RV(cf cours de Gonzalez): On définit la matrice S qui contient les coefficients RV On associe à chaque tableau un poids:

Comme en ACP on peut donc construire une image représentative des objets

Rque: S a tous ses termes positifs, on aura un facteur taille

1 0

0 N

π

π

Δ = ⎢

Interstructure image représentative des objets

• Rappel : STATIS = ACP particulière :

– Individu = Wt = objet représentatif d’un tableau – Tableau de données = S = Matrice des coefficients

RV (produits scalaires entre objets Wt) et poids – Composante principale = vecteur propre de SΔ

(9)

Interstructure image représentative des objets

ACP de SΔ

Les vecteurs propres de SΔ associés aux deux plus grandes valeurs propres permettent la représentation des objets W1,…, WNsur le 1er plan factoriel :

– Les coordonnées des Wtsur l’axe i sont contenues dans ct,i:

,

t i = λi i

c u

ièmevaleurpropre de SΔ

ièmevecteur propre de SΔ

STATIS - Résumé Interstructure

(10)

Exemple 1:

1er tour présidentielle

(11)

Compromis-Intrastructure

Interstructure = analyse globale

mise en évidence de ressemblances ou différences globales entre tableaux sans les expliquer.

Objectif de la suite = analyse plus fine pour expliquer Deux étapes:

* recherche d’un point de repère= compromis

* étude de l’intrastructure

(12)

Recherche d’un compromis Compromis = bon resumé, de même Co nature que les objets

solution: W

co

moyenne pondérée desW

t

Les coefficients étant tels que W

co

soit le plus corrélé avec les W

t

Recherche d’un compromis

1

WCO N tWt

t

α

=

=

( ) 1 1

1 ut

t t

α π

= λ

1èrevaleur propre de SΔ

tièmeélément du 1er vecteur propre de SΔ

=

W X MX

Matrice de données initiales

Matrice Co Compromis W

CO

(13)

Recherche d’un compromis

Représentation

Représentation et et Interprétation Interprétation

4 cas4 cas: : ** WWtt ont des ont des normes voisines normes voisines et des et des grandsgrands RVRV:: existence

existence d’une d’une structure commune structure commune bien bien décrite

décrite par le compromispar le compromis

**un Wun Wttdifférentdifférentdes autresdes autres: : il intervient peu il intervient peu dansdansla construction du compromisla construction du compromis,, robusterobuste

**WWttnormesnormestrop différentestrop différentes: : il faut normeril faut normer

**WWtttrès différents, RV très différents, RV faiblesfaibles: pas de : pas de structure commune

structure commune

Intrastructure image représentative des points compromis

ACP de WCOD

• Les vecteurs propres de WCOD associés aux deux plus grandes valeurs propres fournissent une image euclidienne des points compromis

– Les coordonnées compromis sur l’axe i sont contenues dans le vecteur cCO,i:

,

1

CO i i i co i

i

δ δ

= =

c v W Dv

ièmevaleur propre de WCOD ièmevecteur propre de WCOD

(14)

STATIS - Intrastructure

Intrastructure : corrélation variables- compromis

• Chaque composante principale du compromis est un vecteur à n dimension, n étant le nombre d’individus des tableaux initiaux.

• Calcul de leurs corrélations avec les variables initiales des tableaux Xt

• Représentation des cercles de corrélation

• Interprétation des axes pour expliquer les

(15)
(16)

STATIS - Trajectoires des individus

• Méthode: technique des points supplémentaires:

Représentation sur l’image euclidienne compromis des N nuages des individus

Remarque : cCO,i est le “centre de gravité” des pointscCO t,i

,

1

CO t i t i

δ

i

c = W Dv

STATIS - Trajectoires des individus

• Objectif :

– Mise en évidence des écarts entre les Wtet avec le compromis au niveau individuel

– Détection des individus responsables des écarts entre tableaux

• Définition :

– On place les différentes positions d’un individu tel qu’il est décrit par chaque étude. Ces différentes positions définissent sa trajectoire

(17)

Interprétation des trajectoires

• Deux classes de trajectoires des individus :

– Peu étendue autour de sa position compromis = individus dont l’évolution suit l’évolution moyenne, écart par rapport à la moyenne régulier d’un tableau à l’autre

– Trajectoire de grande amplitude = changement de structure suivant les tableaux, différence avec l’évolution moyenne

Rque: si les axes du compromis sont bien corrélés avec les variables on pourra expliquer les axes par les variables et on interprètera de façon détaillée les trajectoires des individus

(18)

STATIS DUALE

• Même démarche que STATIS en prenant comme matrice représentant un tableau, Vtla matrice de covariance des variables à la place des Wt .

• On privilégie les variables au lieu des individus.

– Interstructure: étude globale des variables – Compromis: moyenne pondérée des Vt – Intrastructure: compromis des variables – Trajectoiresde variables

STATIS DUALE

Exemple d’application:

Contrôle de procédés par lots à temps

variable

Références

Documents relatifs

Donner le terme suivant dans le développement asymptotique..

[r]

• Le troisième quartile Q 3 est la plus petite valeur pour laquelle on atteint ou dépasse 75% ; Exemple Imaginons que l’on ait le tableau statistique suivant :.. Valeurs 3 5 6 8 11

Définition Le premier quartile est la plus petite valeur du caractère notée Q 1 qui fait atteindre ou dépasser le quart des effectifs cummulés croissants.. Le troisième quartile est

Définition Le premier quartile est la plus petite valeur du caractère notée Q 1 qui fait atteindre ou dépasser le quart des effectifs cumulés croissants. Le troisième quartile est

Tel n'est pas le cas dans les exemples que nous avons relevés: non seulement la distribution ajustée s'étend nettement en deçà de zéro; mais, à un écart type à gauche, dans

Dans le cadre de l’analyse de plusieurs tableaux de donn´ ees multivari´ ees par la m´ ethode STATIS,le pr´ esent papier introduit une approche inf´ erentielle pour la validation

2) Regrouper les effectifs de cette série de tailles par classes de longueur 5 cm. 4) a) Calculer la moyenne de la série après avoir centré les classes. b) Comparer le