• Aucun résultat trouvé

Graphiques et données

N/A
N/A
Protected

Academic year: 2021

Partager "Graphiques et données"

Copied!
9
0
0

Texte intégral

(1)

Problème d'analyse des données corrigé

Graphiques et données

D. Chessel

DEA AMSB / 1999 (Stage de 3 jours)

Questions

Chaque question porte sur une carte de données de la pile Data du logiciel ADE-4.

1 - Budget_E Que pensez-vous de la figure présente sur cette carte ? ATTENTION : il est inutile de créer le dossier de travail correspondant.

2 - Lynx Comment est obtenue cette figure et qu’exprime t’elle ?

3 - Clementi Comment est obtenue cette figure et qu’exprime t’elle ?

(2)

5 - OPEP Comment est obtenue cette figure et qu’exprime t’elle ?

6 - Enquete D’où proviennent les données reproduites dans cette carte et à quelle méthode renvoient t’elles ?

7 - Tortues Quel modèle simple utiliser pour le tableau Males ?

8 - Rhone Combien d’axes peut-on conserver dans l’ACP normée du tableau Rh ? 9 - Wisconsin Combien d’axes peut-on conserver dans l’AFC du tableau Wisconsin ? A - Bordeaux Quelle relation existe t’elle entre la qualité des vins et le jugement des consommateurs ?

B - EleParis Caractérisez le lien entre résultats aux élections et prix des appartements.

C - Ombres Pensez-vous qu’on puisse parler de variations de la forme des individus entre les populations d’Ombres communs décrites dans les données ?

(3)

l’analyse factorielle multiple (KTA-MFA: Multiple Factorial Analysis) sur le tableau de cette carte ? Si il y a plusieurs méthodes possibles, que doit-on faire ?

Réponses

Budget_E Que pensez-vous de la figure présente sur cette carte ?

En première lecture, elle fait apparaître que le budget de l’éducation nationale augmente moins vite que le nombre d’étudiants. En fait, cette représentation à deux échelles est une escroquerie intellectuelle, la même technique pouvant conduire à la lecture inverse.

Lynx Comment est obtenue cette figure et qu’exprime t’elle ?

Elle est tracée avec Curves: Lines avec la seul paramètre :

Elle utilise une forme de la fenêtre physique adaptée (200-500 pixels). Elle montre le caractère périodique de la chronique.

(4)

Elle est tracée avec Curves: Lines. On a du transposé le fichier de la carte de données pour mettre les dates en lignes et demandé :

Elle montre la croissance de la production des arbres et l’alternance d’une année sur l’autre. Toutes les chroniques ne sont pas totalement en phase.

Grebes Comment est obtenue cette figure et qu’exprime t’elle ?

Elle est tracée avec Curves: Lines. On a demandé :

Les bornes de la fenêtre logique ont été modifiées. Elle montre la saisonnalité de la présence des grèbes sur les étangs et la variabilité des patterns de reproduction d’un étang à l’autre. OPEP Comment est obtenue cette figure et qu’exprime t’elle ?

(5)

Le fichier Opep.ccmo est issu de HTA: Double centring additive sur Opep. Elle montre une tendance générale de la période à la limitation de la production (choc pétrolier) et les écarts à la tendance dans chaque pays.

Enquete D’où proviennent les données reproduites dans cette carte et à quelle méthode renvoient t’elles ?

La réfrence donnée est :

Rouanet, H. & Le Roux, B. (1993) Analyse des données multidimensionnelles. Dunod, Paris. Elles demande une analyse des correspondances multiples à pondération non uniforme.

Tortues Quel modèle simple utiliser pour le tableau Males ? On utilise HTA: Edit inertia qui donne :

input file: E:\Ade4\TORTUES\Males

Option 1 = No action (non centred PCA) Inertia = 32367.6 Option 2 = Centred table (overall centred PCA) Inertia = 4285.9 Option 3 = Centred (zero mean) columns Inertia = 666.038 Option 4 = Centred (zero mean) rows Inertia = 3717 Option 5 = Additive model Inertia = 97.1424 Option 6 = Multiplicative model Inertia = 19.5128

Le modèle de base est du type xij =kα βi J.

Rhone Combien d’axes peut-on conserver dans l’ACP normée du tableau Rh ?

On utilise PCA: Correlation matrix PCA et le graphe des valeurs propres montre deux axes :

Wisconsin Combien d’axes peut-on conserver dans l’AFC du tableau Wisconsin ?

(6)

Bordeaux Quelle relation existe t’elle entre la qualité des vins et le jugement des consommateurs ?

On fait l’analyse des correspondances du tableau (la corrélation canonique vaut 0.77) et on utilise (par exemple) Graph1D: Labels :

L’échelle des valeurs est respectée ! (N.B. Le dernier caractère de la dernière étiquette est absente par manque d’un RC dans les fichiers).

EleParis Caractérisez le lien entre résultats aux élections et prix des appartements. On peut synthétiser le tableau des résultats par une ACP :

(7)
(8)

C’est une affaire Droite (à gauche) contre Gauche (à droite). Moins on habite un quartier cher et plus on vote à Gauche. Et inversement. Avec un écart à la loi générale dans le 6° arrondissement (les universitaires du quartier latin ?).

Ombres Pensez-vous qu’on puisse parler de variations de la forme des individus entre les populations d’Ombres communs décrites dans les données ?

On peux enlever l’effet taille par un modèle multiplicatif justifié par HTA: Edit inertia :

input file: E:\Ade4\OMBRES\Omb

Option 1 = No action (non centred PCA) Inertia = 899833 Option 2 = Centred table (overall centred PCA) Inertia = 316313 Option 3 = Centred (zero mean) columns Inertia = 14712.6 Option 4 = Centred (zero mean) rows Inertia = 308538 Option 5 = Additive model Inertia = 6937.78 Option 6 = Multiplicative model Inertia = 1928.59

On associe le tableau doublement centré à la variable qualitative Pop (Discrimin: Initialize/LinkPrep) :

La réponse est OUI car le test sur l’analyse discriminante est très significatif (Discrimin: Discriminant analysis/Test) :

(9)

On peut faire la même chose avec une ACP doublement centrée sur les log.

Sorme Peux t’on utiliser l’analyse triadique partielle (STATIS: Table averaging), l’analyse STATIS (STATIS: Operator averaging), l’AFC de Foucart (STATIS: Foucart's COA) et/ou l’analyse factorielle multiple (KTA-MFA: Multiple Factorial Analysis) sur le tableau de cette carte ? Si il y a plusieurs méthodes possibles, que doit-on faire ?

STATIS: Table averaging | OUI avec 12 tableaux 10-10 complets

STATIS: Operator averaging | OUI avec de deux manières différentes (WD ou VQ) STATIS: Foucart's COA | NON (variables quantitatives d’unités différentes)

KTA-MFA: Multiple Factorial Analysis | OUI (mêmes individus stations) Le plus simple est le meilleur (STATIS: Table averaging )

Références

Documents relatifs

Elle suppose, en plus de la normalité des variables, que tous les lots aient la même durée et ne peut donc pas être directement utilisée pour le contrôle des procédés à

Nous proposons une nouvelle approche du contrôle de qualité des procédés par lots basée sur la méthode STATIS et des cartes de contrôles non paramétriques à partir

La prochaine section vise à présenter les caractéristiques abordées dans la section précédente étant intimement liées au pronostic de traitement

Keywords : asset management, complex adaptive system of systems, uncertainties, risk-informed decision-making, extreme and rare events, risks... TABLE

Dans le but de vérifier, simplement, que les coefficients du compromis (ou les coordonnées des blocs sur le premier axe de l’interstructure de STATIS-LDA) sont bien représentatifs de

We now introduce the method to build the control regions from the factorial planes provided by the application of STATIS to the reference sample complete data sets for

Dans le cadre de l’analyse de plusieurs tableaux de donn´ ees multivari´ ees par la m´ ethode STATIS,le pr´ esent papier introduit une approche inf´ erentielle pour la validation

des données (analyse des correspondances, analyse en composantes principales ...) les statis- tiques descriptives utilisées comme aides à l’interprétation peuvent