TD 3
QUE NOUS APPREND L’ANALYSE EN COMPOSANTE PRINCPALE SUR LES DIFFÉRENCIATIONS SOCIO- ÉCONOMIQUES ENTRE QUARTIERS D’EST-ENSEMBLE ?
Fichier à utiliser
TD3_Est_Ensemble_DEMO_ECO_MECI_INSEE.xlsx TD3_Est_Ensemble_2021_ACP
Est_ensemble.shp Objectifs du TD
Interpréter les tableaux et graphiques de sortie d’une ACP Utilisation d’excelStat : réalisation d’une ACP
Le résumé statistique des variables examinées
Variable
Obs.
with missing
data
Obs.
without missing
data Minimum Maximum Mean
Std.
deviation
PC Artisans, Commerçants,
Chefs d'entreprise 0 161 0,000 7,589 2,957 1,293
PC Cadres et Professions
intellectuelles supérieures 0 161 0,000 29,704 10,433 7,040
PC Professions intermédiaires 0 161 0,000 24,390 14,697 4,194
PC Employés 0 161 9,091 29,436 20,479 4,415
PC Ouvriers 0 161 2,919 24,039 13,463 4,197
PC Retraités 0 161 6,696 46,313 17,760 5,747
PC Autres sans activité
professionnelle 0 161 8,909 43,030 20,199 5,624
PC_Chom 0 161 5,146 36,970 12,626 3,684
PC_Etu 0 161 0,000 14,567 8,332 2,138
PC0014 0 161 13,137 30,386 21,638 3,342
PC1529 0 161 6,667 40,012 19,568 3,615
PC3044 0 161 11,158 33,333 23,032 4,154
PC4559 0 161 0,000 26,411 18,929 2,713
PC6074 0 161 4,813 21,151 10,919 2,597
PC75P 0 161 0,000 21,734 5,913 3,076
Population en 2013 0 161 30,000 4984,000 2507,832 779,051
La variable Population (Pop) en 2013 n’a pas été pris en compte dans la construction de l’ACP.
1. Le tableau des valeurs propres
F1 F2 F3 F4 F5 F6 F7 F8 F9 … F14
Eigenvalue 4,400 2,035 1,627 1,500 1,104 0,997 0,966 0,726 0,618 … 0,000 Variability (%) 29,333 13,565 10,848 10,002 7,359 6,650 6,439 4,842 4,117 … 0,000 Cumulative % 29,333 42,897 53,746 63,748 71,107
77,75
7 84,196 89,039 93,156 …
100,00 0 Que représentent les valeurs propres ?
Combien de facteurs a produit l’ACP ?
Combien de facteurs doivent être pris en compte pour interpréter l’ACP ? L’ACP a-t-elle bien hiérarchisé les facteurs ?
Existe-t-il une relation linéaire entre facteurs ?
2. L’axe factoriel 1 : Décrire l’axe factoriel 1 : celui qui traduit les différenciations les plus fortes entre quartiers
F1 COR CTR QLT
PC Artisans, Commerçants, Chefs
d'entreprise 0,361 2,967 0,131
PC Cadres et Professions
intellectuelles supérieures 0,876 17,426 0,767
PC Professions intermédiaires 0,827 15,540 0,684
PC Employés -0,690 10,824 0,476
PC Ouvriers -0,824 15,440 0,679
PC Retraités 0,222 1,123 0,049
PC Autres sans activité
professionnelle -0,865 16,998 0,748
PC_Chom -0,734 12,256 0,539
PC_Etu -0,371 3,134 0,138
PC0014 -0,292 1,940 0,085
PC1529 -0,105 0,250 0,011
PC3044 0,229 1,196 0,053
PC4559 0,191 0,827 0,036
PC6074 0,021 0,010 0,000
PC75P -0,055 0,069 0,003
Population en 2013 0,150 0,163
Qualité de représentation des variables sur l’axe 1
Que signifient les chiffres 0,138 et 0,748 pour la qualité de représentation de PC_Etu, et de PC_CS8 ?
Quelles sont les variables bien représentées sur l’axe (qualité de représentation élevée) ?
Qu’en concluez vous ?
Contributions des variables à la construction de l’axe 1
Que signifie le chiffre 15,440 pour la contribution du % d’employés ?
A votre avis, pourquoi la variable Population en 2013 ne présente pas de contribution ? Quelles variables doivent être prises en compte pour interpréter l’axe 1 au vu des niveaux des contributions ?
Corrélations des variables avec l’axe 1
Que signifie le chiffre -0,69 pour le % d’employés ? et le chiffre de 0,021 pour le % de 60-74 ans ?
Quelles variables doivent être prises en compte pour interpréter l’axe 1 au vu des niveaux des corrélations ? Quelle interprétation sémantique (ou quelle signification) donner à l’axe 1 ? Quelle part des variations totales introduites par les variables entre les départements exprime-t-il ? Comment oppose-t-il les départements ?
Donnez un titre à l’axe 1 :
En vous appuyant sur les sorties de l’ACP qui concernent les observations, procédez de la même manière pour les quartiers
Qualité de représentation des quartiers sur l’axe 1
Quels sont les quartiers bien représentés sur l’axe (qualité de représentation élevée) ? Contributions des quartiers à la construction de l’axe 1
Quels sont les quartiers qui contribuent le plus à la construction de l’axe ? Corrélations des quartiers avec l’axe 1
Quels quartiers doivent être pris en compte pour interpréter l’axe 1 ?
Quels quartiers sont les plus opposés sur cet axe ? quelles sont les caractéristiques des quartiers corrélés négativement avec l’axe ? positivement avec l’axe ?
Cartographie de l'axe 1 : Commentez la carte obtenue.
3. L’axe factoriel 2 : Décrire l’axe factoriel 2 : celui qui traduit les différenciations les plus fortes entre quartiers et variables , une fois que les différenciations introduites par l’axe 1 ont été prises en compte.
F2 COR CTR QLT
PC Artisans, Commerçants, Chefs
d'entreprise -0,141 0,983 0,020
PC Cadres et Professions intellectuelles
supérieures -0,074 0,270 0,005
PC Professions intermédiaires -0,130 0,826 0,017
PC Employés -0,079 0,309 0,006
PC Ouvriers -0,022 0,024 0,000
PC Retraités 0,253 3,140 0,064
PC Autres sans activité professionnelle 0,040 0,080 0,002
% Chômeurs 0,036 0,063 0,001
% Etudiants -0,148 1,080 0,022
% de 00-14 ans -0,436 9,349 0,190
% de 1529 ans -0,546 14,675 0,299
% de 30-44 -0,323 5,131 0,104
% de 45-59 0,080 0,317 0,006
% de 60-74 0,826 33,554 0,683
% de 75P 0,784 30,198 0,614
Population en 2013 -0,247 0,439
Qualité de représentation des variables sur l’axe 2
Quelles sont les variables bien représentées sur l’axe 2 (qualité de représentation élevée) ? Qu’en concluez vous ?
Contributions des variables à la construction de l’axe 2
Quelles variables doivent être prises en compte pour interpréter l’axe 2 au vu des niveaux des contributions ?
Corrélations des variables avec l’axe 2
Quelles variables doivent être prises en compte pour interpréter l’axe 2 au vu des niveaux des corrélations ? Certaines variables ont des corrélations élevées avec l’axe > 0,5 en valeur absolue => on les retient.
Quelle interprétation sémantique (ou quelle signification) donner à l’axe 2 ? Quelle part des variations totales introduites par les variables entre les départements exprime-t-il ? Comment oppose-t-il les départements ?
Donnez un titre à l’axe 2 :
En vous appuyant sur les sorties de l’ACP qui concernent les observations, procédez de la même manière pour les quartiers
Qualité de représentation des quartiers sur l’axe 2
Quels sont les quartiers bien représentés sur l’axe (qualité de représentation élevée) ?
Contributions des quartiers à la construction de l’axe 2
Quels sont les départements qui contribuent le plus à la construction de l’axe ? Corrélations des quartiers avec l’axe 2
Quels départements doivent être pris en compte pour interpréter l’axe 1 ?
Quels quartiers sont les plus opposés sur cet axe ? quelles sont les caractéristiques des quartiers corrélés négativement avec l’axe ? positivement avec l’axe ?
Cartographie de l'axe 2. Commentez la carte obtenue.
Le plan factoriel 1-2 :
-1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1
-1 -0.75 -0.5 -0.25 0 0.25 0.5 0.75 1
-0.247 Variables (axes F1 and F2: 42,90 %)
Active variablesF1 (29,33 %)
F2 (13,56 %)
Que représente ce graphique ?
A partir de ce graphique, identifiez 4 (ou 5) groupes de variables. Quelle hypothèse pouvez-faire par rapport à la manière dont ces groupes vont partager l’ensemble des quartiers ?
4. L’axe factoriel 3 : Décrire l’axe factoriel 3 : celui qui traduit les différenciations les plus fortes entre quartiers , une fois que les différenciations introduites par les axes 2 et 3 ont été prises en compte.
F3 COR CTR QLT
PC Artisans, Commerçants,
Chefs d'entreprise -0,403
10,00
2 0,163
PC Cadres et Professions
intellectuelles supérieures -0,159 1,548 0,025
PC Professions intermédiaires -0,186 2,125 0,035
PC Employés -0,018 0,021 0,000
PC Ouvriers -0,004 0,001 0,000
PC Retraités 0,583
20,88
0 0,340
PC Autres sans activité
professionnelle -0,147 1,333 0,022
% Chômeurs -0,054 0,179 0,003
% Etudiants -0,242 3,599 0,059
% de 00-14 ans 0,172 1,808 0,029
% de 1529 ans
-0,416
10,65
1 0,173
% de 30-44
0,643
25,37
1 0,413
% de 45-59
-0,468
13,47
1 0,219
% de 60-74 -0,354 7,690 0,125
% de 75P 0,147 1,323 0,022
Population en 2013 0,102 0,075
Qualité de représentation des variables sur l’axe 3
Quelles sont les variables bien représentées sur l’axe 3 (qualité de représentation élevée) ? Qu’en concluez vous ?
Contributions des variables à la construction de l’axe 3
Quelles variables doivent être prises en compte pour interpréter l’axe 2 au vu des niveaux des contributions ?
Corrélations des variables avec l’axe 3
Quelles variables doivent être prises en compte pour interpréter l’axe 2 au vu des niveaux des corrélations ?
Quelle interprétation sémantique (ou quelle signification) donner à l’axe 3 ? Quelle part des variations totales introduites par les variables entre les départements exprime-t-il ? Comment oppose-t-il les départements ?
Donnez un titre à l’axe 3 :
En vous appuyant sur les sorties de l’ACP qui concernent les observations, procédez de la même manière pour les quartiers
Qualité de représentation des quartiers sur l’axe 3
Quels sont les quartiers bien représentés sur l’axe (qualité de représentation élevée) ? Contributions des quartiers à la construction de l’axe 3
Quels sont les quartiers qui contribuent le plus à la construction de l’axe ? Corrélations des quartiers avec l’axe 3
Quels quartiers doivent être pris en compte pour interpréter l’axe 1 ?
Quels quartiers sont les plus opposés sur cet axe ? quelles sont les caractéristiques des quartiers corrélés négativement avec l’axe ? positivement avec l’axe ?
Cartographie de l’axe 3.
Commentez la carte obtenue.
Conclusion
qu’a-t-on appris grâce à l’ACP ?
Que peut-on dire des différenciations entre quartiers du point de vue de leur composition socio- démographique ?
Comment l’analyse pourrait-elle être améliorée : y aurait-il selon vous des variables à ajouter, retrancher ?
L’analyse devrait-elle être conduite sur d’autres individus ? Lesquels ?