Intitulé du cours : Introduction à l’Analyse des Données (Code UE : ME1AY030)
Sophie Baudet-Michel, Université Paris Diderot, Enseignante-chercheuse, sophie.baudet-michel@u-paris.fr
30h de Cours/TD Objectif pédagogique
Les techniques d’analyses multivariées sont des outils statistiques permettant de mettre en valeur et d’analyser des informations quantitatives et qualitatives relatives à un grand
nombre d’individus statistiques ; elles sont fréquemment utilisées dans les bureaux d’études, dans les services d’études des collectivités ou des administrations.
Je souhaite vous initier dans cet enseignement à l’utilisation de 2 méthodes d’analyse quantitative (ACP, CAH) qui font partie des outils de l’analyse statistique descriptive. Je vous présenterai ces techniques d’analyse et les étapes qui y mènent sous forme de cours (à partir de l’exemple des différences entre villes françaises quant à la santé et la pollution
atmosphérique).
Le cours d’IAD s’inscrit dans l’ensemble des cours méthodologiques qui vous doteront des outils d’analyses utilisés dans les bureaux d’études, collectivités territoriales ... Le contenu du cours intersecte celui d'analyse statistique appliquée avec R (Thibaud Deguilhem) : des redondances peuvent apparaître ; en IAD la perspective est de vous permettre d’analyser des résultats d’analyse multivariée afin de vous permettre d’être en mesure de commander à des prestataires ce type d’étude et d’adopter une position critique vis à vis de résultats qu’ils vous présenteraient. Il trouve aussi des échos quant à la manipulation des données avec le cours d’initiation à l’ingénierie géographique, ou avec l’enseignement de diagnostic
territorial (Ronan Ysebaert et Hugues Pecoud).
Ce que vous aurez à faire tout au long du semestre
Vous appliquerez ces techniques d’analyse descriptive de manière guidée en TD sur l’analyse des différences entre les quartiers d’une commune de la banlieue parisienne.
Vous manipulerez des données statistiques sur les indicateurs démographiques et sociaux d’une ou plusieurs communes de banlieue, autour de Pantin. Vous utiliserez pour cela R studio.
Vous réaliserez pour la fin du semestre (en binôme) une étude descriptive d’analyse socio- démographique sur un des 12 territoires franciliens (ex : Plaine Commune, Grand Paris Grand Est) ou sur un thème et un espace de votre choix. Les attendus de l'étude et son plan sont précisés dans un document à part. Dans ce cadre vous serez amené.es à construire des représentations cartographiques et à utiliser Magrit ou R ou QGIS (qui sont tous des logiciels libres).
L'étude d’analyse socio-démographique porte sur le même territoire que l'étude d’initiation à l’ingénierie géographique.
Plan du cours/TD :
Chapitre 1 (13.9 et 20.9) : Notions de base, analyses univariées (Cours + TD) Chapitre 2 (20.9 et 27.9) : Analyses bivariées (Cours + TD)
4.10 : Travail sur l'étude en binôme : élaboration du thème, construction des données - Interrogation 1 (TD)
Chapitre 3 (11.10, 18.10, 25.10) : Analyse multivariée : Analyse en composantes principales - Interrogation 2 (Cours + TD)
25.10, 8.11, 15.11, 22.11 : Mise en oeuvre de l'étude en utilisant le logiciel R Moodle : ME1AY030
Les étudiants qui choisissent cet enseignement doivent s’inscrire sur le Moodle du cours : ME1AY030. Il n’y a pas de clef d’inscription. Les cours, consignes de TD, l'étude, les données sous forme de tableau statistiques ou de fonds cartographiques sont sur moodle.
Contrôle des connaissances
Le contrôle des connaissances est en contrôle continu à 100%
- 80% de la note d’UE : l'étude d’analyse socio-démographique d’un territoire métropolitain de la Métropole du Grand Paris. Pour ceux qui ne suivent pas
l’enseignement d’initiation à l’ingénierie territoriale ou qui ne sont pas dans l’option ADL, un autre champ d’analyse peut être envisagé.
- 20% 2 courtes interrogations sur table dans le cadre des séances, au début de chaque nouveau chapitre de cours.
Cette UE ne peut être prise en contrôle terminal.
Ressources
http://factominer.free.fr/course/MOOC_fr.html http://factominer.free.fr/livreV2/index.html http://math.agrocampus-
ouest.fr/infoglueDeliverLive/enseignement/support2cours/livres/statistiques.avec.R
Bibliographie : Manuels
BENZÉCRI J.P, L’analyse des données, Paris, Dunod, 1973.
DUMOLARD P., DUBUS N., CHARLEUX L., 2008, Les statistiques en géographie, Col Géographie Atouts, Paris, Belin, 239 p.
GROUPE ELEMENTR, 2014, R et espace, traitement de l'information géographique. Framabook, , 244 p.
HUSSON FR, LE S., PAGÈS J., 2019, Analyse de données avec R. Rennes, Col Pratique de la statistique, Presses Universitaires de Rennes, 239 p.
LAMBERT N., ZANIN C., 2016, Manuel de cartographie, Paris, Armand Colin, Col Cursus, 1973.
SANDERS L., 1989, L’analyse statistique des données en géographie, Montpellier, RECLUS, Col Alidade, 267 p.
Pour les curieux : articles scientifiques en géographie utilisant ACP et CAH
Fleuret S., 2011, « Essai de typologie des centres de santé et de services sociaux au Québec », Le géographe canadien, vol 5 (2), pp. 143-157
Renaud Le Goix « Les gated communities à Los Angeles, place et enjeux d'un produit immobilier pas tout à fait comme les autres », L'Espace géographique 4/2002 (tome 31), p.
328-344. URL : www.cairn.info/revue-espace-geographique-2002-4-page-328.htm.
Sitographie pour les bases de données INSEE
http://www.insee.fr/fr/bases-de-donnees/default.asp?page=statistiques-locales.htm INED : http://www.ined.fr/
ONU : http://www.un.org/fr/development/progareas/population.shtml IAURIF : http://www.iaurif.org/
Eurostat : http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/
OECD : https://www.oecd.org/fr/statistiques/listedebasesdedonneescompletes.htm Open data Gouvernement France : https://www.data.gouv.fr/fr/
De nombreuses villes proposent aussi des bases de données ouvertes