• Aucun résultat trouvé

Intitulé du cours : Introduction à l’Analyse des Données (Code UE : ME1AY030)

N/A
N/A
Protected

Academic year: 2022

Partager "Intitulé du cours : Introduction à l’Analyse des Données (Code UE : ME1AY030)"

Copied!
3
0
0

Texte intégral

(1)

Intitulé du cours : Introduction à l’Analyse des Données (Code UE : ME1AY030)

Sophie Baudet-Michel, Université Paris Diderot, Enseignante-chercheuse, sophie.baudet-michel@u-paris.fr

30h de Cours/TD Objectif pédagogique

Les techniques d’analyses multivariées sont des outils statistiques permettant de mettre en valeur et d’analyser des informations quantitatives et qualitatives relatives à un grand

nombre d’individus statistiques ; elles sont fréquemment utilisées dans les bureaux d’études, dans les services d’études des collectivités ou des administrations.

Je souhaite vous initier dans cet enseignement à l’utilisation de 2 méthodes d’analyse quantitative (ACP, CAH) qui font partie des outils de l’analyse statistique descriptive. Je vous présenterai ces techniques d’analyse et les étapes qui y mènent sous forme de cours (à partir de l’exemple des différences entre villes françaises quant à la santé et la pollution

atmosphérique).

Le cours d’IAD s’inscrit dans l’ensemble des cours méthodologiques qui vous doteront des outils d’analyses utilisés dans les bureaux d’études, collectivités territoriales ... Le contenu du cours intersecte celui d'analyse statistique appliquée avec R (Thibaud Deguilhem) : des redondances peuvent apparaître ; en IAD la perspective est de vous permettre d’analyser des résultats d’analyse multivariée afin de vous permettre d’être en mesure de commander à des prestataires ce type d’étude et d’adopter une position critique vis à vis de résultats qu’ils vous présenteraient. Il trouve aussi des échos quant à la manipulation des données avec le cours d’initiation à l’ingénierie géographique, ou avec l’enseignement de diagnostic

territorial (Ronan Ysebaert et Hugues Pecoud).

Ce que vous aurez à faire tout au long du semestre

Vous appliquerez ces techniques d’analyse descriptive de manière guidée en TD sur l’analyse des différences entre les quartiers d’une commune de la banlieue parisienne.

Vous manipulerez des données statistiques sur les indicateurs démographiques et sociaux d’une ou plusieurs communes de banlieue, autour de Pantin. Vous utiliserez pour cela R studio.

Vous réaliserez pour la fin du semestre (en binôme) une étude descriptive d’analyse socio- démographique sur un des 12 territoires franciliens (ex : Plaine Commune, Grand Paris Grand Est) ou sur un thème et un espace de votre choix. Les attendus de l'étude et son plan sont précisés dans un document à part. Dans ce cadre vous serez amené.es à construire des représentations cartographiques et à utiliser Magrit ou R ou QGIS (qui sont tous des logiciels libres).

L'étude d’analyse socio-démographique porte sur le même territoire que l'étude d’initiation à l’ingénierie géographique.

(2)

Plan du cours/TD :

Chapitre 1 (13.9 et 20.9) : Notions de base, analyses univariées (Cours + TD) Chapitre 2 (20.9 et 27.9) : Analyses bivariées (Cours + TD)

4.10 : Travail sur l'étude en binôme : élaboration du thème, construction des données - Interrogation 1 (TD)

Chapitre 3 (11.10, 18.10, 25.10) : Analyse multivariée : Analyse en composantes principales - Interrogation 2 (Cours + TD)

25.10, 8.11, 15.11, 22.11 : Mise en oeuvre de l'étude en utilisant le logiciel R Moodle : ME1AY030

Les étudiants qui choisissent cet enseignement doivent s’inscrire sur le Moodle du cours : ME1AY030. Il n’y a pas de clef d’inscription. Les cours, consignes de TD, l'étude, les données sous forme de tableau statistiques ou de fonds cartographiques sont sur moodle.

Contrôle des connaissances

Le contrôle des connaissances est en contrôle continu à 100%

- 80% de la note d’UE : l'étude d’analyse socio-démographique d’un territoire métropolitain de la Métropole du Grand Paris. Pour ceux qui ne suivent pas

l’enseignement d’initiation à l’ingénierie territoriale ou qui ne sont pas dans l’option ADL, un autre champ d’analyse peut être envisagé.

- 20% 2 courtes interrogations sur table dans le cadre des séances, au début de chaque nouveau chapitre de cours.

Cette UE ne peut être prise en contrôle terminal.

Ressources

http://factominer.free.fr/course/MOOC_fr.html http://factominer.free.fr/livreV2/index.html http://math.agrocampus-

ouest.fr/infoglueDeliverLive/enseignement/support2cours/livres/statistiques.avec.R

Bibliographie : Manuels

BENZÉCRI J.P, L’analyse des données, Paris, Dunod, 1973.

DUMOLARD P., DUBUS N., CHARLEUX L., 2008, Les statistiques en géographie, Col Géographie Atouts, Paris, Belin, 239 p.

GROUPE ELEMENTR, 2014, R et espace, traitement de l'information géographique. Framabook, , 244 p.

HUSSON FR, LE S., PAGÈS J., 2019, Analyse de données avec R. Rennes, Col Pratique de la statistique, Presses Universitaires de Rennes, 239 p.

LAMBERT N., ZANIN C., 2016, Manuel de cartographie, Paris, Armand Colin, Col Cursus, 1973.

SANDERS L., 1989, L’analyse statistique des données en géographie, Montpellier, RECLUS, Col Alidade, 267 p.

Pour les curieux : articles scientifiques en géographie utilisant ACP et CAH

Fleuret S., 2011, « Essai de typologie des centres de santé et de services sociaux au Québec », Le géographe canadien, vol 5 (2), pp. 143-157

Renaud Le Goix « Les gated communities à Los Angeles, place et enjeux d'un produit immobilier pas tout à fait comme les autres », L'Espace géographique 4/2002 (tome 31), p.

328-344. URL : www.cairn.info/revue-espace-geographique-2002-4-page-328.htm.

(3)

Sitographie pour les bases de données INSEE

http://www.insee.fr/fr/bases-de-donnees/default.asp?page=statistiques-locales.htm INED : http://www.ined.fr/

ONU : http://www.un.org/fr/development/progareas/population.shtml IAURIF : http://www.iaurif.org/

Eurostat : http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/

OECD : https://www.oecd.org/fr/statistiques/listedebasesdedonneescompletes.htm Open data Gouvernement France : https://www.data.gouv.fr/fr/

De nombreuses villes proposent aussi des bases de données ouvertes

Références

Documents relatifs

Nous avons remarqué que L’AFC de notre exemple faisait apparaitre une valeur propre égale à 1 que nous n’avons pas pris en compte dans le calcul de l’inertie autour de G,

Erreurs de première et deuxième espèces Test d’adéquation à une valeur Test d’un probabilité Test de

histogramme des résidus, QQ plot (quantiles empiriques des résidus e i (ou normalisés) en fonction des quantiles de la gaussienne) graphiques partiels : tracé des p nuage de points (x

En épidémiologie, survenue d’une maladie à un groupe de facteurs de risque, avec des poids spécifiques pour chaque facteur de risque En fiabilité : survenu d’un accident sur

Dans le modèle multiplicatif, l’amplitude de la composante saisonnière et du bruit n’est plus constante au cours du temps : elles varient au cours du temps proportionnellement à

I La racine de l'arbre est étiquetée par l'axiome de la grammaire (qui est aussi le premier élément de la dérivation gauche). I On parcourt la dérivation de gauche à droite,

I Il peut être utile d'avoir plusieurs états - dans chacque état, Flex peut utiliser des expressions régulières diérentes. I Pour en avoir

Comment les religions, les lois religieuses, la colonisation, le système économique ont contribué à la transformation des rapports sociaux dans les sociétés africaines..