• Aucun résultat trouvé

Proposition méthodologique pour l'exploration et la visualisa- tion des données de mobilité

N/A
N/A
Protected

Academic year: 2021

Partager "Proposition méthodologique pour l'exploration et la visualisa- tion des données de mobilité"

Copied!
5
0
0

Texte intégral

(1)

Proposition méthodologique pour l’exploration et la

visualisa-tion des données de mobilité

Emilie Lerond1, Olivier Klein2, Jean-Philippe Antoni1

Laboratoire ThéMA

UMR 6049 CNRS - Université Bourgogne Franche-Comté1

Luxembourg Institute of Socio-Economic Research (LISER)2

Mots-clefs -mobilité quotidienne, agrégation, visualisation, données désagrégées

Introduction

Les sources de données de mobilité indi-viduelle se sont aujourd’hui très diversi ées, aussi bien du côté des outils de col-lecte (smartphones, objets connectés, cap-teurs) que de celui d’applications (appli-cations téléphoniques, simulation spatiale). Ces données partagent en général le fait d’être désagrégées et multidimensionnelles : elles se caractérisent par des attributs à la fois spatiaux (localisation, géométrie), thé-matiques (motif, mode de déplacement) et temporels (heure de début et de n, durée) qui décrivent les déplacements des indivi-dus (Peuquet D., 1994). Leur volume et la structure de leurs attributs les rendent di ciles à manipuler (Batty, 2013 ; Kitchin, 2014). On peut toutefois penser que mal-gré leur complexité, elles o rent, du fait de leur nature, une possibilité nouvelle pour comprendre les mobilités et identi er les règles comportementales qui en sont à l’ori-gine. Nous cherchons justement à traiter et à structurer ces données pour en faire émer-ger de l’information par diverses méthodes d’analyse, d’exploration et de visualisation des données.

Données

Le jeu de données mobilisé est généré par MobiSim, une plateforme de simula-tion LUTI individu-centrée développée au sein du laboratoire ThéMA (Antoni et al., 2016). Il décrit les déplacements quoti-diens de 180.000 individus dans la Commu-nauté d’Agglomération du Grand Besançon

(CAGB) pendant vingt-quatre heures, sous forme d’une matrice origine-destination et sous forme de positions successives des in-dividus. Les heures de départ et d’arrivée sont connues, ainsi que les motifs et modes de transport.

Méthodologie

Pour analyser et visualiser ces données, nous cherchons à réduire le volume des don-nées sans perte de leur caractère multidi-mensionnel ou désagrégé. La solution ap-portée par l’agrégation, en tant que réalisa-tion d’un système de partiréalisa-tion (Openshaw S., 1981), permet de gagner en maniabilité et en visualisation des données. Nous met-tons en œuvre une méthode d’agrégation en trois étapes (3.1) applicable à chacune des dimensions des données, et présentée ici sur les attributs spatiaux (3.2) et aux attributs temporels (3.3).

(2) Les agrégations à plusieurs niveaux (sur le même attribut) peuvent être calculées de manière directe ou itérative (Figure 2). Le chaînage direct permet d’agréger les don-nées à un niveau ni depuis la donnée source, correspondant au niveau n0 . Le chaînage itératif permet d’agréger les données à un niveau ni depuis le niveau précédent ni ?1 ; le chaînage itératif est en partie conditionné par le choix de l’unité d’agrégation à l’étape 1.

(2)

Agrégation en trois étapes

Afin de guider l’exploration de dfférentes agrégations, nous testons une méthode en trois étapes qui s’applique, pour l’instant, à chaque dimension des données prise in-dividuellement. Cette méthode consiste en la sélection (1) de l’opérateur d’agrégation, (2) du type de chaînage et (3) du niveau d’agrégation.

(1) Un opérateur (somme, moyenne, va-leur centrale) est sélectionné pour agré-ger les données selon l’attribut sur lequel porte l’agrégation : nombre d’individus, âge médian, part de déplacement en transport en commun, etc. La structure de l’unité d’agrégation est également choisie à cette étape : pour un attribut spatial, la forme de l’unité (carrés, hexagones, etc.) et celle de la grille (régulière ou non).

(2) Les agrégations à plusieurs niveaux (sur le même attribut) peuvent être calculées de manière directe ou itérative (Figure 2). Le chai ?nage direct permet d’agréger les don-nées à un niveau ni depuis la donnée source, correspondant au niveau n0 . Le chaînage itératif permet d’agréger les données à un niveau ni depuis le niveau précédent ni ?1 ; le chaînage itératif est en partie conditionné par le choix de l’unité d’agrégation à l’étape 1.

Figure 1 : Type de chaînage d’agrégation (3) L’étendue des niveaux d’agrégation sur un attribut est comprise entre n0 et nmax (l’attribut est entièrement agrégé et ne compte alors plus qu’une seule unité), ce qui dé nit l’étendue de ni . Entre ces deux limites, chaque niveau ni peut être testé et chacun d’eux produit une représentation différente du jeu de données, plus ou moins

facile à gérer, analyser et visualiser. Chaque représentation au niveau ni doit être éva-luée et comparée aux autres niveaux a n de mesurer l’information obtenue et de, éven-tuellement, déterminer un intervalle de ni-veaux dans lequel un grand nombre d’infor-mations affleure tout en étant aisé à mani-puler.

Agrégation spatiale

Les déplacements sont réalisés sur un ter-ritoire, à partir d’un réseau de transport entre des lieux. Il semble peu judicieux de chercher à les analyser sans prendre en compte l’occupation du sol, dont ils sont dépendants. Nous disposons ainsi de deux attributs spatiaux à agréger, sur lesquels appliquer l’agrégation en trois étapes : l’oc-cupation du sol (3.2.1) et le réseau routier (3.2.2).

Agrégation de l’occupation du sol Pour représenter l’occupation du sol, nous retenons l’attribut « bâtiment », dont le pourcentage de surface bâtie par unité d’agrégation est calculé. La structure rete-nue pour l’instant est une grille régulière de cellules hexagonales. De ce fait, seul le chaînage direct d’agrégation est applicable dans cet exemple. L’étendue des niveaux est compris entre l’échelle du bâtiment (n0) et celui de la zone d’étude (nmax, soit envi-ron 16km de côté) ; n’importe quel ni peut être testé entre ces deux extrêmes.

Agrégation du réseau routier

Pour représenter le réseau routier, nous ef-fectuons une agrégation sur la géométrie du réseau lui-même. A n de maximiser le nombre de connexions entre cellules (et donc le nombre de tronçons), une grille hexagonale est retenue et seule une agré-gation directe est possible. Cette agréga-tion permet de représenter linéairement le réseau sous forme de « carte de métro ». Pour cela, chaque tronçon du réseau rou-tier est rattaché au tronçon de centroïde à centroïde dont il est le plus proche (Figure 2) : de la sorte, les tronçons routiers - sans

(3)

considération pour leur attributs théma-tiques proches sont agrégés en un seul tron-çon. Cette représentation du réseau routier permet de mieux en voir la structure sans la grever, la connectivité du réseau entre chaque centroïde de cellule devenant ainsi plus visible que sa topologie (Stott, Rod-gers, 2005).

Agrégation temporelle

L’agrégation temporelle peut s’effectuer de manière « classique » en regroupant les se-condes en minutes, les minutes en heures, les heures en périodes de journée (matinée, après-midi), etc. Cela revient finalement à discrétiser le temps de la journée en classes d’égales étendues et conduit à construire une carte ou une vue pour chaque classe temporelle : 86,400 vues pour des classes de 1 seconde, 2 vues pour des classes de 12 heures. Dans le premier cas, le nombre de vues est trop volumineux pour en dé-duire des tendances dans les déplacements individuels. Dans le second cas, les classes temporelles sont trop étendues pour obte-nir une vue interprétable : c’est donc à des niveaux intermédiaires qu’il faut visualiser les données de mobilité quotidienne. Au-delà du nombre de classes temporelles, c’est aussi le recours à des classes d’éten-dues temporelles égales qui semble contrai-gnant (Antoni et al., 2012). En e et, si l’on considère les 24 heures de la jour-née, certaines de ces heures comptabilisent peu de déplacements, alors que d’autres connaissent des pics de déplacements en raison des rythmes urbains. Face à ce constat, chercher une discrétisation tempo-relle à différents niveaux d’agrégation, fon-dée sur les méthodes de discrétisation des variables thématiques (méthode de Jenks, classes d’écart-type, etc.) peut permettre l’homogénéisation des classes. Cela permet de représenter dans des classes temporelles plus petites les moments comptant le plus de déplacements, ce qui réduit donc le nombre de déplacements visualisés simul-tanément a n de faciliter leur analyse.

Résultats

De premiers résultats sont obtenus avec l’agrégation spatiale de l’occupation du sol et du réseau routier de la CAGB. L’agréga-tion de l’occupaL’agréga-tion du sol, prise en compte à partir des bâtiments résidentiels, permet de visualiser les zones résidentielles et leur concentration. Cette représentation agré-gée permet de conserver l’organisation ur-baine de la zone d’étude (forme, localisa-tion, concentration) tout en facilitant la manipulation des données. L’agrégation du réseau routier réduit le nombre de tronçons routiers tout en maintenant la connectivité du réseau, ce qui permet de constater vi-suellement les inégalités d’accessibilité dans la zone d’étude.

Risques naturels et vulnérabilité

Pour l’instant, l’agrégation a été testée sur trois attributs (occupation du sol, réseau, temps). Deux nouveaux attributs théma-tiques peuvent être également testés, les motifs de déplacement et les modes de transport. Dans un premier temps, ces cinq attributs peuvent être agrégés individuel-lement à divers niveaux, a n d’explorer de manière exhaustive le jeu de données. Dans un second temps, ces attributs, à divers niveaux, peuvent être combinés dans une seule vue, a n de visualiser simultanément l’ensemble des données. La vue ainsi obte-nue serait plus ou moins interprétable, plus ou moins e cace pour explorer, analyser et visualiser le jeu de données, et nécessitera une évaluation (quantitative, par passation d’enquête, par cognition).

Perspectives

La méthode d’agrégation en trois étapes proposée doit être validée (1) au niveau lo-cal, (2) au niveau global et (3) en termes d’apport d’informations.

(1) Au niveau local, l’analyse des unités agrégées peut être conduite à partir d’in-dicateurs locaux (Hagen-Zanker, 2006). (2) Au niveau global, la comparaison des

(4)

unités agrégées (et leurs attributs statis-tiques) à di érents niveaux d’agrégation peut être réalisée à partir de mesures d’au-tocorrélation (Goodchild, 1986), par ana-lyse de variance (Silk, 1981), par anaana-lyse multi-niveaux (Mathian et Piron, 2001), ou par indicateurs de forme (analyse de graphe, de di usion, etc.).

(3) L’apport d’informations peut être, dans un premier temps, entendu comme un équi-libre entre précision des données et quantité

d’informations obtenues (nombre d’unités d’agrégation par exemple). Dans un second temps, le recours à une enquête et à une analyse cognitive des résultats obtenus doit permettre la mesure de cet apport d’infor-mations. L’évaluation de cet apport doit conduire à la mise en évidence d’intervalles de niveaux d’agrégation plus particulière-ment propices soit à l’exploration des don-nées, soit à leur communication.

Figure 2 : Type de chaînage d’agrégation

Figure 3 : Méthode d’agrégation du réseau routier

Références

Antoni J.P., Klein O., Moisy S., 2012. La discrétisation temporelle. Une méthode de structuration des donnes pour la cartogra-phie thématique. Cartes et géomatique, 27-31.

Antoni J.-P., Lunardi N., Vuidel G., 2016. Simuler les mobilités individuelles. Les en-jeux de l’information géographique. Revue internationale de géomatique, vol.26. Batty M., 2013. Big data, smart cities and

city planning. Dialogues in Human Geogra-phy, vol.3.

Goodchild M., 1986. Spatial Autocorrela-tion. CATMOG.

Hagen-Zanker A., 2006. Map comparison methods that simultaneously address over-lap and structure. Journal of Geographical Systems, vol.8.

Kitchin, 2014. Big Data, new epistemolo-gies and paradigm shifts. Big Data & So-ciety.

(5)

géo-graphiques et méthodes statistiques multi-dimensionnelles. In Sanders L., Modèles en analyse spatiale. Hermès Lavoisier.

Openshaw S., 1981. Le problème de l’agré-gation spatiale en géographie. L’Espace Géographique, vol.1.

Peuquet D., 1994. It’s about time : a conceptual framework for the representa-tion of temporal dynamics in geographic

information systems. Annals of the Asso-ciation of American Geographers, vol.84. Silk J., 1981. The analysis of variance. CATMOG.

Stott J.M., Rodgers P., 2005. Automa-tic metro map design techniques. In Pro-ceedings 22nd International Cartographic Conference.

Figure

Figure 3 : Méthode d’agrégation du réseau routier Références

Références

Documents relatifs

La mise en place de systèmes d'information à l'échelon national Plusieurs pays ont été intéressés par l'application des techniques de hachage, notamment dans le domaine de la

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Exemple 2 : Le contrat 1183 signé le 15 janvier 2010 intitulé « Audit du réseau » débutera le 18 janvier 2010 et a pour description « Auditer la sécurité du réseau local,

Pour les probl´ ematiques d’estimation param´ etrique, dans un contexte de filtrage conjoint ´ etats-param` etres hors-ligne, et quand la connaissance a priori sur les param` etres

Nous utiliserons pour cela les outils de sémiologie graphique développés par BERTIN (1971) et une technique de réorganisation automatique d’un tableau de données..

‫ﺍﻟﻌﻨﺼﺮ ﺍﻷﻭﻝ ﺗﻨﺎﻭﻟﻨﺎ ﻓﻴﻪ ﻣﺮﺣﻠﺔ ﻭﺻﻒ ﺍﳉﺰﺍﺋﺮ‪ ،‬ﺃﻣﺎ ﺍﻟﻌﻨﺼﺮ ﺍﻟﺜﺎﱐ ﻓﻘﺪ ﲢﺪﺛﻨﺎ ﻓﻴﻪ ﻋﻦ ﻣﺮﺣﻠﺔ ﺍﻟﻠﱢﺠﺎﻥ‬ ‫ﺍﻟﻌﻠﻤﻴﺔ‪ ،‬ﺃﻣﺎ ﺍﻟﻌﻨﺼﺮ ﺍﻟﺜﺎﻟﺚ ﻓﺨ‪‬ﺼ‪‬ﺺ ﻟﻌﺮﺽ

L’objectif associé à l’utilisation, dans le cadre des études d’association, des modèles de prix est de vérifier dans quelle mesure le niveau des données

Avec la symbolique commune à la plupart des versions de Prolog, on écrit [ ] pour la liste vide, [a, b, c, d] pour une liste définie par énumération, et [a | X] si a en est le