• Aucun résultat trouvé

SIX NUANCES D'A-GREY-GATION L'influence du choix des unités spatiales d'agrégation sur la lecture et l'interprétation des résultats cartographiés

N/A
N/A
Protected

Academic year: 2021

Partager "SIX NUANCES D'A-GREY-GATION L'influence du choix des unités spatiales d'agrégation sur la lecture et l'interprétation des résultats cartographiés"

Copied!
4
0
0

Texte intégral

(1)

13ièmesRencontres de Théo Quant Besançon, 17-19 Mai 2017

SIX NUANCES D’A-GREY-GATION

L’influence du choix des unités spatiales d’agrégation sur la

lecture et l’interprétation des résultats cartographiés

Jean-Philippe Antoni1, Émilie Lerond1, Stéphane Moisy2, Olivier Klein3

Laboratoire ThéMA

UMR 6049 CNRS - Université Bourgogne Franche-Comté1

OTE Ingénierie (Strasbourg)2

LISER (Luxemburg Institute of Socio-Economic Research)3

jean-philippe.antoni@univ-fcomte.fr

Mots-clefs -Analyse spatiale, Maillage, Découpage spatial, Agrégation, Systèmes multi-agents

Introduction

Contexte

En même temps que les activités humaines se sont informatisées, les sources de don-nées géographiques se sont diversifiées, au-tant du point de vue de leur production (smartphones, capteurs, simulation) que de leur gestion (modélisation, base de données et protocoles d’interrogation). Ces données de « nouvelle génération » partagent en général le fait d’être massives, désagrégées et multidimensionnelles. Elles se caracté-risent par des attributs riches d’un point de vue spatial (localisation), thématique (type d’activité) et temporel (heure de dé-but et de fin, durée). En contrepartie, leur volume et leur structure les rendent dif-ficiles à manipuler (Batty, 2013 ; Kitchin, 2014). Parmi les principales difficultés, leur simple visualisation est délicate à grande échelle (pour une agglomération entière par exemple) : comment visualiser individuel-lement des centaines de milliers d’objets ou d’individus en mouvement, de manière à ce que l’information de détail reste li-sible (échelle micro), mais que l’on puisse également en dégager une structure spa-tiale interprétable d’un point de vue géo-graphique (échelle macro) ? Pour rendre li-sible ce type de données plusieurs

solu-tions existent, comme l’analyse du semis de points et/ou l’interpolation spatiale des variables associées aux individus. L’incon-vénient est alors de représenter les données de manière continue, même si elles sont dis-crètes. Pour pallier ce problème, l’agréga-tion spatiale reste paradoxalement une opé-ration nécessaire afin de visualiser des don-nées dont l’un des principaux intérêts re-pose au départ sur leur caractère désagrégé.

Hypothèses et objectif

Concrètement, l’agrégation s’appuie sur un double choix. D’une part, il convient de choisir la taille des unités spatiales au sein desquelles les données seront regroupées, ce qui revient à déterminer la résolution (ou la granulométrie) des résultats finaux, se-lon une problématique devenue classique pour la cartographie par carroyage (Dela-haie, 1987 ; Cauvin, 2008). D’autre part, il convient également de déterminer la forme de ces unités spatiales, selon une logique qui relève du problème très général du MAUP (Openshaw, 1983 ; Epson, 2006), mais avec un degré de liberté supplémentaire dans la mesure où les données ne sont généralement contraintes par aucune structure au départ. Ce double choix, encore relativement peu étudié, n’est probablement pas anodin et nous conduit à formuler deux hypothèses :

(2)

13ièmesRencontres de Théo Quant Besançon, 17-19 Mai 2017

— A. Pour un jeu de données identique, la structure (taille et forme) des uni-tés spatiales d’agrégation influence les résultats quantifiés et cartogra-phiés à l’échelle micro.

— B. Cette même structure influence la lecture et l’interprétation des ré-sultats à l’échelle macro et peut conduire à des conclusions falla-cieuses ou contradictoires.

L’objectif de cette communication est triple : (i) vérifier ces hypothèses à partir d’un exemple concret, (ii) proposer des élé-ments permettant de mieux comprendre les enjeux et les écueils liés à la représenta-tion de données individuelles désagrégées, et (iii) envisager des éléments de méthodo-logie pour généraliser la démarche à n’im-porte quel cas d’étude.

Figure 1 – Six ensembles d’unités spatiales présentant des structures différentes

Méthodologie

Terrain d’étude et données

Le jeu de données mobilisé pour cette com-munication a été généré par simulation, à l’aide du modèle LUTI MobiSim (Antoni et al., 2016). Il décrit les déplacements quoti-diens de 180 000 individus dans la Commu-nauté d’Agglomération du Grand Besançon (CAGB) pendant vingt-quatre heures, sous la forme d’une matrice origine-destination et sous la forme de positions successives des individus. Les lieux et les heures de départ et d’arrivée sont connus, ainsi que les mo-tifs et modes de transport. L’une des ques-tions possibles à laquelle nous tentons de

ré-pondre ici à titre d’exemple est la suivante : d’où les individus partent-ils, où arrivent-ils (échelle micro), et quelle est la structure géographique qui se dégage de leurs dépla-cements (échelle macro) ?

Construction des unités d’agréga-tion

Pour tester les hypothèses A et B à par-tir des données MobiSim, la méthodologie consiste en une approche comparative fon-dée sur des ensembles d’unités spatiales dif-férents dans leur nature mais comparables dans leur structure (Figure 1). Ces en-sembles sont construits en respectant trois

(3)

13ièmesRencontres de Théo Quant Besançon, 17-19 Mai 2017

contraintes : (i) ils couvrent l’ensemble du terrain d’étude (CAGB) d’un seul tenant et sans enclave ; (ii) le nombre d’unités spa-tiales de chaque ensemble est identique (au-tant que possible) ; (iii) la taille (superficie) des unités spatiales est identique (autant que possible). Le respect de ces contraintes permet de produire trois ensembles :

— A. Carroyage : 628 cellules carrées d’une surface de 806 192 m2.

— B. Nid d’abeilles : 624 cellules d’une surface de 806 192 m2.

— C. Cible : 655 cellules d’une surface de 806 154 m2.

En assouplissant la troisième contrainte (taille des unités spatiales), il est possible d’ajouter trois ensembles supplémentaires. Le premier est directement lié aux données ; les deux suivants sont construits de manière aléatoire (à partir d’une localisation aléa-toire de centroïdes) pour évaluer la part stochastique des résultats produits :

— D. Polygones de Thiessen fondés sur les centroïdes Origine/ Destination : 626 cellules d’une surface comprise entre 18310 et 4 652 990 m2.

— E. Polygones de Thiessen 1 construits aléatoirement : 626 cel-lules d’une surface comprise entre 57 950 et 3 233 065 m2.

— F. Polygones de Thiessen 2 construits aléatoirement : 626 cel-lules d’une surface comprise entre 38 645 et 2 822 297 m2.

Évaluation

Outre les indicateurs statistiques standards (min, max, moyenne, écart-type), le résul-tat des agrégations dans chacun des en-sembles est évalué à partir de l’analyse de la variance intra-et inter-unités, selon une logique qui fait successivement ap-pel à l’indice de Jenks et Coulson (1971), à l’indice TAI (Tabular Acccuracy Index ; Jenks, 1963 ; Evans, 1977) et à l’indice GVF (Goodness of Variance Fit) fondé sur le de-gré d’homogénéité interne des classes que constituent chaque cellule (Smith, 1986). Cette évaluation croisée permet d’opérer

un classement des ensembles d’unités spa-tiales tenant compte de la manière avec la-quelle il restituent l’homogénéité et/ou la diversité de l’information à l’échelle micro (minimisation de la variance intra-unité) comme à l’échelle macro (maximisation de la variance inter-unités). Ces méthodes per-mettent de vérifier l’hypothèse A.

En ce qui concerne l’hypothèse B, l’éva-luation est faite à partir d’une enquête réalisée auprès de géographes et de non-géographes, sensibilisés aux questionne-ments de la représentation cartographique ou non. Cette enquête est relativement ra-pide, puisqu’elle demande simplement de reconnaître (ou non) des structures géo-graphiques de base à partir des différents maillages testés. Ces structures sont appro-chées à partir de formes géométriques clas-siques en géographie urbaine : organisation radioconcentrique, sectorielle (radiale), po-lynucléaire, linéaire, aléatoire, en opposi-tion, ou autre(s).

Résultats et perspectives

Cette étude propose une méthode pour évaluer la qualité des découpages spatiaux préalablement à l’agréation et à la carto-graphie de données individuelles de manière à en restituer correctement le détail tout en en permettant une lecture d’ensemble. Elle montre de surcroît, que le choix des unités spatiales d’agrégation est une étape fondamentale, au même titre que la discré-tisation des données statistiques. Le décou-page en unités spatiales conduit en effet à des variations notables pour la cartographie qui influence non seulement la valeur loca-lisée des variables cartographiées, mais éga-lement leur lecture et leur interprétation géographique. Dans ce contexte, le choix d’une structure d’agrégation adéquate ap-paraît comme une condition sine qua non pour la visualisation de données, en parti-culier lorsque celle-ci concerne les données issues de modèles individus-centrés fondés sur les Systèmes Multi-Agents. L’intégra-tion de ces choix dans la plateforme de Mo-biSim dédiée à la visualisation des résultats

(4)

13ièmesRencontres de Théo Quant Besançon, 17-19 Mai 2017

constitue de ce fait une perspective majeure de ce travail.

Références

Antoni J.P, Lunardi N., Vuidel G., 2016, Si-muler les mobilités individuelles. Les enjeux de l’information géographique, Revue inter-nationale de géomatique, 26, 2, pp. 237-262. Cauvin C., 2008, Cartographie thématique, Hermes-Lavoisier, 5 tomes.

Delahaie C., 1987, Le carroyage : création d’une entité stable, L’espace géographique, 4, pp. 265-267.

ESPON, 2006, The modifiable areal unit problem, UE Report. http ://www.espon.eu /mmp/online/website/content/projects/261 /431/index_EN.html

Evans I.S., 1977, The selection of class in-tervals, Transactions of the Institute of Bri-tish Geographers, 2, 1, pp. 98-123.

Jenks G.F, Coulson M.R.C., 1963, Class in-tervals for statistical maps, International Yearbook of Geography, 7.

Jenks G.F, Caspall F.C., Error on chorople-thic map : definition, measurement, reduc-tion, Annals of the Association of American Geographers, 61, 2, pp. 217-244.

Openshaw S., 1983, The modifiable area unit problem, Concepts and techniques in modern geography (CATMOG), 41 p. Smith R. M., 1986, Comparing traditio-nal methods for selecting class intervals on choropleth maps, The Professional Geogra-pher, 38, 1, pp. 62-67.

Figure

Figure 1 – Six ensembles d’unités spatiales présentant des structures différentes

Références

Documents relatifs

79 Influence de différentes échelles spatiales et temporelles sur les cortèges de coléoptères saprophiles de la litière Eugénie Cateau & Hervé Brustel ...87 les

Comme les différentes méthodes d’agrégation envisagées dans le paragraphe précédent peuvent conduire à plusieurs résumés ordinaux pour synthétiser les

Cette requête retourne la longueur du parcours, le dénivelé positif, le dénivelé négatif, la durée du parcours sous format décimal dans les deux sens de la route, la distance

En caprin, si le numéro de lactation (L) a un effet significatif (p<0,01) sur la composition en AG du lait, les variations des taux d’AG restent faibles (+0,09% pour les

La race et la production laitière à l’IA ont une influence significative sur les mortalités embryonnaires tardives qui sont plus fréquentes en Prim’Holstein qu’en Normande et

L’espace tend vers une fluidité qui rend la mesure et la précision géométriques une affaire du concepteur. Les ouvertures peuvent assez librement suivre les exigences du programme

n n Les simulations non terminantes commencent avec une initialisati Les simulations non terminantes commencent avec une initialisation du on du système et sont tronquées au bout

I,’observation des 100 grains nécessite donc un changement de champ moins fréquent que dans les autres cas, au détriment des espèces isolées dont les grains