• Aucun résultat trouvé

Un support zonal obtenu par agrégation de zones de la base de

Chapitre 2 : Les fonctionnalités des supports d'enquêtes

2.1 Les trois fonctions des supports spatiaux des données de mobilité

2.1.1 Les supports d'analyse

2.1.1.1 Un support zonal obtenu par agrégation de zones de la base de

communication

Dans cette section nous prenons le rôle d'un utilisateur de données. Nous souhaitons faire des analyses descriptives de la mobilité. Nous remarquons que l’Observatoire de la Mobilité en Île-de-France (Omnil) a effectué des analyses disponibles pour le grand public. Ces analyses sont réalisées dans le cadre du Plan de Déplacement Urbain de la région.

- « Les analyses de l’EGT 2010 seule ou en comparaison avec l’EGT 2001 s’appuient sur un découpage de l’Île-de-France basé sur la morphologie des territoires, retenu dans le projet de Plan de déplacements urbains d’Île-de-France, arrêté en février 2012, qui distingue : •Paris,

•le cœur d’agglomération, qui comprend les communes – en continuité de bâti avec Paris – urbanisées (au moins 80 % d’espaces urbanisés au mode d’occupation du sol de 1999) et denses (au moins 80 habitants et emplois à l’hectare urbain construit),

•l’agglomération centrale, qui correspond à l’agglomération parisienne définie par l’Insee (1999),

•les autres agglomérations (hors «agglomération centrale») définies par l’Insee, •l’espace rural ». (Omnil, Enquête Globale Transpot41,p.3)

Cette typologie de l'espace est centrée sur l'urbain dense. Elle fait l'objet d'une cartographie dans la plaquette de l'Omnil (illustration 13).

41 Omnil - Enquête Globale Transport - [en ligne] (consulté le 31/06/2026)

<http://www.omnil.fr/IMG/pdf/egt2010_enquete_globale_transports_-_2010.pdf>

L'Omnil utilise aussi le support des départements de la région pour représenter les flux entre les départements (illustration 14).

À l'aide de ces supports nous observons bien la polarisation parisienne dans l'espace régional francilien. Plus généralement, un support d'analyse doit permettre d'identifier des zones d'intérêt et/ou de compétence pour des organisations ou des collectivités territoriales.

Nous comprenons bien que pour obtenir ces découpages nous devons disposer de données à l'intérieur des zones de ces supports, pour la deuxième carte au moins à une échelle infra- départementale. Les départements doivent contenir des échantillons robustes et sont souvent obtenues par agrégations de zones plus petites. L'Omnil a donc agrégé les données à l'échelle des départements puis en a fait des analyses descriptives. Dans ce cas, l'échelle départementale permet bien de communiquer/cartographier la centralité parisienne.

En tant qu'utilisateurs de données nous comprenons que si nous souhaitons des effectifs d'observations importants pour que les analyses soient robustes, il est possible d'augmenter la taille des échantillons par agrégation de zone. Un nombre suffisant d'observations permet de prétendre à une représentativité socio-économique à l'intérieur des zones. L'agrégation permet de faire gonfler les effectifs mais nous perdons en précision géographique. Le besoin de disposer d'un gros échantillon posera donc le problème de l'agrégation (perte de précision)

dans les cas où les données sont obtenues par enquête avec un faible taux d'échantillonnage. De plus, l'agrégation pose des problèmes de lissage. L'opération d'agrégation pour construire des supports d'analyses lisse l'information (Smoothing effect42 (Openshaw, 1977) et augmente

artificiellement les différences entre zones dans la répartition spatiale des variables à étudier. Du point de vue intra-zone, la répartition spatiale est lissée à une valeur moyenne ou modale. Pour les variables de localisation l'opération de lissage réduit une distribution des points d'observation à une position centrale. Cette opération renforce les différenciations spatiales des indicateurs statistiques car les variables de localisation ne sont plus continues mais discrètes. Elles créent alors des discontinuités et des seuils. En fonction des besoins il est aussi nécessaire d'agréger les variables non spatiales, notamment socio-économiques. Cela peut conduire à la création d'un individu-moyen (Quetelet, 1835), (Desrosières, 2002), (King, 1997b). Pour éviter de faire des hypothèses trop fortes, les utilisateurs de données attendent un support de donnée le plus fin possible pour pouvoir disposer du plus grand éventail de possibilité pour agréger à façon. Cela dépend du support de la base de donnée diffusé par les producteurs.

Avant de présenter la fonctionnalité du support de la base de données, nous montrons un autre type d'adaptation du support de base de données que celui de l'agrégation : le passage d'un support zonal à un support d'analyse linéaire. Cela permet d'introduire le concept de données modélisées pour répondre aux faibles tailles d'échantillon et donc de proposer une première alternative à l'agrégation pour disposer d'échantillon plus grand. Ensuite nous reprendrons le fil annoncé par l'introduction du chapitre : la fonctionnalité de support de la base de données diffusée.

42 Aujourd'hui nous connaissons bien les sources de la variabilité de ces analyses. : -« The decades

of research on the MAUP and the ecological inference problem have clearly identified the source of these problems The smoothing effect that results from averaging is the underlying cause of both the scale problem in MAUP and aggeration biais in ecological studies. As heterogeneity among units decreases through aggregation, the uniqueness of each unit and the dissimilarity among units are reduced. As Openshaw (194) noted, « wheter the ecological fallacy problem exists or not depends on the nature of the aggregation. A completely homogeneous grouping system would be free of this problem ». (King,2004,p.234)

L’auto-corrélation spatiale est intiment liée à cette problématique. « There is, however, another

mitigating factor : spatial autocorrelation. The decrease in variability is moderated by negative autocorrelation among the original observations and exacerbated by negative autocorrelation (Arbia, 1986 , and Cressi 1993, both illustrate the effcet of autocorrelation on the variance of the sample mean). When areal units are similar to begin with, the aggreagtion process results in much les information loss than it does with highly dissimilar unirs. » (King,2004,p.234)

2.1.1.2 Un support linéaire pour l'analyse du trafic : le passage