• Aucun résultat trouvé

Les données de contrôle pour ventiler les lieux de résidence

Chapitre 3 : Clonage et ventilations spatiales sous contraintes d'observations

3.2 La ventilation spatiale sous contraintes

3.2.2 Les données de contrôle pour ventiler les lieux de résidence

La méthodologie de désagrégation spatiale des données du recensement s'appuie sur des données de contrôle. La suite de ce chapitre présente les données de contrôle que nous allons utiliser dans notre cas d'application à l’Île-de-France. Nous commençons par présenter la source de données à désagréger. Les données de mobilité du recensement sont diffusées par l'intermédiaire du fichier MOBPRO de l'exploitation complémentaire (chapitre 2.3). Nous avons annoncé qu'il existe un fichier confidentiel non diffusé publiquement regroupant l'ensemble des variables de l'exploitation complémentaire des fichiers diffusés librement. Toutefois nous faisons le choix d'utiliser les données disponibles pour le grand public. De cette manière nous considérons que le fichier MOBPRO est la source de données à désagréger. Et, nous considérons les autres fichiers détail, en particulier le fichier INDCANTVILLE, comme des sources de données de contrôle.

Nous présentons donc le fichier MOBPRO, le fichier INDCANTVILLE puis les données carroyées de population. Cette présentation s'attache à montrer les différences de supports des données et les différences d'effectifs de population dénombrés par ces fichiers.

3.2.2.1 Le support communal du fichier MOBPRO

Puisque nous nous intéressons à la dimension spatiale de la mobilité domicile-travail, nous commençons par un travail de cartographie du support de l'information géographique du fichier MOBPRO. Ce travail permet de présenter la zone d'étude, et de comparer les différents niveaux de finesse des données de contrôle présentées par la suite. Cela permet aussi d'exposer les effectifs d’individus que les différents sources de données et supports comptabilisent.

Dans le cas d'application de cette thèse, le fichier utilisé est le fichier MOBPRO 2012 diffusé en octobre 2015 sur le site de l'Insee. Il estime 5 398 596 actifs occupés au 1er Janvier 2012. Il contient 1 955 156 observations avec un poids moyen de 2,8. Comme la cartographie des couples origines-destinations serait illisible, la répartition spatiale des observations MOBPRO est décomposée en deux cartes : les effectifs aux lieux de résidence et aux lieux d'emploi (illustrations 19 et 20).

Illustration 19

Le département parisien puis les départements constituant la petite couronne (92,93,94) sont ceux concentrant les populations aux lieux de résidence et d'emploi. Toutefois ce sont les arrondissements périphériques parisiens qui constituent l'anneau de plus forte densité de population et de travail et non les arrondissements plus centraux.

Précisons avant toute chose que ce type de carte présente des biais inhérents à l'approche adoptée pour la représentation des populations, du fait qu'elle viole des règles importantes de sémiologie graphique (Bertin, 1967). Ici, une règle élémentaire n'a pas été respectée : la cartographie d'une variable dénombrant des effectifs doit se faire avec des cercles proportionnels. Mais une telle carte serait illisible. C'est pourquoi les effectifs sont représentés à l'aide d'une carte choroplète. Il faut donc faire attention aux variations de taille des zones du support. Est-ce que les arrondissements parisiens externes sont plus forts en effectif parce qu’ils sont de plus grande taille ou bien sont-ils plus denses ? C'est bien en descendant d'échelle ou en disposant d'un support régulier que nous allons pouvoir le savoir. 3.2.2.2 Le fichier INDCANTVILLE

Parmi les jeux de données utilisés dans la méthode de changement de support le fichier détail INDCANTVILLE est utilisé. Ce fichier décrit l'ensemble de la population enquêtée qu'elle soit active occupé ou non. À l'instar du fichier MOBPRO le fichier INDCANTVILLE fait partie de l'exploitation complémentaire et renseigne sur la composition des ménages, les secteurs d'activité et sur d'autres caractéristiques socio-démographiques de manière plus précise que le fichier MOBPRO. Rappelons que nous cherchons dans ce fichier des données de contrôle c'est-à-dire apportant une connaissance plus fine que la source de données à désagréger, qu'elle soit spatiale ou sociale. Ce fichier, malgré sa localisation à peine plus fine que MOBPRO, voire moins précise dans certains cas, sera une source de données de contrôle. Bien que les deux fichiers contiennent les mêmes actifs occupés, les observations ne sont pas décrites de la même manière et il n'existe pas d'identifiant permettant de retrouver les correspondances entre les deux fichiers. Il s'agit bien de sources de données différentes que nous allons apparier (chapitre 4.1). De plus le fichier INDCANTVILLE contient toutes les autres observations y compris les actifs non occupés et les inactifs. La méthode d'appariement des fichiers MOBPRO et INDCANTVILLE que nous avons conçue est présentée au chapitre 4.1.

décrivant les localisations ne sont pas les mêmes. Premièrement dans le fichier INDCANTVILLE il n'y a pas de description des lieux de travail. Deuxièmement la

description des lieux de résidence est moins précise pour les habitants des communes de moins de 10 000 habitants. Dans ces cas nous ne connaissons plus les communes de résidence mais les cantons. Mais pour les grandes communes nous gagnons en revanche en précision sur les lieux de résidence. Pour ces types d'espaces, nous allons passer de la connaissance de la commune aux Iris de résidences. Comme le montre la carte du support Iris/pseudo-canton (illustration 21) nous gagnons en précisions pour les zones à forts effectifs. Précisions que l'IGN ne diffuse pas ce support géographique en une seule couche d'information géographique. Cette carte est une estimation des limites de ce support. Rappelons que les IRIS et les cantons évoluent dans le temps.

Aussi avec l'utilisation du fichier INDCANTVILLE comme données de contrôle nous allons gagner en description des profils socio-économiques. Nous avons notamment un secteur d'activité décrit en 17 classes et non en 5 comme dans le fichier Mobpro. Cette plus grande finesse de description des activités de travail des individus va nous être grandement utile pour la ventilation des lieux d'emploi. L'utilisation du fichier INDCANTVILLE nécessitera d'apparier les fichiers détail du recensement afin de disposer des descriptions les plus fines de

chacun des deux sources d'information pour le mettre en relation avec Mobpro (chapitre 4.1). Nous disposerons à l'issue de ce processus d'un fichier dit apparié informant sur les lieux de résidence sur un support IRIS-Communes pour les observations appartenant à des ménages avec au moins un actif occupé, et indiquant les lieux d'emploi à la commune pour l'ensemble des actifs occupés.

Insistons sur le fait que parmi les données internes à l'Insee, le fichier confidentiel du recensement regroupe l'ensemble des variables diffusées dans les deux fichiers détail INDCANTVILLE et MOBPRO. Si le travail de désagrégation est réalisé à partir du fichier confidentiel alors l'utilisation d'INDCANTVILLE et l'étape d'appariement n'est plus nécessaire.

3.2.2.3 Les carroyages de population

La désagrégation des lieux de résidence est constituée d'une seconde étape, en continuant notre descente d'échelle. Les lieux de résidence du fichier apparié (que nous nommons INDCANTVILLE-MOBPRO) sont transférés du support IRIS-Communes au support carroyé de 200 m de côté diffusé par l'Insee en janvier 2013 (encadré 1). Ce support a été diffusé par l'Insee conjointement au support carroyé de 1 km répondant aux recommandations INSPIRE. Ce carroyage de 200 m constituera une étape intermédiaire avant la ré-agrégation au carroyage INSPIRE de 1 km.

A l'aide du support Insee de 200m nous disposons des effectifs de ménages et d'individus. Les carreaux ne contenant pas de population ne sont pas présents, le carroyage diffusé est donc discontinu. Les données sont issues des fichiers de la taxe d'habitation et des revenus fiscaux localisés ; il s'agit donc d'une source relativement distincte du recensement rénové.

« Les revenus fiscaux localisés (RFL) sont établis à partir des fichiers exhaustifs des déclarations de revenus des personnes physiques et de la taxe d'habitation fournis à l'INSEE par la Direction Générale des Impôts. L'INSEE procède au rapprochement de ces deux fichiers afin d'estimer le revenu fiscal à des niveaux géographiques finement localisés, tout en préservant la confidentialité des données.

Les données fournies ici proviennent d'une exploitation spécifique des fichiers fiscaux visant à attribuer à chaque ménage une position géographique précise. Les données carroyées de population sont cohérentes avec les données diffusées par la source

« revenus fiscaux localisés », mais elles ne peuvent fournir qu'une vision partielle de la population, rappelons que par rapport au recensement :

les populations non référencées à la taxe d'habitation ne sont pas présentes : personnes sans domicile, collectivités ;

les étudiants sont généralement localisés au domicile de leurs parents ;

La notion de résidence principale peut être sensiblement différente.

Les données des carreaux de 200 m de coté sont dans les mêmes systèmes de projection que les données à 1km. Les carreaux de 200m de coté correspondent à une subdivision interne en 25 éléments des carreaux de 1km de coté. » (Insee, Documentation générale sur le carroyage72)

Le carroyage de 200 m va servir de support de contrôle (illustration 23). C'est donc à l'aide du carroyage de 200 m que nous allons descendre plus bas que la résolution de 1 km, au risque de perdre la représentativité statistique sur les carreaux de 200 m. Cependant, la ré-agrégation sur les carreaux INSPIRE de 1 km permettra de retrouver cette représentativité. L'opération de ré-agrégation sera facilité puisque ces deux supports entretiennent une relation hiérarchique : ils sont emboîtés.

Les sources d'information pour construire ces carroyages sont bien différentes des enquêtes annuelles du recensement. Les données de population carroyées ont introduit la structure des données des revenus fiscaux déclarés par les ménages. L'utilisation des données de population carroyées en tant que données de contrôle permet d'ajouter cette information externe au recensement. L'utilisation des données confidentielles (CASD) n'utiliserait que cette source d'information supplémentaire.

Le tableau suivant décompte les effectifs des données de contrôle utilisées pour ventiler les lieux de résidences.

72 Insee. Documentation générale sur le carroyage [en ligne] (Consultée le 12/04/2014)

http://www.insee.fr/fr/themes/detail.asp?reg_id=0&ref_id=donnees-carroyees&page=donnees- detaillees/donnees-carroyees/donnees_carroyees_doc.htm

Tableau 7 : Décompte des populations en Île-de-France INDCANTVILLE (1er janv 2012) MOBPRO (1er janv 2012) Carroyage (2009)

Population totale Total 11 898 049

(4 301 151 observations) N.A N.A En ménages ordinaires 11 661 516(4 231 656 observations) N.A 11 368 420 Hors ménage ordinaires 236 532,6(69 495 observations) N.A N.A Effectif d'actifs occupés de + 15 ans révolus Total 5 398 596 (1 955 156 observations) 5 398 596 (1 955 156 observations) N.A En ménages ordinaires (1 939 1605 348 251 observations) 5 348 251 (1 939 160 observations) N.A Hors ménage ordinaires 50 344 (15 996observations) (15 99650 344 observations) N.A

Source : RP 2012 exploitation complémentaire, Revenu Fiscaux localisés 2009

Les données carroyées à 200m de l'Insee nous permettent de disposer d'une information sur les effectifs de population plus fine que les communes de résidence (illustration 22). Toutefois nous ne connaissons pas les effectifs des actifs occupés. C'est pourquoi le processus de changement de support de cette thèse va affecter de nouvelles localisations résidentielles (sur des carreaux de 200 m) à l'ensemble de la population du fichier INDCANTVILLE et non pas seulement aux actifs occupés. Ainsi, pour les lieux de résidence le travail de désagrégation est effectué pour les observations de l'exploitation complémentaire (ménages avec au moins un actif occupé).

Une fois que nous aurons transféré les localisations des observations de l'exploitation complémentaire au lieu de résidence et au lieu d'emploi pour les actifs occupés nous allons ré-agréger les localisations sur le carroyage INSPIRE de 1 km diffusé en janvier 2013 par l'Insee73 (illustration 23). Le choix d'utiliser le support de 1 km comme support final est

conforme à la directive européenne INSPIRE (chapitre 2). L'idée est de produire une source

73 Précisons que les supports des données carroyées ne recouvrent pas l'ensemble de l'espace géographique. Seul les carreaux contenant une population résidente sont retenus. Des lieux d'emploi peuvent ne pas être contenu dans les carreaux. Nous avons ajouté quelques carreaux au carroyage originalement diffusé par l'Insse, notamment dans les zones aéroportuaires.

d’information dont les mailles du support de diffusion permettraient aux différents utilisateurs de ré-agréger à façon le support régulier.

De plus, pour revenir sur le choix cartographique d'une carte choroplète afin de représenter des effectifs de population un support régulier permet d'outre-passer la règle de sémiologie graphique nous imposant d'effectuer des cartes par cercles proportionnelles. Les cartes d'effectif de population sur un support régulier sont des cartes de densités de population.

3.2.3 Les données de contrôle pour ventiler les lieux de