• Aucun résultat trouvé

Passer du recensement aux sources fiscales pour le nouvel échantillon-maître de l'Insee : le projet Nautile (Nouvelle Application Utilisée pour le Tirage des Individus et des Logements des Enquêtes)

N/A
N/A
Protected

Academic year: 2022

Partager "Passer du recensement aux sources fiscales pour le nouvel échantillon-maître de l'Insee : le projet Nautile (Nouvelle Application Utilisée pour le Tirage des Individus et des Logements des Enquêtes)"

Copied!
27
0
0

Texte intégral

(1)

D’Octopusse à Nautile

ou changement de source pour la base de sondage des enquêtes ménages de l’Insee

Ludovic VINCENT

Direction de la Méthodologie et de la Coordination Statistique Internationale

Insee - France

10

e

Colloque francophone sur les Sondages

Lyon

(2)

Plan de la présentation

L’échantillonnage des enquêtes-ménages à l’Insee

– Le principe de l’échantillon-maître

– Le recensement comme base de sondage

Pourquoi changer ? Pour quoi changer ?

– Changer l’échantillon-maître et revoir la méthode

– Une nouvelle source, Fidéli

Les conséquences du changement

– Un nouvel échantillon-maître

– De nouveaux concepts, de nouvelles variables

(3)

L’échantillonnage

des enquêtes-ménages à l’Insee

(4)

Le principe de l’échantillon-maître

Les enquêtes ménages de l’Insee :

– Enquêtes sur les revenus, la santé, les conditions de vie, la mobilité…

– Souvent en face-à-face

– Devant représenter tout le territoire

L’Insee possède un réseau d’enquêteurs sous contrat

– Mais un nombre limité d’enquêteurs…

– ...ne pouvant pas arpenter l’ensemble du territoire.

→ Recours à la méthode de l’échantillon-maître (EM)

(5)

Le principe de l’échantillon-maître

D’un point de vue pratique

D’un point de vue théorique : tirage à deux degrés

– 1

er

degré : Tirage d’unités primaires (UP), les zones constituant l’échantillon-maître

Un échantillon de zones représentant le territoire

Des zones qu’un enquêteur peut couvrir

– 2

e

degré : Tirage d’unités secondaires au sein de chaque unité primaire, les logements

Créer une partition du territoire

Sélectionner

intelligemment les zones

Affecter un enquêteur à chaque zone

Tirer des logements dans

chaque zone, pour chaque

enquête, à partir d'une base de

sondage.

(6)

Le recensement comme base de sondage

Depuis les années 60, utilisation des recensements de la population pour la définition de l’échantillon-maître

Avec le recensement rénové de 2004

– Le nouveau recensement en deux mots,

Répartition initiale en 5 groupes

Des communes de moins de 10 000 habitants

Des adresses dans les communes de plus de 10 000 habitants

Chaque année, une enquête (EAR – enquête annuelle de recensement) sur un groupe telle que :

les communes de moins de 10 000 habitants du groupe sont recensées

40 % des adresses du groupe dans les communes de plus de 10 000 habitants

sont recensées

(7)

Le recensement comme base de sondage

Avec le recensement rénové de 2004

– Constitution de l’échantillon-maître

Partition du territoire en unités primaires

Comme ensemble de communes

Chaque UP possède suffisamment de logements pour que l'enquêteur affecté ait du travail chaque année.

Chaque UP possède suffisamment de logements pour éviter des réinterrogations sur 10 ans (au moins 300 résidences principales de chaque groupe de rotation dans chaque UP).

Tirage équilibré de l’échantillon-maître en 2009

équilibré sur les 5 groupes de rotation

– Au deuxième degré, sélection des logements

au sein des unités primaires de l’échantillon-maître

parmi les logements recensés dans l'année.

(8)

Pourquoi changer ?

Pour quoi changer ?

(9)

Changer l’échantillon-maître et revoir la méthode

● Un besoin régulier de renouveler l’échantillon- maître

– Ne pas toujours réinterroger les mêmes logements

Épuisement des zones de collecte

– Des zones qui ne représentent plus le territoire

Perte de qualité de l’échantillon-maître

(10)

Changer l’échantillon-maître et revoir la méthode

Une méthode à revoir

– Déséquilibre des groupes de rotation et donc de tout échantillon-maître issu de la même méthode

Source : Insee

(11)

Changer l’EM et revoir la méthode

Un système trop complexe

– Répartition en groupes de rotation, sélection d’adresses, partition liée au groupe, tirage équilibré par groupe…

Deux sources de base de sondage rendant difficile la disjonction des enquêtes

– Certains tirages sont effectués dans les sources fiscales

– Difficile de repérer dans le recensement de la population les

logements interrogés après tirage dans les sources fiscales

(12)

Une nouvelle source, Fidéli

Constitution d’un nouveau fichier : Fidéli

FIchier DÉmographique des Logements et des Individus

Issu des sources fiscales

Taxe foncière : impôt pour le propriétaire d'un logement

Taxe d'habitation : impôt pour l'occupant d'un logement

Impôts sur le revenu

Apuré

Suppression de doublons

Redressement de variables

Complété

Géocodage, ajout des prestations sociales...

(13)

Une nouvelle source, Fidéli

Les avantages d’une bonne base de sondage

– Unicité – absence de doublon

– Fraîcheur

– Exhaustivité

– Informations auxiliaires intéressantes

– Une seule source pour toutes les enquêtes

Mais règles administratives de gestion et non statistiques

– Domiciliation, rattachement des enfants aux deux parents...

(14)

Les conséquences du changement

(15)

Un nouvel échantillon-maître

Partition du territoire en 5000 zones

– Ensemble de communes

– De 2500 résidences principales minimum

– Les moins étendues possible

Grâce à une réponse au problème du voyageur de commerce

(16)

Un nouvel échantillon-maître

L’abandon du recensement de la population permet de

s’affranchir de la contrainte sur les cinq groupes de rotation

– Des unités primaires avec plus de résidences principales

donc pouvant durer plus longtemps, sans réinterrogation

– Des unités primaires moins étendues

inutile d’aller chercher une commune de chaque groupe dans chaque

unité primaire

(17)

Un nouvel échantillon-maître

● Sélection de l’échantillon-maître

– Les objectifs :

Obtenir un échantillon-maître représentatif du territoire

– pour un maximum d’enquête, sur des thèmes différents

– Pendant 10 ans

Respecter les contraintes de précision imposées par Eurostat

Sélectionner un nombre de zones que le réseau des

enquêteurs peut couvrir

(18)

Un nouvel échantillon-maître

Sélection de l’échantillon-maître

– La méthode

Tirage spatialement équilibré (Grafström et Tillé, 2008)

Équilibrage par région

Sur des variables majeures

Sur les premiers axes d’une ACP sur les UP portant sur un grand nombre de variables socio-démographiques

Conséquences :

L’échantillon-maître n’est pas directement équilibré sur toutes les variables socio-démographiques souhaitées

Mais est plus représentatif pour un plus grand nombres de variables et d’enquêtes

Coordination avec l’échantillon de l’enquête emploi en continu

À travers des unités de coordination de 10 000 résidences principales minimum

(19)

Un nouvel échantillon Maître

● L’abandon du recensement de la population permet

– d’utiliser des variables de revenus

Très explicatives pour beaucoup d’enquêtes

– de s’affranchir de contraintes de représentativité sur les cinq groupes de rotation

Moins de contraintes, donc plus de précision

Ou moins de zones, et donc moins de territoire à couvrir

(20)

De nouveaux concepts, de nouvelles variables

Une population proche du bilan démographique, sur toutes les années de naissance

population (métropole et DOM) de 67 149 919 dans Fidéli 2016, 66 954 000 dans le bilan

démographique.

(21)

De nouveaux concepts, de nouvelle variables

Même si localement, on peut trouver des différences

– Notamment dans les DOM

0 à 4 ans 5 à 9 ans 10 à 14 ans 15 à 19 ans 20 à 24 ans 25 à 29 ans 30 à 34 ans 35 à 39 ans 40 à 44 ans 45 à 49 ans 50 à 54 ans 55 à 59 ans 60 à 64 ans 65 à 69 ans 70 à 74 ans 75 à 79 ans 80 ans et plus

Estmaton de populaton Fidéli 2015

Les individus par tranches d’âge en Guyane

(22)

De nouveaux concepts, de nouvelles variables

● Stratification et post-traitements

– Quelques variables ne sont plus disponibles

Diplôme

Catégorie socio-professionnelle

– Mais de nouvelles variables importantes

Montant des revenus individuels (et par logements)

Types de revenus (salaires, pensions...)

(23)

De nouveaux concepts, de nouvelles variables

● Un repérage qui évolue

– Disparition des informations « recensement »

Repérage « normalisé » pour le recensement

Mais déjà, des défauts avec le recensement pas internet

– De nouvelles opportunités d’interrogation et de repérage à étudier

Une information géolocalisée et géocodée

Présence du mail et de numéros de téléphones des déclarants

Informations complémentaires sur l’adresse

– Dépendance, présence de commerces, communautés…

– Plusieurs adresses pour un individu

(24)

De nouveaux concepts, de nouvelles variables

● Des changements intervenant dans la définition du concept

– Le logement ordinaire

Des logements connus de la taxe d’habitation

D’autres logements aux contours plus flous

– Présence de communautés

– Foyers fiscaux non rattachés à des structures identifiées – Le concept de résidence principale

Des intérêts divergents entre bases administratives et

enquêtes de recensement

(25)

De nouveaux concepts, de nouvelles variables

Les risques

– Mauvaise couverture de la base

Hors champ et champ non couvert

Doubles comptes

– Un concept différent

Impact sur les estimations produites

Réflexion sur la définition du logement ordinaire, vis-à-vis du recensement

Les solutions envisagées

– Travaux pour rapprocher le concept de résidences principales de celui du recensement

– Études approfondies des populations mal appréciées dans les bases

– Enquêtes et tests sur les informations Fidéli

(26)

Conclusion

Une simplification de la méthode par l’abandon du recensement de la population

– Gain en précision en s’affranchissant des groupes de rotation

– Utilisation d’une base exhaustive

Permettant une méthodologie innovante pour la sélection du nouvel échantillon-maître

– Tirage spatialement équilibré sur variables et axes d’ACP

– Coordonné avec l’échantillon de l’enquête emploi en continu

Mais un changement de source à anticiper

– Modification des variables disponibles pour la stratification et les post-traitements

– Changement d’informations pour le repérage

– Modification de l’appréhension du champ des enquêtes ménages du fait de

sources divergentes

(27)

D’Octopusse à Nautile

ou changement de source pour la base de sondage des enquêtes ménages de l’Insee

Insee

www.insee.fr

Ludovic VINCENT

ludovic.vincent@insee.fr

Merci de votre attention

Avez-vous des questions ?

Références

Documents relatifs

isolation de rampants de combles IKO enertherm comfort easy : isolation de sol de combles IKO enertherm wall : isolation pour murs creux IKO enertherm wrap :. isolation de

Découpe et colle le bon nombre de pieds et de bouches pour chaque groupe d’enfants.. Utiliser si tirage noir et blanc Couper par bandes et utiliser en collant des «

Il s sont l'abou- ti ssement de chaque situation pensée , de chaque geste dan s sa vérité

J’affirme que j’ai construit deux poly` edres convexes : l’un dans lequel toutes les faces ont six arˆ etes ou plus et l’autre dans lequel les nombres d’arˆ etes qui partent

En classe entière, on étudie les questions posées sur chaque thème ainsi que les réponses apportées par chacun. Détail de L'école d'Athènes de

• Création de variables transformées pour intégrer dans l’équilibrage des UP des variables de l’EEC qui permettront aux UC tirées d’être précises sur ces variables. • On

Pour chaque groupe de cartes, relie à main levée :.. • par un trait vert, les figures qui ont le même

On tire au hasard 6 cartes en remettant apr` es chaque tirage la carte tir´ ee dans