• Aucun résultat trouvé

Le dispositif Esane, ou comment l’utilisation combinée de données administratives et de données d’enquête permet d’améliorer la qualité des données individuelles et des statistiques

N/A
N/A
Protected

Academic year: 2022

Partager "Le dispositif Esane, ou comment l’utilisation combinée de données administratives et de données d’enquête permet d’améliorer la qualité des données individuelles et des statistiques"

Copied!
1
0
0

Texte intégral

(1)

Le dispositif Esane, ou comment l’utilisation combinée de données administratives et de données d’enquête permet d’améliorer la qualité des données

individuelles et des statistiques

Emmanuel Gros 1

1 Insee, 18 bd Adolphe Pinard, 75675 PARIS CEDEX 14, emmanuel.gros@insee.fr

Le nouveau dispositif de production des statistiques structurelles d’entreprises françaises, Esane (Élaboration des Statistiques ANnuelles d’Entreprises), a été mis en place en 2009. Il s’appuie sur une utilisation intensive de sources administratives (déclarations annuelles sur les bénéfices adressées par les entreprises à la direction générale des Impôts, déclarations annuelles de données sociales), complétées par des données obtenues par une enquête statistique réalisée sur un échantillon d’entreprises (cf. Brion 2009 et Gros 2012 pour plus de détails). Cette utilisa- tion conjointe de données administratives et de données d’enquête intervient à différentes étapes du processus d’exploitation des données et ouvre de nouvelles perspectives, tant en termes de contrôle des données individuelles que lors de la phase d’estimation, via la mise en œuvre de procédures de calage et l’utilisation d’estimateurs composites spécifiques.

En ce qui concerne l’amélioration de la qualité des données individuelles, une procédure de contrôle de cohérence entre sources administratives et données d’enquête a été mise en œuvre pour un petit groupe de variables communes aux différentes sources : chiffre d’affaires, partage du chiffre d’affaires entre ventes de marchandise, production de biens et production de services, effectifs salariés et salaires. À l’issue de cette phase de réconciliation des données individuelles, qui peut conduire au rappel de certaines entreprises, on dispose donc, pour chaque variable concernée, d’une variable réconciliée contenant la valeur finale de référence de cette variable.

Ces variables réconciliées ne sont bien évidemment disponibles que pour les unités de l’échan- tillon, de même que d’autres variables-clef du dispositif Esane, tel le code APE. Afin de prendre en compte ces informations disponibles uniquement pour les unités de l’enquête tout en mo- bilisant au mieux l’intégralité des informations administratives, une procédure d’estimation composite spécifique, reposant essentiellement sur des estimateurs par différence, a été mise en œuvre.

Cette présentation exposera en détail le mécanisme de contrôle de cohérence mis en oeuvre ainsi que les estimateurs composites retenus, avant de présenter une évaluation de l’impact de ces améliorations méthodologiques sur la qualité des statistiques produites.

Bibliographie

Brion P. (2009). L’utilisation combinée de données d’enquêtes et de données administratives pour produire les statistiques structurelles d’entreprise, article présenté aux dixièmes Journées de Méthodologie Statistique, Paris, France.

Gros E. (2012). Esane ou les malheurs de l’estimation composite : comment gérer les valeurs négatives d’estimateurs par différence ?, article présenté aux onzièmes Journées de Méthodologie Statistique, Paris, France.

Colloque francophone sur les Sondages 1

Références

Documents relatifs

Mis en œuvre sur la base de la technologie des catalogues électroniqu es, ces SIIO sont particulièrement intéressants car ils ont notamment pour objectif l’amélioration de

● Autres INS très actifs (méthodes, outils, organisation d’ensemble) Préalable nécessaire pour définir. une stratégie d’utilisation des identifiants (Nir, Code statistique

– Inventaire des sources administratives (fiscales, sociales notamment), – Choix des sources appropriées pour le transversal (ossature) ou pour. les besoins plus spécifiques

sèment anticipé et en cas de non-remboursement anticipé. Il choisit le remboursement anticipé lorsque la première est inférieure à la seconde. a) est la mensualité à payer en cas

La base de données doit alors rapprocher pour chaque individu les informations obtenues à l'aide de collectes successives de même nature : par exemple les déclarations annuelles

Mémoire Master MEDAS – INTD CNAM – Amal DHANNOO 25 Ce tableau présente quelques problèmes que l’on peut rencontrer dans le traitement d’une donnée.. Par conséquent, ce

• Évaluation de la qualité dans le cadre de la fusion doit tenir compte de plusieurs facteurs essentiels: la qualité et la cohérence des sources, le pouvoir explicatif des

Line Boulonne, Bertrand Laroche, Céline Ratié, Nicolas Saby.. To cite