• Aucun résultat trouvé

La v´erification des donn´ees (”data editing”) Principes, mise en oeuvre

N/A
N/A
Protected

Academic year: 2022

Partager "La v´erification des donn´ees (”data editing”) Principes, mise en oeuvre"

Copied!
2
0
0

Texte intégral

(1)

La v´ erification des donn´ ees (”data editing”) Principes, mise en oeuvre

Philippe Brion

La v´erification des donn´ees (”data editing”) recouvre les activit´es de d´etection et de correction des erreurs qui sont men´ees dans le cadre de la production de statistiques. Bien que ces ac- tivit´es n´ecessitent beaucoup de ressources pour un institut statistique, il semble qu’elles aient fait l’objet d’assez peu d’articles en fran¸cais (en particulier si l’on compare aux probl`emes pos´es par le traitement des non-r´eponses), alors qu’elles ont connu un certain nombre d’´evolutions fortes durant les trente derni`eres ann´ees.

L’objectif de cet atelier est donc de poser, d’abord, le probl`eme, et dresser ensuite un panorama des diff´erentes m´ethodes utilis´ees `a l’heure actuelle.

Plan de l’atelier

1. Principes:

(a) la n´ecessit´e de contrˆoler les donn´ees collect´ees: types de contrˆoles (logiques, fourchettes,

´

evolutions, ...), variables li´ees

(b) le lien entre contrˆoles et redressements

(c) l’impossibilit´e de ”tout nettoyer”, les contraintes budg´etaires (d) micro-contrˆoles et macro-contrˆoles.

2. Les diff´erentes m´ethodes:

(a) les m´ethodes de contrˆole automatique (”automatic editing”), en particulier pr´esentation rapide de la m´ethode de Fellegi Holt

(b) la v´erification s´elective (”selective editing”): l’utilisation de scores relatifs `a chaque unit´e pour mesurer l’impact d’une donn´ee jug´ee suspecte sur une statistique cible, les scores locaux et globaux

(c) la v´erification en sortie (”output editing”)

(d) la mise en place d’une strat´egie globale articulant les diff´erents m´ethodes

(e) l’importance des m´etadonn´ees, en particulier dans le cadre d’un processus d’am´elioration en continu du dispositif de contrˆole redressements.

1

(2)

Bibliographie

[1] ISTAT, CBS and SFSO (2007). Recommended practices for editing and imputation in cross- sectional business surveys, manuel mis au point dans le cadre d’un projet d’Eurostat.

[2] De Waal, T., Pannekoek, J., Scholtus, S. (2011). Handbook of statistical data editing and imputation, Wiley.

[3] Documentation relative aux ”work sessions” des Nations unies consacr´ees au data editing, disponible `a l’adresse

http://www1.unece.org/stat/platform/display/kbase/UNECE+Work+Sessions+on+Statistical+Data+Editing

2

Références

Documents relatifs

[r]

Imaginer et tester (avec phpPgAdmin ou dans l’interface en ligne de commande) des requˆ etes SQL pour r´ ecup´ erer les informations suivantes :2. a) L’ensemble des

Figure 4: ´ Evaluation de la qualit´e visuelle apr`es insertion r´eversible de la charge utile maximale dans l’image leba pour diff´erentes tailles de blocs.. Le syst`eme visuel

PR ´ EPARATION DES DONN ´ EES Pour pouvoir manipuler ce fichier (et faire des statistiques dessus), il faut le stocker dans une variable de type un peu sp´ ecial qu’on

Interrogeons nous maintenant sur la fa¸con dont sont construits ces tests multidimensionnels, autrement dit sur la fa¸con dont sont obtenues les matrices E pour les erreurs du

Introduction.- En langage C, l’acc`es ` a un ´el´ement d’un tableau peut se faire classiquement par le nom du tableau accompagn´e d’un index, mais aussi par un pointeur

S’il y en a, on sauvegarde sur la pile l’adresse du segment des donn´ees, on confond le segment des donn´ees avec le segment de code, on sauvegarde sur la pile les contenus

Nous voyons apparaˆıtre ici une courbe de densit´ e , bien qu’elle ne soit pas sous la forme actuelle (la th´ eorie des fonctions est encore en ´ evolution ` a cette ´ epoque),