Méthodologie; défis présents et futurs
Conférence des journées de la francophonie Sylvie Michaud
14 octobre 2016
14 octobre 2016
Statistics Canada • Statistique Canada
2
Aperçu
Mise en contexte
Défis actuels et futurs
Recherche et méthodes
Ressources humaines
14 octobre 2016
Statistics Canada • Statistique Canada
3
Mise en contexte
Utilisateurs veulent plus de données, à des niveaux désagrégés plus fins, plus rapidement, pour répondre à des questions de plus en plus complexes
On observe un déclin des taux de réponse, particulièrement parmi les enquêtes sociales;
Mesures mises en place pour minimiser le
fardeau de réponse
14 octobre 2016
Statistics Canada • Statistique Canada
4
Mise en contexte
Les enquêtes vont rester nécessaires. Nous devons :
• continuer le travail existant pour améliorer les processus d’échantillonnage
• examiner les para-données pour maximiser l’efficacité du processus de collecte (et dans certains cas se servir de cette information durant la pondération)
• continuer à produire des méthodes robustes pour évaluer la qualité des réponses, faire les ajustements nécessaires et rendre cette information accessible
• Assurer la confidentialité …
14 octobre 2016
Statistics Canada • Statistique Canada
5
Mise en contexte
Nous continuerons aussi notre utilisation des données administratives
• Plus de 800 sources utilisées,
• Permettent de limiter le fardeau de réponse,
• Doit examiner les questions d’assurance de la qualité, de confidentialité…
14 octobre 2016
Statistics Canada • Statistique Canada
6
Mise en contexte
Des données administratives (incluant les données volumineuses) sont disponibles et de plus en plus utilisées (pas juste par les agences statistiques)
• OCDE et Facebook
• Nouvelle-Zélande; données scanner et données en ligne
14 octobre 2016
Patrick Dunagan, Google and Terra-Bella- Third Big Data Conference August 2016
7
14 octobre 2016
Patrick Dunagan, Google and Terra-Bella- Third Big Data Conference August 2016
8
Défis actuels et futurs
La méthodologie doit continuer à innover, dans les domaines traditionnels mais aussi dans des nouveaux domaines:
• Imagerie satellite combinée avec les données d’enquêtes
• Recensement et la segmentation pour les stratégies de marketing
• …
02/27/2022
Statistics Canada • Statistique Canada
9
14 octobre 2016
Statistics Canada • Statistique Canada
10
Défis actuels et futurs
1. L’intégration de diverses sources de données
Les données administratives (incluant les données volumineuses) posent des défis d’intégration
Qualité du processus de jumelage
Problème de couverture, de non-réponse (ou parfois les deux…) ?
Quel est l’impact de l’erreur de réponse / mauvaise classification ?
Comment traiter efficacement des larges volumes de données ?
Comment assurer la qualité dans ces nouveaux processus ?
Adaptation du cadre de RTI pour leur support aux objectifs de développement durable
02/27/2022
Inspiré de Luis Crouch – RTI – Third Big Data Conference – Sept. 2016 Statistics Canada • Statistique Canada
11
Objectifs de l’intégration
Population
Caractéristiques de cette population / variables d’intégration
Sept dimensions de la qualité
(comparabilité ajouté à nos dimensions) Ressources
Caractéristiques des sources (enquête transversale, complexité …)
Outils de
« collecte »
SMS
Téléphones,RVI Données admin.
Crowdsourcing Données non
structurées Entrevues personnelles
améliorées
contexte
14 octobre 2016
Statistics Canada • Statistique Canada
12
Défis actuels et futurs
1. L’intégration de diverses sources de données Besoin de continuer la recherche sur :
Les techniques de jumelage
Les techniques d’appariement statistique La modélisation des petites régions
Les techniques d’intégration
14 octobre 2016
Statistics Canada • Statistique Canada
13
Défis actuels et futurs
2. Des registres statistiques interconnectés; nous avons un registre d’adresses et un registre d’entreprises; nous devons continuer à améliorer leur qualité. Mais devons nous aller plus loin ?
pour créer des bases de sondages, pour la pondération
pour supporter la collecte,
pour supporter l’intégration ?
14 octobre 2016
Statistics Canada • Statistique Canada
14
Défis actuels et futurs
Registres statistiques intégrés
spatialGéo- Personnes
?
Activités ? Environnement?
Entreprises Institutions…
adresses
14 octobre 2016
Statistics Canada • Statistique Canada
15
Défis actuels et futurs
3. Rapidité d’exécution : comment peut-on fournir de l’information de qualité le plus rapidement possible ?
• Continuer l’utilisation de systèmes génériques
Développer de façon agile pour inclure des nouvelles fonctionnalités,
Ré-utiliser ce qui est fait ailleurs lorsque c’est possible,
Algorithmes d’optimisation
• Examiner des nouveaux modes de collecte ?
Comment faire des tests de contenu plus rapidement
14 octobre 2016
Statistics Canada • Statistique Canada
16
Défis actuels et futurs
3. Rapidité d’exécution (suite)
• Automatiser pour limiter/éliminer le nombre d’interventions manuelles
L’auto-codage par les répondants
Apprentissage statistique (machine learning) pour le codage, le jumelage statistique et des méthodes de contrôle de la qualité ?
Ressources humaines
4. Possiblement besoin de valoriser de nouvelles expertises méthodologiques, en plus de celles qui existent
• Recherche opérationnelle
• Optimisation
• « scientistes de données »
• Model based ?
• Expériences multi-disciplinaires
02/27/2022
Statistics Canada • Statistique Canada
17
Conclusions
Futur excitant pour les agences statistiques et pour la méthodologie
• Nous devons continuer le bon travail déjà en cours
• En plus des domaines traditionnels de recherche, il y en a plusieurs nouveaux qui s’ouvrent à nous.
Soyons curieux pour explorer les nouvelles possibilités qui s’offrent à nous …
02/27/2022
Statistics Canada • Statistique Canada
18