Techniques d’enquête
Chapitre introductif
Delphine Boutin
delphine.boutin@uca.fr
Techniques d’enquêtes Chapitre introductif
Objectifs:
Introduction à la méthodologie de la conception des questionnaires et à l’analyse d’enquêtes.
Fournir les outils pour comprendre pourquoi des erreurs peuvent apparaître lorsque l’on fait des statistiques, mais surtout comment les minimiser.
Être capable de réaliser sa propre enquête ou sa propre expérience contrôlée.
Plan:
Intro: définitions, présentations des enquêtes Types d'erreurs rencontrées
Mener une enquête: conception du questionnaire Echantillonnage
Enquêtes sur les populations difficiles et nouvelles tendances Randomized controlled experiment
Structure du cours:
CM de 24h (12 x 2h)
1. Présentation du cours
From abstract ideas to concrete actions
Techniques d’enquêtes Chapitre introductif
Survey Methodology, 2nd Edition, Robert M. Groves et al. (2009), ISBN: 978-0-470-46546-2 Les techniques de sondage, Pascal Ardilly, Editions Technip.
Site du J-Pal
1. Présentation du cours
Quelques références
Techniques d’enquêtes Chapitre introductif
Champ d’exercice des sondages:
Information économique et sociale (démographie, conditions de vie, emploi, consommation, santé, éducation, transports, loisirs, logement, prix…).
Enquêtes sur les intentions de vote, baromètres et côtes de popularité, mesures d’audience…
Contrôle des comptes : Conseil Supérieur de l’ordre des experts comptables et comptables agréés.
Contrôle de qualité : fabrication et réception de produits industriels.
Acteurs:
CNIS (Conseil National de l’Information Statistique) INSEE (secrétariat du CNIS)
Organismes publics et para-publics mènent un grand nombre d’études et de recherches.
Entreprises privées : études de marché, analyses de clientèle, activités de conseil, sondages politiques et études d’opinion : Nielsen, SECODIP (panels), BVA, IFOP, IPSOS, ISL, SOFRES, Médiamétrie (audience des médias), CESP (étude des supports publicitaires)…
2. Contexte
Différents acteurs et champs d’analyse
Techniques d’enquêtes Chapitre introductif
Une enquête c’est une « conversation structurée entre des étrangers » sujette à certains problèmes de communication
• Inattention
• Mauvaise compréhension
• Motifs stratégiques
• Positionnement et projection
• Représentativité: donne un exemple, non représentatif du reste
2. Contexte
Principe de base de l’enquête par sondage
Techniques d’enquêtes Chapitre introductif
Pourquoi faire une enquête par sondage?
Le recensement:
• Etude exhaustive d'un caractère donné dans une population
• Impossibilité matérielle /coût trop élevé
• Destruction des individus étudiés.
Théorie des sondages:
• Etudier un sous-ensemble de la population qu'on appelle un échantillon.
• But: déterminer les caractéristiques d'une population donnée à partir de l'étude de l’échantillon.
La théorie des sondages se consacre essentiellement à résoudre 2 types de problèmes:
la sélection de l’échantillon: L'échantillon doit être représentatif de la population : c'est la théorie de l'échantillonnage.
la recherche de "bons" estimateurs: Les techniques numériques utilisées sur les observations doivent conduire à des résultats fiables, c'est-à-dire donnant une bonne représentation des paramètres inconnus de la population : c'est la théorie de l'estimation et des tests.
Les deux problèmes sont liés: la méthode d'échantillonnage utilisée a une influence sur les estimations obtenues.
2. Contexte
Principe de base de l’enquête par sondage
Techniques d’enquêtes Chapitre introductif
L’ensemble des personnes qui vont constituer “ l’échantillon ”, est extrait d’une population plus large,
“ la population de référence" appelée aussi “ population mère ” ou encore “ population cible ”.
La définition de la population de référence dépend de :
L’objet même de l’étude : la population peut être désignée dans l’énoncé même de l’objet d'étude.
Les hypothèses de travail choisies : le contenu même du ou des problèmes à traiter implique telle ou telle définition de la population.
La nature des documents disponibles pour construire l’échantillon : pour des raisons pratiques on sera éventuellement contraints de restreindre la définition de la population mère.
Les contraintes matérielles imposées : pour des raisons financières ou de délais d’exécution.
Les restrictions dans la définition de la population mère sont acceptables à conditions qu'elles soient connues et justifiées.
sinon les résultats et leur interprétation seront ambigus, voire inexacts (source de biais de sélectivité).
3. Définition
La population-mère
Techniques d’enquêtes Chapitre introductif
La population observée (frame population) est l’ensemble des unités qui vont former la base de sondage.
Une base de sondage:
une liste qui délimite et identifie les éléments de la population mère
cad toutes les unités susceptibles d’être enquêtées parce qu’elles appartiennent à la population sur laquelle on réalise l’inférence.
La base de sondage doit être conforme à la population mère :
il doit y avoir correspondance entre les unités de la base de sondage et les unités de la population- mère à l'étude.
C’est seulement dans ce cas que l’on peut faire fonctionner une procédure d’échantillonnage rigoureuse.
3. Définitions
La base de sondage
Techniques d’enquêtes Chapitre introductif
Une bonne base de sondage doit avoir 5 qualités principales (seules les 3 premières sont impératives) : Une liste exhaustive des unités de la population mère,
• sans omission ni répétition et ne contenant pas d’autres unités.
Doit permettre de repérer l’unité ou l'individu sans aucune ambiguïté.
• Facile à trouver et pas de confusion avec un autre.
L’information de la base de sondage doit être mise à jour.
• Sinon, inclusion d’éléments qui n’existent plus (décès, déménagements) et non inclusion d’éléments récents (emménagements, nouveaux nés).
L’information contenue dans la base doit être la plus large possible
• les informations auxiliaires peuvent servir à améliorer la méthode de tirage, l’estimateur, à redresser les données.
Les informations sur les unités de la base de sondage (identification, classification, adresse, taille, cartes pour les unités géographiques) doivent être de grande qualité
• elles servent: à la sélection des échantillons et éventuellement à leur stratification, à la collecte, au suivi, au traitement des données, à l’imputation, à l’estimation, à l’évaluation de la qualité et à l’analyse.
3. Définitions
La base de sondage
Techniques d’enquêtes Chapitre introductif
Pertinence : s’assurer que les informations recherchées n’existent pas déjà.
Réflexion générale et théorique sur le sujet :
élaboration d’hypothèses qui seront confirmées ou infirmées par les observations d’enquête.
quelle approche empirique?
Faisabilité : matériellement réalisable à un coût raisonnable.
S’assurer que l’enquête produira des informations statistiques de bonne qualité.
Conception générale de l’enquête : Définition des objectifs de l’enquête.
Détermination de la taille de l’échantillon selon budget et précision souhaitée.
Définition d’une technique de recueil de l’information.
Définition simultanée de la méthode d’échantillonnage.
4. Etapes d’une enquête en bref
Phase 1: Définition de la problématique
Techniques d’enquêtes Chapitre introductif
Concrètement c’est:
Revue de littérature théorique et empirique Théories et analyses existantes sur le sujet
Liste des variables expliquées et explicatives (en théorie et dans les cas pratiques)
• Variables expliquées et explicatives souhaitées
• Variables observables et mesurables (âge, sexe, revenu, etc.)
• Informations non directement mesurables (intelligence, émotivité, beauté, charisme, etc.).
proxy!
• quels problèmes d’endogénéité (notamment variables omises)?
Liste des outils statistiques (pensez à l’exploitation des données par la suite)
Analyse critique de la littérature (limites des analyses dues au manque d'information, aux instruments, aux biais de sélection)
Redéfinir la problématique, les questions secondaires et la population
4. Etapes d’une enquête en bref
Phase 1: Définition de la problématique
Techniques d’enquêtes Chapitre introductif
Choix du mode de collecte
Collecte de résultats publiés, Entretiens individuels, collectifs, etc…
Définition des populations cible, choix de l’échantillon, générateur de nombres aléatoires (Excel, Stata)
Construction du questionnaire :
Première rédaction en utilisant, si possible, les résultats d’études exploratoires ou qualitatives préalables.
Pré-test du questionnaire.
Rédaction définitive incluant le pré-codage.
Administration du questionnaire :
Réunion d’information / formation des enquêteurs.
Administration des questionnaires sur le terrain.
Contrôle de la qualité du travail des enquêteurs.
4. Etapes d’une enquête en bref
Phase 2: Collecte de données
Techniques d’enquêtes Chapitre introductif
Traitement et analyse des données :
Vérification
• Exhaustivité et de la vraisemblance des informations.
• Cohérence: repérage de valeurs aberrantes (apurement) Saisie et codage
• Saisie informatique des questionnaires.
• Codage de certaines variables (âge, profession, éducation…).
• Codage des questions ouvertes
Traitement par logiciels spécialisés des données (Stata, R, SAS, autres).
Nouveau questionnaire et nouveau pilote si possible/nécessaire
4. Etablissement d’une enquête en bref
Phase 3: Enquête pilote
Techniques d’enquêtes Chapitre introductif
Etape 1: Questions de recherche:
Comment le risque volcanique affecte la formation des réseaux?
• réseaux: assurance informelle
Pertinence du sujet: peu d’info/d’articles scientifiques sur ce sujet + sujet important (changements climatiques)
Hypothèse: les réseaux ne sont pas constants dans le temps
• RL nous dit que le partage des risques peut se diluer en cas d’exposition prolongé à un choc, ou face à un choc touchant une large partie de la population.
• interview en Indonésie, une femme a dit : "I do not believe in God and I never went to Church before Mt. Pinatubo erupted but now I regularly attend the Sunday mass just to meet my former village mates".
Zone d’étude: Volcan Tungurahua en Equateur 2 zones affectées: Puela et Bilbao
• Risque: essentiellement chute de cendre (surtout Bilbao) Trouver une zone de contrôle:
• Pas facile car pas les mêmes caractéristiques en termes de richesse, migration, fertilité, etc…
• Choix: caractéristiques écologique des sols similaires (ensoleillement, pente, altitude, distance aux route principale: Cañi.
Exemple: Perception des risques volcaniques en Equateur
Techniques d’enquêtes Chapitre introductif
Techniques d’enquêtes Chapitre introductif
Sélection des zones
Techniques d’enquêtes Chapitre introductif
Population mère:
Créer une base de données
Índice
Indicador: Pobreza por necesidades básicas insatisfechas
Ámbito: Cantonal
Fuente: Censo de población y vivienda 2010
Código Nombre de parroquia NO POBRES POBRES Total NO POBRES POBRES Total
010150 CUENCA 252 214 72 502 324 716 77.7% 22.3% 100.0%
010151 BAÑOS 7 326 9 441 16 767 43.7% 56.3% 100.0%
010152 CUMBE 709 4 786 5 495 12.9% 87.1% 100.0%
010153 CHAUCHA 94 1 193 1 287 7.3% 92.7% 100.0%
010154 CHECA (JIDCAY) 888 1 841 2 729 32.5% 67.5% 100.0%
010155 CHIQUINTAD 1 750 3 052 4 802 36.4% 63.6% 100.0%
010156 LLACAO 2 169 3 157 5 326 40.7% 59.3% 100.0%
Techniques d’enquêtes Chapitre introductif
Problème d’occupation des logements:
Certains ont deux habitations = sont-ils alors considérés comme résidents?
Moins de personnes que prévus dans la liste
• Obligé de faire une estimation locale avec les autorités locales, les vigiles du volcan, chefs de communautés
• Créer ainsi la meilleure estimation possible du nombre de personnes vivant dans les zones sélectionnées
Vérifier que le nombre de ménages soit statiquement significatif
Sub-group A = households from volcano slopes and boundary valleys where there has been partial depopulation (A1 = resident households, A2= resettled households)
Sub-group B = six additional communities that are most heavily affected communities by ashfall (and also reached by cascajos during 2006)
Sub-group C= households within the Vascun valley in Banos
Créer un échantillon
Techniques d’enquêtes Chapitre introductif
Sub- group
Province/Canton Parish Community Households (best estimate)
Proportionate sample (rounded)
A1 Tung/Banos Banos de
Agua Santa
Pondoa 20 4
Juive Grande 12 3
Tung/Pelileo Cotaló Cusua 15 3
Chacauco 10 2
Chimb/Penipe Bilbao Bilbao 40 9
Yuibug 20 4
Puela Puela 24 5
El Manzano (incl.
Chogontus)
12 3
Anaba 5 1
Pungal 15 3
El Altar Pallictahua 40 9
Chimb/Guano Guanando Cahuaji Bajo 35 8
Santa Fe de Galan
Palestina 20 4
Total A1 268 58
A2 Tung/Banos Rio Blanco
resettlement
107 23
Tung/Pelileo La Paz
resettlement
214 46
Chimb/Penipe Penipe – 3x
resettlement areas (incl Pusuca)
315 68
Chimb/Guano Guano 80 17
Total A2 721 155
Total A 989 212
B Tung/Pelileo Cotalo Pillate 79 17
San Juan 74 16
Chimb/Penipe El Altar Panchanillay 42 9
Ganzhi 71 15
Chimb/Guano Santa Fe de Galan
Santa Fe de Galan (centro)
110 24
Barrio Norte 35 8
Total B 407 89
Total A+B
1396 301
C Tung/Banos Banos de
Agua Santa
Zone 2 (section 5, part section 4)
464 100
Total C 464 100
Total A+B+C
1860 401
Techniques d’enquêtes Chapitre introductif
Variables que nous souhaitons avoir:
Réseau
Perception/exposition du risque climatique
• Attitude vis-à-vis du risque
Problème d’endogénéité/ Variable omises:
• Migration
• Dommages potentiels
• Richesse héritée
Construction de variables
Techniques d’enquêtes Chapitre introductif
Réseau:
“Different centrality measures exist to capture the prominence of actors inside a network. We can rely for instance on the Degree Centrality which counts the number of connections an agent has. »
Construction de variables
D'une manière générale, est-ce que vous vous confiez aux personnes suivantes?
Souvent Parfois Un peu Jamais
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
Parents
Autre personne du ménages
Autre personne de sa connaissance Vigile du volcan
Authorités locales Authorités nationales
Techniques d’enquêtes Chapitre introductif
Construction de variables
Depuis le début de l'eruption du volcan, quelle est votre opinion sur la bonté des personnes suivantes:
Bien mieux qu'avant
Mieux
qu'avant Egal Pire qu'avant
Bien pire qu'avant
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
Participez-vous aux associations locales suivantes?
Oui NO
1 2
1 2
1 2
1 2
Etes-vous d'accord avec les informations suivantes:
Totalement
d'accord D'accord
Ni d'accord, ni pas d'accord
En désaccord
Totalment en désaccord
5 4 3 2 1
5 4 3 2 1
Vigile du volcan
Autre personne du ménages
Autre personne de sa connaissance Authorités locales
Authorités nationales
Je n'ai pas confiance pour préter de l'argent à cette communauté
La majorité des personnes de ma communauté sont prêtes à m'aider si besoin Coopératives agricoles
Comité communautaire Eglise
Tontine Parents
Techniques d’enquêtes Chapitre introductif
Thème de cette année:
Comment le risque climatique est perçu?
•
Phase 1: Définir la problématique
•
quoi? pourquoi?
•
qui? où?
•
quand?
•
comment?
•
Phase 2: Choix du mode de collecte
•