• Aucun résultat trouvé

Techniques d enquête. Chapitre introductif. Delphine Boutin

N/A
N/A
Protected

Academic year: 2022

Partager "Techniques d enquête. Chapitre introductif. Delphine Boutin"

Copied!
23
0
0

Texte intégral

(1)

Techniques d’enquête

Chapitre introductif

Delphine Boutin

delphine.boutin@uca.fr

(2)

Techniques d’enquêtes Chapitre introductif

Objectifs:

Introduction à la méthodologie de la conception des questionnaires et à l’analyse d’enquêtes.

Fournir les outils pour comprendre pourquoi des erreurs peuvent apparaître lorsque l’on fait des statistiques, mais surtout comment les minimiser.

Être capable de réaliser sa propre enquête ou sa propre expérience contrôlée.

Plan:

Intro: définitions, présentations des enquêtes Types d'erreurs rencontrées

Mener une enquête: conception du questionnaire Echantillonnage

Enquêtes sur les populations difficiles et nouvelles tendances Randomized controlled experiment

Structure du cours:

CM de 24h (12 x 2h)

1. Présentation du cours

From abstract ideas to concrete actions

(3)

Techniques d’enquêtes Chapitre introductif

Survey Methodology, 2nd Edition, Robert M. Groves et al. (2009), ISBN: 978-0-470-46546-2 Les techniques de sondage, Pascal Ardilly, Editions Technip.

Site du J-Pal

1. Présentation du cours

Quelques références

(4)

Techniques d’enquêtes Chapitre introductif

Champ d’exercice des sondages:

Information économique et sociale (démographie, conditions de vie, emploi, consommation, santé, éducation, transports, loisirs, logement, prix…).

Enquêtes sur les intentions de vote, baromètres et côtes de popularité, mesures d’audience…

Contrôle des comptes : Conseil Supérieur de l’ordre des experts comptables et comptables agréés.

Contrôle de qualité : fabrication et réception de produits industriels.

Acteurs:

CNIS (Conseil National de l’Information Statistique) INSEE (secrétariat du CNIS)

Organismes publics et para-publics mènent un grand nombre d’études et de recherches.

Entreprises privées : études de marché, analyses de clientèle, activités de conseil, sondages politiques et études d’opinion : Nielsen, SECODIP (panels), BVA, IFOP, IPSOS, ISL, SOFRES, Médiamétrie (audience des médias), CESP (étude des supports publicitaires)…

2. Contexte

Différents acteurs et champs d’analyse

(5)

Techniques d’enquêtes Chapitre introductif

Une enquête c’est une « conversation structurée entre des étrangers » sujette à certains problèmes de communication

• Inattention

• Mauvaise compréhension

• Motifs stratégiques

• Positionnement et projection

• Représentativité: donne un exemple, non représentatif du reste

2. Contexte

Principe de base de l’enquête par sondage

(6)

Techniques d’enquêtes Chapitre introductif

Pourquoi faire une enquête par sondage?

Le recensement:

• Etude exhaustive d'un caractère donné dans une population

• Impossibilité matérielle /coût trop élevé

• Destruction des individus étudiés.

Théorie des sondages:

• Etudier un sous-ensemble de la population qu'on appelle un échantillon.

But: déterminer les caractéristiques d'une population donnée à partir de l'étude de l’échantillon.

La théorie des sondages se consacre essentiellement à résoudre 2 types de problèmes:

la sélection de l’échantillon: L'échantillon doit être représentatif de la population : c'est la théorie de l'échantillonnage.

la recherche de "bons" estimateurs: Les techniques numériques utilisées sur les observations doivent conduire à des résultats fiables, c'est-à-dire donnant une bonne représentation des paramètres inconnus de la population : c'est la théorie de l'estimation et des tests.

 Les deux problèmes sont liés: la méthode d'échantillonnage utilisée a une influence sur les estimations obtenues.

2. Contexte

Principe de base de l’enquête par sondage

(7)

Techniques d’enquêtes Chapitre introductif

L’ensemble des personnes qui vont constituer “ l’échantillon ”, est extrait d’une population plus large,

“ la population de référence" appelée aussi “ population mère ” ou encore “ population cible ”.

La définition de la population de référence dépend de :

L’objet même de l’étude : la population peut être désignée dans l’énoncé même de l’objet d'étude.

Les hypothèses de travail choisies : le contenu même du ou des problèmes à traiter implique telle ou telle définition de la population.

La nature des documents disponibles pour construire l’échantillon : pour des raisons pratiques on sera éventuellement contraints de restreindre la définition de la population mère.

Les contraintes matérielles imposées : pour des raisons financières ou de délais d’exécution.

Les restrictions dans la définition de la population mère sont acceptables à conditions qu'elles soient connues et justifiées.

sinon les résultats et leur interprétation seront ambigus, voire inexacts (source de biais de sélectivité).

3. Définition

La population-mère

(8)

Techniques d’enquêtes Chapitre introductif

La population observée (frame population) est l’ensemble des unités qui vont former la base de sondage.

Une base de sondage:

une liste qui délimite et identifie les éléments de la population mère

cad toutes les unités susceptibles d’être enquêtées parce qu’elles appartiennent à la population sur laquelle on réalise l’inférence.

La base de sondage doit être conforme à la population mère :

il doit y avoir correspondance entre les unités de la base de sondage et les unités de la population- mère à l'étude.

C’est seulement dans ce cas que l’on peut faire fonctionner une procédure d’échantillonnage rigoureuse.

3. Définitions

La base de sondage

(9)

Techniques d’enquêtes Chapitre introductif

Une bonne base de sondage doit avoir 5 qualités principales (seules les 3 premières sont impératives) : Une liste exhaustive des unités de la population mère,

• sans omission ni répétition et ne contenant pas d’autres unités.

Doit permettre de repérer l’unité ou l'individu sans aucune ambiguïté.

• Facile à trouver et pas de confusion avec un autre.

L’information de la base de sondage doit être mise à jour.

• Sinon, inclusion d’éléments qui n’existent plus (décès, déménagements) et non inclusion d’éléments récents (emménagements, nouveaux nés).

L’information contenue dans la base doit être la plus large possible

• les informations auxiliaires peuvent servir à améliorer la méthode de tirage, l’estimateur, à redresser les données.

Les informations sur les unités de la base de sondage (identification, classification, adresse, taille, cartes pour les unités géographiques) doivent être de grande qualité

• elles servent: à la sélection des échantillons et éventuellement à leur stratification, à la collecte, au suivi, au traitement des données, à l’imputation, à l’estimation, à l’évaluation de la qualité et à l’analyse.

3. Définitions

La base de sondage

(10)

Techniques d’enquêtes Chapitre introductif

Pertinence : s’assurer que les informations recherchées n’existent pas déjà.

Réflexion générale et théorique sur le sujet :

élaboration d’hypothèses qui seront confirmées ou infirmées par les observations d’enquête.

quelle approche empirique?

Faisabilité : matériellement réalisable à un coût raisonnable.

S’assurer que l’enquête produira des informations statistiques de bonne qualité.

Conception générale de l’enquête : Définition des objectifs de l’enquête.

Détermination de la taille de l’échantillon selon budget et précision souhaitée.

Définition d’une technique de recueil de l’information.

Définition simultanée de la méthode d’échantillonnage.

4. Etapes d’une enquête en bref

Phase 1: Définition de la problématique

(11)

Techniques d’enquêtes Chapitre introductif

Concrètement c’est:

Revue de littérature théorique et empirique Théories et analyses existantes sur le sujet

Liste des variables expliquées et explicatives (en théorie et dans les cas pratiques)

• Variables expliquées et explicatives souhaitées

• Variables observables et mesurables (âge, sexe, revenu, etc.)

• Informations non directement mesurables (intelligence, émotivité, beauté, charisme, etc.).

proxy!

• quels problèmes d’endogénéité (notamment variables omises)?

Liste des outils statistiques (pensez à l’exploitation des données par la suite)

Analyse critique de la littérature (limites des analyses dues au manque d'information, aux instruments, aux biais de sélection)

Redéfinir la problématique, les questions secondaires et la population

4. Etapes d’une enquête en bref

Phase 1: Définition de la problématique

(12)

Techniques d’enquêtes Chapitre introductif

Choix du mode de collecte

Collecte de résultats publiés, Entretiens individuels, collectifs, etc…

Définition des populations cible, choix de l’échantillon, générateur de nombres aléatoires (Excel, Stata)

Construction du questionnaire :

Première rédaction en utilisant, si possible, les résultats d’études exploratoires ou qualitatives préalables.

Pré-test du questionnaire.

Rédaction définitive incluant le pré-codage.

Administration du questionnaire :

Réunion d’information / formation des enquêteurs.

Administration des questionnaires sur le terrain.

Contrôle de la qualité du travail des enquêteurs.

4. Etapes d’une enquête en bref

Phase 2: Collecte de données

(13)

Techniques d’enquêtes Chapitre introductif

Traitement et analyse des données :

Vérification

• Exhaustivité et de la vraisemblance des informations.

• Cohérence: repérage de valeurs aberrantes (apurement) Saisie et codage

• Saisie informatique des questionnaires.

• Codage de certaines variables (âge, profession, éducation…).

• Codage des questions ouvertes

Traitement par logiciels spécialisés des données (Stata, R, SAS, autres).

Nouveau questionnaire et nouveau pilote si possible/nécessaire

4. Etablissement d’une enquête en bref

Phase 3: Enquête pilote

(14)

Techniques d’enquêtes Chapitre introductif

Etape 1: Questions de recherche:

Comment le risque volcanique affecte la formation des réseaux?

• réseaux: assurance informelle

Pertinence du sujet: peu d’info/d’articles scientifiques sur ce sujet + sujet important (changements climatiques)

Hypothèse: les réseaux ne sont pas constants dans le temps

• RL nous dit que le partage des risques peut se diluer en cas d’exposition prolongé à un choc, ou face à un choc touchant une large partie de la population.

• interview en Indonésie, une femme a dit : "I do not believe in God and I never went to Church before Mt. Pinatubo erupted but now I regularly attend the Sunday mass just to meet my former village mates".

Zone d’étude: Volcan Tungurahua en Equateur 2 zones affectées: Puela et Bilbao

• Risque: essentiellement chute de cendre (surtout Bilbao) Trouver une zone de contrôle:

• Pas facile car pas les mêmes caractéristiques en termes de richesse, migration, fertilité, etc…

• Choix: caractéristiques écologique des sols similaires (ensoleillement, pente, altitude, distance aux route principale: Cañi.

Exemple: Perception des risques volcaniques en Equateur

(15)

Techniques d’enquêtes Chapitre introductif

(16)

Techniques d’enquêtes Chapitre introductif

Sélection des zones

(17)

Techniques d’enquêtes Chapitre introductif

Population mère:

Créer une base de données

Índice

Indicador: Pobreza por necesidades básicas insatisfechas

Ámbito: Cantonal

Fuente: Censo de población y vivienda 2010

Código Nombre de parroquia NO POBRES POBRES Total NO POBRES POBRES Total

010150 CUENCA 252 214 72 502 324 716 77.7% 22.3% 100.0%

010151 BAÑOS 7 326 9 441 16 767 43.7% 56.3% 100.0%

010152 CUMBE 709 4 786 5 495 12.9% 87.1% 100.0%

010153 CHAUCHA 94 1 193 1 287 7.3% 92.7% 100.0%

010154 CHECA (JIDCAY) 888 1 841 2 729 32.5% 67.5% 100.0%

010155 CHIQUINTAD 1 750 3 052 4 802 36.4% 63.6% 100.0%

010156 LLACAO 2 169 3 157 5 326 40.7% 59.3% 100.0%

(18)

Techniques d’enquêtes Chapitre introductif

Problème d’occupation des logements:

Certains ont deux habitations = sont-ils alors considérés comme résidents?

Moins de personnes que prévus dans la liste

• Obligé de faire une estimation locale avec les autorités locales, les vigiles du volcan, chefs de communautés

• Créer ainsi la meilleure estimation possible du nombre de personnes vivant dans les zones sélectionnées

Vérifier que le nombre de ménages soit statiquement significatif

Sub-group A = households from volcano slopes and boundary valleys where there has been partial depopulation (A1 = resident households, A2= resettled households)

Sub-group B = six additional communities that are most heavily affected communities by ashfall (and also reached by cascajos during 2006)

Sub-group C= households within the Vascun valley in Banos

Créer un échantillon

(19)

Techniques d’enquêtes Chapitre introductif

Sub- group

Province/Canton Parish Community Households (best estimate)

Proportionate sample (rounded)

A1 Tung/Banos Banos de

Agua Santa

Pondoa 20 4

Juive Grande 12 3

Tung/Pelileo Cotaló Cusua 15 3

Chacauco 10 2

Chimb/Penipe Bilbao Bilbao 40 9

Yuibug 20 4

Puela Puela 24 5

El Manzano (incl.

Chogontus)

12 3

Anaba 5 1

Pungal 15 3

El Altar Pallictahua 40 9

Chimb/Guano Guanando Cahuaji Bajo 35 8

Santa Fe de Galan

Palestina 20 4

Total A1 268 58

A2 Tung/Banos Rio Blanco

resettlement

107 23

Tung/Pelileo La Paz

resettlement

214 46

Chimb/Penipe Penipe – 3x

resettlement areas (incl Pusuca)

315 68

Chimb/Guano Guano 80 17

Total A2 721 155

Total A 989 212

B Tung/Pelileo Cotalo Pillate 79 17

San Juan 74 16

Chimb/Penipe El Altar Panchanillay 42 9

Ganzhi 71 15

Chimb/Guano Santa Fe de Galan

Santa Fe de Galan (centro)

110 24

Barrio Norte 35 8

Total B 407 89

Total A+B

1396 301

C Tung/Banos Banos de

Agua Santa

Zone 2 (section 5, part section 4)

464 100

Total C 464 100

Total A+B+C

1860 401

(20)

Techniques d’enquêtes Chapitre introductif

Variables que nous souhaitons avoir:

Réseau

Perception/exposition du risque climatique

• Attitude vis-à-vis du risque

Problème d’endogénéité/ Variable omises:

• Migration

• Dommages potentiels

• Richesse héritée

Construction de variables

(21)

Techniques d’enquêtes Chapitre introductif

Réseau:

“Different centrality measures exist to capture the prominence of actors inside a network. We can rely for instance on the Degree Centrality which counts the number of connections an agent has. »

Construction de variables

D'une manière générale, est-ce que vous vous confiez aux personnes suivantes?

Souvent Parfois Un peu Jamais

1 2 3 4

1 2 3 4

1 2 3 4

1 2 3 4

1 2 3 4

1 2 3 4

Parents

Autre personne du ménages

Autre personne de sa connaissance Vigile du volcan

Authorités locales Authorités nationales

(22)

Techniques d’enquêtes Chapitre introductif

Construction de variables

Depuis le début de l'eruption du volcan, quelle est votre opinion sur la bonté des personnes suivantes:

Bien mieux qu'avant

Mieux

qu'avant Egal Pire qu'avant

Bien pire qu'avant

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

5 4 3 2 1

Participez-vous aux associations locales suivantes?

Oui NO

1 2

1 2

1 2

1 2

Etes-vous d'accord avec les informations suivantes:

Totalement

d'accord D'accord

Ni d'accord, ni pas d'accord

En désaccord

Totalment en désaccord

5 4 3 2 1

5 4 3 2 1

Vigile du volcan

Autre personne du ménages

Autre personne de sa connaissance Authorités locales

Authorités nationales

Je n'ai pas confiance pour préter de l'argent à cette communauté

La majorité des personnes de ma communauté sont prêtes à m'aider si besoin Coopératives agricoles

Comité communautaire Eglise

Tontine Parents

(23)

Techniques d’enquêtes Chapitre introductif

Thème de cette année:

Comment le risque climatique est perçu?

Phase 1: Définir la problématique

quoi? pourquoi?

qui? où?

quand?

comment?

Phase 2: Choix du mode de collecte

Phase 3: Enquête pilote

Références

Documents relatifs

peut |Stre 23 fois superiour au nombro annuel de naissances alors quo dans unq eociete entieroment. 75 fois, voire plus, le chiffre annuel dos naissances• A la suite du dl

Le personnage est vulnérable pendant cette période et l’adversaire peut stopper l’attaque avec un de ses propres coups : on parle alors de Contre-attaque.. Vient ensuite le coup,

 Un coût et des limites opérationnelles. La répartition de l’échantillon finale a été affinée en tenant.. compte des informations actualisées à travers les

} En 2006, la part des personnes âgées de 75 ans et plus vivant dans l’espace à dominante rurale (40 %) est plus importante que dans l’ensemble de la population bourguignonne

Dans le tableau, il s'agit de la précision qu'aurait donné, en 1982, le plan proposé élaboré sur les données de 1982; on voit naturellement que la précision est absolue pour

La liste des chiffrements compatibles (avec la distinction des cas fréquents et des cas possibles mais rares) est donnée pages 10 et 11 de la 3 e partie du Code imprimé (Statut

M. Bourdon m'a supérieurement intéressé, mais il me pardonnera de remarquer qu'il n'a fait qu'effleurer son sujet. Après avoir proposé que nous adoptions immédiatement sa proposition

• En 2000 : intégration des numéros inscrits sur liste rouge (incrémentation +1 à partir de l’annuaire France Télécom) (incrémentation +1 à partir de l’annuaire