• Aucun résultat trouvé

Réponse équilibrée et ajustement des estimations: Deux étapes dans le traitement de la non-réponse Carl-Erik Särndal Université d’Örebro Statistique Suède

N/A
N/A
Protected

Academic year: 2022

Partager "Réponse équilibrée et ajustement des estimations: Deux étapes dans le traitement de la non-réponse Carl-Erik Särndal Université d’Örebro Statistique Suède"

Copied!
86
0
0

Texte intégral

(1)

Réponse équilibrée et ajustement des estimations:

Deux étapes dans le traitement de la non-réponse

Carl-Erik Särndal Université d’Örebro

Statistique Suède

2012-11-06

7e Colloque francophone sur les sondages Rennes , 2012

(2)

.

Face à la non-réponse : deux types d’activités

(a) au « stade collecte (des données) »

(b) au « stade estimation », collecte ayant été terminée Les étapes (a) et (b) ne sont pas indépendantes .

Nous examinerons les deux, et leur interaction

(3)

.

• Collecte des données: Évolue sur une période de temps (des jours, semaines). Aspect dynamique.

Objectif: obtenir à la fin un ensemble de répondants bien équilibré

• Estimation: Objectif: Ajustement pour réduire le biais qui affecte néanmoins les estimations (malgré un

certain équilibrage).

(4)

.

• Collecte des données

• Estimation

Les deux activités dépendent intégralement de l’accès aux variables auxiliaires

Plus on en a, mieux c’est

En Scandinavie, on est bien équipé

(5)

Les idées pour cette présentation

Collecte adaptive (Responsive design, USA, Canada) Europe:

Statistics Netherlands (projet RISQ; représentativité) Statistics Sweden (réponse équilibrée) :

projet en collaboration avec Peter Lundquist

(6)

Points de départ:

Les variables d’intérêt (variables y) : affectées par une non-réponse non-aléatoire (même conditionnellement sur vecteur auxiliaire x)

• Estimations plus ou moins baisées

• Le biais ne sera jamais entièrement éliminé

• La non-réponse ignorable (MAR) n’existe pas.

(7)

Points de départ:

Les variables auxiliaires (variables x) jouent un rôle

primordial. Connues pour les unités de l’échantillon s (répondants et non-répondants), peut-être

pour toute la population Vecteur x multivarié

(8)

Points de départ:

En Scandinavie, aux Pays-Bas et de plus en plus ailleurs

Une multitude de variables auxiliaires disponibles , surtout pour les enquêtes sur ménages et individus : Sources : Les registres administratifs

Nécessité de choisir “les meilleures”.

(9)

Exemple, Suède :

• Pays d’origine

• Revenu

• Age

• Sexe

• Statut civil

• Région

• Taille de ménage

• Périodes sans emploi

• Urbain/rural

• Occupation

et beaucoup d’autres

Enquête sur ménages et individus,

parmi les variables auxiliaires potentielles:

(10)

.

Je vous présente une théorie pour ce qui est pour nous, en Scandinavie, une réalité,

chez vous, c’est peut-être différent …

(11)

Les étapes de ma présentation

1. La notion de maléquilibre (ang.: imbalance) 2. Stade collecte : surveiller et intervenir

3. Partager le travail et les ressources : collecte vis-à-vis estimation

4. Stade estimation : réduction du biais

(12)

Population U = {1, …, k , ..., N}

Échantillon probabiliste

s (s  U)

1. La notion de mal-équilibre

.

Proba d’inclusion de l’unité

k :

Poids d’échantillonnage de

k :

π k

k

d k  1 / π

(13)

Population U = {1, …, k , ..., N}

Échantillon probabiliste s Ensemble des répondants r

r s U

Sélectionnés mais non-répondants

: s – r

La non-réponse arrive

 

r

d

k s k

d

P /

Taux de réponse

pondéré : dk = 1/k

(14)

La (les) variable(s) d’intérêt y

continue ou catégorique

U s

r r

k

y

k

pour  ;  

On observe valeur

.

emploi sans

si

1 k

yk

; y

k

 0 sinon

par exemple

(15)

r d yk

k k

θ 1

Pondération désirable mais hypothétique

Y ˆ

Serait sans biais pour le total de y, mais inutilisable

proba de réponse

k inconnu, tout unité

k :

.

(16)

Introduisons

Les concepts d’équilibre et de distance reposant sur des variables auxiliaires

(Mais la variable d’intérêt yk pour

k

r

seulement)

r

s  U

Vecteur auxiliaire

x

k

de dimension

J

 1

connu

k  s,

ou bien pour tout

k

U

(17)

;

) ,

,...

, ...

, (

: vecteur

En DD

1

D

j

D

J

js jr

j

x x

D  

moyenne répondants

Contraster les répondants avec l’échantillon entier Pour la variable

x

j , calculer

moyenne

échantillon entier

(18)

s r

x x

D  

;

Comparer répondants avec l’échantillon entier Le vecteur des différences , dim.

J

 1

r k k r k

r d x / d

x ; xs

s dk xk /

s kd

pondéré : dk = 1/k

(19)

Répondants égaux (en moyenne) à l’échantillon tout entier Réponse équilibrée

:

x 0

x

D

n echantillo repondants

s r

Désirable, mais difficile à réaliser entièrement

Objectif pour la collecte : un niveau d’équilibre élevé néanmoins, au stade estimation, un ajustement s’impose

.

(20)

: réponse mal équilibrée

D

étant vectoriel, on forme une mesure uni-variée du maléquilibre (ang: imbalance)

s k k k s k

s d x x / d

Σ

D Σ

D s1 (xr xs )Σs1(xr xs )

,

Matrice

J  J

de pondération, non-singulier : 0

x x

Drs  ,

t Normalemen

(21)

Exemple, la Suède :

• Pays d’origine

• Revenu

• Age

• Sexe

• Statut civil

• Région

• Taille de ménage

• Période(s) sans emploi

• Urbain/rural

• Occupation

Vecteur

x

composé de :

dimension souvent 40 ou plus

(22)

Notation :

IMB = imbalance = maléquilibre

D Σ

D1

s

IMB

IMB est une mesure descriptive -

parmi d’autres également possibles - de l’ensemble

r

des répondants, tel qu’il se présente à un certain moment

de la collecte des données.

.

) (

)

(xrxsΣs1 xrxs

(23)

Remarquer :

dépend de (i) la composition du vecteur auxiliaire

x

k

(ii) la composition de

r ,

étant donné

s

D Σ

D1

s

IMB

) ,

( r s

IMB xk serait notation plus complète

Mais par simplicité, utilisons IMB tout court

) (

)

(xrxsΣs1 xrxs

(24)

Propriété : Pour réponse

r

et échantillon

s

fixés , ajouter plus de variables au vecteur

x

fera augmenter

IMB

Un vecteur

x

plus grand donne plus de maléquilibre, naturellement, car davantage de variables

pour lesquelles les moyennes doivent concorder.

Le vecteur trivial

x

k = 1 donne

IMB

= 0

mais c’est un vecteur dépourvu d’intérêt

.

(25)

La pondération avec

s

nous permet de poser

une borne supérieure simple pour le maléquilibre IMBDΣs1D

(26)

Pour toute réalisation (s, r) et vecteur xk , 1 1

0   

IMB P

20% non-response

: 0  IMB  0.25

50% non-response

: 0  IMB  1

IMB

n’est pas numériquement grand

Mais

IMB

= 0.20 indique maléquilibre considérable comparablement à

IMB

= 0 (équilibre parfait)

P = taux de réponse

(27)

La notion de distance

entre répondants

r

and non-répondants

nr

=

s - r

Relation simple avec maléquilibre IMB :

2 / 1

1 ( )}

)

{( r s r s r s r

nr

dist rxx Σ xx

P IMB distr nr

  1

1

P = taux de réponse

(28)

La distance

Par exemple, 40% non-réponse, et maléquilibre

IMB  0 . 16

 1

distr nr

P IMB distr nr

  1

1

(29)

) 1

( 1

P distr nr P

peu importe r, s et choix de vecteur x Par ex., non-réponse 50%  dist  2

Pour nos données, dist rarement  0.5 mais varie selon le choix du vecteur

x

Propritété :

(30)

2. Stade collecte: surveiller et intervenir (un aspect de « Responsive Design »)

Optique dynamique : Surveiller la collecte des données, vue en fonction du temps (les jours, les tentatives de contact);

Envisager des interventions ou altérations dans un plan original.

(31)

Surveiller et modifier la collecte

Optique dynamique : Une série d’ensembles de

répondants emboités, fonctions du point temporel a

...

... ( )

) 2 ( )

1

(r   r a

r

Pour simplicité

r

dénotera n’importe lequel de ces ensembles

(32)

Tirage aléatoire simple de personnes dans le registre de la population suédoise.

Interviews par téléphone.

Les tentatives de contact sont enregistrées par le dispositif WinDATI

Nous analysons ici un sous-échantillon de taille 8,220 Exemple d’application:

Enquête sur les Conditions de Vie , Suède 2009 ECV2009

tributaire du EU-SILC

.

(33)

Tentatives de contact enregistrées par

WinDATI.

Période

collecte ordinaire

: 3 semaines;

pour beaucoup d’unités, > 30 tentatives;

à la fin de cette période, taux de réponse P = 60.4

%

Période des

suivis (follow-up)

, 3 semaines , taux de réponse ultime P = 67.4%

Enquête sur les conditions de vie, Suède 2009 (ECV2009)

.

(34)

Collecte ordinaire

> 30 tentatives pour bon nombre d’unités Collecte suivie

souvent > 10 tentatives

Toutes ces tentatives … 53258, au total Est-que cela vaut la peine ?

Fortement douteux.

.

(35)

) (

)

(xrxsΣs1 xrxs Pour le fichier ECV2009, calculons

le maléquilibre

et la distance rép/non-rép

D Σs1D IMB

2 / 1

1

( )}

)

{(

r s r s r s r

nr

dist

r

xx

Σ

xx

P IMB

  1

1

sur vecteur x = (educ  owner  origin); dim = 23 = 8

(36)

.

3 variables binaires :

Éduc (élevée ou non)

Own (propriétaire ou non) Origine (suédois ou non)

x = (educ  owner  origin); dim = 2  2  2 = 8

(37)

Fichier ECV2009 tel quel Tentative Taux rép.

100  P

dist

r/nr 100  IMB

no.1 ordin 12.8 0.233 4.13

no. 5 ordin 44.3 0.310 2.99

no.12 ordin 57.7 0.394 2.78

Fin ordin 60.4 0.417 2.72

no. 1 fol-up 61.4 0.418 2.61

no.4 fol-up 64.6 0.435 2.37

Final 67.4 0.471 2.36

La distance augmente sans cesse. Comment est-ce possible ?

(38)

Fichier ECV2009 :

La distance augmente de 0.310 tentative no. 5

à 0.471 fin collecte

Répondants de moins en moins semblables aux non-répondants ...

C’est troublant …

Mais dites-vous, cela dépend du vecteur x choisi …

P IMB distr nr

1

1

(39)

.

Durant la phase collecte, comment réduire le maléquilibre ?

Quelles interventions pouvons nous apporter à la collecte?

Quelles modifications dans un plan original, pour pouvoir terminer avec

un ensemble de répondants plus approprié?

(40)

Pour répondre à ces questions , il faudrait effectuer des expériences

dans la collecte des données de la ECV.

.

(41)

Faute d’ expériences réelles, nous effectuons des

“expériences rétrospectives” dans le fichier ECV2009 On considère la collecte terminée

dans un sous-groupe

ayant atteint un certain taux de réponse comme 55% ou 60% ou 65%

Cela possible avec le fichier ECV2009 .

.

(42)

Ainsi, dans ces expériences, on rejette volontairement une partie des données du fichier ECV2009

(pour que le reste soit plus équilibré et avoir un

IMB

moindre)

.

.

(43)

Les groupes définis par le vecteur connu

k  s

x = (educ  owner  origin)

de dimension = 2  2 2 = 8

On sait que ces groupes diffèrent dans leur disposition à répondre

ECV2009

.

(44)

Résultats d’une de ces expériences rétrospectives:

Considérer collecte terminée dans un group ayant atteint un taux de réponse de 60%

les 23 = 8 groupes définis par le vecteur x = (educ  owner  origin)

ECV2009

.

(45)

Expérience rétrospective : collecte terminée dans un groupe si son taux réponse

> 60%

Tentative Taux rép.

100  P distr/nr 100  IMB

7 ordin 50.9 0.357 3.07

8 ordin 52.5 0.353 2.81

9 ordin 53.8 0.341 2.49

15 ordin 56.0 0.287 1.59

3 fol-up 58.6 0.252 1.09

Final 58.9 0.220 0.82

La distance maintenant décroissante, comme on souhaite

(46)

Comparaison au point Final (collecte terminée)

Moins de réponses (58.9% vs. 67.4%) Mais distance très réduite (0.22 vs. 0.42)

.

ECV tel quel 67.4 2.36 0.417 Expérience 58.9 0.82 0.220 (intervention

par groupes)

Taux rép.

100  P 100  IMB distance

(47)

Non seulement économise-t-on sur le nombre de tentatives (réduction d’environ 15%)

mais la distance diminue aussi

(répondants et non-répondants plus semblables) .

.

(48)

3 .

Collecte vis-à-vis estimation

Comment partager les ressources ? Quelle utilisation doit-on faire de l’information

auxiliaire disponible?

Quand faut-il agir, et dans quelle mesure ?

• stade collecte ou bien

• stade estimation ou les deux ?

(49)

On se rend compte alors que

les variables auxiliaires (nombreuses) doivent être regroupés en deux catégories :

• Celles qu’on utilise lors du stade collecte, pour une surveillance

• Celles qu’on utilise, la collecte terminée, lors du stade estimation

(50)

.

Le vecteur surveillance

x

a

contient les variables x destinées à surveiller et diriger la collecte de données,

pour s’assurer à la fin

d’un ensemble de répondants bien équilibré, qui ressemble fortement à l’échantillon probabiliste

s

.

(51)

.

D’autres variables auxiliaires, quoique disponibles, demeurent inactives lors de la collecte ;

Ce vecteur supplémentaire

x

b

prend de l’importance au stade estimation pour calculer les poids de calage.

(52)

.

C’est un fait :

Certaines unités faciles à rejoindre ou à faire participer, d’autres plus dures,

et cela dépendamment de leurs caractéristiques observables (leurs données auxiliaires)

.

(53)

Le contexte dynamique: .

A tout point de la collecte, toute unité k  s est caractérisée par son

Intensité de réponse (ang.: Response Propensity) par rapport au vecteur surveillance choisi

x

a

s k k ak s k ak ak ak

ak d I d

Pˆ ( x ) ( x x ) 1x

Interprétation : Régression de l’indicateur de réponse Ik = 1 si réponse ; 0 sinon, sur xak

(54)

Intensité de réponse

Peut se calculer à n’importe quel point de la collecte, pour k  s

s kd

s dk PPak 2

2

) ˆ 1

1 (

: ) variation de

(coeff relative

variance

s k k ak s k ak ak ak

ak d I d

Pˆ ( x ) ( x x ) 1x

d P d d

P P d

s k r k s k

s k ak

as

 

 

ˆ

: ˆ moyenne

P étant le taux de réponse réussi à ce point de la collecte

(55)

où IMBa est le mal-équilibre de

x

a

c’est-à-dire la valeur de

calculée sur

x = x

a

On découvre une relation entre maléquilibre et intensité de réponse

s k k ak s k ak ak ak

ak d I d

Pˆ ( x ) ( x x ) 1x

) (

)

( r s s1 r s

IMBxxΣ xx

a

ak IMB

Pˆ )  (

variation de

coeff.

.

(56)

.

La relation :

entre intensité de réponse et maléquilibre est logique :

Plus les intensités de réponse varient, plus il doit y avoir maléquilibre,

à un moment donné de la collecte.

.

a

ak IMB

Pˆ )  (

variation coeff

(57)

Note mathématique: Nous considérons ici la famille de vecteurs

x

tels que :

On peut spécifier vecteur

tel que

) 1 ,...., 1

, 1 (

prendre   

s

kk

x 1 for all μ

) 0 , 1 ( prendre

, ) ,

1 (

Si x

k

x

k

   

) 0 ,..., 1

,..., 0

(

Si x

k

 

La majorité des vecteurs d’importance sont de cette espèce, par exemple

OO

(58)

Disponible pour ECV2009 :

multitude variables auxiliaires potentielles Prenons un exemple

Retour à l’Enquête Conditions de Vie, Suède (ECV2009)

.

(59)

.

Exemple : On a retenu les variables auxiliaires suivantes (toutes catégoriques) :

.

Binaires :

Éduc (élevée ou non)

Own (propriétaire ou non) Origine (suédois ou non) Phone (téléphone ou non) Civil (marié ou non)

Sexe (homme ou femme) Par 4 groupes :

Age

(60)

.

) )

((EducOwn Origin Phone Age Civil Sexe

x

Préalablement analyser le fichier ECV2009 tel quel, pour maléquilibre et distance ,

avec le vecteur (de toutes les variables de la liste)

.

.

dim(x) = 23+ 1 + (4 – 1) + 1 + 1 = 14

(61)

Fichier ECV2009 tel quel (aucune intervention)

Tentative Taux rép.

100×P distr|nr 100×IMB

8 ordinaire 53.0 0.515 5.85

Fin ordin. 60.4 0.552 4.79

3 follow-up 63.8 0.581 4.43

Final 67.4 0.623 4.14

La distance rép/non-rép augmente sans cesse

) )

((Educ Own Origin Phone Age Civil Sexe

x

(62)

Faire mieux: Expériences rétrospectives

Préciser un vecteur

x

a de surveillance pour

effectuer des interventions « après coup » dans ECV2009 : Considérer les tentatives de contact terminées

pour des unités « ne valant plus la peine d’être poursuivies »

(63)

Procédure

Arrêter les efforts de contact pour les unités ayant intensité élevée.

Du coup, quand on continue avec celles qui restent, ils vont

successivement atteindre une intensité de réponse plus élevée.

Pˆak

(64)

.

.

.

Vecteur de surveillance : Comment le choisir ? Options :

• Affecter toutes les variables de la liste au vecteur

x

a de surveillance

• Affecter une partie des variables à la surveillance, laisser les autres pour l’estimation

(65)

.

Liste des variables auxiliaires retenues :

.

Binaires :

Éduc (élevée ou non)

Own (propriétaire ou non) Origine (suédois ou non) Phone (téléphone ou non) Civil (marié ou non)

Sexe (homme ou femme) Par 4 groupes :

Age

(66)

.

.

) )

((Educ Owner Origin Phone Age Civil Sexe

a

x

Dim(

x

a ) = 23+1 + 3 + 1 + 1 = 14

Nombre de valeurs possibles de

x

a = nombre de propriétés reconnues chez les unités = 256

Affecter toutes les variables à la surveillance

 1

x

b

(67)

Procédure

A chacun de J points définis à l’avance, mettre de côté (ne plus poursuivre) une partie, 1/(J+1), des unités,

celles ayant des valeurs élevées de l’intensité

P ˆ

ak

OO

(68)

x

a de dim.14 (toutes les var.

x

) , aucun

x

b

Tentative Taux rép.

100×P distr|nr 100×

IMBa

8 ordinaire 53.0 0.515 5.85

Fin ordin. 58.6 0.473 3.85

3 follow-up 60.0 0.446 3.18

Final 60.5 0.418 2.72

Reduction du nombre de tentatives : 16.1%

Distance diminue ; bon signe.

(69)

Alternativement,

affecter seulement une partie des variables à la surveillance ;

retenir les autres pour l’estimation (inactives au stade collecte)

8 2

dim );

(   

3

Educ Own Origin x

a

. b

 ( PhoneAgeCivilSexe ); dim  7 x

.

Conséquence : IMB et distr/nr plus élevés, comparativement à la surveillance

sur toutes les variables x de la liste.

(70)

.

Données finales

taux rép.

100P distr/nr IMBab

ECV2009

tel quel; aucune surveillance

67.4 0.623 4.14

Surveiller

sur une partie xa

de dim 8

60.8 0.513 3.45

Surveiller sur toutes

xa de dim 14

60.5 0.418 2.72

.

Comparaison, 3 différentes collectes de données

Surveillance plus serrée  distance diminue

(71)

Données

finales IMBab

(total)

IMBb (marg)

IMBa/b (cond)

ECV2009

tel quel ; aucune surveillance

4.14 2.77 1.37

Surveiller

sur une partie

xa de dim 8

3.45 3.04 0.41

Surveiller sur toutes

xa de dim 14

2.72 2.17 0.55

.

Maléquilibre total, marginal , conditionnel )

(Phone Age Civil Sexe

b

x

(72)

4.

Stade estimation : ajustement pour non-réponse

y

k

disponible

k  r

seulement

La situation est changée :

r

est désormais fixé plus possible d’améliorer sa composition ;

faut l’accepter tel quel pour l’estimation

Objectif: Construire un vecteur x puissant r  s  U

réponse  échantillon  population

(73)

.

Disponible : Liste de variables auxiliaires (nombreux) Objectif: construire un vecteur x pour un calcul des poids de calage

réduire autant que possible le biais des estimations

car il y en a, malgré un certain équilibrage lors du collecte des données

(74)

Comment choisir, dans une manière « stepwise » ou autrement, les variables x à retenir ?

« Prendre les meilleurs d'abord » est une solution.

Les variables y sont nombreuses, ce qui complique le

choix des variables x . Celles qui sont bonnes pour une certaine y ne l’est peut-être pas pour les autres.

Pour la théorie nous examinons une seule variable y.

OO

(75)

U  s  r

population 

échantillon  répondants

y

k

observé k  r seulement Estimateurs de

r k k k

CAL

d m y

Y ˆ par calage; moins b

iaisé

s k k

FUL d y

Yˆ

sans biais mais

irréa

lisable par expansion; tres bi

aisé

d s k r

EXP

d y

Y ˆ  (  ) 

;

U k

y

Y

(76)

r dkmk yk

CAL

Y ˆ

Estimateur calage de

avec poids de calage

Propriété calage des poids d

k

m

k

colonne

rangee

x x

x

x k

s k k r k k k

k d d

m

 

 

) 1

) (

r dkmkxk s dkxk

U k

y

Y

(77)

0 Y ˆ FUL

Quand

x

k

devient plus puissant, étant donne r et s :

 

 

ajustement

EXP

CAL

Y

Y ˆ ˆ

CAL EXP Y Yˆ ˆ

Y ˆ

EXP

.

Ajustement

s’éloigne de l’estimation rudimentaire

Y ˆ

CAL

grandit

(78)

0

YˆFUL

YˆCAL

YˆEXP

s’éloigne de pour se rapprocher de

YˆEXP

YˆCAL

YˆFUL

(très biaisé) (sans biais)

diminuant

FUL EXP

CAL EXP

Y Y

Y Y

ˆ ˆ

ˆ 1 ˆ

biais du

ratio

Pour r et s fixés :

La tendance lorsque x devient plus puissant :

OO

(79)

L’intuition nous dit : plus il y a du maléquilibre,

plus il faudra ajuster les estimations.

C’est ainsi.

.

.

(80)

Ajustement standardisé :

y CAL EXP

S N

Y StAdj Y

ˆ ˆ

S

y = écart-type de y, calculé sur la réponse

r

(81)

ou

IMB

est le maléquilibre

Ry,x et

R

DC des coefficients de corrélation

y CAL EXP

S N

Y StAdj Y

ˆ

ˆ ˆ

C D

y R

R

IMB,,

x

Une analyse montre que StAdj se décompose en 3 facteurs :

(82)

.

L’importance de l’ajustement dépend (en partie) du maléquilibre

IMB

subsistant encore

malgré les efforts de l’équilibrage au stade collecte) Pas de maléquilibre

pas d’ajustement

y CAL EXP

S N

Y StAdj Y

ˆ

ˆ ˆ

C D

y R

R

IMB,,

x

(83)

1 avons

Nous Ry,x  ; 1

RD,C

3 . 0 0

souvent

et  IMB

% 8 2

. 0 8

. 0 5

.

0   

EXP y

CAL S

N Y N

Y ˆ 0.08 ˆ

ˆ ˆ StAdj

ex.

Par

C D

y

R

R IMB

StAdj  

,x

,

OO

ajustement = 0.08 écarts-type Estimation ajustée

(84)

Conclusion:

Comment « optimiser » le partage d’une quantité de variables x , entre les deux étapes,

surveillance de la collecte et estimation.

Serait-ce possible ?

.

.

(85)

.

Bibliographie

Groves, R.M. and Heeringa, S.G. (2006). Responsive design for household surveys: tools for actively controlling survey errors and costs. Journal of the Royal Statistical Society: Series A, 169.

Bethlehem, J., Cobben, F. and Schouten, B. (2011). Handbook of Nonresponse in Household Surveys. New York: Wiley.

Schouten, B., Cobben, F. and Bethlehem, J. (2009). Indicators for the representativeness of survey response.

Survey Methodology, 35, 101-113.

Schouten, B., Shlomo, N. and Skinner, C. (2011). Indicators for monitoring and improving representativeness of response. Journal of Official Statistics, 27, 231-253.

Särndal, C.E. and Lundström, S. (2005). Estimation in Surveys with Nonresponse. New York: Wiley.

Särndal, C.E. (2011a). Dealing with Survey Nonresponse in Data Collection, in Estimation (Morris Hansen lecture). Journal of Official Statistics, 27, 1-21.

Särndal, C.E. (2011b). Three factors to signal nonresponse bias, with applications to categorical auxiliary variables. International Statistical Review, 79, 233-254.

Lundquist, P. and Särndal, C.E. (2012). Aspects of responsive design with applications to the Swedish Living Conditions Survey. Report 2011:1, Statistics Sweden

(86)

Merci de votre attention

.

Références

Documents relatifs

Les étapes de la réponse immunitaire à médiation

• Indiquer List1 sur la ligne Var-X-List et List2 sur la ligne Var-Y-List.. Appuyez

b) Trouve le chemin de la lumière qui permet à Charlotte de voir l’arbre la nuit. Tracer les rayons limites du faisceau lumineux qui pénètre dans la boîte. Des 4 points,

• Il y a des divergences importantes parmi les évaluations des hôpitaux accordées par les infirmières en tant qu’informateurs (erreur, différences d’opinion). •

Nous étendons la notion d’influence au cas d’un sondage à deux phases et construisons un estimateur robuste dans le cas d’un tirage à deux phases.. L’estimateur robuste

En un deuxième temps, la collecte de données terminée, on se trouve en présence d’un ensemble de répondants alors fixé ; pour la phase d’estimation il faut accepter la limitation

De ce fait, les variables latentes peuvent être utilisées comme variables instrumentales dans le calage généralisé pour la correction de la non-réponse non-ignorable. De plus,

Nous avons proposé une méthode pour réduire le biais de la non-réponse dans le cas où une variable latente peut être calculée à partir de variables d'intérêt. La méthode