• Aucun résultat trouvé

Consistance sous un modèle de réponse de la fonction de répartition estimée en présence de données manquantes

N/A
N/A
Protected

Academic year: 2022

Partager "Consistance sous un modèle de réponse de la fonction de répartition estimée en présence de données manquantes"

Copied!
1
0
0

Texte intégral

(1)

Consistance sous un modèle de réponse de la fonction de répartition estimée en présence de

données manquantes

Guillaume Chauvet 1 & Hélène Boistard 2 & David Haziza 3

1 Ensai (Crest), chauvet@ensai.fr

2 Université Toulouse 1, helene@boistard.fr

3 Université de Montréal, David.Haziza@umontreal.ca

On rencontre des problèmes de données manquantes dans les enquêtes quand certaines des unités refusent de répondre, ou quand il est impossible de les contacter. Nous nous intéressons ici au cas où une méthode d’imputation simple est utilisée pour remplacer une valeur manquante par une valeur artificielle. Afin d’étudier les propriétés des estimateurs, nous considérons deux approches : (i) l’approche par le modèle de non-réponse (NM), et (ii) l’approche par le modèle d’imputation (IM) qui nécessite la spécification d’un modèle décrivant la distribution de la variable étudiée. Les procédures doublement robustes offrent, dans une certaine mesure, une protection contre une mauvaise spécification de l’un des deux modèles ; voir par exemple Kang et Schafer (2007), Caoet al.(2009) pour la Statistique Classique, Kim et Park (2006) et Haziza et Rao (2006) dans le cadre d’un sondage, et les références dans ces articles.

La littérature mentionnée ci-dessus traite seulement le cas où l’on estime la valeur moyenne de la variable d’intérêt. À notre connaissance, le cas d’un estimateur doublement robuste de la fonction de répartition est peu (ou pas) abordé dans la littérature. Dans ce travail, nous consi- dérons le cas d’un mécanisme d’imputation des valeurs manquantes par la régression aléatoire pondérée (motivé par le modèle IM). Plus précisément, pour chaque non-répondant, un résidu observé pour un répondant est sélectionné au hasard avec une probabilité proportionnelle à un poids d’imputation, et utilisé dans l’imputation de la valeur manquante. Nous étudions les propriétés de double robustesse de la fonction de répartition estimée, en fonction des poids d’imputation utilisés, théoriquement et à l’aide d’une étude par simulations.

Bibliographie

Cao, W., et Tsiatis, A.A., et Davidian, M. (2009). Improving efficiency and robustness of the doubly robust estimator for a population mean with incomplete data, Biometrika, 96, 723-734.

Haziza, D., et Rao, J.N.K. (2006). A nonresponse model approach to inference under impu- tation for missing survey data, Survey Methodology, 32, 53-64.

Kang, D.Y., et Schafer, J.L. (2007). Demystifying double robustness : a comparison of al- ternative strategies for estimating a population mean from incomplete data (with discussion and rejoinder), Statistical Science, 22, 523-539.

Kim, J.K., et Park, H.A. (2006). Imputation using response probability, Canadian Journal Statistics, 34, 171-182.

Colloque francophone sur les Sondages 1

Références

Documents relatifs

La théorie des sondages (échantillonnage et estimation dans des populations finies) modifie profondément les concepts étudiés en probabilités et statistique inférentielle ; dans

Estimateurs non param´ etriques de la fonction de r´ epartition d’une variable censur´ ee ` a droite sur petits domaines : approche bas´ ee sur un mod` ele.. Sandrine C ASANOVA

Il peut y avoir plusieurs occurrences pour un service ou appareil particulier, ou plusieurs occurrences de personnes dans un document de format de données d'informations de

il ne faut voir dans ce comportement ni masochisme ni désintérêt des bretons envers leur langue. l’amour des parents pour leurs enfants et la volonté de leur « ouvrir toutes les

Dans cet exposé, nous étudions les propriétés asymptotiques des estimateurs variation- nels des paramètres pour le modèle Mixnet, ainsi que pour un modèle semi-paramétrique lié

courant pour que l’hamiltonien total de seconde quantification soit un opérateur autoadjoint positif sur l’espace de Fock des champs

Dans ce contexte de données manquantes, une solution simple pour estimer β 0 consiste à mener une analyse en "cas complets" ("CC" par la suite) c’est-à-dire à :

Dans nos tra- vaux, nous faisons l’hypothèse que les données manquantes sont de type NMAR et nous modélisons le mécanisme de manquement.. Nous supposons par exemple que la propension