• Aucun résultat trouvé

Modèle de sélection en présence de non-réponse non ignorable et population hétérogène

N/A
N/A
Protected

Academic year: 2022

Partager "Modèle de sélection en présence de non-réponse non ignorable et population hétérogène"

Copied!
1
0
0

Texte intégral

(1)

Modèle de sélection en présence de non-réponse non ignorable et population hétérogène

Éric Gautier 1

1 Ensae, Crest, 3 avenue Pierre Larousse, 92245 Malakoff Cedex, France, Eric.Gautier@ensae-paristech.fr

Supposons que nous disposions de données d’enquête en présence de non-réponse non- ignorable et que nous souhaitions estimer la fonction de répartition d’une variable Y. La fonction de répartition permet de retrouver de nombreux paramètres d’intérêt, par exemple des indicateurs d’inégalité.

Une approche usuelle consiste à modéliser conjointement la variable d’intérêt et le mécanisme de non-réponse. Le modèle de non-réponse que nous considérons est très souple, il s’écrit

D=I{Z0Γ + >0}.

Le casD= 1 correspond au cas où la variableY est renseignée et le casD = 0correspond à la non-réponse. Z est un vecteur de variables observées chez les répondants et les non-répondants etΓest un vecteur de cœfficients aléatoires dont on ne spécifie pas la distribution, on ne spécifie pas non plus la loi du terme d’erreur. Les variables entrant dans le vecteur Z doivent être convenablement choisies car leur loi jointe (sachant X, des variables de contrôle, si nécessaire pour justifier l’indépendance) doit être indépendante de la loi jointe de (Γ0, , Y) (sachant X si nécessaire). On les appelle des variables instrumentales. L’introduction de cœfficients aléatoires autorise des comportements de non-réponse différents pour chaque individu. La non-réponse est ignorable du fait de la dépendance entre (Γ0, ) et Y. La méthode proposée permet de conditionner par(Γ0, )et de retrouver toute la distribution deY. Ce modèle faisant apparaître plusieurs sources d’hétérogénéité ne restreint pas le modèle de non-réponse comme le ferait un modèle de la forme

D=I{π(Z) + >0}

où π est la fonction score qui implique l’hypothèse classique et critiquable de monotonie. En présence d’hétérogénéité inobservée dans l’équation de sélection il est connu que les méthodes à variables instrumentales n’utilisant pas explicitement de modèle de non-réponse ne permettent même pas de retrouver la moyenne de Y.

Outre l’hypothèse de variables instrumentales nous aurons besoin de quelques hypothèses techniques pour montrer qu’il est possible d’estimer la fonction de répartition de Y sachant (X,Γ, )et donc deY car la densité de(Γ, )peut être estimée. Même si le problème d’estimation fait intervenir un problème inverse mal posé, l’estimateur est une simple somme sur l’échantillon.

Bibliographie

Gautier, E., et Hoderlein, S. (2012). Estimating treatment effects with random coefficients in the selection equation, Preprint : hal-00618469.

Colloque francophone sur les Sondages 1

Références

Documents relatifs

Nous obtenons une repr´ esentation asymptotique de notre statistique de test se rap- prochant de celle obtenue sous des hypothses plus restrictives par Lopez et Patilea (2009)

Nous proposons une nouvelle méthode de sélection de variables pour données corrélées qui intègre les données manquantes : le Multiple Imputation Penalized Generalized

Il peut y avoir plusieurs occurrences pour un service ou appareil particulier, ou plusieurs occurrences de personnes dans un document de format de données d'informations de

De sorte qu’une messagerie instantanée serait la combinaison d’un Agent d’Utilisateur Présence, d’un agent d’utilisateur Observateur, d’un agent d’utilisateur de Boîte

Dans la section 2, nous introduisons brièvement les modèles loglinéaires pour variables qualitatives ; une attention spéciale est portée sur les modèles graphiques qui

Nous proposons une approche fondée sur le modèle de mélange de lois qui permet de sélectionner un modèle de classication et un nombre de classes de sorte à produire une

C'est une fonction positive et une hypothèse raisonnable du point de vue de la modélisation consiste à choisir une fonction croissante par rapport à x an de signier que l'âge est

Dans la littérature, les deux méthodes les plus connues pour estimer les paramètres d’un processus gamma (maximum de vraisemblance et méthode des moments) ont été dis- cutées