Mod` ele de s´ election en pr´ esence de non-r´ eponse non ignorable et population h´ et´ erog` ene
7e colloque francophone sur les sondages - ENSAI
Eric Gautier (CREST (ENSAE)) gautier@ensae.fr
le 7 novembre 2012
Non-r´eponse et sondage
Consid´erons un mod`ele de superpopulation o`u chaque unit´ei dans la population totale est une r´ealisation iid dans la loi jointe de
caract´eristiques (Y,XT,ZT,UT).
IY = variable sujette `a non-r´eponse partielle dans l’enquˆete ´etudi´ee.
IX,Z = vecteurs de caract´eristiques observ´es pour tous dans
l’´echantillon final.X =variable de contrˆole,Z =variable instrumentale.
(XT,ZT) rend compte del’h´et´erog´en´eit´e observ´ee.
IU est un vecteur de caract´eristiques inobserv´ees, il rend compte de l’h´et´erog´en´eit´e inobserv´ee.
D´efinissons 2 autres variables al´eatoires :DetB.
ID= 1 si l’unit´e se trouve dans l’´echantillon et 0 sinon.
L’´echantillon est celui obtenu apr`es tirage de l’enquˆete puis non-r´eponse totale. Pour simplifier, nous supposons que les poids obtenus apr`es redressement (y compris le calage sur marge) sont les vrais inverses des probabilit´es de s´election.
IB= 1 si l’unit´e dans l’´echantillon fourni la valeur de sonY et 0 sinon.
Non-r´eponse et sondage
Consid´erons un mod`ele de superpopulation o`u chaque unit´ei dans la population totale est une r´ealisation iid dans la loi jointe de
caract´eristiques (Y,XT,ZT,UT).
IY = variable sujette `a non-r´eponse partielle dans l’enquˆete ´etudi´ee.
IX,Z = vecteurs de caract´eristiques observ´es pour tous dans
l’´echantillon final.X =variable de contrˆole,Z =variable instrumentale.
(XT,ZT) rend compte del’h´et´erog´en´eit´e observ´ee.
IU est un vecteur de caract´eristiques inobserv´ees, il rend compte de l’h´et´erog´en´eit´e inobserv´ee.
D´efinissons 2 autres variables al´eatoires :DetB.
ID= 1 si l’unit´e se trouve dans l’´echantillon et 0 sinon.
L’´echantillon est celui obtenu apr`es tirage de l’enquˆete puis non-r´eponse totale. Pour simplifier, nous supposons que les poids obtenus apr`es redressement (y compris le calage sur marge) sont les vrais inverses des probabilit´es de s´election.
IB= 1 si l’unit´e dans l’´echantillon fourni la valeur de sonY et 0 sinon.
Mod´elisation hierarchique pour l’inf´erence
Gautier, E.(2011) : “Hierarchical Bayesian estimation of inequality measures with non-rectangular censored survey data with an application to wealth distribution of the French households”.Annals of Applied Statistics51632–1656.
1 G =Gb(Y1, . . . ,Yn) + r
V\ Gb
(Y1, . . . ,Yn)o`u∼ N(0,1),
⊥(Y1, . . . ,Yn)|(X1, . . . ,Xn) (s´election sur observables, la non-r´eponse totale est suppos´ee MAR),
Gb(y1, . . . ,yn) =
Pn
k=1(2ˆr(k)−1)wkyk Pn
k=1wkPn
k=1wkyk −1, ˆr(k) =Pn
j=1wj1l{yj≤yk}et V\
Gb
(y1, . . . ,yn) est obtenu sur le lin´earis´e en tenant compte du calage et du plan (exemple : utiliser POULPE) (ref. Deville (1999), Shao (1994))
2 FY|X,D=1(·|X) (que l’on estime, c.f. plus loin).
Nous fournissons un intervalle [b,h], le plus petit possible, tel que bP(G ∈[b,h]|Y1=y1, . . . ,Yr =yr;X1=x1, . . . ,Xn=xn)≥1−α.
Cette probabilit´e est calcul´ee par Monte-Carlo `a partir de la distribution empirique en simulantmcompl´etions dansFY\|X,D=1(·|xk) puisG pour cesm compl´etions.
Mod´elisation hierarchique pour l’inf´erence
Gautier, E.(2011) : “Hierarchical Bayesian estimation of inequality measures with non-rectangular censored survey data with an application to wealth distribution of the French households”.Annals of Applied Statistics51632–1656.
1 G =Gb(Y1, . . . ,Yn) + r
V\ Gb
(Y1, . . . ,Yn)o`u∼ N(0,1),
⊥(Y1, . . . ,Yn)|(X1, . . . ,Xn) (s´election sur observables, la non-r´eponse totale est suppos´ee MAR),
Gb(y1, . . . ,yn) =
Pn
k=1(2ˆr(k)−1)wkyk Pn
k=1wkPn
k=1wkyk −1, ˆr(k) =Pn
j=1wj1l{yj≤yk}et V\
Gb
(y1, . . . ,yn) est obtenu sur le lin´earis´e en tenant compte du calage et du plan (exemple : utiliser POULPE) (ref. Deville (1999), Shao (1994))
2 FY|X,D=1(·|X) (que l’on estime, c.f. plus loin).
Nous fournissons un intervalle [b,h], le plus petit possible, tel que bP(G ∈[b,h]|Y1=y1, . . . ,Yr =yr;X1=x1, . . . ,Xn=xn)≥1−α.
Cette probabilit´e est calcul´ee par Monte-Carlo `a partir de la distribution empirique en simulantmcompl´etions dansFY\|X,D=1(·|xk) puisG pour cesm compl´etions.
Mod´elisation hierarchique pour l’inf´erence
Gautier, E.(2011) : “Hierarchical Bayesian estimation of inequality measures with non-rectangular censored survey data with an application to wealth distribution of the French households”.Annals of Applied Statistics51632–1656.
1 G =Gb(Y1, . . . ,Yn) + r
V\ Gb
(Y1, . . . ,Yn)o`u∼ N(0,1),
⊥(Y1, . . . ,Yn)|(X1, . . . ,Xn) (s´election sur observables, la non-r´eponse totale est suppos´ee MAR),
Gb(y1, . . . ,yn) =
Pn
k=1(2ˆr(k)−1)wkyk Pn
k=1wkPn
k=1wkyk −1, ˆr(k) =Pn
j=1wj1l{yj≤yk}et V\
Gb
(y1, . . . ,yn) est obtenu sur le lin´earis´e en tenant compte du calage et du plan (exemple : utiliser POULPE) (ref. Deville (1999), Shao (1994))
2 FY|X,D=1(·|X) (que l’on estime, c.f. plus loin).
Nous fournissons un intervalle [b,h], le plus petit possible, tel que bP(G ∈[b,h]|Y1=y1, . . . ,Yr =yr;X1=x1, . . . ,Xn=xn)≥1−α.
Cette probabilit´e est calcul´ee par Monte-Carlo `a partir de la distribution empirique en simulantmcompl´etions dansFY\|X,D=1(·|xk) puisG pour cesm compl´etions.
Mod´elisation hierarchique pour l’inf´erence
Gautier, E.(2011) : “Hierarchical Bayesian estimation of inequality measures with non-rectangular censored survey data with an application to wealth distribution of the French households”.Annals of Applied Statistics51632–1656.
1 G =Gb(Y1, . . . ,Yn) + r
V\ Gb
(Y1, . . . ,Yn)o`u∼ N(0,1),
⊥(Y1, . . . ,Yn)|(X1, . . . ,Xn) (s´election sur observables, la non-r´eponse totale est suppos´ee MAR),
Gb(y1, . . . ,yn) =
Pn
k=1(2ˆr(k)−1)wkyk Pn
k=1wkPn
k=1wkyk −1, ˆr(k) =Pn
j=1wj1l{yj≤yk}et V\
Gb
(y1, . . . ,yn) est obtenu sur le lin´earis´e en tenant compte du calage et du plan (exemple : utiliser POULPE) (ref. Deville (1999), Shao (1994))
2 FY|X,D=1(·|X) (que l’on estime, c.f. plus loin).
Nous fournissons un intervalle [b,h], le plus petit possible, tel que bP(G ∈[b,h]|Y1=y1, . . . ,Yr =yr;X1=x1, . . . ,Xn=xn)≥1−α.
Cette probabilit´e est calcul´ee par Monte-Carlo `a partir de la distribution empirique en simulantmcompl´etions dansFY\|X,D=1(·|xk) puisG pour cesm compl´etions.
Non-r´eponse partielle
La non-r´eponse est MAR (Rubin) si∃X, toujours observ´e lorsqueD= 1, tel que∀φ∈Cb(R),
E[φ(Y)B|X,D= 1] =E[φ(Y)|X,D= 1]E[B|X,D= 1]
ou de mani`ere equivalente si
E[φ(Y)|X,B= 1,D= 1] =E[φ(Y)|X,D= 1].
Nous nous int´eressons `a des situations non-MAR. Dans ce cas, nous ne pouvons pas faire d’inf´erence sans mod´eliser explicitement le m´ecanisme de non-r´eponse : on dit que la non-r´eponse est ”non-ignorable”.
Un mod`ele qui semble flexible :B=1{g(Z)> }etZ⊥(,Y)|X,D= 1 o`ug et la loi desont nonparam´etriques. Ce mod`ele est ´equivalent `a B=1{F(Z)>U}o`uU|X =x,D= 1∼ U(0,1) etZ⊥(U,Y)|X,D= 1.
Les variables constituant le vecteur d’instrumentsZ doivent ˆetre li´ees `a la non-r´eponse mais pas `aY, les variablesX peuvent ˆetre introduites pour justifier l’utilisation des instruments. Par exemple l’heure de passage de l’enquˆeteur, l’identit´e de l’enquˆeteur (par exemple s’il n’y en avait que 2), etc. La valeur de l’instrument doit varier pour les unit´es de l’´echantillon.
Non-r´eponse partielle
La non-r´eponse est MAR (Rubin) si∃X, toujours observ´e lorsqueD= 1, tel que∀φ∈Cb(R),
E[φ(Y)B|X,D= 1] =E[φ(Y)|X,D= 1]E[B|X,D= 1]
ou de mani`ere equivalente si
E[φ(Y)|X,B= 1,D= 1] =E[φ(Y)|X,D= 1].
Nous nous int´eressons `a des situations non-MAR. Dans ce cas, nous ne pouvons pas faire d’inf´erence sans mod´eliser explicitement le m´ecanisme de non-r´eponse : on dit que la non-r´eponse est ”non-ignorable”.
Un mod`ele qui semble flexible :B=1{g(Z)> }etZ⊥(,Y)|X,D= 1 o`ug et la loi desont nonparam´etriques. Ce mod`ele est ´equivalent `a B=1{F(Z)>U}o`uU|X =x,D= 1∼ U(0,1) etZ⊥(U,Y)|X,D= 1.
Les variables constituant le vecteur d’instrumentsZ doivent ˆetre li´ees `a la non-r´eponse mais pas `aY, les variablesX peuvent ˆetre introduites pour justifier l’utilisation des instruments. Par exemple l’heure de passage de l’enquˆeteur, l’identit´e de l’enquˆeteur (par exemple s’il n’y en avait que 2), etc. La valeur de l’instrument doit varier pour les unit´es de l’´echantillon.
Non-r´eponse partielle
La non-r´eponse est MAR (Rubin) si∃X, toujours observ´e lorsqueD= 1, tel que∀φ∈Cb(R),
E[φ(Y)B|X,D= 1] =E[φ(Y)|X,D= 1]E[B|X,D= 1]
ou de mani`ere equivalente si
E[φ(Y)|X,B= 1,D= 1] =E[φ(Y)|X,D= 1].
Nous nous int´eressons `a des situations non-MAR. Dans ce cas, nous ne pouvons pas faire d’inf´erence sans mod´eliser explicitement le m´ecanisme de non-r´eponse : on dit que la non-r´eponse est ”non-ignorable”.
Un mod`ele qui semble flexible :B=1{g(Z)> }etZ⊥(,Y)|X,D= 1 o`ug et la loi desont nonparam´etriques. Ce mod`ele est ´equivalent `a B=1{F(Z)>U}o`uU|X =x,D= 1∼ U(0,1) etZ⊥(U,Y)|X,D= 1.
Les variables constituant le vecteur d’instrumentsZ doivent ˆetre li´ees `a la non-r´eponse mais pas `aY, les variablesX peuvent ˆetre introduites pour justifier l’utilisation des instruments. Par exemple l’heure de passage de l’enquˆeteur, l’identit´e de l’enquˆeteur (par exemple s’il n’y en avait que 2), etc. La valeur de l’instrument doit varier pour les unit´es de l’´echantillon.
Non-r´eponse partielle
La non-r´eponse est MAR (Rubin) si∃X, toujours observ´e lorsqueD= 1, tel que∀φ∈Cb(R),
E[φ(Y)B|X,D= 1] =E[φ(Y)|X,D= 1]E[B|X,D= 1]
ou de mani`ere equivalente si
E[φ(Y)|X,B= 1,D= 1] =E[φ(Y)|X,D= 1].
Nous nous int´eressons `a des situations non-MAR. Dans ce cas, nous ne pouvons pas faire d’inf´erence sans mod´eliser explicitement le m´ecanisme de non-r´eponse : on dit que la non-r´eponse est ”non-ignorable”.
Un mod`ele qui semble flexible :B=1{g(Z)> }etZ⊥(,Y)|X,D= 1 o`ug et la loi desont nonparam´etriques. Ce mod`ele est ´equivalent `a B=1{F(Z)>U}o`uU|X =x,D= 1∼ U(0,1) etZ⊥(U,Y)|X,D= 1.
Les variables constituant le vecteur d’instrumentsZ doivent ˆetre li´ees `a la non-r´eponse mais pas `aY, les variablesX peuvent ˆetre introduites pour justifier l’utilisation des instruments. Par exemple l’heure de passage de l’enquˆeteur, l’identit´e de l’enquˆeteur (par exemple s’il n’y en avait que 2), etc. La valeur de l’instrument doit varier pour les unit´es de l’´echantillon.
Monotonie
Cas non-MAR siU⊥Y|X, i.e. le param`etre d’h´et´erog´en´eit´e inobserv´eeU (des variables manquantes dans le mod`ele de non-r´eponse, etc.) est responsable de la s´election endog`ene.
Ce mod`ele est en fait extrˆemement restrictif !
Il est ´equivalent (Vytlacil 02) `a l’hypoth`ese de monotonie introduite par Imbens & Angrist 94 :∀z,z0∈supp(Z), si on change la valeur des instruments pour tous dez`az0
♠ ∀u∈[0,1],1{F(z)>u} ≥1{F(z0)>u}(siF(z)≥F(z0))
♠ou∀u∈[0,1],1{F(z)>u}<1{F(z0)>U}(siF(z)<F(z0)).
Dans le cas o`u il n’y a que deux enquˆeteurs A et B et que l’on utilise l’identiti´e de l’enquˆeteur comme instrument, la monotonie signifie que tout individu d´evoilant son Y `a A le d´evoilerait aussi `a B (ou le contraire).
Exemple de raison d’´echec : un individu particulier trouve l’enquˆeteur A plus sympathique que B (ex. car il lui ressemble) et accepte de r´epondre.
Dans ce cas une caract´eristique suppl´ementaire intervient dans le choix de r´epondre ou non. Celle-ci n’est pas observ´ee par le statisticien⇒ important d’introduire plusieurs sources d’h´et´erog´en´eit´e dans l’´equation de s´election.
Monotonie
Cas non-MAR siU⊥Y|X, i.e. le param`etre d’h´et´erog´en´eit´e inobserv´eeU (des variables manquantes dans le mod`ele de non-r´eponse, etc.) est responsable de la s´election endog`ene.
Ce mod`ele est en fait extrˆemement restrictif !
Il est ´equivalent (Vytlacil 02) `a l’hypoth`ese de monotonie introduite par Imbens & Angrist 94 :∀z,z0∈supp(Z), si on change la valeur des instruments pour tous dez`az0
♠ ∀u∈[0,1],1{F(z)>u} ≥1{F(z0)>u}(siF(z)≥F(z0))
♠ou∀u∈[0,1],1{F(z)>u}<1{F(z0)>U}(siF(z)<F(z0)).
Dans le cas o`u il n’y a que deux enquˆeteurs A et B et que l’on utilise l’identiti´e de l’enquˆeteur comme instrument, la monotonie signifie que tout individu d´evoilant son Y `a A le d´evoilerait aussi `a B (ou le contraire).
Exemple de raison d’´echec : un individu particulier trouve l’enquˆeteur A plus sympathique que B (ex. car il lui ressemble) et accepte de r´epondre.
Dans ce cas une caract´eristique suppl´ementaire intervient dans le choix de r´epondre ou non. Celle-ci n’est pas observ´ee par le statisticien⇒ important d’introduire plusieurs sources d’h´et´erog´en´eit´e dans l’´equation de s´election.
Monotonie
Cas non-MAR siU⊥Y|X, i.e. le param`etre d’h´et´erog´en´eit´e inobserv´eeU (des variables manquantes dans le mod`ele de non-r´eponse, etc.) est responsable de la s´election endog`ene.
Ce mod`ele est en fait extrˆemement restrictif !
Il est ´equivalent (Vytlacil 02) `a l’hypoth`ese de monotonie introduite par Imbens & Angrist 94 :∀z,z0∈supp(Z), si on change la valeur des instruments pour tous dez`az0
♠ ∀u∈[0,1],1{F(z)>u} ≥1{F(z0)>u}(siF(z)≥F(z0))
♠ou∀u∈[0,1],1{F(z)>u}<1{F(z0)>U}(siF(z)<F(z0)).
Dans le cas o`u il n’y a que deux enquˆeteurs A et B et que l’on utilise l’identiti´e de l’enquˆeteur comme instrument, la monotonie signifie que tout individu d´evoilant son Y `a A le d´evoilerait aussi `a B (ou le contraire).
Exemple de raison d’´echec : un individu particulier trouve l’enquˆeteur A plus sympathique que B (ex. car il lui ressemble) et accepte de r´epondre.
Dans ce cas une caract´eristique suppl´ementaire intervient dans le choix de r´epondre ou non. Celle-ci n’est pas observ´ee par le statisticien⇒ important d’introduire plusieurs sources d’h´et´erog´en´eit´e dans l’´equation de s´election.
Monotonie
Cas non-MAR siU⊥Y|X, i.e. le param`etre d’h´et´erog´en´eit´e inobserv´eeU (des variables manquantes dans le mod`ele de non-r´eponse, etc.) est responsable de la s´election endog`ene.
Ce mod`ele est en fait extrˆemement restrictif !
Il est ´equivalent (Vytlacil 02) `a l’hypoth`ese de monotonie introduite par Imbens & Angrist 94 :∀z,z0∈supp(Z), si on change la valeur des instruments pour tous dez`az0
♠ ∀u∈[0,1],1{F(z)>u} ≥1{F(z0)>u}(siF(z)≥F(z0))
♠ou∀u∈[0,1],1{F(z)>u}<1{F(z0)>U}(siF(z)<F(z0)).
Dans le cas o`u il n’y a que deux enquˆeteurs A et B et que l’on utilise l’identiti´e de l’enquˆeteur comme instrument, la monotonie signifie que tout individu d´evoilant son Y `a A le d´evoilerait aussi `a B (ou le contraire).
Exemple de raison d’´echec : un individu particulier trouve l’enquˆeteur A plus sympathique que B (ex. car il lui ressemble) et accepte de r´epondre.
Dans ce cas une caract´eristique suppl´ementaire intervient dans le choix de r´epondre ou non. Celle-ci n’est pas observ´ee par le statisticien⇒ important d’introduire plusieurs sources d’h´et´erog´en´eit´e dans l’´equation de s´election.
Le mod`ele `a choix binaire et coefficients al´eatoires
Gautier, E., et Y. Kitamura(2008) : “Nonparametric estimation in random coefficients binary choice models”. A paraˆıtre dansEconometrica.
Gautier, E., et S. Hooderlein(2011) : “Estimating treatment effects with a nonparametric random coefficients selection equation”. Preprint (v1) arXiv :1109.0362.
Gautier, E., et E. Le Pennec(2011) : “Adaptive estimation in random coefficients binary choice models using needlet thresholding”. Preprint arXiv :1106.3503.
Heckman & Vytlacil 05, le mod`ele ”benchmark” non additivement s´eparable et avec plusieurs sources d’h´et´erog´en´eit´e inobserv´e est un mod`ele `a choix binaire et coefficients al´eatoires :
B=1{Z1Γ1+Z2T
Γ2+ Γ0>0}
avecZ1scalaire etZ2de tailleL−1 o`uL≥2. Supposons un mod`ele nonparam´etrique pour la loi de (Γ1,ΓT2,Γ0) et Γ1>0 p.s.
Dans ce mod`ele, chaque individu a son propre vecteur de coefficients (pr´ef´erences).
R´e-´ecrivons :B=1{Z1−Z2T
Γ−Θ>0}puis, en posant Se= (Z2T,1)T/k(Z2T,1)k,Ve=Z1/k(Z2T,1)k, eteΓ = (ΓT,Θ)T, B=1{eSTeΓ<Ve}.
Le mod`ele `a choix binaire et coefficients al´eatoires
Gautier, E., et Y. Kitamura(2008) : “Nonparametric estimation in random coefficients binary choice models”. A paraˆıtre dansEconometrica.
Gautier, E., et S. Hooderlein(2011) : “Estimating treatment effects with a nonparametric random coefficients selection equation”. Preprint (v1) arXiv :1109.0362.
Gautier, E., et E. Le Pennec(2011) : “Adaptive estimation in random coefficients binary choice models using needlet thresholding”. Preprint arXiv :1106.3503.
Heckman & Vytlacil 05, le mod`ele ”benchmark” non additivement s´eparable et avec plusieurs sources d’h´et´erog´en´eit´e inobserv´e est un mod`ele `a choix binaire et coefficients al´eatoires :
B=1{Z1Γ1+Z2T
Γ2+ Γ0>0}
avecZ1scalaire etZ2de tailleL−1 o`uL≥2. Supposons un mod`ele nonparam´etrique pour la loi de (Γ1,ΓT2,Γ0) et Γ1>0 p.s.
Dans ce mod`ele, chaque individu a son propre vecteur de coefficients (pr´ef´erences).
R´e-´ecrivons :B=1{Z1−Z2T
Γ−Θ>0}puis, en posant Se= (Z2T,1)T/k(Z2T,1)k,Ve=Z1/k(Z2T,1)k, eteΓ = (ΓT,Θ)T, B=1{eSTeΓ<Ve}.
Le mod`ele `a choix binaire et coefficients al´eatoires
Gautier, E., et Y. Kitamura(2008) : “Nonparametric estimation in random coefficients binary choice models”. A paraˆıtre dansEconometrica.
Gautier, E., et S. Hooderlein(2011) : “Estimating treatment effects with a nonparametric random coefficients selection equation”. Preprint (v1) arXiv :1109.0362.
Gautier, E., et E. Le Pennec(2011) : “Adaptive estimation in random coefficients binary choice models using needlet thresholding”. Preprint arXiv :1106.3503.
Heckman & Vytlacil 05, le mod`ele ”benchmark” non additivement s´eparable et avec plusieurs sources d’h´et´erog´en´eit´e inobserv´e est un mod`ele `a choix binaire et coefficients al´eatoires :
B=1{Z1Γ1+Z2T
Γ2+ Γ0>0}
avecZ1scalaire etZ2de tailleL−1 o`uL≥2. Supposons un mod`ele nonparam´etrique pour la loi de (Γ1,ΓT2,Γ0) et Γ1>0 p.s.
Dans ce mod`ele, chaque individu a son propre vecteur de coefficients (pr´ef´erences).
R´e-´ecrivons :B=1{Z1−Z2T
Γ−Θ>0}puis, en posant Se= (Z2T,1)T/k(Z2T,1)k,Ve=Z1/k(Z2T,1)k, eteΓ = (ΓT,Θ)T, B=1{eSTeΓ<Ve}.
Le mod`ele `a choix binaire et coefficients al´eatoires
Gautier, E., et Y. Kitamura(2008) : “Nonparametric estimation in random coefficients binary choice models”. A paraˆıtre dansEconometrica.
Gautier, E., et S. Hooderlein(2011) : “Estimating treatment effects with a nonparametric random coefficients selection equation”. Preprint (v1) arXiv :1109.0362.
Gautier, E., et E. Le Pennec(2011) : “Adaptive estimation in random coefficients binary choice models using needlet thresholding”. Preprint arXiv :1106.3503.
Heckman & Vytlacil 05, le mod`ele ”benchmark” non additivement s´eparable et avec plusieurs sources d’h´et´erog´en´eit´e inobserv´e est un mod`ele `a choix binaire et coefficients al´eatoires :
B=1{Z1Γ1+Z2T
Γ2+ Γ0>0}
avecZ1scalaire etZ2de tailleL−1 o`uL≥2. Supposons un mod`ele nonparam´etrique pour la loi de (Γ1,ΓT2,Γ0) et Γ1>0 p.s.
Dans ce mod`ele, chaque individu a son propre vecteur de coefficients (pr´ef´erences).
R´e-´ecrivons :B=1{Z1−Z2T
Γ−Θ>0}puis, en posant Se= (Z2T,1)T/k(Z2T,1)k,Ve=Z1/k(Z2T,1)k, eteΓ = (ΓT,Θ)T, B=1{eSTeΓ<Ve}.
Le mod`ele `a choix binaire et coefficients al´eatoires
Gautier, E., et Y. Kitamura(2008) : “Nonparametric estimation in random coefficients binary choice models”. A paraˆıtre dansEconometrica.
Gautier, E., et S. Hooderlein(2011) : “Estimating treatment effects with a nonparametric random coefficients selection equation”. Preprint (v1) arXiv :1109.0362.
Gautier, E., et E. Le Pennec(2011) : “Adaptive estimation in random coefficients binary choice models using needlet thresholding”. Preprint arXiv :1106.3503.
Heckman & Vytlacil 05, le mod`ele ”benchmark” non additivement s´eparable et avec plusieurs sources d’h´et´erog´en´eit´e inobserv´e est un mod`ele `a choix binaire et coefficients al´eatoires :
B=1{Z1Γ1+Z2T
Γ2+ Γ0>0}
avecZ1scalaire etZ2de tailleL−1 o`uL≥2. Supposons un mod`ele nonparam´etrique pour la loi de (Γ1,ΓT2,Γ0) et Γ1>0 p.s.
Dans ce mod`ele, chaque individu a son propre vecteur de coefficients (pr´ef´erences).
R´e-´ecrivons :B=1{Z1−Z2T
Γ−Θ>0}puis, en posant Se= (Z2T,1)T/k(Z2T,1)k,Ve=Z1/k(Z2T,1)k, eteΓ = (ΓT,Θ)T, B=1{eSTeΓ<Ve}.
Non-monotonie
Le mod`elepermet des situations non-monotones dans le m´ecanisme de non-r´eponse. Fixonsv ∈supp(Ve),s ets0danssupp
feS|Ve(·|v)
, et posons Ds(γ) =1{sTγ <v}
Dans la zone 2Ds= 0 etDs0 = 1, dans la 4Ds= 1 etDs0= 0
Hypoth`eses
(H-1) La loi conditionnelle de (Z1,Z2,ΓT,Θ) sachantX =x,D= 1 est absoluement continue par rapport `a la mesure de Lebesgue
∀x ∈supp fX|D=1
.Z1et Ypeuvent en fait ˆetre discrets.
⇒restrictions d’exclusion (H-2) (Z1,Z2)⊥(Y,ΓT,Θ)|X,D= 1.
(H-3) 0<P(B= 1|X,D= 1)<1 p.s.
(H-4) ∀x ∈supp fX|D=1
,supp
feS|X,D=1(·|x)
=H+ et
∀s ∈SL: sT(0, . . . ,0,1)≥0,supp
fVe|eS,X,D=1(·|s,x)
⊃
infγ∈supp
f
eΓ|X,D=1(·|x)sTγ,supγ∈supp
f
eΓ|X,D=1(·|x)sTγ
.
Hypoth`eses
(H-1) La loi conditionnelle de (Z1,Z2,ΓT,Θ) sachantX =x,D= 1 est absoluement continue par rapport `a la mesure de Lebesgue
∀x ∈supp fX|D=1
.Z1et Ypeuvent en fait ˆetre discrets.
⇒restrictions d’exclusion (H-2) (Z1,Z2)⊥(Y,ΓT,Θ)|X,D= 1.
(H-3) 0<P(B= 1|X,D= 1)<1 p.s.
(H-4) ∀x ∈supp fX|D=1
,supp
feS|X,D=1(·|x)
=H+ et
∀s ∈SL: sT(0, . . . ,0,1)≥0,supp
fVe|eS,X,D=1(·|s,x)
⊃
infγ∈supp
f
eΓ|X,D=1(·|x)sTγ,supγ∈supp
f
eΓ|X,D=1(·|x)sTγ
.
Hypoth`eses
(H-1) La loi conditionnelle de (Z1,Z2,ΓT,Θ) sachantX =x,D= 1 est absoluement continue par rapport `a la mesure de Lebesgue
∀x ∈supp fX|D=1
.Z1et Ypeuvent en fait ˆetre discrets.
⇒restrictions d’exclusion (H-2) (Z1,Z2)⊥(Y,ΓT,Θ)|X,D= 1.
(H-3) 0<P(B= 1|X,D= 1)<1 p.s.
(H-4) ∀x ∈supp fX|D=1
,supp
feS|X,D=1(·|x)
=H+ et
∀s ∈SL: sT(0, . . . ,0,1)≥0,supp
fVe|eS,X,D=1(·|s,x)
⊃
infγ∈supp
f
eΓ|X,D=1(·|x)sTγ,supγ∈supp
f
eΓ|X,D=1(·|x)sTγ
.
Hypoth`eses
(H-1) La loi conditionnelle de (Z1,Z2,ΓT,Θ) sachantX =x,D= 1 est absoluement continue par rapport `a la mesure de Lebesgue
∀x ∈supp fX|D=1
.Z1et Ypeuvent en fait ˆetre discrets.
⇒restrictions d’exclusion (H-2) (Z1,Z2)⊥(Y,ΓT,Θ)|X,D= 1.
(H-3) 0<P(B= 1|X,D= 1)<1 p.s.
(H-4) ∀x ∈supp fX|D=1
,supp
feS|X,D=1(·|x)
=H+ et
∀s ∈SL: sT(0, . . . ,0,1)≥0,supp
fVe|eS,X,D=1(·|s,x)
⊃
infγ∈supp
f
eΓ|X,D=1(·|x)sTγ,supγ∈supp
f
eΓ|X,D=1(·|x)sTγ
.
Identification
NotonsY0=YB, dans ce cas la non-r´eponse correspond `a un 0 (on suppose queP(Y = 0|D= 1,X) = 0 p.s.) etEDl’esp´erance conditionnelle sachant D= 1.
Theorem
∀φ: ED[|φ(Y)|]<∞, p.p. x ∈supp(X) feΓ|X,D=1(·|x) =R−1
∂vED
h B
S,e Ve
=·,X =xi ED
h φ(Y)
eΓ =·,X =xi
feΓ|X,D=1(·|x) =R−1
∂vED
h φ(Y0)B
eS,Ve
=·,X =xi .
g = extension deg qui vaut 0 en dehors du domaine de d´efinition
⇒(ex)
FY|X,D=1(y|x) =R
RLR−1
∂vED
h
1{Y0≤y}B
S,e Ve
=·,X=xi (γ)dγ
⇒(ex) mesure d’in´egalit´e, quantiles, etc.
Estimateur
AT[f](γ) :=R
s∈SL:sT(0,...,0,1)≥0
R∞
−∞KT(sTγ−u)f(s,u)dudσ(s) = inverse r´egularis´ee deR,KT(u) := 2(2π)−LRT
0 cos(tu)tL−1Ψ(t/T)dt o`u Ψ∈ S(R) est symmetrique et Ψ(0) = 1 (ex.ψ=ψ0o`u
ψ0: x7→exp
1−maxn
1 1−x2,0o
).
Estimateur :ATn
\
∂vED[φ(Y0)B|(eS,Ve) =·,X =x]
(γ), l’estimateur de la d´eriv´ee de la fonction de r´egression est obtenu par polynˆomes locaux, etc.
FY|X,D=1(y|x) = R
RLATn
\
∂vED[1{Y0≤y}B|(eS,Ve) =·,X =x]
(γ)1{γ∈ Bn}dγ o`uBn
est un ferm´e born´e deRL.
Estimateur
AT[f](γ) :=R
s∈SL:sT(0,...,0,1)≥0
R∞
−∞KT(sTγ−u)f(s,u)dudσ(s) = inverse r´egularis´ee deR,KT(u) := 2(2π)−LRT
0 cos(tu)tL−1Ψ(t/T)dt o`u Ψ∈ S(R) est symmetrique et Ψ(0) = 1 (ex.ψ=ψ0o`u
ψ0: x7→exp
1−maxn
1 1−x2,0o
).
Estimateur :ATn
\
∂vED[φ(Y0)B|(eS,Ve) =·,X =x]
(γ), l’estimateur de la d´eriv´ee de la fonction de r´egression est obtenu par polynˆomes locaux, etc.
FY|X,D=1(y|x) = R
RLATn
\
∂vED[1{Y0≤y}B|(eS,Ve) =·,X =x]
(γ)1{γ∈ Bn}dγ o`uBn
est un ferm´e born´e deRL.
Estimateur
AT[f](γ) :=R
s∈SL:sT(0,...,0,1)≥0
R∞
−∞KT(sTγ−u)f(s,u)dudσ(s) = inverse r´egularis´ee deR,KT(u) := 2(2π)−LRT
0 cos(tu)tL−1Ψ(t/T)dt o`u Ψ∈ S(R) est symmetrique et Ψ(0) = 1 (ex.ψ=ψ0o`u
ψ0: x7→exp
1−maxn
1 1−x2,0o
).
Estimateur :ATn
\
∂vED[φ(Y0)B|(eS,Ve) =·,X =x]
(γ), l’estimateur de la d´eriv´ee de la fonction de r´egression est obtenu par polynˆomes locaux, etc.
FY|X,D=1(y|x) = R
RLATn
\
∂vED[1{Y0≤y}B|(eS,Ve) =·,X =x]
(γ)1{γ∈ Bn}dγ o`uBn
est un ferm´e born´e deRL.
Estimateur simple
(H-5) p.p. pours ∈SL: sT(0, . . . ,0,1)≥0 et p.s. pourx∈supp(X), supp
fVe|eS,X,D=1(·|s,x)
=R; Pour la fonctionφconsid´er´ee, p.p. en s∈SL: sT(0, . . . ,0,1)≥0 et p.s. enx ∈supp(fX|D=1),
v 7→ED[φ(Y0)B|(eS,Ve) = (s,v),X=x] est continue et v 7→ED[φ(Y0)B|(eS,Ve) = (s,v),X=x] et
v 7→∂vED[φ(Y0)B|(eS,Ve) = (s,v),X =x] sont born´ees par des polynˆomes env.
Sous (H-5) nous pouvons utiliser l’estimateur 1
n
n
X
i=1
KeTn(esiTγ−evi)Tτn(φ(y0i))bi
f \
eS,eV,X|D=1(esi,evi,x)
1n f \
eS,eV,X|D=1(esi,evi,x) >tn
o
Kηn(xi−x)
o`uKeT(u) := 2(2π)−LRT
0 sin(tu)tLΨ(t/T)dt,f \
eS,eV,X|D=1 est un estimateur plug-in def
eS,eV,X|D=1,Tτ(x) =−τ1{x<−τ}+x1{|x| ≤τ}+τ1{x > τ}
etKηest un noyau multivari´e de fenˆetreη.
Estimateur simple
(H-5) p.p. pours ∈SL: sT(0, . . . ,0,1)≥0 et p.s. pourx∈supp(X), supp
fVe|eS,X,D=1(·|s,x)
=R; Pour la fonctionφconsid´er´ee, p.p. en s∈SL: sT(0, . . . ,0,1)≥0 et p.s. enx ∈supp(fX|D=1),
v 7→ED[φ(Y0)B|(eS,Ve) = (s,v),X=x] est continue et v 7→ED[φ(Y0)B|(eS,Ve) = (s,v),X=x] et
v 7→∂vED[φ(Y0)B|(eS,Ve) = (s,v),X =x] sont born´ees par des polynˆomes env.
Sous (H-5) nous pouvons utiliser l’estimateur 1
n
n
X
i=1
KeTn(esiTγ−evi)Tτn(φ(y0i))bi
f \
eS,eV,X|D=1(esi,evi,x)
1n f \
eS,eV,X|D=1(esi,evi,x) >tn
o
Kηn(xi−x)
o`uKeT(u) := 2(2π)−LRT
0 sin(tu)tLΨ(t/T)dt,f \
eS,eV,X|D=1 est un estimateur plug-in def
eS,eV,X|D=1,Tτ(x) =−τ1{x<−τ}+x1{|x| ≤τ}+τ1{x > τ}
etKηest un noyau multivari´e de fenˆetreη.
R´esultats asymptotiques
g(γ) =R−1
∂vED
h φ(Y0)B
S,e Ve
=·i
(γ),est estim´e par
ˆ g(γ) = 1
n
n
X
i=1
KeTn(esi0γ−evi)Tτn(φ(y0i))bi
max
feS,\V|D=1e (esi,evi),mn
.
Ws,∞(RL) :=
f ∈L∞(RL) : ∀|α| ≤s, ∂αf ∈L∞(RL) o`us ∈N\ {0}, α∈NL,|α|:=PL
l=1αl and∂αf :=QL l=1∂lαlf, kfks,∞:=P
α:|α|≤sk∂αfk∞.
Nous consid´erons les ellipsoides de Sobolev Ws,∞(M) :=n
f ∈Ws,∞(RL) : kfks,∞≤Mo Bn un ferm´e deRL etd(Bn) son diam`etre pour la norme Euclidi`ene.
R´esultats asymptotiques
g(γ) =R−1
∂vED
h φ(Y0)B
S,e Ve
=·i
(γ),est estim´e par
ˆ g(γ) = 1
n
n
X
i=1
KeTn(esi0γ−evi)Tτn(φ(y0i))bi
max
feS,\V|D=1e (esi,evi),mn
.
Ws,∞(RL) :=
f ∈L∞(RL) : ∀|α| ≤s, ∂αf ∈L∞(RL) o`us ∈N\ {0}, α∈NL,|α|:=PL
l=1αl and∂αf :=QL l=1∂lαlf, kfks,∞:=P
α:|α|≤sk∂αfk∞.
Nous consid´erons les ellipsoides de Sobolev Ws,∞(M) :=n
f ∈Ws,∞(RL) : kfks,∞≤Mo Bn un ferm´e deRL etd(Bn) son diam`etre pour la norme Euclidi`ene.
R´esultats asymptotiques
g(γ) =R−1
∂vED
h φ(Y0)B
S,e Ve
=·i
(γ),est estim´e par
ˆ g(γ) = 1
n
n
X
i=1
KeTn(esi0γ−evi)Tτn(φ(y0i))bi
max
feS,\V|D=1e (esi,evi),mn
.
Ws,∞(RL) :=
f ∈L∞(RL) : ∀|α| ≤s, ∂αf ∈L∞(RL) o`us ∈N\ {0}, α∈NL,|α|:=PL
l=1αl and∂αf :=QL l=1∂lαlf, kfks,∞:=P
α:|α|≤sk∂αfk∞.
Nous consid´erons les ellipsoides de Sobolev Ws,∞(M) :=n
f ∈Ws,∞(RL) : kfks,∞≤Mo Bn un ferm´e deRL etd(Bn) son diam`etre pour la norme Euclidi`ene.
R´esultats asymptotiques 2
Proposition
Supposons (H-5) et g∈Ws∞(M),∃α >0 : log(Tn3/mn) +Llog(d(Bn))≤α,
∃rIV,n →
n→∞0et MIV tq limn→∞rIV−1,n max
i=1,...,n
f
eS,eV|D=1(esi,evi)−f\
eS,eV|D=1(esi,evi)
≤MIV a.s.
pour M(α), C(s)avec proba 1,∀ >0, ∃N>0 : ∀N>N k(ˆg−g)1{Bn}k∞≤(MIV+) min (τn,kφk∞)rIV,rm−1n
E
KeTn
eS0γ−Ve max
\ f
eS,Ve|D=1
eS,Ve ,mn
∞
+ (MIV+) min (τn,kφk∞)rIV,nm−3/2n (M(α) +) logn
n 1/2
TnL+1/2
+m−1/2n (M(α) +) min (τn,kφk∞) logn
n 1/2
TnL+1/2
+ min (τn,kφk∞) sup γ∈Bn
Z
(s,v):f
eS,V|D=1e (s,v)<mn
KeTn(s0γ−v) dσ(s)dv
+MC(s)Tn−s
+ 1
(2π)LTnL+2k|t|Lψk1E[|φ(Y)|1{|φ(Y)|> τr}].
R´esultats asymptotiques 3
Dans le cas id´eal o`u : (1)f
eS,eV|D=1est minor´e, (2) sa densit´e est suffisamment r´eguli`ere pour que le premier terme soit n´eglig´eable et (3) le biais li´e `a la troncature est n´egligeable (ex.lorsqueφest born´e), nous obtenons,∃MI >0
limn→∞
logn n
−2s+2L+1s
kˆg−gk∞≤MI p.s.
lorsqueTn(n/log(n))1/(2s+2L+1)
. La vitesse d’un probl`eme direct est (n/log(n))s/(2s+L).
Extensions - Approfondissements
Il est possible de consid´erer des instruments binaires.
Mod`eles d’attrition dans les panel et mod`ele de censure.
Inf´erence sur la distribution deY sans imputation mais en utilisant le plan pour l’estimation de la loi deY.
Effets h´et´erog`enes deX surY (mod`ele `a coefficients al´eatoires) en pr´esence de non-r´eponse non-MAR.
avec J. Heckman : distribution des gains ex-ante et ex-post, avec H.
Broome et S. Hoderlein : application du papier d’´evaluation des politiques publiques `a l’effet des ´etudes sup´erieures sur le salaire (`a partir de NLSY 79).
Extensions - Approfondissements
Il est possible de consid´erer des instruments binaires.
Mod`eles d’attrition dans les panel et mod`ele de censure.
Inf´erence sur la distribution deY sans imputation mais en utilisant le plan pour l’estimation de la loi deY.
Effets h´et´erog`enes deX surY (mod`ele `a coefficients al´eatoires) en pr´esence de non-r´eponse non-MAR.
avec J. Heckman : distribution des gains ex-ante et ex-post, avec H.
Broome et S. Hoderlein : application du papier d’´evaluation des politiques publiques `a l’effet des ´etudes sup´erieures sur le salaire (`a partir de NLSY 79).
Extensions - Approfondissements
Il est possible de consid´erer des instruments binaires.
Mod`eles d’attrition dans les panel et mod`ele de censure.
Inf´erence sur la distribution deY sans imputation mais en utilisant le plan pour l’estimation de la loi deY.
Effets h´et´erog`enes deX surY (mod`ele `a coefficients al´eatoires) en pr´esence de non-r´eponse non-MAR.
avec J. Heckman : distribution des gains ex-ante et ex-post, avec H.
Broome et S. Hoderlein : application du papier d’´evaluation des politiques publiques `a l’effet des ´etudes sup´erieures sur le salaire (`a partir de NLSY 79).
Extensions - Approfondissements
Il est possible de consid´erer des instruments binaires.
Mod`eles d’attrition dans les panel et mod`ele de censure.
Inf´erence sur la distribution deY sans imputation mais en utilisant le plan pour l’estimation de la loi deY.
Effets h´et´erog`enes deX surY (mod`ele `a coefficients al´eatoires) en pr´esence de non-r´eponse non-MAR.
avec J. Heckman : distribution des gains ex-ante et ex-post, avec H.
Broome et S. Hoderlein : application du papier d’´evaluation des politiques publiques `a l’effet des ´etudes sup´erieures sur le salaire (`a partir de NLSY 79).
Extensions - Approfondissements
Il est possible de consid´erer des instruments binaires.
Mod`eles d’attrition dans les panel et mod`ele de censure.
Inf´erence sur la distribution deY sans imputation mais en utilisant le plan pour l’estimation de la loi deY.
Effets h´et´erog`enes deX surY (mod`ele `a coefficients al´eatoires) en pr´esence de non-r´eponse non-MAR.
avec J. Heckman : distribution des gains ex-ante et ex-post, avec H.
Broome et S. Hoderlein : application du papier d’´evaluation des politiques publiques `a l’effet des ´etudes sup´erieures sur le salaire (`a partir de NLSY 79).
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.
Quelques ´el´ements de bibliographie
Gautier, E.(2005) : “ El´ements sur la s´election dans les enquˆetes et sur la nonr´eponse non ignorable”, Actes des Journ´ees de M´ethodologie Statistique 2005.
Heckman, J. J., et E. Vytlacil(2005) : “Structural Equations, Treatment Effects, and Econometric Policy Evaluation”.Econometrica.
Helgason, S.(1999) :The Radon Transform. Birkhauser.
Imbens, G. W., et J. D. Angrist(1994) : “Identification and Estimation of Local Average Treatment Effects”.Econometrica.
Little R.J.A. et Rubin D.B.(2002) :Statistical analysis with missing data. Wiley.
Vytlacil, E.(2002) : “Independence, Monotonicity, and Latent Index Models : An Equivalence Result”.
Econometrica.