Estimation d’un rapport de cote en pr´ esence d’information auxiliaire.
Camelia Goga(1) et AnneRuiz-Gazen(2)
(1) IMB, Universit´e de Bourgogne-Dijon, [email protected] (2) TSE, Universit´e Toulouse 1 Capitole,
ENSAI, novembre 2012
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 1 / 35
Introduction : contexte
Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,
avec prise en compte d’information auxiliaire.
Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).
Introduction : contexte
Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,
avec prise en compte d’information auxiliaire.
Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 2 / 35
Introduction : contexte
Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,
avec prise en compte d’information auxiliaire.
Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).
Introduction : contexte
Le rapport de cotes(odds-ratio) est un autre exemple de param`etre complexe (utilis´e en ´epid´emiologie) que l’on peut ´ecrire comme une solution d’´equation estimante.
On applique les r´esultats de Goga et Ruiz-Gazen (2012)`a cet exemple et on montre les limites de l’approche.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 3 / 35
Introduction : contexte
Le rapport de cotes(odds-ratio) est un autre exemple de param`etre complexe (utilis´e en ´epid´emiologie) que l’on peut ´ecrire comme une solution d’´equation estimante.
On applique les r´esultats de Goga et Ruiz-Gazen (2012)`a cet exemple et on montre les limites de l’approche.
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 4 / 35
Rappels sur le rapport de cotes (odds-ratio)
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
Objectif : quantifier le lien d’association entre les niveaux d’une variable de r´eponse dichotomique Y et une variable de risqueX.
cotes : ratio de probabilit´es entre la proba de l’occurence d’un ´evenement et la proba de sa non-occurence.
rapport de cotes (OR) : ratio de cotes
X Y Cancer poumon pas cancer poumon
Fumeur 80 20
Non-fumeur 20 80
cote fumeur : 80/20 = 4 cote non-fumeur : 20/40 = 1/4 rapport de cotes : 4/(1/4)= 16
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 6 / 35
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
Objectif : quantifier le lien d’association entre les niveaux d’une variable de r´eponse dichotomique Y et une variable de risqueX.
cotes : ratio de probabilit´es entre la proba de l’occurence d’un ´evenement et la proba de sa non-occurence.
rapport de cotes (OR) : ratio de cotes
X Y Cancer poumon pas cancer poumon
Fumeur 80 20
Non-fumeur 20 80
cote fumeur : 80/20 = 4 cote non-fumeur : 20/40 = 1/4 rapport de cotes : 4/(1/4)= 16
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
- Dans le cas o`u la variable de risqueest elle-mˆemedichotomique, l’OR a une forme simple que l’on peut d´eduire de la table de contingence :
OR = N00N11 N01N10
.
- Dans le cas g´en´eral, on note yk, resp. xk,les valeurs de Y, resp. X, pour le k`eme individu de la population U ={1, . . . ,N} et
pk =P(Y = 1|X =xk) .
logit(pk) = log pk 1−pk
=β0+β1xk pk = exp(β0+β1xk)(1 + exp(β0+β1xk))−1.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 7 / 35
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
- Dans le cas o`u la variable de risqueest elle-mˆemedichotomique, l’OR a une forme simple que l’on peut d´eduire de la table de contingence :
OR = N00N11 N01N10
.
- Dans le cas g´en´eral, on note yk, resp. xk,les valeurs de Y, resp. X, pour le k`eme individu de la population U ={1, . . . ,N} et
pk =P(Y = 1|X =xk) .
logit(pk) = log pk 1−pk
=β0+β1xk
p = exp(β +β x )(1 + exp(β +β x ))−1.
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)
P(Y = 0|X =xk)
odds(Y = 1|X =xk+ 1) = exp(β0+β1(xk + 1)) odds(Y = 1|X =xk) = exp(β0+β1xk)
OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)
= expβ1.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 8 / 35
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)
P(Y = 0|X =xk)
odds(Y = 1|X =xk+ 1) = exp(β0+β1(xk + 1)) odds(Y = 1|X =xk) = exp(β0+β1xk)
OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)
= expβ1.
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)
P(Y = 0|X =xk)
odds(Y = 1|X =xk+ 1) = exp(β0+β1(xk + 1)) odds(Y = 1|X =xk) = exp(β0+β1xk)
OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)
= expβ1.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 8 / 35
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)
= expβ1. Dans la suite, on cherche `a estimerβ =
β0
β1
On maximise la vraisemblance :
L(y1, . . . ,yN;β) = ΠNk=1pkyk(1−pk)1−yk,
X
U
xk(yk−µ(xk0β)) = 0 avec µ(xk0β) =pk = exp(xk0β)(1 + exp(xk0β))−1.
Rappels sur le rapport de cotes (odds-ratio)
Rapport de cotes
OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)
= expβ1. Dans la suite, on cherche `a estimerβ =
β0
β1
On maximise la vraisemblance :
L(y1, . . . ,yN;β) = ΠNk=1pkyk(1−pk)1−yk,
X
U
xk(yk−µ(xk0β)) = 0 avec µ(xk0β) =pk = exp(xk0β)(1 + exp(xk0β))−1.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 9 / 35
Rappels sur l’estimation d’un total
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Rappels sur l’estimation d’un total
Population, ´ echantillon, estimateur d’un total
U ={1, . . . ,k, . . . ,N}population finie et s ⊂U ´echantillon ; Probabilit´es d’inclusion :πk =Pr(k ∈s), πkl =Pr(k,l ∈s);
y variable d’int´erˆet et total ty =X
k∈U
yk param`etre d’int´erˆet `a estimer.
Estimateurs classiques (homog`enes) : ˆty,w =X
k∈s
wkyk
Pour des enquˆetes `a plusieurs items (plusieurs variables d’int´erˆet), les poidswk ne d´ependent pas dey.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 11 / 35
Rappels sur l’estimation d’un total
Population, ´ echantillon, estimateur d’un total
U ={1, . . . ,k, . . . ,N}population finie et s ⊂U ´echantillon ; Probabilit´es d’inclusion :πk =Pr(k ∈s), πkl =Pr(k,l ∈s);
y variable d’int´erˆet et total ty =X
k∈U
yk param`etre d’int´erˆet `a estimer.
Estimateurs classiques (homog`enes) : ˆty,w =X
k∈s
wkyk
Pour des enquˆetes `a plusieurs items (plusieurs variables d’int´erˆet), les poidswk ne d´ependent pas de y.
Rappels sur l’estimation d’un total
Estimation par les valeurs dilat´ ees (HT) pour un total
ˆty,d =X
k∈s
dkyk avecdk = 1 πk Variance : V(ˆty,d) =X
k∈U
X
l∈U
∆kl
yk
πk yl
πl, ∆kl =πkl −πkπl
Estimateur sans biais de la variance : Vˆ(ˆty,d) =X
k∈s
X
l∈s
∆kl πkl
yk πk
yl πl
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 12 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
Approche assist´ ee par un mod` ele
On suppose que l’on dispose d’information auxiliaire not´eez. Mod`ele de super-population :
les yk sont des r´ealisations de variables al´eatoires i.i.d. avec ξ : yk =f(zk) +εk, et Vξ(εk) =v(zk) , k ∈U
Remarque : dans le cas o`u ξ est un mod`ele lin´eaire, on obtient la classe d’estimateurs par r´egression g´en´eralis´ee (GREG).
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 14 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
Approche assist´ ee par un mod` ele
On suppose que l’on dispose d’information auxiliaire not´eez. Mod`ele de super-population :
les yk sont des r´ealisations de variables al´eatoires i.i.d. avec
ξ : yk =f(zk) +εk, et Vξ(εk) =v(zk) , k ∈U
Remarque : dans le cas o`u ξ est un mod`ele lin´eaire, on obtient la classe d’estimateurs par r´egression g´en´eralis´ee (GREG).
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
La classe d’estimateurs GREG
On consid`ere le mod`ele lin´eaire suivant (pourzk0 = (z1k, . . . ,zpk)) ξ : yk =zk0β+εk et Vξ(εk) =σ2k.
L’estimateur GREG pour le total ty est donn´e par ˆty,GREG =X
s
wkyk
avec siσ2k =λ0zk,
wk = X
U
zi0
! X
s
zizi0 πi
!−1
zk πk
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 15 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
La classe d’estimateurs GREG
On consid`ere le mod`ele lin´eaire suivant (pourzk0 = (z1k, . . . ,zpk)) ξ : yk =zk0β+εk et Vξ(εk) =σ2k.
L’estimateur GREG pour le totalty est donn´e par ˆty,GREG =X
s
wkyk
avec siσk2 =λ0zk,
wk = X zi0
! X
s
zizi0 πi
!−1
zk πk
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
Quelques remarques
Pour obtenir les poidswk,on estimeβ sous le mod`ele et sous le plan :
Bˆ = (P
Uzkzk0/σk2)−1P
Uzkyk/σk2 Bˆd= (P
sdkzkzk0/σ2k)−1P
sdkzkyk/σk2
Les poidswk ne d´ependent pas de y mais d´ependent dez.
AV(ˆty,GREG) =X
U
X
U
∆klEk
πk El
πl avec Ek =yk−zk0B.ˆ Vb(ˆty,GREG) =X
s
X
s
∆kl πkl
Eˆk πk
Eˆl
πl avec Eˆk =yk −zk0Bˆd.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 16 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire
Quelques remarques
Pour obtenir les poidswk,on estimeβ sous le mod`ele et sous le plan :
Bˆ = (P
Uzkzk0/σk2)−1P
Uzkyk/σk2 Bˆd= (P
sdkzkzk0/σ2k)−1P
sdkzkyk/σk2
Les poidswk ne d´ependent pas de y mais d´ependent dez. AV(ˆty,GREG) =X
U
X
U
∆klEk πk
El
πl avec Ek =yk−zk0B.ˆ Vb(ˆty,GREG) =X
s
X
s
∆kl πkl
Eˆk πk
Eˆl
πl avec Eˆk =yk −zk0Bˆd.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 17 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimation d’un total assist´ e par un mod` ele non-param´ etrique (NP)
Pour une variable auxiliaire z,
ξnp :yk =f(zk) +εk avec V(εk) =v(zk).
• Etape 1 - au niveau de la population: on estime f(zk) par ˆf(zk) `a l’aide d’une m´ethode d’estimation non-param´etrique. Dans la suite, B-splines (Goga, 2005).
• Etape 2 - au niveau de l’´echantillon: on estime ˆf(zk) par ˜f(zk) en utilisant les poids de sondages 1/πk.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimation d’un total par r´ egression B-splines (Goga, 2005)
ˆty,BS =X
s
wkyk
avec wk = 1 πk
X
U
b0(zi)
! X
s
b(zi)b0(zi) πi
!−1
b(zk) b0(zk) = (B1(zk), . . . ,Bq(zk))
B1, . . . ,Bq, la base de fonctions B-splines.
Variance asymptotique :AV(ˆty,BS) =X
U
X
U
∆klEk πk
El πl avec Ek =yk−fˆ(zk) est le r´esidu deyk sous le mod`ele ξnp.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 19 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimation d’un total par r´ egression B-splines (Goga, 2005)
ˆty,BS =X
s
wkyk
avec wk = 1 πk
X
U
b0(zi)
! X
s
b(zi)b0(zi) πi
!−1
b(zk) b0(zk) = (B1(zk), . . . ,Bq(zk))
B1, . . . ,Bq, la base de fonctions B-splines.
Variance asymptotique :AV(ˆty,BS) =X
U
X
U
∆klEk πk
El πl avec Ek =yk −fˆ(zk) est le r´esidu deyk sous le mod`ele ξnp.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Quelques pr´ ecisions sur les fonctions B-splines
On choisitK nœuds int´erieurs et mle degr´e des splines (pour contrˆoler la r´egularit´e de ˆf) ;
Les fonctions splines sont des polynˆomes de degr´em−1entre les nœuds ;
Le nombre de fonctions B-splines de la base est q =K +m.
Cas particuliers :
m= 2, fonctions continues et lin´eaires par morceaux.
m= 2 et K = 0, droites → estimateur GREG pour la r´egression simple.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 20 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Quelques pr´ ecisions sur les fonctions B-splines
On choisitK nœuds int´erieurs et mle degr´e des splines (pour contrˆoler la r´egularit´e de ˆf) ;
Les fonctions splines sont des polynˆomes de degr´em−1entre les nœuds ;
Le nombre de fonctions B-splines de la base est q =K +m.
Cas particuliers :
m= 2, fonctions continues et lin´eaires par morceaux.
m= 2 etK = 0, droites → estimateur GREG pour la r´egression simple.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
0.00.20.40.60.81.0
Function B1
x
B1
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B2
x
B2
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B3
x
B3
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B4
x
B4
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B5
x
B5
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B1
x
B1
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B2
x
B2
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B3
x
B3
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B4
x
B4
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B5
x
B5
0 K1 K2 K3 1
0.00.20.40.60.81.0
Function B6
x
B6
0 K1 K2 K3 1
Fig.:Les fonctions B-splines avec 3 nœuds int´erieurs etm= 2 `a gauche (m=3 `a droite).
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 21 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimateur B-splines versus GREG
Les poids de l’estimateur GREG si σk2 =λ0zk : wk = 1
πk
X
U
zi0
! X
s
zizi0 πi
!−1
zk
Les poids de l’estimateur B-splines : wk = 1
πk
X
U
b0(zi)
! X
s
b(zi)b0(zi) πi
!−1
b(zk)
les poids NP n´ecessitent de connaˆıtre zk pour toutk ∈U.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimateur B-splines versus GREG
Les poids de l’estimateur GREG si σk2 =λ0zk : wk = 1
πk
X
U
zi0
! X
s
zizi0 πi
!−1
zk
Les poids de l’estimateur B-splines : wk = 1
πk X
U
b0(zi)
! X
s
b(zi)b0(zi) πi
!−1
b(zk)
les poids NP n´ecessitent de connaˆıtre zk pour toutk ∈U.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 22 / 35
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Estimateur B-splines versus GREG
Les poids de l’estimateur GREG si σk2 =λ0zk : wk = 1
πk
X
U
zi0
! X
s
zizi0 πi
!−1
zk
Les poids de l’estimateur B-splines : wk = 1
πk X
U
b0(zi)
! X
s
b(zi)b0(zi) πi
!−1
b(zk)
les poids NP n´ecessitent de connaˆıtre zk pour tout k ∈U.
Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique
Remarques sur le lien entre estimateurs B-splines et le calage (Deville &
Sarndal, 1992) : X
s
wkBj(zk) =X
U
Bj(zk), j = 1, . . . ,q X
s
wk =N;
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 23 / 35
Estimation de param`etres complexes avec information auxiliaire
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)
• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.
• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999). On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN
k=1δyk.
• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 25 / 35
Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)
• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.
• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999).
On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN
k=1δyk.
• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.
Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)
• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.
• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999).
On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN
k=1δyk.
• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 25 / 35
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
Estimation d’un rapport de cote
On peut d´efinir le param`etre β comme solution d’une ´equation estimante X
U
xk(yk−µ(xk0β)) = 0 avec µ(xk0β) = exp(xk0β)(1 + exp(xk0β))−1.
On a aussi :
T(M;β) =X
U
xk(yk −µ(xk0β)) avec β solution de l’´equation implicite
T(M;β) = 0
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 27 / 35
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
Estimation d’un rapport de cote
On peut d´efinir le param`etre β comme solution d’une ´equation estimante X
U
xk(yk−µ(xk0β)) = 0 avec µ(xk0β) = exp(xk0β)(1 + exp(xk0β))−1. On a aussi :
T(M;β) =X
U
xk(yk −µ(xk0β)) avec β solution de l’´equation implicite
T(M;β) = 0
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
Estimation d’un rapport de cote
βbest la solution de l’´equation implicite : X
s
wkxk(yk −µ(x0kβ)) = 0
On calcule la lin´earis´ee associ´ee `a l’estimateur : uk = (ui,0,ui,1) = (X
U
ν(xk0β)xkxk0)−1·xk(yk −µ(xk0β)) avec
ν(xk0β) =µ(xk0β)(1−µ(xk0β))
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 28 / 35
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
Estimation d’un rapport de cote
On en d´eduit :
βˆ−β 'X
s
wkuk−X
U
uk
βˆ−β'X
s
uk −θb0ub(zk)
πk −X
U
uk avec θbu = (P
Udkb(zk)b0(zk))−1(P
Udkb(zk)u0k).
On en d´eduit la variance asymtpotique de l’estimateur B-splines. Dans le cas particulier o`u la variable X est dichotomique on a une expression simple pour la lin´earis´ee de β1 :
uk,1 = 1{xk=0,yk=0}
N00
+1{xk=1,yk=1}
N11
−1{xk=1,yk=0}
N10
−1{xk=0,yk=1}
N01
.
Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote
Estimation d’un rapport de cote
On en d´eduit :
βˆ−β 'X
s
wkuk−X
U
uk
βˆ−β'X
s
uk −θb0ub(zk)
πk −X
U
uk avec θbu = (P
Udkb(zk)b0(zk))−1(P
Udkb(zk)u0k).
On en d´eduit la variance asymtpotique de l’estimateur B-splines.
Dans le cas particulier o`u la variable X est dichotomique on a une expression simple pour la lin´earis´ee de β1 :
uk,1 = 1{xk=0,yk=0}
N00
+1{xk=1,yk=1}
N11
−1{xk=1,yk=0}
N10
−1{xk=0,yk=1}
N01
.
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 29 / 35
Mise en œuvre et exemples
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
Mise en œuvre et exemples Mise en œuvre
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 31 / 35
Mise en œuvre et exemples Mise en œuvre
Mise en œuvre
Mise en œuvre :
1 Calcul des fonctions de la base B-splines avec SAS ou R en sp´ecifiant le degr´e et le nombre de nœuds.
2 Utiliser les poids de sondage dk = 1/πk et les fonctions de la base B-splines dans une proc´edure de calage pour calculer les poids wk et en d´eduire le param`etre estim´e.
3 Calculer la variable lin´earis´eeuk et l’estimer par ˆuk.
4 Calculer θb
bu = X
s
dkb(zk)bT(zk)
!−1
X
s
dkb(zk)buTk
!
et les r´esidus associ´es ˆuk −θbTub(zk).
Mise en œuvre et exemples Exemples
1 Rappels sur le rapport de cotes (odds-ratio)
2 Rappels sur l’estimation d’un total
Estimation d’un total assist´ee par mod`ele lin´eaire
Estimation d’un total assist´ee par un mod`ele non-param´etrique
3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral
Cas de l’estimation d’un rapport de cote
4 Mise en œuvre et exemples Mise en œuvre
Exemples
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 33 / 35
Mise en œuvre et exemples Exemples
Enquˆ ete Emploi
Population de N = 14621 salari´es de moins de 50 ans enquˆet´es en 1999 et en 2000.
Variable de r´eponse y= 1 si salaire en 2000sup´erieur `a 1500 euros et 0 sinon,
Variable de risquex=1 si salaire en1999 sup´erieur `a 1500 euros et 0 sinon,
Variableauxiliaire z= 1 si l’individu a un diplˆome universitaire et 0 sinon.
Gain en terme de variance asymptotique pour le GREG compar´e au HT : 20% et 33% pour l’estimateur B-splines (ordre de 1 `a 5 et nbre de nœuds de 5 `a 50).
Mise en œuvre et exemples Exemples
Enquˆ ete Emploi
Population de N = 14621 salari´es de moins de 50 ans enquˆet´es en 1999 et en 2000.
Variable de r´eponse y= 1 si salaire en 2000sup´erieur `a 1500 euros et 0 sinon,
Variable de risquex=1 si salaire en1999 sup´erieur `a 1500 euros et 0 sinon,
Variableauxiliaire z= 1 si l’individu a un diplˆome universitaire et 0 sinon.
Gain en terme de variance asymptotique pour le GREG compar´e au HT : 20% et 33% pour l’estimateur B-splines (ordre de 1 `a 5 et nbre de nœuds de 5 `a 50).
(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 34 / 35
Mise en œuvre et exemples Exemples
Enquˆ ete CHIS (California Health Interview Survey)
Donn´ees extraites de 2009 par Center for Health Policy Research `a l’universit´e de Californie.
N = 11074 adultes de moins de 60 ans.
Variable de r´eponse y= 1 si personne assur´ee et 0 sinon Variable de risquex= 1 si personne fumeuse et 0 sinon Variableauxiliaire z= age
Gain en terme de variance asymptotique pour le GREG ou l’estimateur B-splines compar´e au HT : moins de 2%. Variable auxiliaire n’explique pas la lin´earis´ee qui est une variable `a 4 valeurs (selon les valeurs dex ety).