• Aucun résultat trouvé

Estimation d’un rapport de cote en pr´esence d’information auxiliaire.

N/A
N/A
Protected

Academic year: 2022

Partager "Estimation d’un rapport de cote en pr´esence d’information auxiliaire."

Copied!
56
0
0

Texte intégral

(1)

Estimation d’un rapport de cote en pr´ esence d’information auxiliaire.

Camelia Goga(1) et AnneRuiz-Gazen(2)

(1) IMB, Universit´e de Bourgogne-Dijon, [email protected] (2) TSE, Universit´e Toulouse 1 Capitole,

[email protected]

ENSAI, novembre 2012

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 1 / 35

(2)

Introduction : contexte

Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,

avec prise en compte d’information auxiliaire.

Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).

(3)

Introduction : contexte

Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,

avec prise en compte d’information auxiliaire.

Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 2 / 35

(4)

Introduction : contexte

Estimation de param`etres pluscomplexesque des totauxou desmoyennes en population finie,

avec prise en compte d’information auxiliaire.

Goga et Ruiz-Gazen (2012) proposent une approche non param´etrique utilisant les B-splines pour l’estimation de param`etres complexes et l’estimation de la variance asymptotique de ces estimateurs (approche g´en´erale et exemples des quantiles et indice de Gini).

(5)

Introduction : contexte

Le rapport de cotes(odds-ratio) est un autre exemple de param`etre complexe (utilis´e en ´epid´emiologie) que l’on peut ´ecrire comme une solution d’´equation estimante.

On applique les r´esultats de Goga et Ruiz-Gazen (2012)`a cet exemple et on montre les limites de l’approche.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 3 / 35

(6)

Introduction : contexte

Le rapport de cotes(odds-ratio) est un autre exemple de param`etre complexe (utilis´e en ´epid´emiologie) que l’on peut ´ecrire comme une solution d’´equation estimante.

On applique les r´esultats de Goga et Ruiz-Gazen (2012)`a cet exemple et on montre les limites de l’approche.

(7)

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 4 / 35

(8)

Rappels sur le rapport de cotes (odds-ratio)

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(9)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

Objectif : quantifier le lien d’association entre les niveaux d’une variable de r´eponse dichotomique Y et une variable de risqueX.

cotes : ratio de probabilit´es entre la proba de l’occurence d’un ´evenement et la proba de sa non-occurence.

rapport de cotes (OR) : ratio de cotes

X Y Cancer poumon pas cancer poumon

Fumeur 80 20

Non-fumeur 20 80

cote fumeur : 80/20 = 4 cote non-fumeur : 20/40 = 1/4 rapport de cotes : 4/(1/4)= 16

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 6 / 35

(10)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

Objectif : quantifier le lien d’association entre les niveaux d’une variable de r´eponse dichotomique Y et une variable de risqueX.

cotes : ratio de probabilit´es entre la proba de l’occurence d’un ´evenement et la proba de sa non-occurence.

rapport de cotes (OR) : ratio de cotes

X Y Cancer poumon pas cancer poumon

Fumeur 80 20

Non-fumeur 20 80

cote fumeur : 80/20 = 4 cote non-fumeur : 20/40 = 1/4 rapport de cotes : 4/(1/4)= 16

(11)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

- Dans le cas o`u la variable de risqueest elle-mˆemedichotomique, l’OR a une forme simple que l’on peut d´eduire de la table de contingence :

OR = N00N11 N01N10

.

- Dans le cas g´en´eral, on note yk, resp. xk,les valeurs de Y, resp. X, pour le k`eme individu de la population U ={1, . . . ,N} et

pk =P(Y = 1|X =xk) .

logit(pk) = log pk 1−pk

01xk pk = exp(β01xk)(1 + exp(β01xk))−1.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 7 / 35

(12)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

- Dans le cas o`u la variable de risqueest elle-mˆemedichotomique, l’OR a une forme simple que l’on peut d´eduire de la table de contingence :

OR = N00N11 N01N10

.

- Dans le cas g´en´eral, on note yk, resp. xk,les valeurs de Y, resp. X, pour le k`eme individu de la population U ={1, . . . ,N} et

pk =P(Y = 1|X =xk) .

logit(pk) = log pk 1−pk

01xk

p = exp(β +β x )(1 + exp(β +β x ))−1.

(13)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)

P(Y = 0|X =xk)

odds(Y = 1|X =xk+ 1) = exp(β01(xk + 1)) odds(Y = 1|X =xk) = exp(β01xk)

OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)

= expβ1.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 8 / 35

(14)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)

P(Y = 0|X =xk)

odds(Y = 1|X =xk+ 1) = exp(β01(xk + 1)) odds(Y = 1|X =xk) = exp(β01xk)

OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)

= expβ1.

(15)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

odds(Y = 1|X =xk + 1) = P(Y = 1|X =xk + 1) P(Y = 0|X =xk + 1) odds(Y = 1|X =xk) = P(Y = 1|X =xk)

P(Y = 0|X =xk)

odds(Y = 1|X =xk+ 1) = exp(β01(xk + 1)) odds(Y = 1|X =xk) = exp(β01xk)

OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)

= expβ1.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 8 / 35

(16)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)

= expβ1. Dans la suite, on cherche `a estimerβ =

β0

β1

On maximise la vraisemblance :

L(y1, . . . ,yN;β) = ΠNk=1pkyk(1−pk)1−yk,

X

U

xk(yk−µ(xk0β)) = 0 avec µ(xk0β) =pk = exp(xk0β)(1 + exp(xk0β))−1.

(17)

Rappels sur le rapport de cotes (odds-ratio)

Rapport de cotes

OR = odds(Y = 1|X =xk + 1) odds(Y = 1|X =xk)

= expβ1. Dans la suite, on cherche `a estimerβ =

β0

β1

On maximise la vraisemblance :

L(y1, . . . ,yN;β) = ΠNk=1pkyk(1−pk)1−yk,

X

U

xk(yk−µ(xk0β)) = 0 avec µ(xk0β) =pk = exp(xk0β)(1 + exp(xk0β))−1.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 9 / 35

(18)

Rappels sur l’estimation d’un total

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(19)

Rappels sur l’estimation d’un total

Population, ´ echantillon, estimateur d’un total

U ={1, . . . ,k, . . . ,N}population finie et s ⊂U ´echantillon ; Probabilit´es d’inclusion :πk =Pr(k ∈s), πkl =Pr(k,l ∈s);

y variable d’int´erˆet et total ty =X

k∈U

yk param`etre d’int´erˆet `a estimer.

Estimateurs classiques (homog`enes) : ˆty,w =X

k∈s

wkyk

Pour des enquˆetes `a plusieurs items (plusieurs variables d’int´erˆet), les poidswk ne d´ependent pas dey.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 11 / 35

(20)

Rappels sur l’estimation d’un total

Population, ´ echantillon, estimateur d’un total

U ={1, . . . ,k, . . . ,N}population finie et s ⊂U ´echantillon ; Probabilit´es d’inclusion :πk =Pr(k ∈s), πkl =Pr(k,l ∈s);

y variable d’int´erˆet et total ty =X

k∈U

yk param`etre d’int´erˆet `a estimer.

Estimateurs classiques (homog`enes) : ˆty,w =X

k∈s

wkyk

Pour des enquˆetes `a plusieurs items (plusieurs variables d’int´erˆet), les poidswk ne d´ependent pas de y.

(21)

Rappels sur l’estimation d’un total

Estimation par les valeurs dilat´ ees (HT) pour un total

ˆty,d =X

k∈s

dkyk avecdk = 1 πk Variance : V(ˆty,d) =X

k∈U

X

l∈U

kl

yk

πk yl

πl, ∆klkl −πkπl

Estimateur sans biais de la variance : Vˆ(ˆty,d) =X

k∈s

X

l∈s

kl πkl

yk πk

yl πl

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 12 / 35

(22)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(23)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

Approche assist´ ee par un mod` ele

On suppose que l’on dispose d’information auxiliaire not´eez. Mod`ele de super-population :

les yk sont des r´ealisations de variables al´eatoires i.i.d. avec ξ : yk =f(zk) +εk, et Vξk) =v(zk) , k ∈U

Remarque : dans le cas o`u ξ est un mod`ele lin´eaire, on obtient la classe d’estimateurs par r´egression g´en´eralis´ee (GREG).

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 14 / 35

(24)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

Approche assist´ ee par un mod` ele

On suppose que l’on dispose d’information auxiliaire not´eez. Mod`ele de super-population :

les yk sont des r´ealisations de variables al´eatoires i.i.d. avec

ξ : yk =f(zk) +εk, et Vξk) =v(zk) , k ∈U

Remarque : dans le cas o`u ξ est un mod`ele lin´eaire, on obtient la classe d’estimateurs par r´egression g´en´eralis´ee (GREG).

(25)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

La classe d’estimateurs GREG

On consid`ere le mod`ele lin´eaire suivant (pourzk0 = (z1k, . . . ,zpk)) ξ : yk =zk0β+εk et Vξk) =σ2k.

L’estimateur GREG pour le total ty est donn´e par ˆty,GREG =X

s

wkyk

avec siσ2k0zk,

wk = X

U

zi0

! X

s

zizi0 πi

!−1

zk πk

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 15 / 35

(26)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

La classe d’estimateurs GREG

On consid`ere le mod`ele lin´eaire suivant (pourzk0 = (z1k, . . . ,zpk)) ξ : yk =zk0β+εk et Vξk) =σ2k.

L’estimateur GREG pour le totalty est donn´e par ˆty,GREG =X

s

wkyk

avec siσk20zk,

wk = X zi0

! X

s

zizi0 πi

!−1

zk πk

(27)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

Quelques remarques

Pour obtenir les poidswk,on estimeβ sous le mod`ele et sous le plan :

Bˆ = (P

Uzkzk0k2)−1P

Uzkykk2 Bˆd= (P

sdkzkzk02k)−1P

sdkzkykk2

Les poidswk ne d´ependent pas de y mais d´ependent dez.

AV(ˆty,GREG) =X

U

X

U

klEk

πk El

πl avec Ek =yk−zk0B.ˆ Vb(ˆty,GREG) =X

s

X

s

kl πkl

k πk

l

πl avec Eˆk =yk −zk0d.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 16 / 35

(28)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par mod`ele lin´eaire

Quelques remarques

Pour obtenir les poidswk,on estimeβ sous le mod`ele et sous le plan :

Bˆ = (P

Uzkzk0k2)−1P

Uzkykk2 Bˆd= (P

sdkzkzk02k)−1P

sdkzkykk2

Les poidswk ne d´ependent pas de y mais d´ependent dez. AV(ˆty,GREG) =X

U

X

U

klEk πk

El

πl avec Ek =yk−zk0B.ˆ Vb(ˆty,GREG) =X

s

X

s

kl πkl

k πk

l

πl avec Eˆk =yk −zk0d.

(29)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 17 / 35

(30)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimation d’un total assist´ e par un mod` ele non-param´ etrique (NP)

Pour une variable auxiliaire z,

ξnp :yk =f(zk) +εk avec V(εk) =v(zk).

• Etape 1 - au niveau de la population: on estime f(zk) par ˆf(zk) `a l’aide d’une m´ethode d’estimation non-param´etrique. Dans la suite, B-splines (Goga, 2005).

• Etape 2 - au niveau de l’´echantillon: on estime ˆf(zk) par ˜f(zk) en utilisant les poids de sondages 1/πk.

(31)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimation d’un total par r´ egression B-splines (Goga, 2005)

ˆty,BS =X

s

wkyk

avec wk = 1 πk

X

U

b0(zi)

! X

s

b(zi)b0(zi) πi

!−1

b(zk) b0(zk) = (B1(zk), . . . ,Bq(zk))

B1, . . . ,Bq, la base de fonctions B-splines.

Variance asymptotique :AV(ˆty,BS) =X

U

X

U

klEk πk

El πl avec Ek =yk−fˆ(zk) est le r´esidu deyk sous le mod`ele ξnp.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 19 / 35

(32)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimation d’un total par r´ egression B-splines (Goga, 2005)

ˆty,BS =X

s

wkyk

avec wk = 1 πk

X

U

b0(zi)

! X

s

b(zi)b0(zi) πi

!−1

b(zk) b0(zk) = (B1(zk), . . . ,Bq(zk))

B1, . . . ,Bq, la base de fonctions B-splines.

Variance asymptotique :AV(ˆty,BS) =X

U

X

U

klEk πk

El πl avec Ek =yk −fˆ(zk) est le r´esidu deyk sous le mod`ele ξnp.

(33)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Quelques pr´ ecisions sur les fonctions B-splines

On choisitK nœuds int´erieurs et mle degr´e des splines (pour contrˆoler la r´egularit´e de ˆf) ;

Les fonctions splines sont des polynˆomes de degr´em−1entre les nœuds ;

Le nombre de fonctions B-splines de la base est q =K +m.

Cas particuliers :

m= 2, fonctions continues et lin´eaires par morceaux.

m= 2 et K = 0, droites → estimateur GREG pour la r´egression simple.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 20 / 35

(34)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Quelques pr´ ecisions sur les fonctions B-splines

On choisitK nœuds int´erieurs et mle degr´e des splines (pour contrˆoler la r´egularit´e de ˆf) ;

Les fonctions splines sont des polynˆomes de degr´em−1entre les nœuds ;

Le nombre de fonctions B-splines de la base est q =K +m.

Cas particuliers :

m= 2, fonctions continues et lin´eaires par morceaux.

m= 2 etK = 0, droites → estimateur GREG pour la r´egression simple.

(35)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

0.00.20.40.60.81.0

Function B1

x

B1

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B2

x

B2

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B3

x

B3

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B4

x

B4

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B5

x

B5

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B1

x

B1

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B2

x

B2

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B3

x

B3

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B4

x

B4

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B5

x

B5

0 K1 K2 K3 1

0.00.20.40.60.81.0

Function B6

x

B6

0 K1 K2 K3 1

Fig.:Les fonctions B-splines avec 3 nœuds int´erieurs etm= 2 `a gauche (m=3 `a droite).

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 21 / 35

(36)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimateur B-splines versus GREG

Les poids de l’estimateur GREG si σk20zk : wk = 1

πk

X

U

zi0

! X

s

zizi0 πi

!−1

zk

Les poids de l’estimateur B-splines : wk = 1

πk

X

U

b0(zi)

! X

s

b(zi)b0(zi) πi

!−1

b(zk)

les poids NP n´ecessitent de connaˆıtre zk pour toutk ∈U.

(37)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimateur B-splines versus GREG

Les poids de l’estimateur GREG si σk20zk : wk = 1

πk

X

U

zi0

! X

s

zizi0 πi

!−1

zk

Les poids de l’estimateur B-splines : wk = 1

πk X

U

b0(zi)

! X

s

b(zi)b0(zi) πi

!−1

b(zk)

les poids NP n´ecessitent de connaˆıtre zk pour toutk ∈U.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 22 / 35

(38)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Estimateur B-splines versus GREG

Les poids de l’estimateur GREG si σk20zk : wk = 1

πk

X

U

zi0

! X

s

zizi0 πi

!−1

zk

Les poids de l’estimateur B-splines : wk = 1

πk X

U

b0(zi)

! X

s

b(zi)b0(zi) πi

!−1

b(zk)

les poids NP n´ecessitent de connaˆıtre zk pour tout k ∈U.

(39)

Rappels sur l’estimation d’un total Estimation d’un total assist´ee par un mod`ele non-param´etrique

Remarques sur le lien entre estimateurs B-splines et le calage (Deville &

Sarndal, 1992) : X

s

wkBj(zk) =X

U

Bj(zk), j = 1, . . . ,q X

s

wk =N;

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 23 / 35

(40)

Estimation de param`etres complexes avec information auxiliaire

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(41)

Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)

• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.

• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999). On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN

k=1δyk.

• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 25 / 35

(42)

Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)

• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.

• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999).

On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN

k=1δyk.

• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.

(43)

Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Estimation des param` etres complexes assist´ e par un mod` ele non-param´ etrique (Goga & Ruiz-Gazen, 2012)

• Poids HT remplac´es par poids non-param´etriques obtenus pr´ec´edemment.

• Th´eorie justifi´ee par l’approchefonctionnelle de Deville (1999).

On associe `a un estimateur d’un param`etre une fonctionnelleT qui est une fonction de la mesure M =PN

k=1δyk.

• En particulier, on montre que variance asymptotique bas´ee sur r´esidus de la lin´earis´eeu (de la fonctionnelle associ´ee `a l’estimateur) sur la variable auxiliaire z.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 25 / 35

(44)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(45)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

Estimation d’un rapport de cote

On peut d´efinir le param`etre β comme solution d’une ´equation estimante X

U

xk(yk−µ(xk0β)) = 0 avec µ(xk0β) = exp(xk0β)(1 + exp(xk0β))−1.

On a aussi :

T(M;β) =X

U

xk(yk −µ(xk0β)) avec β solution de l’´equation implicite

T(M;β) = 0

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 27 / 35

(46)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

Estimation d’un rapport de cote

On peut d´efinir le param`etre β comme solution d’une ´equation estimante X

U

xk(yk−µ(xk0β)) = 0 avec µ(xk0β) = exp(xk0β)(1 + exp(xk0β))−1. On a aussi :

T(M;β) =X

U

xk(yk −µ(xk0β)) avec β solution de l’´equation implicite

T(M;β) = 0

(47)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

Estimation d’un rapport de cote

βbest la solution de l’´equation implicite : X

s

wkxk(yk −µ(x0kβ)) = 0

On calcule la lin´earis´ee associ´ee `a l’estimateur : uk = (ui,0,ui,1) = (X

U

ν(xk0β)xkxk0)−1·xk(yk −µ(xk0β)) avec

ν(xk0β) =µ(xk0β)(1−µ(xk0β))

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 28 / 35

(48)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

Estimation d’un rapport de cote

On en d´eduit :

βˆ−β 'X

s

wkuk−X

U

uk

βˆ−β'X

s

uk −θb0ub(zk)

πk −X

U

uk avec θbu = (P

Udkb(zk)b0(zk))−1(P

Udkb(zk)u0k).

On en d´eduit la variance asymtpotique de l’estimateur B-splines. Dans le cas particulier o`u la variable X est dichotomique on a une expression simple pour la lin´earis´ee de β1 :

uk,1 = 1{xk=0,yk=0}

N00

+1{xk=1,yk=1}

N11

−1{xk=1,yk=0}

N10

−1{xk=0,yk=1}

N01

.

(49)

Estimation de param`etres complexes avec information auxiliaire Cas de l’estimation d’un rapport de cote

Estimation d’un rapport de cote

On en d´eduit :

βˆ−β 'X

s

wkuk−X

U

uk

βˆ−β'X

s

uk −θb0ub(zk)

πk −X

U

uk avec θbu = (P

Udkb(zk)b0(zk))−1(P

Udkb(zk)u0k).

On en d´eduit la variance asymtpotique de l’estimateur B-splines.

Dans le cas particulier o`u la variable X est dichotomique on a une expression simple pour la lin´earis´ee de β1 :

uk,1 = 1{xk=0,yk=0}

N00

+1{xk=1,yk=1}

N11

−1{xk=1,yk=0}

N10

−1{xk=0,yk=1}

N01

.

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 29 / 35

(50)

Mise en œuvre et exemples

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(51)

Mise en œuvre et exemples Mise en œuvre

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 31 / 35

(52)

Mise en œuvre et exemples Mise en œuvre

Mise en œuvre

Mise en œuvre :

1 Calcul des fonctions de la base B-splines avec SAS ou R en sp´ecifiant le degr´e et le nombre de nœuds.

2 Utiliser les poids de sondage dk = 1/πk et les fonctions de la base B-splines dans une proc´edure de calage pour calculer les poids wk et en d´eduire le param`etre estim´e.

3 Calculer la variable lin´earis´eeuk et l’estimer par ˆuk.

4 Calculer θb

bu = X

s

dkb(zk)bT(zk)

!−1

X

s

dkb(zk)buTk

!

et les r´esidus associ´es ˆuk −θbTub(zk).

(53)

Mise en œuvre et exemples Exemples

1 Rappels sur le rapport de cotes (odds-ratio)

2 Rappels sur l’estimation d’un total

Estimation d’un total assist´ee par mod`ele lin´eaire

Estimation d’un total assist´ee par un mod`ele non-param´etrique

3 Estimation de param`etres complexes avec information auxiliaire Cas g´en´eral

Cas de l’estimation d’un rapport de cote

4 Mise en œuvre et exemples Mise en œuvre

Exemples

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 33 / 35

(54)

Mise en œuvre et exemples Exemples

Enquˆ ete Emploi

Population de N = 14621 salari´es de moins de 50 ans enquˆet´es en 1999 et en 2000.

Variable de r´eponse y= 1 si salaire en 2000sup´erieur `a 1500 euros et 0 sinon,

Variable de risquex=1 si salaire en1999 sup´erieur `a 1500 euros et 0 sinon,

Variableauxiliaire z= 1 si l’individu a un diplˆome universitaire et 0 sinon.

Gain en terme de variance asymptotique pour le GREG compar´e au HT : 20% et 33% pour l’estimateur B-splines (ordre de 1 `a 5 et nbre de nœuds de 5 `a 50).

(55)

Mise en œuvre et exemples Exemples

Enquˆ ete Emploi

Population de N = 14621 salari´es de moins de 50 ans enquˆet´es en 1999 et en 2000.

Variable de r´eponse y= 1 si salaire en 2000sup´erieur `a 1500 euros et 0 sinon,

Variable de risquex=1 si salaire en1999 sup´erieur `a 1500 euros et 0 sinon,

Variableauxiliaire z= 1 si l’individu a un diplˆome universitaire et 0 sinon.

Gain en terme de variance asymptotique pour le GREG compar´e au HT : 20% et 33% pour l’estimateur B-splines (ordre de 1 `a 5 et nbre de nœuds de 5 `a 50).

(Goga & Ruiz-Gazen) Odds-ratio ENSAI, novembre 2012 34 / 35

(56)

Mise en œuvre et exemples Exemples

Enquˆ ete CHIS (California Health Interview Survey)

Donn´ees extraites de 2009 par Center for Health Policy Research `a l’universit´e de Californie.

N = 11074 adultes de moins de 60 ans.

Variable de r´eponse y= 1 si personne assur´ee et 0 sinon Variable de risquex= 1 si personne fumeuse et 0 sinon Variableauxiliaire z= age

Gain en terme de variance asymptotique pour le GREG ou l’estimateur B-splines compar´e au HT : moins de 2%. Variable auxiliaire n’explique pas la lin´earis´ee qui est une variable `a 4 valeurs (selon les valeurs dex ety).

Références

Documents relatifs

De tels mod` eles ` a censure ont ´ et´ e abondamment ´ etudi´ es dans la litt´ erature pour des variables al´ eatoires r´ eelles ou multi-dimensionnelles, et dans des

Sous des conditions de m´ elange assez g´ en´ erales, on ´ etablit la convergence presque compl` ete (avec vitesse) d’un estimateur ` a noyau pour la fonction de hasard d’une

Un tel estimateur permet, entre autres, de construire des intervalles de confiance pour les mesures de dépendance associées aux statistiques de rang, de construire des

residents age 12 or older experienced an estimated 18.7 million violent and property crime victimizations, down from 20.1 million in 2009 and 24.2 million in 2001, according to the

[r]

Estimation des param` etres et de l’´ etat cach´ e des mod` eles d’espace d’´ etats: application au mod`

F., A Robbins-Monro procedure for estimation in semiparametric regression models, Annals of

L’objet du probl` eme est d’´ etudier quelques propri´ et´ es d’un estimateur du param` etre p d’une loi g´ eom´ etrique..