An Oxford Manuscript - Ce volume consacré aux

Treatment on the Treated (ATT)

Na base da aplicação do Propensity Score Matching está o método Matching utilizado em grande parte por estudos que visam investigar o impacto de políticas públicas, idealizado por Rosenbaum e Rubin (1983).

Considerando um grupo de tratamento e outro de controle, como definidos anteriormente, o impacto médio de tratamento, ou seja, da participação de uma observação do grupo de controle no grupo de tratamento pode ser obtido equiparando as observações de cada grupo considerando um vetor Xm de características observáveis. Esse vetor é a versão

simplificada (para efeito de aplicação) do vetor Hm do modelo de maximização da utilidade,

contendo atributos e características próprias para cada família. Assim, torna-se claro o entendimento de que se for possível encontrar dois grupos de famílias i e j com as mesmas características, que influenciariam no processo de maximização da utilidade, ou seja,o fator (H_m) que determinaria a classificação do tipo desta família poderia ser considerado como aleatório e exógeno ao processo decisório (PEREIRA, LIMA e JUSTO, 2016).

Tomando o caso em questão, dada a igualdade entre as observações para as informações contidas no vetor característico Xm, e dado que os dois grupos de famílias (de

tratamento e controle) são classificados em agrícolas e não-agrícolas, ou agrícolas e pluriativos, respectivamente, o diferencial de rendas dos dois grupos representa apenas particularidades do tipo de atividades, na qual seus membros estão empregados, e não a aptidão relacionada à educação, idade ou grau de dependência da família.

Dessa forma, o problema do viés E(R0j|Di= 1) − E(R0j|Di = 0) pode ser diminuído ao

médio de participar ou não do grupo tratado considera as observações com características mais próximas dentre a amostra analisada.

Pela perspectiva do presente estudo, se for possível comparar observações do grupo de tratamento com aquelas famílias exclusivamente agrícolas, considerando a igualdade em todas as variáveis do vetor Xm, os dois grupos analisados compartilhariam das mesmas

características observáveis, e o viés de seleção que influenciaria no fato da família ser ou não pertencente ao grupo de tratamento, seria eliminado como mostra a equação abaixo (ROSENBAUM e RUBIN, 1983):

E(R0j|Xm, Di= 1) − E(R0j|Xm, D0= 1) = 0 (3.9)

Dessa forma, o impacto médio das diferenças entre as rendas das famílias não- agrícolas ou famílias pluriativas e as rendas das famílias exclusivamente agrícolas, apresentado em (3.8), pode ser reescrito sem o viés de seleção com base na função (3.10) abaixo:

δRij= E(Rij|Xm, Di= 1) − E(R0j|Xm, D0= 1) (3.10)

Para o cálculo desse impacto médio, toma-se a expectativa condicional da diferença dos rendimentos entre dois tipos de famílias, tendo como base a existência de n observações no grupo de tratamento representado por Di= 1. Dessa maneira, a comparação seria realizada

truncando a quantidade de famílias do grupo de controle pelo número de j famílias do grupo de tratamento com características observáveis semelhantes, introduzindo assim, o Average effect

of Treatment on the Treated (ATT) ou Efeito Médio de Tratamento no Tratado (tradução direta

do termo) dado por:

τ = {E[E(Rij|Xm, Di= 1) − E(R0j|Xm, D0= 1)]|Di = 1} = (δRij|Di= 1) (3.11)

O fato de considerar a comparação das diferenças dos rendimentos do grupo de tratamento com o grupo de controle tem uma dificuldade central relacionada ao vetor de características Xm. Nesse ponto, quanto maior o número de variáveis consideradas no Matching,

menor o número de observações utilizadas no cálculo do ATT devido à dificuldade de encontrar duas ou mais famílias com características semelhantes pertencentes a grupos diferentes.

Essa dificuldade foi definida como “multidimensionalidade do pareamento” por Rosenbaum e Rubin (1983) e teve como solução a mudança na perspectiva do efeito direto do vetor característico Xm. Neste ponto, encontrar famílias semelhantes em particularidade pode

ser contornado pela substituição da comparação direta entre características pela comparação generalizada entre o efeito conjunto, de como essas variáveis direcionam as decisões familiares nas diferentes probabilidades de escolha da alternativa ocupacional e maximização da utilidade. Logo, esse problema é superado considerando-se, em vez do vetor de características

Xm, uma estimativa de probabilidade relacionada a esse vetor, dada por p(Xm), definido como Propensity Score. Esse escalar associado ao conjunto de variáveis Xm, que representa a chance

de participar ou não do grupo de tratamento, pode ser obtido considerando um modelo de resposta binária (BECKER e ICHINO, 2002). Modelos do tipo logit ou probit são amplamente utilizados na literatura. Nesse trabalho o caso se assemelha a múltiplos processos binários, dado que a escolha entre as alternativas ocupacionais reflete uma simultaneidade de comparações entre as alternativas ocupacionais, como: todos os membros empregados na agricultura, nenhum emprego na agricultura ou apenas uma parte. Sendo assim, para estimação do score de propensão p(Xm) foi escolhido o modelo logit multinomial, como apresentado no próximo

tópico.

Assim, o impacto das rendas não-agrícolas e pluriatividade deixariam de considerar a comparação entre as características das famílias do grupo de tratamento e controle, para considerar a comparação entre os scores de probabilidades relacionadas à família agrícola passar a ser do tipo não-agrícola ou pluriativa, como representado pela equação (3.12):

p(Xm) = Pr(Di= 1|Xm) = E(Di|X) (3.12)

A diferença média dos rendimentos, considerando essas probabilidades passa a ser:

δRij= E(Rij|p(Xm), Di= 1) − E(R0j|p(Xm), Di= 1) (3.13)

E em relação ao Efeito Médio de Tratamento no Tratado, esse pode ser reescrito como:

τ = {E[E(Rij|p(Xm), Di= 1) − E(R0j|p(Xm), Di= 1)]|Di= 1} = (δRij|Di= 1) (3.14)

Para o cálculo de τ deve-se admitir duas hipóteses sobre p(Xm), observadas por Becker

e Ichino (2002):

• Hipótese 1 – Balanceamento das variáveis observadas antes do tratamento, ou seja, que

a seleção da amostra de famílias utilizadas no pareamento seja independente das características observadas condicionais às probabilidades de ser do tipo não-agrícola ou pluriativa, de maneira formal:

Di⊥ Xm |p(Xm) (3.15)

• Hipótese 2 – As rendas não-agrícolas e agrícolas independem dos grupos considerados

(tratamento e controle), dado o vetor de características observáveis:

R0, R1⊥ Di | Xm (3.16)

Sendo satisfeitas as hipóteses 1 e 2 acima, o próximo passo é a escolha do procedimento de pareamento para cálculo do ATT. Entre os principais métodos, quatro se destacam como mais usuais na literatura, são eles: Radius Matching, Kernel Matching,

Stratification Matching Method e Nearest-Neighbor Matching. A atribuição dos pesos para

ponderação da inclusão do vetor p(Xm) é o que causa as diferenças entre tais métodos (BECKER

e ICHINO, 2002).

No método Radius Matching a comparação é realizada com peso fixo, baseado em um fator pré-estabelecido de diferenças r para todas as probabilidades. Assim, a comparação entre os escores de propensão acontece considerando a expressão a seguir:

p(Xm)i− p(Xm)j< r (3.16)

Para o presente estudo, o referido método não se torna adequado devido à maneira totalmente aleatória na qual o fator r é estabelecido, podendo carregar viés de seletividade por desconhecimento de influência das probabilidades particulares de uma família ser classificada como, agrícola, não-agrícola ou pluriativa.

No método de Kernel Matching se considera o ATT como a média geral das probabilidades dos grupos de controle e tratamento pela equação a seguir, as probabilidades ponderadas pelas diferenças nos erros-padrão calculadas sob uma função Gaussiana:

τK₌ 1 NT∑ [ RTi − ∑ ( p(Xm)i− p(Xm)j Xm p(Xm)K− p(Xm)j Xm ) RojC j ∈ C ] i ∈ T (3.16)

Esse método também carrega um possível viés de seleção por tratar como similares aquelas famílias dentro de uma mesma região, mas com características diferentes que podem afetar de maneira significativa o nível do score de propensão estimado e entrar no cálculo do

ATT com peso similar a uma outra família com níveis de escolaridade totalmente diferentes,

mas que tiverem, no geral, a mesma probabilidade.

A mesma explicação dada para a não escolha do método Radius Matching pode ser dada ao Stratification Matching Method, já que esse último é baseado no cálculo do ATT pela divisão das probabilidades observadas em estratos pré-definidos.

Para o cálculo do ATT foi escolhido o método de pareamento Nearest-Neighbor

Matching (Vizinho Comparável Mais Próximo), que considera a menor diferença entre os scores para um conjunto observações do grupo de tratamento e controle, considerando um

número de vizinhos para o estabelecimento do contrafactual:

Min

j ‖p(Xm)i− p(Xm)j‖ (3.17)

Como mostrado por Pereira, Lima e Justo (2015), este método é livre de influência aleatória e o mais adequado para o problema em questão por realizar a comparação considerando os efeitos marginais mais próximos de mudanças nas variáveis explicativas, dadas suas respectivas médias, do vetor p(Xm).

No que se refere à escolha do número de vizinhos utilizadas no pareamento, essa é de grande importância, pois é esse parâmetro que define a matriz de ponderação wc utilizada no

cálculo do ATT (DEHEJIA e WAHBA, 2002). A escolha do número de vizinhos foi estabelecida em 1 e os pesos estimados são de acordo com o tamanho da diferença entre os

scores no pareamento. Assim, cada família do grupo de controle será pareada com apenas uma

observação mais próxima do grupo de tratamento. Pois, escolher um número maior de vizinhos poderia tornar o cálculo de τ vulnerável às variações das características familiares relacionadas às dinâmicas regionais ou locais de desenvolvimento econômico, bem como, às influências de políticas específicas para um conjunto de famílias semelhantes. Portanto não sendo eficiente, dessa forma, na diminuição do viés de seleção como destacado por Becker e Ichino (2002).

A estimação do ATT pelo método Nearest-Neighbor Matching pode ser obtida de acordo com a seguinte função (BECKER e ICHINO, 2002):

τNNM₌ 1 NT∑ (RTi − ∑ wcRojC j ∈ C ) = i ∈ T = 1 NT(∑ RTi i ∈ T − ∑ ∑ wcRCoj j ∈ C i ∈ T ) = (3.18) = (1 NT∑ Ri T i ∈ T − 1 NT∑ wjRCoj j ∈ C ) Na qual,

RiTsão o conjunto de renda per capita familiar do grupo tratado;

RojC são o conjunto de renda per capita familiar do grupo de controle;

NT_{é o número de observações do grupo tratado; e,}

wc é a matriz de ponderação para vizinhança, estabelecida no presente trabalho com

todos os seus elementos iguais ao inverso da distância entre os scores de pareamento, entre o grupo de tratamento e controle considerados.

Depois de realizada a estimação do ATT pelo método Nearest-Neighbor Matching verifica-se a validade dos resultados por meio das estatísticas de suporte comum R e B de Rubin. No teste R, verifica-se a média ponderada (com base na diferença padronizada entre as médias de cada variável explicativa) entre os scores de propensão calculados entre os grupos de tratamento e controle, considerando o cálculo do viés de seleção antes e depois do pareamento. Para o referido teste, o valor da estatística R-Rubin deve ficar no intervalo de 0,5 e 2 para as observações inseridas no conjunto de pareamento (conjunto suporte comum) estimando uma razão de máxima verossimilhança que segue uma distribuição de qui-quadrado, com o número de observações dentro do suporte comum menos o número de variáveis explicativas introduzidas no modelo probabilístico.

Na estatística B-Rubin, a análise se dá a partir da proporção padronizada das variâncias das observações utilizadas no referido cálculo do ATT, também considerando o cálculo do viés de seleção antes e depois do pareamento. Essa medida mostra o impacto do pareamento sobre o viés e pode assumir valores negativos, caso o viés tenha sido reajustado para um valor inferior à média das variâncias ou positivo, caso tenha sido ajustado para um valor superior à média. A literatura indica que para esse teste, o valor da estatística B não deve ser inferior à -25% ou superior à 125% da média da proporção das variâncias padronizadas (BRYSON, DORSETT e PURDON, 2002).

Finalizando, a variância do estimador τ é estimada assumindo que os pesos são fixos e independentes entre as alternativas da variável dependente do modelo probabilístico tanto para o grupo de controle, quanto para o grupo de tratamento. Sendo assim, são assumidas como homocedásticas e viáveis para realização de inferência, baseada também numa distribuição de qui-quadrado. A equação seguinte mostra o cálculo da variância do ATT (LECHNER, 2002):

Var(τNNM_{) =} 1 (NT₎2[∑ Var(RTi) i ∈ T + ∑(wc)2Var(RojC) j ∈ C ] = = 1 (NT₎2[N T_Var(R i T_{) + ∑(w} c)2Var(RojC) j ∈ C ] = (3.19) = 1 NTVar(RiT) + 1 (NT₎2∑(wc) 2_Var(R oj C₎ j ∈ C

Dans le document Ce volume consacré aux (Page 27-30)