CHAPITRE 2 : MODELE – RESOLUTION NUMERIQUE
A. Modèle physique
Information Maximum Likelihood
Neste trabalho é proposta a modelação através de um modelo com trajetória latente de um indicador de privação material para os anos de 2006 a 2009. Ao longo destes quatro momentos temporais em análise permaneceram no painel um conjunto de 845 agregados, para os quais existe informação completa e que se passa a designar por “caso completo”. Todavia, existe ainda um outro conjunto de 848 agregados que participaram no estudo en- tre 2006 e 2008 e que não estiveram em 2009 devido ao esquema de rotatividade do painel. Ao conjunto destes dois grupos constituídos por um total de 1693 agregados designa-se por “caso com todas as observações”, no qual existem aproximadamente 50% de omissões na quarto momento temporal (2009).
A utilização de procedimentos de full information maximum likelihood permite esti- mar um modelo com trajetória latente (figura 4.1) para modelar a trajetória do score de privação material entre 2006 e 2009, considerando a totalidade dos 1 693 agregados, “caso com todas as observações”. Também para os 845 agregados que constituem o “caso completo” é modelada a trajetória do score de privação material, no período considerado, recorrendo a um modelo com trajetória latente. O score de privação material é calculado como uma soma de items para cada um dos quatro momentos temporais considerados. Este score toma valores entre 0 e 10, indicando o valor 0 que o agregado não se encontra privado e 10 que não consegue assegurar nenhum dos itens considerados.
CAPÍTULO 4. MODELAÇÕES CONSIDERANDO A EXISTÊNCIA DE DADOS OMISSOS 1 1 1 1 0 1 2 3 intercepto declive Privação Material_06 Privação Material_07 Privação Material_08 Privação Material_09
Figura 4.1: Diagrama de um modelo com trajetória latente
Na tabela 4.5 são apresentadas as medidas de qualidade do ajustamento usuais, para o “caso completo” e para o “caso com todas as observações”. Os valores obtidos para as várias medidas consideradas permitem concluir que existe um ajustamento razoável modelo-dados, para ambas as subamostras consideradas. De salientar que o valor do RMSEA para o “caso completo”, se encontra no limite do razoável, enquanto que para o “caso com todas as observações” apresenta um valor claramente superior a 0.08, valor recomendado na literatura da especialidade.
“caso completo” “caso com todas as observações”
N = 845 N = 1 693
RMSEA 0.079 0.125
CFI 0.990 0.968
TLI 0.988 0.961
SRMR 0.025 0.046
Tabela 4.5: Medidas da qualidade do ajustamento (“caso completo” e “caso com todas as observações”)
“caso completo” “caso com todas as observações”
N = 845 N = 1 693 Média do intercepto (µα) 2.514 2.500 Média do declive (µβ) -0.025 -0.106 Variância do intercepto (ψαα) 3.028 3.014 Variância do declive(ψββ) 0.123 0.168 Covariância inter/decl(ψαβ) -0.293 -0.415
Tabela 4.6: Estimativas dos parâmetros obtidas no ajustamento de um modelo com tra- jetória latente (“caso completo” e “caso com todas as observações”). A bold estão os valores que se mostraram significativos
CAPÍTULO 4. MODELAÇÕES CONSIDERANDO A EXISTÊNCIA DE DADOS OMISSOS
As estimativas dos parâmetros do modelo com trajetória latente são apresentadas, para o “caso completo” e para “o caso com todas as observações”, na tabela 4.6. Para o conjunto dos 845 agregados que permaneceram no estudo de 2006 a 2009 é possível concluir que em 2006 o valor médio da privação é de 2.514 itens. A taxa média de mu- dança na privação entre 2006 e 2009, embora negativa, não é significativa. Nem todos os agregados têm o mesmo nível de privação material em 2006 e nem todos mudam da mesma forma. Níveis mais elevados de privação em 2006 estão associados com uma taxa média de mudança mais lenta.
Para o conjunto dos 1 693 agregados considerados, que constituem o “caso com todas as observações”, é possível concluir que em 2006 o valor médio de privação é de 2.500 itens. A taxa média de mudança na privação entre 2006 e 2009 diminui, sendo a mé- dia do declive (-0.106) negativa e significativa. Nem todos os agregados têm o mesmo nível de privação material em 2006 e nem todos mudam da mesma forma. Níveis mais elevados de privação em 2006 estão associados com uma taxa média de mudança mais lenta. Embora, a estimativa da média do declive para o caso com todas as observações se tenha mostrado significativa, no caso completo isso não se verifica, permitindo conclusões distintas sobre a taxa média de mudança da privação material entre 2006 e 2009, para as diferentes subamostras consideradas. Assim, são utilizados procedimentos de Monte Carlo para perceber qual das opções metodológicas deve o analista considerar.
Num estudo de simulação utilizando um procedimento de Monte Carlo, os dados são gerados de uma população com determinados valores dos parâmetros, Mooney [98], Smith [149] e Rubinstein [133]. Um grande número de amostras são geradas e um modelo é es- timado para cada uma dessas amostras. Os valores dos parâmetros e os erros padrão são médias desses mesmos valores obtidos para as várias amostras geradas. Os seguintes critérios podem ser utilizados na avaliação dos valores estimados: enviesamento relativo das estimativas dos parâmetros; enviesamento relativo do erro padrão; erro quadrático médio; coverage; e a potência do teste. Para maior detalhe sobre a realização de um estudo de simulação de Monte Carlo utilizando o software estatístico Mplus deve ser con- sultado o capítulo 5.
Assumindo como valores dos parâmetros populacionais os valores dos parâmetros que foram estimados pelo ajustamento de um modelo com trajetória latente para os dados que constituíam o “caso completo”, são geradas 1 000 amostras cada uma com um padrão de 10%, 20%, 30%, 40% e 50% de omissões no último momento temporal, ano de 2009. Na realidade pretende-se recriar uma amostra que tenha um desenho semelhante à amostra com todos os 1 693 agregados (figura 2.3) e ainda ver o que acontece se diminuir a per- centagem de observações omissas nesse momento temporal.
As tabelas 4.7 a 4.11 apresentam os resultados para a geração de 1 000 amostras com 845 observações cada e com um padrão de omissão de 10%, 20%, 30%, 40% e 50% em 2009, sendo possível a partir destas calcular o enviesamento relativo verificado na esti- mação dos parâmetros e cujos valores são apresentados na tabela 4.12.
CAPÍTULO 4. MODELAÇÕES CONSIDERANDO A EXISTÊNCIA DE DADOS OMISSOS
De acordo com Muthén e Muthén [106], o enviesamento relativo na estimação de cada parâmetro, θ, pode ser calculado utilizando o valor considerado como parâmetro popula- cional e a média das estimativas dos parâmetros obtidos nas várias amostras geradas, da seguinte forma
BR(ˆθ) =
E(ˆθ) − θ
θ . (4.7)
Parâmetros “população” média desvio média proporção de proporção de
padrão erros intervalos de réplicas com
padrão confiança a 95% coeficiente significativo
µα 2.514 2.5159 0.0639 0.0627 0.938 1.000
µβ -0.025 -0.0256 0.0165 0.0164 0.952 0.351
ψαα 3.028 3.0323 0.1617 0.1661 0.956 1.000
ψββ 0.123 0.1218 0.0146 0.0150 0.958 1.000
ψαβ -0.293 -0.2928 0.0366 0.0375 0.958 1.000
Tabela 4.7: Resultados obtidos no estudo de simulação gerando 1 000 amostras com 10% de omissões no ano de 2009
Parâmetros “população” média desvio média proporção de proporção de
padrão erros intervalos de réplicas com
padrão confiança a 95% coeficiente significativo
µα 2.514 2.5160 0.0639 0.0628 0.938 1.000
µβ -0.025 -0.0257 0.0168 0.0168 0.948 0.346
ψαα 3.028 3.0321 0.1619 0.1665 0.956 1.000
ψββ 0.123 0.1217 0.0153 0.0157 0.954 1.000
ψαβ -0.293 -0.2927 0.0378 0.0386 0.956 1.000
Tabela 4.8: Resultados obtidos no estudo de simulação gerando 1 000 amostras com 20% de omissões no ano de 2009
Parâmetros “população” média desvio média proporção de proporção de
padrão erros intervalos de réplicas com
padrão confiança a 95% coeficiente significativo
µα 2.514 2.5159 0.0639 0.0628 0.939 1.000
µβ -0.025 -0.0256 0.0172 0.0173 0.948 0.328
ψαα 3.028 3.0323 0.1626 0.1669 0.956 1.000
ψββ 0.123 0.1218 0.0160 0.0165 0.951 1.000
ψαβ -0.293 -0.2928 0.0391 0.0398 0.952 1.000
Tabela 4.9: Resultados obtidos no estudo de simulação gerando 1 000 amostras com 30% de omissões no ano de 2009
CAPÍTULO 4. MODELAÇÕES CONSIDERANDO A EXISTÊNCIA DE DADOS OMISSOS
Parâmetros “população” média desvio média proporção de proporção de
padrão erros intervalos de réplicas com
padrão confiança a 95% coeficiente significativo
µα 2.514 2.5160 0.0640 0.0628 0.943 1.000
µβ -0.025 -0.0257 0.0176 0.0177 0.948 0.316
ψαα 3.028 3.0323 0.1627 0.1673 0.957 1.000
ψββ 0.123 0.1219 0.0169 0.0175 0.951 1.000
ψαβ -0.293 -0.2927 0.0400 0.0412 0.958 1.000
Tabela 4.10: Resultados obtidos no estudo de simulação gerando 1 000 amostras com 40% de omissões no ano de 2009
Parâmetros “população” média desvio média proporção de proporção de
padrão erros intervalos de réplicas com
padrão confiança a 95% coeficiente significativo
µα 2.514 2.5160 0.0640 0.0628 0.938 1.000
µβ -0.025 -0.0258 0.0181 0.0183 0.945 0.288
ψαα 3.028 3.0326 0.1635 0.1679 0.955 1.000
ψββ 0.123 0.1220 0.0182 0.0187 0.950 1.000
ψαβ -0.293 -0.2929 0.0415 0.0429 0.961 1.000
Tabela 4.11: Resultados obtidos no estudo de simulação gerando 1 000 amostras com 50% de omissões no ano de 2009
Enviesamento nos Parâmetros 50% omissões 40% omissões 30% omissões 20% omissões 10% omissões
µα 0.0008 0.0008 0.0008 0.0008 0.0008
µβ 0.0320 0.0280 0.0240 0.0280 0.0240
ψαα 0.0015 0.0014 0.0014 0.0014 0.0014
ψββ -0.0081 -0.0089 -0.0098 -0.0106 -0.0098
ψαβ -0.0003 -0.0010 -0.0007 -0.0010 -0.0007
Tabela 4.12: Enviesamento relativo na estimativa média dos parâmetros quando são ge- radas 1 000 amostras com 50%, 40%, 30%, 20% e 10% de omissões no ano de 2009
Da análise das tabelas 4.7 a 4.11 é possível concluir que a estimativa média para cada um dos parâmetros de interesse no modelo com trajetória latente apresenta valores aná- logos, qualquer que seja a percentagem de omissões considerada. Todavia, a média dos erros padrão aumenta à medida que aumenta a percentagem de omissões. Na tabela 4.12 é possivel observar que o parâmetro que apresenta maior enviesamento, em qualquer uma das situações consideradas, é a média do declive. Este é o parâmetro para o qual, as con- clusões se mostraram contraditórias, quando comparados os resultados do caso completo, com os resultados obtidos para todas as observações.
CAPÍTULO 4. MODELAÇÕES CONSIDERANDO A EXISTÊNCIA DE DADOS OMISSOS