Como ressaltado pela Figura (3), o número de possíveis sequências é muito alto, tornando inviável qualquer análise que considere toda essa complexidade. Uma abordagem interessante para tornar possível gerir toda essa complexidade empírica consiste em agru- par as diferentes trajetórias em sub-conjuntos de trajetórias através de algumas técnicas estatísticas.
Realizou-se um agrupamento através da análise de cluster, a qual consiste em classificar os objetos do grupo em diferentes subgrupos, em que cada subgrupo criado contém objetos semelhantes segundo alguma função de distância ou semelhança.
Entretanto, quando nos referimos a sequências categóricas necessitamos de uma função robusta para captar a semelhança entre os objetos. Dessa forma, segundoGabadinho
et al. (2011a), as principais funções de semelhança para sequência categóricas são: Maior
prefixo comum (LCP), Maior sufixo comum (RLCP), Maior subsequência comum (LCS), “Optimal matching” (OM), Hamming (HAM) e distância Hamming dinâmica (DHD). Essas
funções mensuram a dissimilaridade entre sequências.
Segundo Gabadinho et al. (2011a), a distância de dissimilaridade OM tem uma propriedade que ao variar o seu indel e a matriz de custo de substituição, esta, se aproxima de quase todas as outras distâncias de dissimilaridade. Segundo Piccarreta e Billari (2007) a distância OM é bastante adequada em dados sociais, portanto, utilizou-se como função de semelhança a distância OM para a construção do agrupamento do grupo de mulheres de 33 a 38 anos de idade. Segundo Gabadinho e Ritschard (2013) ao adotar o indel 1 e a um custo de substituição constante, igual a 2, a distância OM apresenta bons resultados para dados de fertilidade, assim, fez-se uso dessas métricas.
Realizando a análise de cluster, construiu-se o gráfico do dendograma de método “ward”, Figura (4), o qual consiste num gráfico em forma de árvore onde pode-se observar alterações no nível de similaridade para as sucessivas etapas do agrupamento, que ocorre de maneira hierárquica. Consequentemente, no grupo de mulheres de 33 a 38 anos tem-se várias ramificações e a escolha do tamanho da distância é de suma importância, dado que, uma distância escolhida muito pequena gera muitos agrupamentos. Já se for grande, se aproxima do grupo em si.
Portanto, decidimos escolher 4 subgrupos à uma distância OM de 200 a 300, aproximadamente.
o 3. A nál ise empíric a 44
Agora temos 4 grupos de mulheres com faixa etária entre 33 e 39 anos, esses grupos serão referenciados pela seguinte maneira: Tipo 1, Tipo 2, Tipo 3 e Tipo 4. Bem como, cada grupo terá uma característica específica sobre a dinâmica de fertilidade. Com a finalidade de encontrar a dinâmica em cada grupo se realiza a análise de sequência para cada grupo.
Tabela 5 – Porcentagem de mulheres em cada subgrupo
Grupos %
Tipo 1 41.95
Tipo 2 13.72
Tipo 3 19.14
Tipo 4 25.17
Fonte: Elaborado pelo próprio autor
Tipo 1: Ao analisar este grupo, observa-se um grupo de mulheres com dois ou mais filhos, ou seja, todas mulheres estiveram no estado P2 (Figura 5). Devido a este fato é possível ver claramente a duração nos estados P0 e P1, desse modo, constatou-se um duração razoável no estado P0, em média 16 anos, já no estado P1 uma duração média de, aproximadamente, 4 anos (Figura 6). A duração de tempo médio entre o primeiro filho e o segundo está dentro do espaçamento ótimo entre filhos 1. Compreendendo,
assim, que essas mulheres após terem o primeiro filho, em período de tempo de 3 a 5 anos tem o segundo filho. Este é um grupo relativamente heterogêneo devido ao fato do número de padrões distintos serem razoáveis, 220 padrões, um pouco menos da metade do número de sequências existentes, 480, neste grupo (Tabela 6). Diante disto, observou-se que todas as mães têm pelo menos 2 filhos, contudo, existe uma pequena parcela de mulheres que tem três ou mais filhos (Figuras 5).
Tipo 2: Observando o grupo do Tipo 2, nota-se uma homogeneidade considerável aproxi- madamente 95% das mulheres tiveram somente um filho (Figura 5 ). Além disso, o número de padrões é de apenas 13 num total de 157 sequências, ou seja, com aproximadamente 8% das sequências é possível explicar todos os padrões deste grupo (Tabela 6). Percebe-se uma grande duração no estado P0, ou seja, as mulheres desse grupo tiveram o primeiro filho mais tardiamente. Conclui-se que em média essas mulheres tinham a idade entre 29 a 34 anos, aproximadamente, quando tiveram o primeiro filho (Figura6). Importante ressaltar as mulheres que tiveram 2 filhos nesse grupo, apesar de serem poucas, pois elas passaram um período de tempo razoável no estado P1, ou seja, o espaçamento entre o estado P0 e P2 é de um período de tempo longo, maior que o espaçamento ótimo entre filhos.
Tipo 3: Este grupo é de longe o grupo mais heterogêneo de 219 sequências neste grupo existe 209 padrões diferentes, ou seja, aproximadamente 95% das sequências são distintas ( Tabela6). Todas as mulheres tiveram pelo menos 3 filhos e há uma grande proporção de mulheres com quatro filhos ou mais (Figura 5). As mulheres deste grupo tiveram o primeiro filho bastante cedo em média com idade entre [15 e 21 anos], ou seja, um curtíssimo período de tempo no estado P0. Além disso, tiveram também um período de tempo médio no estado P1 e P2 dentro do espaçamento ótimo entre filhos, porém, um período longo no estado P3 e um razoável longo no P4+ (Figura 6).Portanto, conclui-se que essas mulheres tiveram o primeiro muito cedo, um espaçamento ótimo entre o primeiro e o segundo filho, como entre o segundo e o terceiro filho. Tem-se também, que como elas tiveram filho cedo muitas têm mais de 4 filhos novas. Tipo 4: Grupo marcado pela homogeneidade, mas antes disso pela curta duração no estado
P0 e pela longa duração no estado P1 (Tabela 6 e Figuras 6). De modo que as mulheres desse grupo em média ficaram aproximadamente 17 anos no estado inicial (P0) e 13 anos no estado P1 (Figura6). Demostrando que apesar das mulheres terem o primeiro filho cedo permaneceram muito tempo somente com um filho. Na Figura (5) é possível ver que uma pequena proporção das mulheres tiveram o segundo filho .
Tabela 6 – Quantidade de padrões distintos em cada subgrupo Grupos N Seq.distintas
Tipo 1 480 220
Tipo 2 157 13
Tipo 3 219 209
Tipo 4 288 34
o 3. A nál ise empíric a 47 Freq. (n=480)
a86 a89 a92 a95 a98 a01 a04 a07 a10 a13 a16
0.0 0.2 0.4 0.6 0.8 1.0 Freq. (n=157)
a86 a89 a92 a95 a98 a01 a04 a07 a10 a13 a16
0.0 0.2 0.4 0.6 0.8 1.0 Tipo 3 Freq. (n=219)
a86 a89 a92 a95 a98 a01 a04 a07 a10 a13 a16
0.0 0.2 0.4 0.6 0.8 1.0 Tipo 4 Freq. (n=288)
a86 a89 a92 a95 a98 a01 a04 a07 a10 a13 a16
0.0 0.2 0.4 0.6 0.8 1.0 P0 P1 P2 P3 P4+
P0 P1 P2 P3 P4+ Tipo 1 T empo médio 0 6 12 19 25 31 P0 P1 P2 P3 P4+ Tipo 2 T empo médio 0 6 12 19 25 31 P0 P1 P2 P3 P4+ Tipo 3 T empo médio 0 6 12 19 25 31 P0 P1 P2 P3 P4+ Tipo 4 T empo médio 0 6 12 19 25 31 P0 P1 P2 P3 P4+
Figura 6 – Tempo médio em cada estado
Para compreender a classificação das mulheres em cada grupo é preciso estudar as variáveis sociais que predominam e classificam cada grupo. Portanto, o intuito é modelar a classificação das mulheres em relação a cada grupo utilizando as variáveis sociais, con- sequentemente, realizou-se um modelo multinomial logístico o qual será apresentado na próxima seção.
4 Modelo multinomial logístico para a dinâ-
mica de fertilidade
A dinâmica de fertilidade está ligada diretamente com a taxa de natalidade e fecundidade, devido ao fato de a dinâmica conseguir representar ambas as taxas. Dado que, em resumo, a taxa de natalidade é referente ao número de nascimentos em um dado ano e a taxa de fecundidade relaciona o número de crianças com o número de mulheres em idade reprodutiva (IBGE, 1998).
Uma mudança na dinâmica é reflexo de diversos acontecimentos ou situações, tais como: entrada da mulher no mercado de trabalho; alto custo de vida; acesso a contracepti- vos; entre outros. Diante disso, o entendimento dessa dinâmica ajuda na implantação de medidas públicas prevenindo e oferecendo um apoio a população a cerca da dinâmica da fertilidade.
Segundo Bongaarts (1978), a dinâmica de fertilidade é descrita perfeitamente quando há uma combinação entre as variáveis determinantes indiretas e as diretas. As variáveis indiretas são as informações socioeconômicas, culturais e do meio ambiente.
Hirschman (2004) descreve a hipótese cultural como a influência cultural na fertilidade que
permanece mesmo depois de controlar as características socioeconômicas. Já em relação às variáveis diretas são, por exemplo, uso de contraceptivo, se é casada, frequência de relação sexual, entre outras. Ou seja, pode-se obter a informação substancial (completa) se, além dos fatores socioeconômicos e/ou culturais que influenciam a fertilidade, forem identificados os mecanismos específicos pelos os quais esses fatores operam.
Determinantes Indiretos Determinantes Diretos
Variáveis Variáveis
socioeconômicas, intermediarias
culturais, ⇒ da fertilidade ⇒ Dinâmica da Fertilidade
e o meio ambiente
Fonte:Bongaarts (1978)
Dessa forma, o modelo seguinte irá utilizar variáveis indiretas para identificar quais variáveis são mais atuantes sobre cada dinâmica de fertilidade. Para isto, serão utilizadas informações socioeconômicas/demográfica e culturais. A seguir apresentaremos estatísti- cas descritivas básicas das variáveis por subtipo de agrupamento de dinâmica de fertilidade.
4.1
Definindo as variáveis
Inicialmente, será abordado sobre variáveis socioeconômicas/demográfica (Idade, Raça, Escolaridade e Renda) em seguida a variável cultural (Religião). Como a faixa etária do grupo analisado é um pouco abrangente, de 33 a 38 anos, é de suma importância observar a sua distribuição. Assim, tem-se que a proporção das idades é bem distribuídas proporcionalmente, dado que, as porcentagem ficaram em torno de 17%, mudando apenas no intervalo de [37; 38) anos idade que possui 14%, aproximadamente, Tabela (7). Já em relação a todos os subgrupos temos que o Tipo 1 é o grupo mais disperso com um elevado percentual de mulheres abaixo de 35 anos, Tipo 2 é o grupo de mulheres mais novas, próximas de 33 anos, o Tipo 3 é o grupo com idade em torno de 36 anos, mas tendendo a serem mais velhas, e por fim, o Tipo 4 que é o grupo de mulheres mais velhas, próximas de 38 anos, ver Tabela (7). É fácil ver essa disposição na Figura (7), a qual é um gráfico de boxplot das idades de cada grupo, assim, fica visível que o Tipo 1 e 2 são os grupos de mulheres mais jovens e os Tipos 3 e 4, os que contém as mulheres mais velhas.
Tabela 7 – Variável Idade ajustada para cada subgrupo Tipo 1 Tipo 2 Tipo 3 Tipo 4 Todos
[33; 34) 18.11 18.88 15.03 9.80 16.17 [34; 35) 17.30 20.48 13.07 15.10 17.31 [35; 36) 18.11 18.62 15.69 18.37 18.01 [36; 37) 14.32 19.41 20.92 17.14 17.48 [37; 38) 17.57 9.57 16.34 15.92 14.42 [38; 39) 14.59 13.03 18.95 23.67 16.61
Fonte: Elaborado pelo próprio autor
Tipo 1 Tipo 2 Tipo 3 Tipo 4
33 34 35 36 37 38
Com relação a variável Raça, Tabela (8), tem-se que a grande maioria é de mulheres que se declaram não branca. Do mesmo modo, segundo IBGE(2014), o Nordeste brasileiro é composto basicamente de mulheres com raça não branca 73%. Fato esse que pode estar ligado a época do Brasil colônia em que portugueses, espanhóis, entre outros, vinham para o brasil e se relacionavam com os índios dando origem a uma raça bem miscigenada. Nos quatro grupos, ou tipos, a porcentagem de não brancos são aproximadamente as mesmas (78%), contudo no grupo 3, o percentual de não brancos é mais acentuado que os demais,
84% aproximadamente, ver Tabela (8).
Tabela 8 – Variável Raça ajustada para cada subgrupo Tipo 1 Tipo 2 Tipo 3 Tipo 4 Todos Não branco (0) 78.11 75.53 84.31 78.28 78.13 Branco (1) 21.89 24.47 15.69 21.72 21.87
Fonte: Elaborado pelo próprio autor
Outra variável é a religião das pessoas. SegundoAlves, Barros e Cavenaghi (2012), 95% das filiações religiosas no Brasil se concentram em três grupos: Católicos, Evangélicos e Sem religião. O grupo de outras religiões, como muçulmana, islâmica, judeus, etc., representam apenas 5% das filiações religiosas. Portanto, como o maior objetivo é destacar o impacto das religião na fertilidade utilizaremos os três maiores agrupamentos e um outro representando as demais religiões.
Constatou-se que aproximadamente 84% das mulheres têm religião Católica ou Evangélica, em que a maioria é Católica (51,97%). Contudo, a religião Evangélica apre- senta um grande percentual 31,67%, percentual bem acima do que foi observado pelo segundo IBGE (2013) e Alves, Barros e Cavenaghi (2012) em relação a população do Nordeste 16% e o Brasil 22,2%. Tem-se um percentual maior de mulheres que se declaram Sem religião (10,85%) em relação as pessoas do Nordeste (8,3%) e o Brasil (8%). Ao se analisar dentre os grupos, destacam-se os Tipos 1 e 3, como os grupos com maiores percen- tuais de evangélicos, e os Tipos 2 e 4, com o percentual mais elevado de católicos (Tabela9).
Considerando a escolaridade observada das mulheres na amostra, observou-se que tanto há mulheres sem escolaridade alguma como mulheres com um alto grau de escolari- dade (Tabela 10). Dado o fato da baixa proporção de pessoas com escolaridade no Curso técnico e Pós-graduação, decidiu-se unir essas escolaridades com sua classe mais próxima, respectivamente. Assim, o Curso técnico se uniu com Ensino médio e a Pós-graduação com o Ensino superior. Além disso, ajustou-se a informação da variável de variável categórica
Tabela 9 – Variável Religião ajustada para cada subgrupo Tipo 1 Tipo 2 Tipo 3 Tipo 4 Todos Católica 47.57 56.91 44.44 55.74 51.97 Evangélica 36.22 26.06 39.22 28.69 31.67
Outras 5.68 6.65 5.23 3.69 5.51
Sem religião 10.54 10.37 11.11 11.89 10.85
Fonte: Elaborado pelo próprio autor
para variável numérica ordinal, devido ao fato de que o indivíduo com menos escolaridade receberá a menor pontuação (0, zero) e o de maior escolaridade ao contrário (6, seis), para mais detalhes ver Tabela (10).
Ao observar a escolaridade de todas as mulheres da amostra temos que 15,92% o Ensino fundamental incompleto e 47,37% possuem o Ensino médio/Técnico, ou seja, há um grande percentual de mulheres com escolaridade relativamente baixa se considerarmos que mulheres com o Ensino médio/Técnico terão grande dificuldade de encontrar um emprego. Tem-se 10,42% das mulheres possuem o Ensino superior/Pós-graduação, o que é um percentual bom de mulheres com uma alta escolaridade.
Desse modo, ao observarmos a escolaridade com relação a cada Tipo temos que o Tipo 2 é o grupo com a maior escolaridade quase 26% das mulheres têm pelo menos o Ensino superior incompleto. Outro grupo que se assemelha com o Tipo 2 é o grupo de mulheres do Tipo 4, as quais 15%, aproximadamente, têm pelo menos o Ensino superior incompleto, contudo, tem-se que 65% dessas mulheres possuem o Ensino médio incompleto ou Ensino médio/Técnico, assim é um grupo que tende a ter uma grau de educação alto (Tabela 10).
O grupo do Tipo 1 se assemelha bastante as mulheres do Tipo 4, porém, têm um elevado percentual de mulheres com baixa escolaridade. Quase 40% das mulheres desse grupo têm no máximo o Ensino médio incompleto. Já as mulheres do Tipo 3 são de baixa escolaridade, aproximadamente 50% têm educação menor ou igual ao Ensino médio incompleto (Tabela 10). Portanto, classificando os grupos de acordo com a ordem crescente em relação à escolaridade seria a seguinte: Tipo 3, Tipo 1, Tipo 4 e Tipo 1. É possível ver essa disposição da escolaridade na Figura (8 ).
Ao analisarmos a variável renda temos que em média a renda é de 1080 reais aprox.,nota-se um alto percentual, 50%, de mulheres que possuem renda abaixo de 1 mil reais, aproximadamente, demostrando assim que grande maioria são mulheres de pouco potencial aquisitivo (Tabela 11 e Figura9). Observando cada Tipo, nota-se grupos bem
Tabela 10 – Variável Escolaridade ajustada para cada subgrupo
Tipo 1 Tipo 2 Tipo 3 Tipo 4 Todos
Sem educação (0) 0.81 0.27 0.00 0.82 0.53
Ensino fundamental incompleto (1) 19.19 6.13 37.91 12.30 15.94
Ensino fundamental (2) 6.49 2.93 11.76 7.38 6.22
Ensino médio incompleto (3) 14.32 9.07 16.34 14.75 12.96 Ensino médio/Técnico (4) 44.59 54.93 29.41 51.23 47.37 Ensino superior incompleto (5) 6.76 8.53 3.92 4.92 6.57 Ensino superior/Pós-graduação (6) 7.84 18.13 0.65 8.61 10.42
Fonte: Elaborado pelo próprio autor
Tipo 1 Tipo 2 Tipo 3 Tipo 4
0 1 2 3 4 5 6
Figura 8 – Gráfico de boxplot da variável Escolaridade, considerando uma variável ordinal, em relação a cada subgrupo.
próximo com relação a renda contudo os tipos com uma renda um pouco maior são os Tipo 1 e 2, em que as mulheres do Tipo 2 têm uma renda mais elevada que as demais, em média essas mulheres possuem renda de 1287,5 reais. Já as mulheres do Tipo 1 contém em média 1088,675 reais de renda, valor um pouco abaixo das do Tipo 2. Contudo, grande parte (quase 50%) das mulheres desse grupo possuem renda menor que 1 mil reais. Examinando os grupos com menor renda temos os Tipos 3 e 4, os quais possuem, respectivamente, renda média de 820,339 e 925,9057. Grupos de mulheres com baixo poder aquisitivo devido que mais que 50% das mulheres possuem renda menor que 1 mil reais (Figura 10).
Agora, podemos entender e realizar o modelo logístico, dado que, temos toda infor- mação e embasamento a respeito das covariáveis. Logo na próxima sessão será apresentado o modelo.
0 1000 2000 3000 4000 5000
Figura 9 – Gráfico de boxplot da variável Renda
Tipo 1 Tipo 2 Tipo 3 Tipo 4
0 1000 2000 3000 4000 5000
Figura 10 – Gráfico de boxplot da variável Renda em relação a cada subgrupo
Tabela 11 – Resumo das variáveis socioeconômicas/demográficas e cultural
Mínimo Máximo Média Desvio padrão
Idade 33 38 35.465 1.689
Raça 0 1 0.219 0.414
Religião - Católica 0 1 0.519 0.5
Religião - Evangelica 0 1 0.316 0.465
Religião - Outras 0 1 0.055 0.228
Religião - Sem religião 0 1 0.108 0.311
Escolaridade 0 6 3.521 1.467
Renda 80 5000 1089.322 722.963
4.2
Especificação do modelo
Primeiramente será abordado sobre as especificações do modelo e em seguida será apresentado os resultados acerca do modelo com as covariáveis definidas na seção 4.1.
A Regressão logística multinomial é útil para situações nas quais você deseja poder classificar assuntos com base em valores de um conjunto de variáveis preditoras. Esse tipo de regressão é semelhante à regressão logística, ver McCullagh e Nelder (1989) e Lindsey
(1997), mas é mais geral porque a variável dependente não está restrita a duas categorias.
Por exemplo, para comercializar filmes de forma mais eficiente, os estúdios de cinema querem prever o tipo de filme que um frequentador de cinema tem probabilidade de assistir. Ao executar uma Regressão logística multinomial, o estúdio pode determinar a força de influência que a idade, o gênero e o estado civil de uma pessoa têm sobre seu tipo de filme preferido. O estúdio então se concentra na campanha de publicidade de um determinado filme voltado para um grupo de pessoas que têm probabilidade de assisti-lo.
Na Regressão logística multinomial tem dois tipos de modelagem, com variáveis dependentes ordinais, que a ordem de escolha é importante, ou os casos em que as variáveis dependentes são não ordenadas,ou seja, não há uma ordem pre-definida. No presente trabalho será abordado somente os casos de não importância de ordem, para mais detalhes sobre o Modelo logístico ordinal ver Wooldridge (2010).
Logo, em casos de respostas multinomiais não ordenadas incluem vários tipos de escolha. Ou seja, um indivíduo escolhe uma alternativa do grupo de escolhas, e a rotulagem das escolhas é arbitrária. Seja y uma variável aleatória, dependente, assumindo os valores {0, 1, · · · , J} para J um inteiro positivo, e x denotar um conjunto de variáveis condicionais, ou covariáveis . Por exemplo, se y denota escolha profissional, x pode ser a educação, idade, sexo, raça e estado civil(WOOLDRIDGE, 2010)
Como no modelo de resposta binária, estamos interessados em ver como a variável dependente y muda em relação as covariáveis x e o quanto isso afeta a probabilidade,
P(y = j | x), j = 0, 1, · · · , J . Uma vez que a probabilidade deve somar 1, tem-se que P(y = 0 | x) deve ser determinado quando soubermos a probabilidade para os valores de j = 1, 2, · · · , J (WOOLDRIDGE, 2010).
Seja x um vetor, 1 × k, em que o primeiro valor é unitátio. O modelo multinomial logístico terá a probabilidade resposta definida como:
P(Y = j | x) = expxβj 1 +PJ
h=1expxβh
(4.1) onde βj é um vetor coluna, k × 1. Como a soma das probabilidade tem que ser 1, tem-se:
P(Y = 0 | x) = 1
1 +PJ
hexpxβh
(4.2) quando J = 1, teremos o modelo logístico binário.
A obtenção dos efeitos marginais para este modelo é complicada. Contudo, se xk
for contínuo, podemos escrever:
∂P(Y = j | x) ∂xk = P (Y = j | x) βjk h PJ h=1βhkexpxβhk i g(x, β) (4.3)
onde βhk é o k-ésimo elemento de βh e g(x, β) = 1 +PJh=1. A equação acima (4.3), mostra
que a direção do efeito não é determinada inteiramente por βjk. Uma simples interpretação
de βj é dada por:
pj(x, β)
p0(x, β)
= expx,βj, j = 1, 2, · · · , J (4.4)
onde pj(x, β) denota a probabilidade resposta na equaçõ (4.1). Assim a mudança
em pj(x,β)
p0(x,β) é aproximadamente βjkexp
xβj∆x
k para xk aproximadamente contínuo. Equiva-
lentemente, o log-odds ration é linear em xlog[pj(x,β)
p0(x,β)] = xβj. Este resultado se estende a
j e h : [pj(x,β)
ph(x,β)] = x(βj − βh).
Segundo Wooldridge (2010), outro fato sobre o modelo logit multinomial é :
P(y = j ou y = h|x) = pj(xβ) + ph(xβ) P(y = j|y = j ou y = h, x) = pj(xβ)
[pj(xβ) + ph(xβ)]
= Λ [x(xj− xh)]
onde Λ é a função logística. Em outras palavras, a escolha condicional ser j ou h, a probabilidade de que o resultado seja j segue um modelo logístico padrão com vetor de parâmetro βj − βh.
Dado que especificamos totalmente a densidade de y dado x, a estimativa do modelo multinomial logístico é melhor estimado pela função de máxima verossimilhança. Para cada i a probabilidade de log condicional pode ser escrita como:
ℓi(β) = J
X
j=0
1[yi = j]log[pj(xiβ)] (4.5)
onde a função indicadora seleciona a probabilidade de resposta apropriada para cada observação i.
Assim, segundo Wooldridge (2010), estimamos β maximizando PN
i=1ℓi(β). McFad-
den (1974a) mostrou que a função log-verossimilhança é globalmente côncava, o que torna
o problema da maximização simples. Para mais detalhes ver McFadden (1974b).
Consequentemente, pode-se ajustar e analisar o modelo multinomial referente a cada dinâmica de fertilidade. Neste modelo específico as possíveis variáveis dependente serão os tipos de dinâmica de fertilidade: Tipo 1, Tipo 2, Tipo 3 e Tipo 4; definidos na sessão 3.1. Desse modo a regressão utilizará as variáveis Idade, Raça, Religião, Renda e Escolaridade.
Portanto construiu-se as estimativas dos efeitos marginais com relação a cada tipo. Contudo, no modelo a variável Renda não foi incluída devido a sua correlação com a variável Escolaridade e a falta e dados. Pois com a variável no modelo teríamos 489 observações e sem ela temos 1142 observações. Dessa forma, decidiu-se retirar a variável Renda do modelo, assim, teremos as seguintes variáveis socioeconômicas/demográficas: Idade, Raça,e Escolaridade; a variável cultural é a Religião.
De acordo com o ajuste do modelo, em relação ao grupo base Tipo 1, a variável