Com o objetivo de verificar como se dá a inserção dos trabalhadores no mercado formal, será utilizado um modelo de escolha qualitativa a fim de analisar quais características individuais e geográficas influenciam a probabilidade de inserção em tal setor.
No presente caso, a equação a ser estimada é dada por:
= + + + + + + + +
+ + + + + + +
+ + + + + + � (02)
discretas que indicam a escolaridade do trabalhador, em anos de estudo, sendo E1, E2, E3 e E4 formados, respectivamente, por trabalhadores com 1 a 4, 5 a 8, 9 a 11 e mais de 11 anos de estudo; Exp representa a experiência do trabalhador em anos8
; Rm (m= 1, 2) são variáveis dummies que indicam a raça do trabalhador, com o grupo base sendo formado por brancos, R1 assumindo o valor 1 para negros e 0 caso contrário e R2 assumindo o valor 1 para pardos e zero caso contrário; Urb é uma variável qualitativa que representa a localização do domicílio, assumindo valor 1 caso se situe em área urbana e 0 para área rural; RM é uma dummy com valor 1 caso o domicílio do trabalhador seja em região metropolitana e 0 caso contrário; Regn (n = 1, ..., 4) são dummies para a região onde se encontra o domicílio do trabalhador, sendo o grupo base representado pela região Nordeste; Reg1 para o Sudeste, Reg2 para o Sul, Reg3 para o Centro-Oeste e Reg4 para o Norte; Sk (k = 1, ..., 4) são variáveis dummies que indicam o setor de atividade do trabalhador, sendo o grupo base formado pela indústria, S1 representando a agricultura, S2 a construção, S3 o comércio e S4 os serviços; U é uma variável binária que indica se o trabalhador é sindicalizado; RNPT é uma dummy que indica rendas não provenientes do trabalho9, caso em que assume valor 1; e εi representa os resíduos da regressão10. Finalmente, o regressando Li é uma variável binária, assumindo valor 1 caso o trabalhador esteja inserido no mercado de trabalho formal, e 0 no informal.
Espera-se que os parâmetros estimados para as variáveis Ek possuam sinal positivo, indicando que maiores níveis de escolaridade estejam associados a maiores probabilidades de inserção no mercado formal. Da mesma forma, espera-se um sinal positivo para Exp, de modo que a probabilidade de participação no setor formal aumente com a experiência do indivíduo, mas atingindo um ponto de máximo, de modo que Exp² tenha, a princípio, um sinal negativo. Para as dummies Rm esperam-se sinais negativos, indicando que indivíduos negros e pardos possuem menor probabilidade de estar no mercado de trabalho formal do que os brancos. Para as variáveis Urb e RM são esperados parâmetros com sinais positivos, indicando que trabalhadores das áreas urbanas e regiões metropolitanas possuem maior probabilidade de estar no setor formal do que suas respectivas contrapartes das áreas rurais e regiões não-
8 Exp é uma proxy construída da seguinte forma: Exp = idade – escolaridade – 6, conforme sugerido por Mincer (1974) e já mencionado anteriormente.
9 De acordo com a classificação da PNAD, são consideradas rendas não provenientes do trabalho, por exemplo, pensões alimentícias, fundos de pensão, abonos de permanência, aluguéis, doações, juros de caderneta de poupança, dividendos, etc.
10 As variáveis relacionadas às características dos indivíduos e de suas localidades, que não dizem respeito diretamente ao capital humano, foram incluídas seguindo a sugestão de Borgas e Mincer (1976). Diversos outros trabalhos seguem a mesma linha, como Tannuri-Pianto e Pianto (2002), Carneiro e Henley (2001) e Machado, Oliveira e Antigo (2008).
metropolitanas. Quanto às regiões, dado que o Nordeste é considerado como região base, são esperados sinais positivos para os parâmetros de Regn, sugerindo que trabalhadores das regiões Sudeste, Sul, Centro-Oeste e Norte possuem maior inserção média na formalidade. Para as variáveis Sk são esperados sinais negativos, indicando que aos setores de agricultura, construção, comércio e serviços estão associadas menores probabilidades de formalidade dos postos de trabalho. Para a variável U espera-se um coeficiente positivo, de modo que o fato de pertencer a um sindicato eleve a probabilidade do trabalhador se inserir no mercado de trabalho formal e, por fim, para variável RNPT é esperado um sinal negativo, de forma que o recebimento de rendimentos não provenientes do trabalho eleve o nível do salário de reserva do indivíduo e, assim, reduza sua probabilidade de ofertar formalmente sua mão de obra.
Considerando que a variável dependente assume valores binários, torna-se necessário utilizar um modelo capaz de estimar corretamente os coeficientes e as probabilidades diante de tal situação. Para tanto, será aplicado o modelo Probit, que se baseia na distribuição normal padrão acumulada para estimar as probabilidades de inserção de modo que as mesmas estejam restritas ao intervalo [0,1].
De acordo com Greene (2003) e Johnston e DiNardo (1996), a partir de um modelo de variável latente, é possível derivar o modelo Probit. Considere-se uma L* uma variável latente não observável, que no presente caso representa a decisão do trabalhador em optar pelo setor formal, de modo que:
∗ = + � (03)
onde Xi é um vetor de variáveis explicativas que determinam a decisão de participar do mercado de trabalho formal ou informal, é um vetor de parâmetros e � é o termo de erro aleatório com média zero.
Na prática, não se observa ∗, mas sim o resultado da decisão do indivíduo, que pode ser expressa da seguinte maneira:
{ = ∗ > �
= ∗ � (04)
em que � é um limite da variável latente que determina a mudança de decisão. Para o presente caso, esse limite determina o ponto a partir do qual o trabalhador opta por se inserir no mercado de trabalho formal, isto é, caso o trabalhador esteja no setor formal, L assume o valor 1; caso esteja no informal, L assume o valor 0.
se inicialmente as probabilidades de L assumir os valores 1 ou 0, isto é, P(L = 1) e P(L = 0). Condicional aos valores de X, tem-se:
{ = | = ∗ > �
= | = ∗ �
(05) normalizando � em 0, e utilizando a definição dada em (03), a probabilidade de L = 1 é:
= | = ∗ > | = | = + � > | = | = � > − | (06) e a probabilidade de L = 0 é = | = ∗ | = | = + � | = | = � − | (07)
Dado que � é uma variável aleatória com função de densidade de probabilidade cumulativa F(.), tem-se que
= | = (08)
e
= | = − (09)
Através de tal definição, a função F(.) garante que os valores de = | estejam dentro do limite [0,1], para X variando dentro do intervalo [-∞, +∞]. Como há duas alternativas mutuamente excludentes, basta estimar a equação (08).
3.1.2 Os determinantes dos rendimentos dos trabalhadores formais e informais: o modelo