Para Gujarati e Porter (2011), análise de regressão é o estudo da relação entre variáveis, sendo uma delas dependente de uma ou mais outras. Dessa forma, é possível obter uma estimativa das mudanças ocorridas na variável dependente, a partir de valores predefinidos ou conhecidos de outras, ditas independentes.
Modelos econométricos são muito utilizados em estudos de demanda, com a intenção de entender o peso das influências de fatores teóricos e experimentais, bem como realizar estimativas dentro de certa margem de erro e intervalo de confiança. A estimativa da demanda é resultado da relação de variáveis independentes, obtida através de meios matemáticos e estatísticos. As metodologias de aplicação da econometria são muito variadas e dependem da disponibilidade de dados e da estratégia definida pelo pesquisador. Gujarati e Porter (2011) descrevem de forma genérica por meio do fluxograma da Figura 18, a metodologia econométrica clássica ou tradicional subdividida em oito etapas.
Figura 18 – Modelagem Econométrica Clássica
Fonte: Gujarati e Porter (2011)
Analisando-se a formulação em etapas da aplicação metodológica da econometria por Gujarati e Porter (2011), vê-se que a primeira etapa incorpora a discussão da teoria econômica ou hipótese que embasa o estudo. Na segunda, a teoria de base define o modelo matemático adotado. De forma mais simplificada, a função matemática pode ser definida pela relação linear entre a variável dependente (Y) e variáveis independentes ou explicativas (Xki), por meio dos
parâmetros βk ou coeficientes parciais de regressão, conforme apresentado na Equação 1. Na
terceira etapa é feita a especificação do modelo estatístico ou econométrico por meio da modificação da Equação 1 pela adição da variável μi que representa o termo de erro aleatório.
Esta modificação conduz à Equação 2, que leva em conta fatores que não estão representados pelas variáveis do modelo, mas que afetam a variável explicada (GUJARATI; PORTER, 2011).
(1)
Nessa fase, explicitam-se os métodos para a estimação da função amostral, que têm como finalidade explicar os efeitos das alterações nas variáveis independentes sobre a variável dependente, sendo o mais conhecido o método dos mínimos quadrados. Este método é utilizado em análises de regressão, pela sua simplicidade matemática e robustez no alinhamento com a teoria econômica relacionada e também por ter propriedades estatísticas muito eficazes. (PINDYCK; RUBINFELD, 2013; GUJARATI; PORTER, 2011).
Para aplicação do método dos mínimos quadrados, evolui-se a Equação 2 da regressão populacional para a regressão amostral conforme Equação 3. A estimativa do comportamento populacional é feita por intermédio dos resíduos da função de regressão amostral, sendo Ŷi a
média condicional de Yi. Assim, podem-se extrair os resíduos da função de regressão amostral,
que representam a diferença entre os valores observados (Y) e os valores estimados (Ŷ), conforme Equação 4. (GUJARATI; PORTER, 2011).
(3)
(4) Objetivando definir a função amostral, busca-se uma expressão que se aproxime ao máximo dos dados observados. Para tal fim, é necessário que a soma dos resíduos obtidos na Equação 4 seja minimizada. Assim, para se equalizar a importância dos resíduos de dimensões e direções diferentes, o método dos mínimos quadrados introduz a soma dos resíduos elevados ao quadrado. Dessa forma, a função de regressão amostral será transformada na Equação 5. (PINDYCK; RUBINFELD, 2013; GUJARATI; PORTER, 2011).
(5) A quarta etapa é a coleta de dados, que representa um dos passos mais importantes para a garantia da qualidade da análise econométrica. Neste aspecto, é importante observar a natureza, a fonte e as limitações dos dados obtidos. Existem três tipos de estruturação de base de dados: i) séries temporais, nas quais uma mesma unidade é observada ao longo de vários períodos de tempo; ii) cortes transversais em que várias unidades são observadas na mesma referência temporal; e iii) combinados de séries temporais com cortes transversais ou em painel, nos quais várias unidades são observadas ao longo de certo período de tempo (STOCK; WATSON, 2004).
A quinta fase é a estimativa dos parâmetros do modelo através dos dados obtidos. A aplicação dos dados ao modelo econométrico definido estima os valores dos parâmetros , e (GUJARATI; PORTER, 2011;).
Na sexta etapa são realizados os testes de hipóteses para confirmar o atendimento dos pressupostos da utilização do modelo clássico de regressão linear (MCRL). Nesta fase os estimadores dos mínimos quadrados são definidos como os melhores estimadores não viesados (MELNT), pois devem ser não tendenciosos, consistentes, lineares e produzir estimativas com a menor variância dentre todos os estimadores lineares não tendenciosos, conforme Teorema de Gauss-Markov. A definição da precisão dos estimadores e da qualidade de ajustamento do modelo é medida pelos seus erros padrões e pelo coeficiente de determinação (R2). O coeficiente de determinação exprime o quanto o conjunto de variáveis independentes explica a variância da variável dependente, ou seja, a proporção da variação de Y, que é explicada pela equação de regressão múltipla (PINDYCK; RUBINFELD, 2013).
Deve-se realçar uma especificidade do coeficiente R², uma vez que ele é sensível ao número de variáveis incluídas no modelo. Um aumento no número de variáveis explicativas eleva também o seu valor, com exceção se houver variáveis perfeitamente colineares. Uma técnica de avaliar a melhoria na função de regressão pelo acréscimo de nova variável é a utilização do R² ajustado, que representa o resultado do ajuste do R² com redução de graus de liberdade. Desta forma, o R2 ajustado tem uma série de propriedades que o torna uma medida de qualidade de ajusamento melhor do que o R2, porque com o acréscimo de novas variáveis, o R2 ajustado pode diminuir ou aumentar (STOCK; WATSON, 2004). A sua definição matemática está apresentada na Equação 6.
(6) Adicionalmente são realizadas verificações para testar se o modelo construído atende aos seguintes pressupostos: i) o modelo é linear ou linear nos parâmetros; ii) o termo de erro
tem valor médio zero; iii) os termos de erro têm variância constante ou seja, são homocedásticos; iv) não há autocorrelação entre os termos de erros e as variáveis independentes; e v) ausência de multicolinearidade ou correlação forte ou exata entre variáveis dependentes. (PINDYCK; RUBINFELD, 2013; GUJARATI; PORTER, 2011).
A partir da finalização do processo com os critérios de significância estatística testados e o modelo validado, a estimativa dos valores da variável dependente é realizada na sétima etapa por meio da função gerada pelos seus parâmetros.
4.2 APLICAÇÃO DE UM MODELO ECONOMÉTRICO AO MERCADO DA