• Aucun résultat trouvé

De rares demandes d’informations de la part des entreprises

2/ L’information transmise

2.1 De rares demandes d’informations de la part des entreprises

Uma vez preparadas as bases de dados e as respectivas tabelas, passa-se aos procedimentos referentes à obtenção das distribuições de frequência (discretas) e de severidade (contínuas) que melhor se ajustem aos dados empíricos, assim como à estimativa dos parâmetros das respectivas distribuições. Para tanto, utilizou-se o software especialista ExpertFit®, versão 8.01, da empresa Averill M. Law Associates Inc, o qual permite testar14 o grau de ajuste aos dados para as trinta distribuições contínuas e oito distribuições discretas utilizadas nesta pesquisa, as quais se encontram especificadas no Anexo A, com a descrição dos respectivos

14

É importante destacar que o software ExpertFit® tem, dentre suas funcionalidades, a execução da análise prévia das características estatísticas dos dados, de forma que há uma pré-seleção de quais distribuições são teoricamente passíveis de serem ajustadas.

parâmetros estimados segundo a abordagem de máxima verossimilhança (ML - maximum- likelihood).

No que tange aos testes de ajuste aos dados, Law (2007, p. 340) observa:

Before proceeding with a discussion of several specific goodness-of-fit tests, we feel compelled to comment on the formal structure and properties of these tests. First, failure to reject Ho should not be interpreted as “accepting Ho as being true”. These

tests are often not very powerful for small to moderate sample sizes n; that is, they are not very sensitive to subtle disagreements between the data and the fitted distribution. Instead, they should be regarded as a systematic approach for detecting fairly gross differences. On the other hand, if n is very large, then these tests will almost always reject Ho [see Gibbons (1985, p. 76)]. Since Ho is virtually never

exactly true, even a minute departure from the hypothesized distribution will be detect for large n. This is an unfortunate property of these tests, since it is usually sufficient to have a distribution that is “nearly” correct.

Como neste estudo as amostras apresentam, em geral, tamanho muito superior a mil observações, os testes de ajustamento serão utilizados como critério de classificação, e não de eliminação. No caso das distribuições discretas, será considerada como a distribuição que melhor se ajusta aos dados aquela que apresentar o valor negativo do logaritmo neperiano da função verossimilhança (-LL) mais próximo de zero. Por sua vez, para as distribuições contínuas, o critério de seleção será o que apresentar menor valor apurado no teste de Anderson-Darling (AD) que, além de considerar todas as observações da amostra, atribui maior peso às discrepâncias existentes nas caudas (STEPHENS, 1979; CRUZ, 2002, KLUGMAN, PANJER e WILLMOT, 2004; HEIJ, BOER, FRANSES, KLOEK e DIJK, 2004; DUTTA e PERRY, 2007).

Dois pontos adicionais devem ser destacados no que tange a este tópico. O primeiro ponto refere-se à funcionalidade do software ExpertFit® que proporciona um teste automático sobre a possibilidade de introdução de um deslocamento (shift) nas distribuições teóricas. Esta funcionalidade é de especial importância no caso dos testes em que se impõe um valor mínimo de corte, no qual há um truncamento nos valores mínimos. Assim, sempre que

possível, o software atribui parâmetros de deslocamento (no caso deste estudo, sempre para a direita), de forma a compensar o truncamento realizado à esquerda (inexistência de observações inferiores a um valor mínimo estipulado).

O segundo ponto refere-se à limitação do número de observações que o software pode processar, qual seja: 100 mil observações. Como neste estudo têm-se situações em que existem registros de eventos de perda superiores a este limite, foi necessário acrescentar uma análise adicional com o software MatLab®, que, se por um lado permite uma melhor flexibilidade de programação, por outro torna praticamente impraticável a implantação do teste para todas as distribuições disponíveis no ExpertFit® no contexto desta tese. Dessa forma, o procedimento adotado para suprir a limitação do software especialista e viabilizar a utilização do MatLab® é descrito a seguir:

a) separa-se a base de dados original em frações sequenciais de 100 mil observações, criando-se diversos subconjuntos com tamanho igual a 100 mil ou inferior (em geral, ocorrendo para o último conjunto);

b) gera-se um subconjunto adicional de 100 mil observações, por meio de uma rotina de seleção aleatória na base de dados original;

c) submete-se cada um dos subconjuntos aos procedimentos usuais com o ExpertFit®, selecionando-se as três distribuições que melhor se ajustaram ao respectivo subconjunto. Assim, mantêm-se a compatibilidade dos procedimentos e o rigor aplicados com observações menores ou iguais a 100 mil, testando-se todas as distribuições disponíveis;

d) reúnem-se todas as distribuições anteriormente pré-selecionados por subconjunto e faz-se uma nova classificação, utilizando-se o valor do teste AD obtidos nos procedimentos anteriores;

e) da classificação do passo anterior, escolhem-se três distribuições distintas entre as melhores classificadas;

f) apenas para as três distribuições finais, efetua-se o processamento no MatLab®15, estimando-se os parâmetros por máxima verossimilhança e calculando-se o valor do teste AD; e

g) segundo o mesmo critério anterior, considera-se a melhor distribuição ajustada aquela que apresenta menor valor apurado no teste AD.

Vale ressaltar que, para testar os efeitos da substituição das distribuições de frequência mais bem ajustadas pela distribuição de Poisson, em todos os cenários é necessário estimar também o seu parâmetro (média), independentemente da sua classificação.

Por fim, novamente os procedimentos discutidos neste tópico devem ser efetuados tanto para os valores históricos quanto para os valores corrigidos pelo IPCA, excetuando-se a análise relativa à distribuição de Poisson, efetuada só para os valores corrigidos.