• Aucun résultat trouvé

III - ENVIRONNEMENT, ENERGIE, AGRICULTURE, EAU ET DECHETS : 517 M€

en date du 25 janvier 2021

III - ENVIRONNEMENT, ENERGIE, AGRICULTURE, EAU ET DECHETS : 517 M€

desempenho do uso da TRI. Segundo Bazán (2005), os problemas de estimação na TRI podem ser agrupados em três categorias: estimação por máxima verossimilhança (frequentista ou clássica), estimação Bayesiana e estimação Bayesiana com MCMC (Markov Chain Monte Carlo).

Os principais métodos de estimação são: o método de Máxima Verossimilhança Marginal (MVM), o método bayesiano da Moda a Posteriori (MAP), o método bayesiano da Média a Posteriori (EAP) e o método da Máxima Verossimilhança Conjunta (MVC). Esses métodos não possuem solução explícita, o que torna necessária a utilização de algum método numérico iterativo6, como o Algoritmo Newton-Raphson, o Método Scoring de Fisher e o Algoritmo EM. Devido à dificuldade de integração das equações nos métodos de estimação, também é muito comum o uso do método numérico de integração de quadratura gaussiana, o qual consiste em aproximar as funções contínuas à funções discretas através de retângulos. Essas soluções envolvem cálculos bastante complexos e, conseqüentemente, necessitam de programas computacionais específicos.

Nessa seção esses métodos serão descritos de forma sucinta. Para maiores detalhes, sugerem-se os trabalhos de Andrade, Tavares e Valle (2000), Azevedo (2003; 2008), Baker (2001), Baker e Kim (2004), Bazán (2005), Costa (2009), de Ayala (2008), Embretson e Reise (2000), Francisco (2005), Glas (2010), Hambleton, Swaminathan e Rogers (1991), Thissen e Wainer (2001) e van der Linden e Glas (2000b; 2010).

2.4.1. Método da Máxima Verossimilhança Conjunta (MVC)

Segundo Andrade, Tavares e Valle (2000), esse método foi mais utilizado nos primeiros estudos da TRI, onde parâmetros dos itens e das proficiências eram estimados e maximizados simultaneamente (DE AYALA, 2009). Entretanto, por envolver uma quantidade muito grande

6 Geralmente um método iterativo começa fornecendo um valor inicial para estimar os

parâmetros. Entretanto, um problema que pode ocorrer é que o valor pode convergir para um máximo local e não para o máximo global. Para obter um resultado mais confiável, pode-se executar esse método com diferentes valores iniciais ou utilizar simulações.

de parâmetros a serem estimados, existem grandes problemas computacionais na utilização desse método.

Para contornar os problemas computacionais, foi proposto um processo que divide o MVC em duas etapas: (1) é iniciado com determinadas estimativas das habilidades (consideradas conhecidas) para a estimação dos parâmetros dos itens; (2) são estimadas as habilidades considerando os parâmetros dos itens conhecidos baseado nas estimativas da primeira etapa. Porém, esse procedimento pode produzir estimativas viciadas.

No método MVC existe o problema de identificabilidade do modelo, no que se trata da escala do mesmo. O fato é que existem diferentes valores de θ e de b que fornecem o mesmo valor para a probabilidade

P

ij. A solução para esse impasse é fixar uma métrica. Geralmente se estabelece uma escala com média  e desvio padrão , sendo muito comum utilizar  = 0 e  = 1.

Conforme Andrade, Tavares e Valle (2000), o método MVC pode apresentar problemas de indeterminação e problemas na estimação do parâmetro de acerto casual (valores fora do intervalo [0, 1]), e da discriminação (valores negativos). Além disso, esse método não está definido para alguns padrões de resposta (itens respondidos corretamente ou incorretamente por todos os respondentes e respondentes que acertaram ou erraram todos os itens).

2.4.2. Método da Máxima Verossimilhança Marginal (MVM) Em 1970, com o objetivo de resolver o problema de inconsistência do método MVC, foi proposto o método da máxima verossimilhança marginal para a estimação dos parâmetros em duas etapas (BOCK; LIEBERMAN, 1970): (1) estima-se os parâmetros dos itens, assumindo-se uma certa distribuição para as proficiências; e (2), estimam-se as proficiências assumindo os parâmetros dos itens conhecidos. Apesar do avanço que esse método trouxe para o problema, ele requeria que todos os parâmetros dos itens fossem estimados simultaneamente. Em 1981, Bock e Aitkin (1981) propuseram a utilização do algoritmo EM (DEMPSTER; LAIRD; RUBIN, 1977) – um processo iterativo para determinação de estimativas de máxima verossimilhança – que permitiu que os itens pudessem ter seus parâmetros estimados em separado, facilitando em muito o aspecto computacional do processo de estimação.

O método MVM, assim como o MVC, procura encontrar os valores dos parâmetros que fazem com que a probabilidade de ter dado a

resposta que foi encontrada seja a maior possível, ou seja, a mais provável de ter ocorrido.

Quando as habilidades são consideradas conhecidas, um procedimento alternativo de estimação dos itens consiste em agrupar as habilidades em categorias, o que pode reduzir bastante a exigência computacional. Para maiores detalhes, recomenda-se Andrade, Tavares e Valle (2000).

Conforme Andrade, Tavares e Valle (2000), o método da MVM pode apresentar problemas de indeterminação e problemas na estimação do parâmetro de acerto casual, obtendo valores fora do intervalo [0, 1], e da discriminação, obtendo valores negativos. Além disso, esse método não está definido para alguns padrões de resposta (itens respondidos corretamente ou incorretamente por todos os respondentes).

2.4.3. Métodos Bayesianos

Mais recentemente, os métodos bayesianos foram propostos para, entre outras coisas, resolver dois problemas das estimações por Máxima Verossimilhança: (1) estimação dos parâmetros dos itens respondidos corretamente ou incorretamente por todos os respondentes, (2) estimação das proficiências dos respondentes que acertaram ou erraram todos os itens da prova.

Nos métodos de Máxima Verossimilhança também há a possibilidade de que as estimativas dos parâmetros dos itens caiam fora do intervalo esperado, por exemplo, valores negativos para a discriminação ou valores estimados para o acerto casual fora do intervalo [0, 1]. A utilização de prioris nos métodos bayesianos é a solução para esses problemas.

A estimação bayesiana consiste em estabelecer distribuições a priori para os parâmetros, construir uma nova função denominada distribuição a posteriori e estimar os parâmetros de interesse com base em alguma característica dessa distribuição. Os métodos bayesianos mais utilizados para estimar os parâmetros são o da Média a Posteriori (EAP), que utiliza a média da distribuição a posteriori; e o da Moda a Posteriori (MAP), que utiliza a moda da distribuição a posteriori.

As prioris utilizadas são definidas conforme a característica do parâmetro a ser estimado. Para o parâmetro de discriminação

a

i, geralmente adota-se como priori a distribuição Log-Normal ou a Qui- quadrado, justificando-se pelo fato que na prática os

a

i devem ser positivos. Para o parâmetro de dificuldade

b

i geralmente adota-se como

priori a distribuição Normal, por se supor que os

b

i tenham distribuição Normal, já que estão na mesma escala das habilidades. Para o parâmetro de acerto casual

c

i, que é uma probabilidade, geralmente adota-se como priori a distribuição Beta, uma vez que essa distribuição varia dentro do intervalo [0, 1] (ANDRADE; TAVARES; VALLE, 2000).

2.4.4. Método Bayesiano com MCMC

Conforme Bazán (2005), os métodos MCMC são um conjunto de métodos de simulação de amostras aleatórias de uma distribuição multivariada usualmente desconhecida, baseados na construção de uma cadeia de Markov cuja distribuição estacionária é a distribuição multivariada de interesse. No contexto da Inferência Bayesiana, a distribuição multivariada de interesse é uma distribuição a posteriori. Assim, estatísticas da distribuição teórica de interesse (desconhecida) podem ser estimadas através das correspondentes estatísticas da amostra aleatória simulada. Azevedo (2008) destaca que os métodos MCMC permitem obter, de forma empírica, a estrutura de distribuições a posteriori conjuntas e marginais que são complicadas ou impossíveis de obter-se de forma explícita.