• Aucun résultat trouvé

IV. LES COMPOSANTS PASSIFS

IV.4 Les plots RF

Análise estatística do tipo inferencial

A estatística indutiva ou inferencial é o conjunto de técnicas, assentes na teoria das probabilidades, que permitem construir proposições de caráter probabilístico acerca da população, partindo da observação de alguns dos seus elementos (amostra) (Vairinhos, 1996). A indução é, segundo a lógica filosófica, a operação mental que parte de um certo número de observações ou experiências, para a proposição geral, a lei (Sobral e Barreiros, 1980). Assim, os métodos de inferência estatística envolvem o cálculo de estatísticas, a partir das quais se infere sobre os parâmetros da população, isto é, permitem com determinado grau de probabilidade, generalizar à população certas conclusões, por comparação com os resultados amostrais (Reis et al., 1997a). Na inferência estatística ou estatística matemática a questão central é: como usar os dados para tentar obter conclusões acerca do todo ou população de onde são originários os dados (Vairinhos, 1996).

De outra forma podemos dizer que a estatística inferencial é um conjunto de técnicas utilizadas para identificar relações entre variáveis que representem ou não relações de causa efeito. Este tipo de estatística tem como objetivo a extrapolação dos resultados obtidos através da estatística descritiva para a população em análise.

Os testes de hipóteses sobre a significância do coeficiente de correlação de Spearman e as análises de regressão linear múltipla, são algumas das diferentes técnicas disponíveis no âmbito da estatística inferencial. Paralelamente, também são habitualmente consideradas na fase prévia do estudo inferencial, a análise da consistência interna (confiabilidade), através do índice de Cronbach e a análise da validade do instrumento, através da análise fatorial.

Análise de consistência e validade

Entre os diferentes métodos que nos fornecem estimativas do grau de consistência de uma medida salienta-se o índice do Alfa de Cronbach. Este índice fornece-nos uma subestimativa da verdadeira fiabilidade da medida. A fiabilidade de uma medida refere a capacidade desta ser consistente.

O índice do Alfa de Cronbach mede a correlação das respostas de um questionário através da análise das respostas dadas pelos inquiridos, apresentando uma correlação média entre as perguntas. O coeficiente α é calculado a partir da variância dos itens individuais e da variância da soma dos itens de cada avaliador de todos os itens de um questionário que utilizem a mesma escala de medição.

Um valor de limite mínimo consensual para esta medida situa-se entre 0,60 e 0,70 (Moreira, 2004). Neste âmbito é importante referir que o valor do alfa tende a aumentar com o número de questões colocadas, sendo por exemplo comum encontrar um valor de alfa próximo dos 0,90 para um conjunto de 20 questões.

Verificada a fiabilidade da medida é necessário posteriormente avaliar a sua validade. Qualquer medida para ser válida enquanto medida de um dado construto, tem necessariamente de ser fiável, pelo que, a fiabilidade surge como condição necessária, mas não suficiente, para a validade. Daí a fiabilidade de uma medida ser o primeiro passo para saber da sua validade, ou seja, após garantir a fiabilidade é necessário por de lado a hipótese de existência de erro sistemático, para podermos garantir a validade. Para avaliar a validade de uma medida efetua-se habitualmente uma análise fatorial. A análise fatorial é uma técnica estatística multivariada, que tem como objetivo reduzir um conjunto inicial, com certo número de variáveis correlacionadas, num outro conjunto, composto por um menor número de fatores, de modo a identificar as dimensões latentes nessas variáveis. A base teórica para a análise fatorial é que as variáveis são correlacionadas porque partilham um ou mais componentes, de tal forma que a correlação entre elas pode ser expressa por fatores subjacentes. A análise fatorial a desenvolver no presente estudo incluirá o seguinte conjunto de análises/testes:

Teste Kaiser-Meyer-Olkin (KMO);

Teste de esfericidade de Bartlett; – Matriz das correlações;

– Quadro de análise da variância (variância total explicada); – Matriz dos componentes principais (sem rotação);

Matriz dos componentes principais (com rotação Varimax).

O teste de KMO é um dos testes utilizados para verificar a adequação dos dados para a realização da análise fatorial. Este teste usa uma estatística que apresenta valores normalizados entre 0 e 1, que indica a proporção da variância dos dados que pode ser comum a todas as variáveis, ou seja, que pode ser atribuída a um fator comum. Quanto mais próximo de 1 (unidade) melhor o resultado, isto é, mais adequada é a amostra à aplicação da análise fatorial. Assim em função do valor da estatística KMO, a análise fatorial é classificada da seguinte forma:

Classificação da Análise Fatorial segundo o teste KMO

KMO Grau de ajuste à análise fatorial

0,9 - 1 Muito boa 0,8-0,9 Boa 0,7-0,8 Média 0,6-0,7 Razoável 0,5-0,6 Má ou insuficiente >0,5 Inaceitável

Tal como o teste KMO, o teste de esfericidade de Barlett também é utilizado para verificar a adequação dos dados para a realização da análise fatorial. Este teste permite verificar se a matriz de correlação é uma matriz identidade, o que indicaria a inexistência de correlação entre os dados. Este teste rejeita a hipótese nula (H0), se “p < 0,05” (Manso, 1998).

O método das componentes principais permite a extração dos fatores, e consiste na extração de fatores que explicam o máximo da variância do conjunto de dados. Como método de rotação dos fatores foi escolhido o método Varimax, por ser um método de rotação ortogonal que minimiza o número de variáveis que cada agrupamento terá.

Análise correlacional

A análise correlacional é um procedimento estatístico que pretende averiguar o tipo de relacionamento entre duas ou mais variáveis, em termos da direção e do grau de relação que mantêm entre si. O seu objetivo é portanto medir o grau e a direção de uma relação entre duas variáveis, expressa por um coeficiente de correlação.

O coeficiente de correlação de Spearman é um dos métodos mais utilizados no âmbito da análise correlacional, e corresponde a uma medida de correlação não paramétrica que mede a intensidade da relação entre variáveis ordinais, usando em vez do valor observado, apenas a ordem das observações. Deste modo, este coeficiente não é sensível a assimetrias na distribuição, não exigindo portanto que os dados provenham de duas populações normais.

O coeficiente p (letra grega rho) de Spearman quanto mais baixo for (isto é, perto de 0), mais significativos são os resultados, e portanto maior é a fundamentação para rejeitar a hipótese nula. Se “p< 0,05”, significa que os resultados já são estatisticamente significativos, enquanto que valores de “p < 0,01”, significa resultados estatisticamente muito significativos.

Análise de regressão

A análise de regressão estuda o relacionamento entre uma variável chamada “variável dependente” (“variável de resposta”) e outras variáveis chamadas “variáveis independentes” (“variáveis explicativas”). Este relacionamento é representado por um modelo matemático, isto é, por uma equação que associa a variável dependente com as variáveis independentes. O modelo é designado por modelo de regressão linear simples se define uma relação linear entre a variável dependente e uma variável independente. Se em vez de uma, forem incorporadas várias variáveis independentes, o modelo passa a denominar-se modelo de regressão linear múltipla.

No presente trabalho de investigação será feita uma análise de regressão linear múltipla com o intuito de selecionar conjuntos de variáveis que se possam assumir como preditoras nos processos de adoção de OSS. Para este efeito utiliza-se o método de seleção de variáveis independentes Stepwise, que é um procedimento padrão para seleção de variáveis que combina dois outros métodos, o forward selection e backward elimination (Montgomery et al., citado por Chong e Jun, 2005). O algoritmo progressivamente adiciona novas variáveis ao modelo, iniciando naquela que tiver maior correlação com a resposta, como no método forward selection, e incorpora um mecanismo de eliminação de variáveis, igual ao método de backward elimination. O forward selection é um método iterativo que começa com uma variável (x) e, progressivamente, adiciona mais variáveis ao modelo de regressão até que um critério de parada seja satisfeito. A variável inicial deve apresentar máxima correlação com a variável de resposta (y). A cada iteração, é construído um novo modelo e o efeito da variável incluída é avaliado por um teste-F. A variável com um valor de F maior que um F-crítico é incluída no modelo. No método backward elimination, inicia-se com a construção de um modelo de regressão com todas as variáveis disponíveis e, subsequentemente, as variáveis são retiradas e o efeito dessa eliminação é avaliado, da mesma forma que no método forward selection. As variáveis com valores de F menores que F-crítico são descartadas do modelo. Uma recente modificação neste método é apresentada por Forina et al. (2007), onde é feita uma ortogonalização para eliminar o problema de multicolinearidade entre as variáveis selecionadas.

Documents relatifs