• Aucun résultat trouvé

PARTIE I : ETAT DE L’ART

I. Chapitre I : Les matériaux composites

I.4 Conclusion

A estimação do modelo logístico inicia-se com o ajuste de uma regressão simples a cada uma das variáveis explicativas. O objetivo desta análise é verificar a importância que cada variável explicativa tem para a variável resposta, severidade de um acidente.

A tabela 7.10 apresenta os valores estimados dos coeficientes de regressão, desvio padrão, teste de Wald e respetivos valores p. As estimativas dos coeficientes representam o efeito que cada uma das variáveis explicativas pode causar na variável resposta. O desvio padrão da estimativa é utilizado para o cálculo da estatística de teste Wald que avalia a significância dos coeficientes estimados. Assim, para testar a significância dos coeficientes estimados, compara-se o valor do teste de Wald com o quantil de probabilidade da normal padrão. Esse quantil depende do nível de significância que se pretender.

Também foi apresentado na tabela 7.10 o valor estimado da medida razão da chance (Odds ratio). Para a variável explicativa categórica, esta medida indica o quanto o logaritmo da razão da chance muda quando se passa da categoria referência da variável para uma outra sua categoria. No caso da variável explicativa contínua, o aumento de uma unidade no valor da variável corresponde a um incremento de valor igual no logaritmo da razão da chance.

42 Tabela 7.10: Ajuste de regressão logística a cada uma das variáveis explicativas

Variáveis explicativas Estimativas dos coeficientes Odds ratio (OR) Intervalo de confiança (95%, OR) Desvio padrão Teste Wald Valor- p(wald) Meses

Termo Constante -1.76 1.00 0.0062 -284.9 <2e-16 Março-Maio 0.069 1.09 (1.05;1.09) 0.009 8.1 5.5e-16 Junho-Setembro 0.099 1.10 (1.09;1.12) 0.008 12.4 <2e-16 Outubro-Novembro 0.031 1.03 (1.01;1.05) 0.0094 3.3 0.0008

Dia_Semana

Termo Constante -1.77 1.00 0.004 -503.4 <2e-16 Sábado 0.189 1.21 (1.18;1.23) 0.0089 32.64 <2e-16 Domingo 0.291 1.34 (1.32;1.36) 0.0084 22.59 <2e-16

Hora do dia

Termo Constante -1.87 1.00 0.006 -289.5 <2e-16 1-5horas 0.28 1.32 (1.29;1.35) 0.0095 29.4 <2e-16 12-17horas 0.11 1.12 (1.09;1.13) 0.008 13.8 <2e-16 18-24horas 0.34 1.40 (1.38;1.43) 0.009 38.6 <2e-16

Condições_Iluminação

Termo Constante -1.80 1.00 0.004 -502.2 <2e-16 Não luz do dia 0.34 1.40 (1.39;1.42) 0.006 52.6 <2e-16

Tipo_Veículo

Termo Constante -1.86 1.00 0.004 -518.5 <2e-16 Motocicleta 0.89 2.43 (2.39;2.47) 0.008 109.3 <2e-16 Camião 0.43 1.54 (1.50;1.57) 0.011 38.1 <2e-16 Outro tipo_veículo 0.11 1.12 (1.09;1.15) 0.013 8.9 <2e-16

Género_condutor

Termo Constante -2.04 1.00 0.006 -350.4 <2e-16 Masculino 0.5 1.65 (1.63;1.67) 0.007 70.03 <2e-16

Faixa_etária_Condutor

Termo Constante -1.73 1.00 0.0045 -387.4 <2e-16 36-55 anos 0.013 1.013 (0.99;1.027) 0.007 1.97 0.05 >55 anos 0.15 1.16 (1.14;1.18) 0.009 17.4 <2e-16

Idade_Veículo

Termo Constante -1.76 1.00 0.006 -318.2 <2e-16 Idade 0.008 1.008 (1.007;1.009) 0.0006 12.4 <2e-16

Limite_Velocidade

Termo Constante -1.67 1.00 0.0307 -54.5 <2e-16 30-50 m/hora -0.15 0.86 (0.81;0.91) 0.0309 -4.7 2.25e-06 >50 m/horas 0.25 1.28 (1.21;1.36) 0.031 8.06 7.54e-16

A partir dos resultados de ajuste do modelo de regressão Logística a cada variável explicativa apresentados na tabela 7.10, verifica-se que todas as variáveis explicativas apresentam uma associação estatisticamente significativa e positiva com a variável resposta.

A chance da ocorrência de acidentes não ligeiros nos meses de Outubro a Dezembro é 3% superior aos meses de Dezembro a Fevereiro (classe referência), e para os meses de Junho a Setembro e Outubro a Novembro a chance é de 9% e 10% respetivamente, superior aos meses de Dezembro a Fevereiro.

43

Relativamente aos dias da semana verifica-se que nos dias de sábado e domingo a chance é de 21% e 34% respetivamente, superior em relação aos dias úteis (segunda a sexta). Para a variável hora do dia, o horário de 18 a 24 horas e das 1 a 5 horas apresentam uma chance de 40% e 32% respetivamente, superior à classe referência (6 a 11 horas), o mesmo se verifica para a variável condição de iluminação em que os acidentes que ocorrem à noite têm uma chance 40% superior de serem não ligeiros em relação à classe referência (luz do dia).

Também se verifica na tabela 7.10 que a chance dos acidentes envolvendo os condutores de motocicletas terem vítimas não ligeiras é maior (OR=2.43) em relação aos condutores de automóveis, os condutores de camião têm uma chance 54% superior aos condutores de automóveis. O odds ratio da idade do veículo é 1.008, o que significa que a cada aumento de um ano na idade do veículo aumenta exp(0.008) na chance de acidentes não ligeiros.

7.2.1.1. Modelo de regressão múltipla

Depois da análise da tabela de contingência e do ajuste do modelo logístico a cada uma das variáveis explicativas, procede-se à seleção das variáveis para a construção do modelo de regressão múltipla. Para a seleção das variáveis foi utilizado o procedimento automático backward stepwise, forward stepwise e both stepwise.

Método backward stepwise

O método backward stepwise inicia-se com a suposição de que todas as variáveis estão incluídas no modelo. A ideia é verificar, por fase, se cada variável pode ser ou não eliminada do modelo. A decisão de eliminar a variável é com base na estatística deviance ou a medida AIC, de modo que este método terminou o processo de seleção com o seguinte modelo ajustado:

Severidade_acidente ~ meses + dia_semana + hora_do_dia + limite_velocidade + condições_iluminações + tipo_veículo + género + faixa_etária + idade_veículo.

Os resultados das estimativas dos coeficientes do modelo, da estatística de teste de Wald e respetivos valores p são apresentados no Anexo4.

Método forward stepwise

Esse procedimento parte da suposição que não há variável no modelo. A ideia do método é adicionar uma variável a cada passo. A primeira variável selecionada é aquela com maior correlação com a variável resposta, tendo por base a estatística deviance ou a medida AIC.

44

Severidade_acidente ~ tipo_veiculo + limite_velocidade + condições_iluminações + género + dia_semana + faixa_etária + meses + hora_do_dia + idade_veículo

Os resultados das estimativas dos coeficientes do modelo, da estatística de teste de Wald e respetivos valores p são apresentados em Anexo4.

Método both stepwise

O método both stepwise é uma combinação dos dois métodos anteriores. Este método utiliza a adição e a remoção de covariáveis com base na estatística deviance ou a medida AIC. O modelo final selecionado por este método foi o seguinte:

Severidade_acidente ~ meses + dia_semana + hora_do_dia + limite_velocidade + condições_iluminações + tipo_veículo + género + faixa_etária + idade_veículo.

Os resultados das estimativas dos coeficientes do modelo, da estatística de teste de Wald e respetivos valores p são apresentados no Anexo4.

A partir dos resultados apresentados em Anexo4 verifica-se que o modelo final é o mesmo para todos os métodos de seleção das covariáveis. De acordo com o valor da estatística de teste Wald existe evidência estatística de que os coeficientes estimados são todos significativos a qualquer nível de significância considerado. Para confirmar que o modelo selecionado pelos procedimentos automáticos se ajusta melhor com a presença de todas as covariáveis faz-se a comparação do modelo ajustado com o modelo nulo através dos cálculos das medidas descritas na secção (3.6). A tabela 7.11 apresenta os resultados para tal comparação:

Tabela 7.11: Comparação entre os modelos (backward, both e forward) e o modelo nulo

AIC Deviance (D) Diferença entre deviance Valor-p Modelo nulo (Mn) 747964 747962

Modelo backward (Mb) 724834 724796 (𝐷Mn-𝐷Mb) = 23166 <2.2e-16 Modelo both (Mbh) 724834 724796 (𝐷Mn-𝐷Mbh) = 23166 <2.2e-16 Modelo forward (Mf) 724834 724796 (𝐷Mn-𝐷Mf) = 23166 <2.2e-16

A medida AIC mede o grau de informação que se perde com o ajuste de um determinado modelo, o seu valor mostra que os modelos backward, both e forward têm uma menor perda de informação em relação ao modelo nulo (tabela 7.11), portanto o ajustamento é melhor. A deviance é o desvio do modelo ajustado em relação ao modelo saturado, isto é, a distância do modelo ajustado, µ̂, dos dados observados, y, e quanto menor é esta distância melhor é o ajuste do modelo.

A diferença entre a deviance do modelo nulo em relação aos modelos backward, both e forward corresponde ao valor da estatística de teste de verosimilhança e é dada como uma

45

medida de variação dos dados. A comparação desta medida com o quantil da distribuição Qui-Quadrado permite concluir que as variáveis explicativas incluídas nos modelos backward, both e forward são significativos, o valor p correspondente é aproximadamente zero.

Pelo facto de existir uma forte associação entre a variável condições de iluminação e a variável hora do dia, decidiu-se ajustar estas duas variáveis em modelos diferentes com o método forward stepwise.

Os dois modelos ajustados são:

Modelo 1:

Log(1−pp )=β1 + β2*Tipo_Veículo + β3*Limite_Velocidade + β4*Condições_Iluminação + β5*Género_Condutor + β6*Dia_Semana + β7*FaixaEtária_Condutor + β8*Meses + β9*Idade_Veículo

Modelo 2:

Log(1−pp )=β1 + β2*Tipo_Veículo + β3*Limite_Velocidade + β4* Género_Condutor + β5* Dia_Semana + β6* FaixaEtária_Condutor + β7* Meses + β8*Hora_do_dia + β9*Idade_Veículo

Para a escolha do melhor modelo é utilizado a medida AIC, pois os dois modelos não são aninhados. A tabela 7.12 apresenta os resultados de AIC dos dois modelos:

Tabela 7.12: Resultado para comparação dos modelos de regressão Logística (modelo1 e 2)

AIC Número de parâmetros

Modelo1 725229 16

Modelo2 726295 18

Seguindo o critério de parcimónia, isto é, escolher um modelo que esteja bem ajustado e com um número reduzido de parâmetros, a escolha do modelo final será o modelo1 com menor número de parâmetros e menor valor de AIC. A tabela 7.13 apresenta os resultados da estimativa dos parâmetros do modelo selecionado.

46 Tabela 7.13: Modelo de regressão Logística (Modelo1)

Avaliação do modelo 1

Depois do ajustamento do modelo 1, procede-se à sua avaliação. A estatística de teste de Wald, a medida deviance e o teste de Hosmer e Lemeshow são os métodos utilizados para avaliar a qualidade de ajuste do modelo.

O primeiro passo da avaliação do modelo foi a significância estatística dos coeficientes estimados utilizando a estatística de Wald e a medida deviance. Analisando os valores apresentados na tabela 7.13, o teste de Wald, para qualquer nível habitual de significância (1%, 5% e 10%), considera que os parâmetros estimados são estatisticamente significativos. Também, pelo resultado da medida deviance comprova-se que o modelo é globalmente significativo. Para esta conclusão faz-se a análise de comparação entre a deviance do modelo ajustado (modelo1) com a deviance do modelo nulo (ver o Anexo4). Ainda sobre a qualidade de ajuste do modelo o resultado de teste de Hosmer e Lemeshow foi igual a 62.1 e valor p é de 1.83e-10, isso indica que o modelo não se ajusta bem aos dados.

Com o objetivo de encontrar um modelo que se ajusta bem aos dados foi realizado uma análise mais específica considerando uma base de dados de acidentes com peões. As variáveis explicativas utilizadas são as mesmas consideradas no modelo 1.

Variáveis explicativas Estimativas dos coeficientes

Teste de Wald Valor-p (Wald) Termo Constante -2.36 -72.3 <2e-16

Tipo_Veículo

Motocicleta 0.87 100.8 <2e-16 Camião 0.39 31.91 <2e-16 Outro tipo_veículo 0.12 9.4 <2e-16

Limite_Velocidade

30-50 m/horas -0.19 -6.1 1.3e-09 >50 m/horas 0.21 6.62 3.51e-11

Condições_Iluminação

Não luz do dia 0.39 57.016 <2e-16

Género_Condutor Masculino 0.25 34.4 <2e-16 Dia_Semana Sábado 0.17 19.7 Domingo 0.24 25.9 <2e-16 Faixa_etária_Condutor 36-55anos 0.04 5.6 2.07e-08 >55anos 0.28 31.6 <2e-16 Meses Março-Maio 0.15 16.7 <2e-16 Junho-Setembro 0.18 20.9 <2e-16 Outubro-Novembro 0.043 4.6 4.77e-06 Idade_veículo Idade 0.009 14.44 <2e-16

47

Análise de acidentes com peões

Nesta análise, os dados da amostra descrita na secção 7.1.2 foram reduzidos, considerando apenas as instâncias da base de dados que correspondem a acidentes com peões.

Os resultados de ajustamento do modelo sobre os dados de acidentes com peões com a regressão Logística encontram-se no Anexo5.

Analisando a tabela (Anexo5), verifica-se uma diferença estatística significativa na proporção de acidentes não ligeiros em comparação com os ligeiros, para a variável tipo_veículo (categoria camião, valor p <2e-16, e outro tipo de veículo, valor p = 0.017), mas não significativa para as motocicletas. Também se verifica que a diferença de proporção de acidentes não ligeiros em comparação com os meses de Dezembro a Fevereiro não foi estatisticamente significativa para os meses de Março a Maio, Junho a Setembro e Outubro a Novembro, os valores-p são (0.342, 0.18 e 0.79) respetivamente. Pelos valores estimados da estatística de Wald e respetivos valores p associados à variável “meses”, conclui-se que esta variável não é significativa, portanto foi retirada do modelo. O modelo final selecionado para explicar a severidade dos acidentes com peões foi o seguinte:

Modelo 3:

Log(1−pp )=β1 + β2*Tipo_Veículo + β3*Limite_Velocidade + β4*Condições_Iluminação + β5*Género_Condutor + β6*Dia_Semana + β7*FaixaEtária_Condutor + β8*Idade_Veículo

Os resultados da estimativa dos parâmetros, estatística de Wald e valor p são apresentados na tabela 7.14.

48 Tabela 7.14: Estimativas dos parâmetros, estatística de Wald e valor p (Modelo3)

Variáveis explicativas Estimativas dos

coeficientes

Teste de Wald Valor-p (Wald)

Termo Constante -1.45 -32,1 <2e-16

Tipo_Veículo Motocicleta 0.025 0.74 0.46 Camião 0.39 15.46 <2e-16 Outro tipo_veículo 0.05 2.43 0.015 Limite_Velocidade 30-50 m/horas 0.118 2.78 0.0054 >50 m/horas 0.89 16.83 2e-16 Condições_Iluminação

Não luz do dia 0.37 26.76 <2e-16

Género_Condutor Masculino 0.091 6.3 2.97e-10 Dia_Semana Sábado 0.079 4.41 1.05e-05 Domingo 0.13 5.93 3.00e-09 Faixa_etária_Condutor 36-55anos -0.092 -6.547 5.86e-11 >55anos -0.078 -4.47 8e-06 Idade_veículo Idade 0.004 2.43 0.015

Para um nível de significância de 5%, os valores estimados da estatística de teste de Wald (tabela 7.14) indicam que todos os parâmetros estimados são estatisticamente significativos, evidenciando que existe associação entre a variável resposta (severidade de acidentes) e as variáveis explicativas. Para uma avaliação mais global do modelo sobre a sua eficiência em descrever a variável resposta utiliza-se o teste de Hosmer e Lemeshow. O valor estimado da estatística de teste foi 8.9 e o valor p é 0.35, logo não se rejeita a hipótese de que o modelo3 se ajusta bem aos dados.

49

Análise de resíduos

A análise de resíduos permite verificar a qualidade de ajustamento do modelo e identificar as observações consideradas outliers ou influentes. A figura 7.7 apresenta o gráfico de resíduos da deviance versus os valores ajustados, o gráfico de leverage (hii versus os

índices das observações) e o gráfico da distância de Cook para a análise do modelo3.

Figura 7.7: Gráficos da análise de resíduos referentes ao modelo de regressão Logística ajustados aos

dados de acidentes com peões de 2005 a 2013

Relativamente ao gráfico de resíduos da deviance mostra que todas as observações estão dentro do intervalo considerado [-2,2], portanto nenhuma observação é considerada outlier. Quanto ao gráfico de leverage permitiu identificar algumas observações como sendo influentes, pois seus hii são superiores ao valor crítico

2𝑝

𝑛 = 0.00019. Para avaliar

com mais detalhe esta influência, utilizou-se a medida distância de Cook. Pelo gráfico referente a esta medida nota-se que as observações 21520 e 139216 apresentam maiores valores de DCi. No Anexo5 apresentam-se os resultados do modelo ajustado sem essas

duas observações. As variações encontradas foram pequenas e não houve mudança inferencial, isto é, todas as variáveis que foram significativas no modelo3 continuaram presentes nesse modelo.

Avaliação preditiva do modelo3

A avaliação da capacidade preditiva do modelo é importante quando existe a possibilidade de o utilizar para fazer a previsão. Para essa avaliação recorreu-se ao estudo das medidas de desempenho através da tabela de contingência e área da curva ROC. O melhor ponto de corte (cutoff ) é 0.243, como mostra a figura no Anexo5. Na tabela 7.15

50

estão os resultados possíveis na classificação dos indivíduos em cada classe da variável resposta (Y = 0 e Y = 1).

Tabela 7.15: Tabela de classificação do modelo3

Através da tabela 7.15 é possível estimar os valores das medidas de desempenho, verifica- se que a percentagem total de acertos, ou seja, a proporção de indivíduos corretamente classificados foi de 60.9%, a sensibilidade e a especificidade foram 44.01% e 66.5% respetivamente, isso mostra que o modelo tem problemas em avaliar os verdadeiros positivos.

Área da curva ROC

A área abaixo da curva ROC varia entre 0 e 1 e dá-nos uma medida da capacidade do modelo em discriminar os valores da variável resposta Y=1, dos valores da variável Y=0.

Figura 7.8: gráfico da Curva ROC (modelo de regressão Logística)

A linha diagonal representada no gráfico indica uma classificação aleatória, quanto mais distante estiver a curva da diagonal principal melhor é o desempenho do modelo. O valor da área abaixo da curva foi de 0.567, uma discriminação não aceitável de acordo com os critérios de avaliação propostos por Hosmer e Lemeshow. O modelo em análise faz classificação aleatória dos indivíduos. O problema do baixo desempenho do modelo em

Classificação Valores Observados Classe (0) Classe (1)

Total Classe (0) 70030 19415 89445 Classe (1) 35269 15267 50536 Total 105299 34682 139981

51

discriminar os valores da variável resposta está associado à distribuição da mesma. A proporção da classe negativa que corresponde a acidentes ligeiros é de 75.2% enquanto a proporção da classe positiva “acidentes não ligeiros” é de apenas 24.8%.

Interpretação do modelo 3

A interpretação será feita em termos da razão da chance a cada variável explicativa incluída no modelo. A tabela 7.16 apresenta os valores da razão da chance (odds ratio) e a correspondente estimativa do intervalo de confiança ao nível de 95% de confiança.

Tabela 7.16: valores obtidos para a razão da chance (Odds ratio) e intervalo de confiança

Variáveis explicativas Estimativas dos coeficientes Odds ratio (OR) Intervalo de confiança (95%, OR) Tipo_veículo Motocicleta 0.025 1.03 (0.96;1.096) Camião 0.39 1.48 (1.41;1.55) Outro_tipo_veículo 0.05 1.05 (1.009;1.095) Limite_velocidade 30-50 m/hora 0.12 1.13 (1.04;1.23) >50 m/hora 0.89 2.44 (2.19;2.70) Condições_Iluminação

Não luz do dia 0.37 1.40 (1.37;1.44)

Género_condutor Masculino 0.09 1.09 (1.06;1.13) Dia_semana Sábado 0.08 1.08 (1.05;1.12) Domingo 0.13 1.14 (1.09;1.19) Faixa_etária_Condutor 36-55 anos -0.09 0.91 (0.89;1.12) >55 anos -0.08 0.92 (0.89;1.12) Idade_Veículo Idade 0.004 1.004 (0.99;1.007) Variáveis explicativas: Tipo de veículo:

A ocorrência de acidentes não ligeiros é 48% superior entre os condutores de camiões, 3% superior entre os condutores de motocicletas e 5% superior entre os condutores de outros tipos de veículos, em relação aos veículos ligeiros. Os motivos podem ser atribuídos a maior peso e a alta velocidade do veículo (Eluru et al. 2008).

Limite de velocidade

O valor desta variável explicativa está relacionado com o valor do limite de velocidade na estrada onde ocorreu o acidente. Verifica-se em relação à classe referência (limite de

52

velocidade <30 milhas/hora), um aumento na ocorrência de acidentes não ligeiros de 13% para o limite de velocidade entre 30 e 50 milhas/hora. Para limite de velocidade maior que 50 milhas/hora a chance de acidentes não ligeiros é 2.44 vezes superiores em relação a limite de velocidade <30 milhas/hora. Parece, então, que a alta velocidade contribui significativamente para a severidade dos acidentes.

Condições de iluminação

Em relação a esta variável verifica-se que de risco a acidentes não ligeiros é maior a noite do que à luz do dia (odds ratio = 1.40). A razão para isso é o maior fluxo de tráfego durante o dia permitindo aos condutores diminuir a velocidade.

Género de condutor

O risco de envolvimento em acidentes não ligeiros é maior entre os condutores masculinos do que entre os condutores femininos, cerca de 9% superior.

Dia de semana

Quanto a esta variável, a classe de referência definida são os dias úteis (segunda a sexta feira) e verifica-se que a chance da ocorrência de acidentes não ligeiros é maior aos fins- de-semana, sendo 8% superior ao sábado e 14% superior ao domingo.

Idade do veículo

Por último a idade do veículo, verifica-se que a chance de acidentes não ligeiros aumenta com a idade do veículo.

53

Análise de acidentes com peões na zona rural e urbana

Os dados da amostra utilizada na análise de acidentes com peões foram divididos em duas bases de dados, uma representa os dados de acidentes com peões na zona rural e a outra representa os dados de acidentes com peões na zona urbana. A percentagem de acidentes não ligeiros é maior em zona rural do que em zona urbana (ver Anexo6). O objetivo desta análise é comparar a probabilidade de ocorrência de acidentes não ligeiros na zona rural em relação à zona urbana. Para isso, foi ajustada o modelo de regressão Logística aos dados, considerando as mesmas variáveis explicativas utilizadas no modelo3.

A tabela 7.17 apresenta os resultados do modelo ajustado aos dados da ocorrência de acidentes com peões na zona rural.

Tabela 7.17: Regressão Logística ajustado aos dados de acidentes com peões na zona rural

Variáveis explicativas Estimativas dos coeficientes

Teste de Wald Valor-p (Wald) Termo Constante -1.72 -12.5 <2e-16

Tipo_Veículo Motocicleta 0.17 1.6 0.09 Camião 0.37 6.11 9.73e-10 Outro tipo_veículo -0.06 -0.8 0.43 Limite_Velocidade 30-50 m/horas 0.36 2.7 0.007 >50 m/horas 1.07 7.8 4.77e-15 Condições_Iluminação

Não luz do dia 0.58 15.3 <2e-16

Género_Condutor Masculino 0.11 2.7 0.007 Dia_Semana Sábado 0.11 2.31 0.02 Domingo 0.19 3.4 0.0007 Faixa_etária_Condutor 36-55anos 0.034 0.84 0.4 >55anos -0.012 -0.27 0.8 Idade_veículo idade 0.008 2.13 0.03

Analisando a tabela 7.17, verifica-se que a diferença na proporção de acidentes não ligeiros em comparação com os acidentes ligeiros foi estatisticamente significativa para camiões (valor p = 9.73e-10), mas não significativa para as motocicletas e outros tipos de veículos com valores p (0.09 e 0.43), respetivamente.

Para qualquer nível habitual de significância (1%, 5% e 10%), os valores estimados da estatística de Wald e respetivos valores p associados a variável “faixa etária dos condutores”, permitem concluir que esta variável não é significativa. Em relação às outras variáveis (limite de velocidade nas estradas, condições de iluminação, género dos

54

condutores, dia da semana e idade do veículo), conclui-se que para um nível de significância de 5% que existe uma relação estatisticamente significativa com a variável resposta (severidade de acidentes com peões na zona rural).

Para além da análise individual de cada variável explicativa no modelo logístico ajustado aos dados da ocorrência de acidentes com peões na zona rural com a estatística Wald, utilizam-se outras técnicas estatísticas para a análise da qualidade de ajustamento do modelo. O resultado da estatística de teste de Hosmer e Lemeshow foi 0.73 e o valor p é