• Aucun résultat trouvé

FLEXIBLE DISC CONTROLLER

Dans le document ~ronoo COMMITTED (Page 24-30)

Este caso é em tudo idêntico ao caso anterior, com a excepção de que agora a escolha das classes Ai, que constituem uma partição do domínio da variável aleatória X, já não é tão óbvia, como no caso dos dados discretos. Assim, de forma a reduzir a arbitrariedade na escolha da partição Ai, 1≤i≤k, é usual escolher os Ai, tais que

P(XεAi׀H0) = 1/k ou seja pi = 1/k, 1≤i≤k. Como escolher o k?

A escolha de k é feita de modo a garantir que o número esperado ei=npi, de elementos em cada classe seja ≥5. Assim, deve ter-se n/k≥5, o que implica que k≤n/5. Considera- se geralmente para k o maior inteiro contido em n/5 (a não ser que este valor seja demasiado grande, como veremos no exemplo a seguir, em que se escolhe um valor inferior), e as classes Ai, são assim construídas:

A1 = (-∞, a1[, P(XεA1׀H0) = 1/k → P(X≤ a1) = F(a1) = 1/k → a1=F-1 (1/k)

A2 = [a1, a2[, P(XεA2׀H0) = 1/k → P(a1<X≤ a2) = F(a2)- F(a1)= 1/k → a2=F-1(2/k) ...

Ak = [ak-1, ∞[, P(XεAk׀H0) = 1/k → P(X> ak-1) = 1 – F(ak-1)= 1/k → ak-1=F-1

((k-1)/k) A estatística de teste obtém-se da mesma maneira, assim como a distribuição de amostragem.

Exemplo 5.4 O Sr. Silva, industrial têxtil, decidiu começar a fabricar camisas de homem, destinadas a serem vendidas em Portugal. Para ter alguma informação sobre os moldes que deve considerar, nomeadamente no que diz respeito ao comprimento das mangas, resolveu pedir a uma empresa de Consultoria de Estatística que o ajudasse, dando-lhe algumas indicações sobre a população a que se destinam as camisas.

Vamos delinear o processo utilizado pela tal empresa, para ajudar o Sr. Silva. 1º passo – Recolha de uma amostra

A empresa de Consultoria encarregou o Departamento de Sondagens de recolher uma amostra de dimensão 250, tendo esta fornecido os seguintes dados, relativos ao comprimento do braço direito de 250 homens:

51.5 56.0 55.0 58.3 58.4 55.3 56.3 52.2 55.2 57.3 55.4 52.9 54.0 59.7 55.4 53.0 52.6 55.5 53.1 52.4 57.9 57.7 55.3 53.5 55.8 57.9 54.7 55.7 54.0 52.1 57.6 52.9 54.2 52.9 56.2 54.9 58.2 53.2 54.1 53.1 53.9 54.9 56.7 52.1 57.7 55.4 54.9 54.9 55.5 56.6 56.6 54.7 55.6 53.2 54.7 53.0 57.5 55.6 56.9 57.4 49.9 54.7 53.8 58.4 55.7 55.4 54.3 49.1 56.7 55.4 53.0 55.3 55.7 52.1 51.0 53.1 55.3 52.1 54.3 54.9 55.3 56.7 57.1 54.4 53.7 58.9 53.8 54.8 55.7 55.4 56.6 56.8 53.4 53.4 56.0 56.5 56.7 54.0 51.6 52.6 56.4 56.8 57.4 54.7 55.5 53.2 54.7 54.7 58.4 56.3 58.1 53.4 56.7 58.1 54.9 54.2 56.5 53.2 51.3 56.6 56.6 58.8 57.7 52.5 56.2 54.4 56.8 51.8 53.9 58.4 58.7 55.2 53.0 58.0 58.6 52.3 59.2 56.5 57.1 54.2 55.3 55.5 56.1 52.1 53.9 53.2 52.9 58.8 55.0 54.2 54.8 53.4 56.8 51.9 55.0 51.6 58.2 55.5 56.2 53.7 54.6 51.7 55.5 52.8 54.4 55.7 54.0 56.8 53.3 56.8 54.2 50.5 54.3 54.6 53.2 52.2 55.2 55.4 55.8 55.6 60.2 57.0 54.6 55.0 56.6 55.1 58.0 57.3 56.0 51.7 55.1 54.5 53.8 55.1 55.7 57.1 53.2 52.4 55.5 57.2 56.1 55.1 55.2 56.3 57.1 55.5 53.2 54.8 55.6 56.0 60.7 58.3 59.4 52.8 55.8 56.8 56.3 55.7 53.0 53.0 51.9 55.7 53.4 53.8 52.1 57.5 59.8 55.3 55.0 55.0 54.2 57.6 55.1 56.5 58.3 53.1 55.2 53.7 48.4 54.7 55.0 56.5 56.9 57.0 58.2 56.7 54.4 50.2 54.4 56.5

2º passo – Estudo descritivo

Procedeu-se ao estudo descritivo dos dados anteriores, calculando algumas características amostrais e procedendo à redução dos dados através de uma tabela de frequências e à construção do histograma correspondente. Apresentam-se a seguir os resultados obtidos:

Maria Eugénia Graça Martins

Decidimos construir uma tabela de frequências com 8 classes, valor sugerido pela regra empírica enunciada quando da construção do histograma, e considerar como amplitude de classe o valor 1.54 (valor aproximado, por excesso, de (max-min)/8).Construímos uma tabela de frequências e o histograma associado, utilizando a metodologia das PivotTables.:

O histograma sugere-nos um modelo Normal, pelo que, o passo seguinte será testar se efectivamente tem sentido ajustar um modelo Normal aos dados. Uma questão que se levanta neste momento é a seguinte: terá sentido estar a ajustar aos nossos dados um modelo com suporte R, isto é, que pode assumir qualquer valor real, quando nós sabemos que isso não se passa com o comprimento do braço? Mas se estamos renitentes em ajustar um modelo com suporte em R, talvez pensassemos que seria mais razoável um cujo suporte fosse R+, pois se temos a garantia que o comprimento não pode ser negativo, não sabemos qual o valor máximo que devemos escolher. Ou poderíamos inventar um valor ao acaso como limite superior, por exemplo 150 cm, mas com que legitimidade é que escolhemos este e não outro valor? Também não devemos considerar o valor 60.7 como valor máximo, embora tenha sido o maior valor da amostra que se recolheu. Ninguém nos garante que na população não haja homens com o comprimento do braço superior a 60.7! Nesta altura, de reflexão sobre qual o modelo a adoptar, recordemos o que se disse sobre a escolha de um modelo para traduzir um fenómeno aleatório – todos os modelos são maus, alguns são úteis. No entanto, além do histograma nos sugerir o modelo Normal, devido à semelhança com a função densidade da Normal, também dispomos de alguma informação científica sobre este modelo; e são esses estudos que nos dizem que ele se aplica em situações de fenómenos que possam ser considerados provenientes de uma contribuição aditiva de várias variáveis, como é, por exemplo, o caso da variável em estudo. Então, em posse da informação sobre a proveniência dos dados e dos resultados do estudo descritivo dos mesmos, estamos em condições de propor o modelo Normal.

Representando por X, a v.a. que representa o comprimento do braço, consideremos as seguintes hipóteses:

H0: X∩N(µ,σ) contra H1: X N(µ,σ)

Para utilizarmos o teste de ajustamento do Qui-qudrado, as classes Ai têm que constituir uma partição do

suporte da v.a. X. Neste momento podemos seguir dois processos, nomeadamente: utilizar a tabela de frequência anterior, procedendo às modificações adequadas nas classes, de forma a termos uma partição, ou utilizar o processo enunciado anteriormente, para a formação das classes. Vamos exemplificar os dois processos:

Processo 1 – Modificação da tabela de frequências, de forma a termos uma partição de R

Para obter uma partição, basta proceder a uma alteração conveniente na primeira e na última classe, como se apresenta a seguir:

Para calcular estimativas das probabiliaddes pi, utilizámos o modelo Normal(55.14, 2.087), no Excel. Por

exemplo, para calcular a probabilidade do intervalo ]49.94, 51.48], colocámos o cursor na célula G19 e

escrevemos =NORMDIST(51,48;55,14;2,087;TRUE)-NORMDIST(49,94;55, 14;2,087;TRUE).

Como estimámos dois parâmetros a partir dos dados, a estatística de teste X2, tem uma distribuição assintótica dum χ2

(8-2-1), ou seja dum Qui-quadrado com 5 graus de liberdade.

Para tomar uma decisão calculámos o P-value, bastando colocar o cursor na célula J26 e escrever =CHIDIST(I26;5):

Maria Eugénia Graça Martins

Decisão: Não existe evidência para rejeitar a hipótese do modelo Normal.

Processo 2 – Admitindo que não tinha havido uma fase anterior, em que tinha sido necessário proceder a um agrupamento dos dados, como no caso do exemplo que estamos a tratar, vamos exemplificar o processo sugerido na secção anterior.

Temos n=250, donde k≤250/5. Vamos considerar k=10, isto é, 10 classes. Então os limites de classe a1,

a2, ..., a9, com a notação introduzida na secção referida, podem ser obtidos no Excel, da seguinte forma:

Uma vez as classes construídas, teremos de contar quais os valores observados. Utilizámos a seguinte tabela feita no Excel, para determinar esses valores, assim como o valor observado da estatística de teste:

A estatística de teste é a mesma, mas agora tem uma distribuição de amostragem dum Qui-quadrado com 7=(10-2-1) graus de liberdade, uma vez que considerámos 10 classes e estimámos 2 parâmetros:

Decisão: Uma vez que o P-value é igual a 32.56%, não existe evidência para rejeitar a hipótese de que os dados sejam provenientes de um modelo Normal.

4º passo – Transmissão dos resultados ao industrial têxtil

Agora, nesta fase, justificava-se uma conversa com o Sr. Silva, para a apresentação dos resultados. Pode-se, no entanto, ir adiantando alguma informação, em termos de percentagens dos futuros compradores das camisas. Assim, temos os seguintes números:

Aproximadamente 68% dos homens têm o comprimento dos braços no intervalo [53, 57]

P(55.14-2.087≤X≤55.14+2.087)=φ(1)-φ(-1)= 2φ(1)-1≈0.68

Aproximadamente 95% dos homens têm o comprimento dos braços no intervalo [51, 59]

P(55.14-2×2.087≤X≤55.14+2×2.087)=φ(2)-φ(-2)= 2φ(2)-1≈0.95

Aproximadamente 100% dos homens têm o comprimento dos braços no intervalo [49, 61]

P(55.14-3×2.087≤X≤55.14+3×2.087)=φ(2)-φ(-2)= 2φ(3)-1≈0.997

Utilizando ainda o modelo Normal(55.14, 2.087), podemos ser um pouco mais precisos, informando o Sr. Silva sobre os valores do 1º e 3º quartis, que são respectivamente 53.7 cm e 56.5 cm:

Assim, o industrial sabe que, por exemplo, só 25% dos homens é que têm o comprimento dos braços inferior a 53.7 cm e que 50% dos homens têm o comprimento dos braços no intervalo [53.7, 56.5]. Esta informação é importante, pois permite fazer uma programação adequada da percentagem de camisas que devem ser fabricadas, para cada tamanho

Maria Eugénia Graça Martins

Dans le document ~ronoo COMMITTED (Page 24-30)

Documents relatifs