• Aucun résultat trouvé

PREVENTIVE MAINTENANCE

Dans le document ~ronoo COMMITTED (Page 69-74)

existentes e que se verificou dar bons resultados quando se procede à representação gráfica, sob a forma de histograma, a partir dos dados agrupados. Existem outras regras como por exemplo a sugerida por Velleman em 1976, que considera para k o maior inteiro contido em 2 n e a

considerada num trabalho de Dixon e Kronmal em 1965, que utilizam para k o maior inteiro contido em 10xlog10n.

Nota 2: A metodologia utilizada para a construção das classes não é única. Pode-se, por exemplo, decidir construir as classes fechadas à direita e abertas à esquerda, metodologia

seguida pela folha de cálculo Excel, quando se utiliza a função Frequency, ou seguir a

metodologia indicada, utilizada, por exemplo, no software de Estatística Statview, ou ainda utilizar outras abordagens diferentes.

Utilização do Excel na obtenção de tabelas de frequências

1 - Dados de tipo qualitativo ou quantitativo discreto

Vamos exemplificar a utilização do Excel na construção de tabelas de frequência de dados qualitativos ou quantitativos discretos.

O procedimento para a construção de tabelas de frequência é idêntico, quer tenhamos um conjunto de dados qualitativos ou quantitativos discretos, já que as classes que se consideram para a tabela de frequência são, de um modo geral, como vimos anteriormente, as diferentes categorias ou valores que surgem, respectivamente, no conjunto de dados.

1.1 - Função COUNTIF

Exemplo – Considerando ainda o ficheiro EscolasSec.xls, vamos agrupar os dados segundo a variável qualitativa Distrito. Para ver quais as diferentes categorias que a variável assume, um processo simples é proceder à ordenação dos dados segundo aquela variável. Fizémos essa ordenação e escrevemos as diferentes categorias nas células F3:F18. A seguir utilizámos a função COUNTIF(a;b), que devolve o número de células consideradas no argumento a, que são iguais à categoria considerada no argumento b:

Recomenda-se que ao construir a tabela de frequências, se proceda à soma das frequências absolutas, para confirmar que a soma é igual ao número de elmentos do conjunto de dados que se está a agrupar.

1.2 - PivotTable

Outro processo que pode ser utilizado para construir uma tabela de frequências de dados qualitativos ou quantitativos discretos, é usando a PivotTable, como se mostra a seguir.

Exemplo – Utilizando a PivotTable, proceda ao agrupamento dos dados da variável Distrito, do ficheiro EscolasSec.xls. • No menu Data, clicar em PivotTable and PivotChart Report;

No passo 1 da PivotTable and PivotTable Wizard, seguir as instruções, e clicar PivotTable à pergunta What kind

of report do you want to create?;

• No passo 2 seguir as instruções, seleccionando os dados que se pretende usar (não esquecer de seleccionar os títulos). Neste caso seleccionar as células C1 a C71;

• No passo 3 seleccionar o lugar onde pretende criar a tabela. Nós optámos por seleccionar a célula E2;

Arrastar o botão Distrito da barra PivotTable, e colocá-lo (drop it) no campo Row; Arrastar ainda o botão Distrito e colocá-lo (drop it) no campo Data:

O procedimento anterior conduziu-nos à tabela do lado esquerdo da figura anterior, cujo conteúdo foi copiado para construir a tabela do lado direito, com uma apresentação mais sugestiva. Pode obter as frequências relativas, em vez das absolutas, clicando duas vezes em Count of Distrito e seleccionando sucessivamnete Options>> → Show data as: → % of

total.

Exemplo – A um conjunto de 25 alunos de uma escola, perguntou-se quantos irmãos tinham, tendo-se obtido os seguintes valores: 1, 2, 1, 0, 3, 3, 2, 1, 0, 1, 2, 2, 3, 1, 1, 0, 2, 3, 1, 2, 0, 3, 4, 1, 6. Proceda a um agrupamento conveniente dos dados. Começámos por inserir os dados numa folha de Excel e utilizando o procedimento anterior, obtivémos a seguinte tabela:

Observação: Se ao construir uma tabela de frequências de dados quantitativos discretos, faltar algum valor entre o mínimo e o máximo, deve-se considerá-lo na tabela, com frequência nula, se a seguir se pretende construir um diagrama de barras.

2 - Dados de tipo contínuo 2.1 – Utilização da função COUNTIF

Exemplo – Considere o seguinte ficheiro – IdadeTrabalhadores.xls, constituído pelas idades de 180 indivíduos escolhidos aleatoriamente de entre os trabalhadores de uma grande empresa têxtil. Proceda ao agrupamento dos dados, da forma que achar conveniente.

Vamos utilizar a metodologia indicada na secção 2.2.2.2, para a definição das classes. Definição das classes

1. Determinar a amplitude da amostra, subtraindo o mínimo do máximo;

2. Calcular a amplitude de classe h, dividindo a amplitude da amostra pelo número K de classes pretendido e tomando para h um valor aproximado por excesso do quociente anteriormente obtido. Existe uma regra empírica que nos dá um valor aproximado para o número K de classes e que consiste no seguinte: para uma amostra de dimensão n, considerar para K o menor inteiro tal que 2K≥n. Uma expressão equivalente para obter K, consiste

em considerar K=INT(LOG(n;2))+1 ou K=ROUNDUP(LOG(n;2);0), em que a função ROUNDUP(x;m), devolve um valor de x, arredondado por excesso, com m casas decimais;

3. Construir as classes C1, C2, ..., Ck. Vamos considerar como classes os intervalos [mínimo, mínimo + h[, [mínimo

+ h, mínimo + 2h[, ..., [mínimo + (k-1)h, mínimo + kh[. Uma alternativa a este procedimento seria considerar as classes abertas à esquerda e fechadas à direita, da seguinte forma: ]max – Kh, max – (K-1)h], ]max – (K-1)h, max – (K-2)h], ]max – h, max].

O resultado destes passos são representados na figura seguinte, para a amostra das idades:

Para calcular as frequências absolutas das classes obtidas anteriormente utilizámos a função COUNTIF, como se exemplifica a seguir para a classe C5:

Nota: Para obter o valor de h, utilizámos a função ROUNDUP(x;m), referida anteriormente. Neste caso utilizámos a função ROUNDUP(U8;1). Chamamos, no entanto, a atenção, para que nem sempre este arredondamento produz o resultado desejado, já que o valor arredondado por excesso pode vir igual ao valor que se pretende arredondar. Por exemplo, se no caso presente o resultado da célula U8 fosse 5,8, então a função ROUNDUP(U8;1) devolveria o valor 5,8. Assim, é necessário estar atento para eventualmente se proceder a um arredondamento manual.

2.2 –Utilização da função Frequency

O Excel tem uma função, que é a função Frequency(Data_array;Bins_array), que calcula o número de elementos da variável - cujos valores se encontram na Data_array, existentes nas classes - cujos limites se encontram em Bins_array. Este vector Bins_array é constituído por um conjunto de k valores b1, b2, ..., bk, formando (k+1) classes, tais que:

• A 1ª classe é dada por (-∞, b1], isto é, conterá todos os elementos ≤b1;

• A 2ª classe é dada por]b1, b2];

• A 3ª classe é dada por ]b2, b3];

• A késima classe é dada por ]bk-1, bk];

• A (k+1)ésima classe é dada por ]bk, +∞);

Vamos exemplificar construindo uma tabela de frequências para a variável idade, assumindo como separadores (bins) os valores 23,8; 29,6; 35;4; 41,2; 47; 52,8 e 58,6 considerados em 2.1:

Para utilizar a função Frequency(Data_array;Bins_array), procede-se do seguinte modo:

Definir a coluna de separadores ou limites das classes, que constituirá o Bins_array; no nosso caso será {23,8, 29,6, 35,4, 41,2, 47, 52,8, 58,6}

• Seleccionar tantas células em coluna, quantas as classes consideradas para a tabela de frequências (não esquecer que o número de classes é superior em uma unidade ao número de separadores, pelo que o número de células seleccionadas deverá ser, neste caso, de 8);

• Introduzir a função Frequency, considerando como primeiro argumento o conjunto de células onde se encontram

os dados a agrupar, chamado de Data_array, e como segundo argumento as células que constituem o

Bins_array;

Repare-se que a frequência absoluta da classe C5 vem diferente da obtida em 2.1, pois as classes agora são fechadas à

direita e abertas à esquerda, pelo que os elementos iguais a 47 pertencem a esta classe, ao contrário do que acontecia em 2.1, em que pertenciam à classe C6. Assim, se se pretende utilizar a função Frequency, a metodologia para formar as

classes deve ser a utilizada em 2.1, com a alternativa considerada no passo 4, isto é:

4. Considerar as classes abertas à esquerda e fechadas à direita, da seguinte forma: ]max – Kh, max – (K-1)h], ]max – (K-1)h, max – (K-2)h], ]max – h, max].

2.3 - Utilização da PivotTable

Outro processo que pode ser utilizado para fazer o agrupamento de uma variável de tipo contínuo é utilizando a PivotTable. Vamos distinguir algumas situações, pois o método de construção das tabelas de frequência sofre algumas alterações, para as quais devemos estar alertas, conforme o tipo de dados a tratar. O processo que vamos utilizar foi sugerido, em parte, por um artigo de Neville Hunt, na revista Teaching Statistics (Volume 25, Number 2, Summer 2003).

2.3.1 – Dados em formato de inteiro e amplitude de classe também de tipo inteiro

Exemplo – Considere ainda o ficheiro IdadeTrabalhadores.xls utilizado anteriormente e proceda ao agrupamento dos dados utilizando a PivotTable.

Antes de processarmos os passos associados à construção da tabela, é necessário dispormos os dados numa única coluna, em que na 1ª linha dessa coluna deve estar o nome da variável. Optámos por inserir os dados com o título Idade, nas células A1:A181 da Sheet2 do nosso ficheiro.

Procedimento a seguir:

1. No menu Data, clique em PivotTable and PivotChart Report;

2. No passo 1 da PivotTable and PivotTable Wizard, siga as instruções, e clique PivotTable à pergunta What kind of

report do you want to create?;

3. No passo 2 siga as instruções, seleccionando os dados que pretende usar. Neste caso seleccione as células A1:A181 (embora os dados estejam nas células A2:A181, o título está na célula A1);

4. No passo 3 seleccione o lugar onde pretende criar a tabela. Nós optámos por seleccionar a célula C2; 5. Arraste o botão Idade da barra PivotTable, e coloque-o (drop it) no campo Row; Arraste o mesmo botão e

coloque-o (drop it) no campo Data;

6. Clique duas vezes no botão Sum of Idade, da tabela, e seleccione Count;

A tabela que aparece depois destas operações, mostra a frequência de cada valor individual (como estamos com dados contínuos, embora inteiros, corremos o risco de termos uma tabela com tantas classes, quantos os dados, todos com frequência igual a 1!). Assim, é necessário proceder a mais algumas operações, para agrupar os dados:

7. Clique em algum dos dados da variável Idade e seleccione Data → Group and Outline → Group (ou então clique em algum dos dados com o botão direito do rato e seleccione Group and Outline → Group) , fazendo surgir o seguinte diálogo:

Por defeito, no diálogo anterior é considerado como “Starting at” e “Ending at” respectivamente, o mínimo e o máximo do conjunto de dados a agrupar. Para “By” é considerado, também por defeito, um valor que dependerá do número de dados e da grandeza desses dados.

Observação: Repare-se que na construção automática desta tabela, as classes estão construídas de tal modo que são equivalentes às classes [18, 28[, [28, 38[, [38, 48[, [48, 58[, [58, 68[ (não esqueçamos que estamos a trabalhar com números inteiros e, neste caso, a amplitude de classe também é um número inteiro).

2.2.2 – Dados em formato de inteiro e amplitude de classe de tipo não inteiro

Suponhamos agora que no passo 7, escolhíamos para amplitude de classe o valor 5.8, sugerido em 2.1:

Como se verifica, ao contrário do que acontecia quando a amplitude de classe era um inteiro, o limite superior de um intervalo é igual ao limite inferior do intervalo seguinte, ficando a dúvida de saber em que classe inserir um elemento igual a um desses limites (esta situação não de põe neste caso, uma vez que os dados são inteiros). Na verdade estes intervalos funcionam como se fossem fechados à esquerda e abertos à direita (excepto a última classe que também é fechada à direita).

2.2.3 – Dados em formato decimal

Quando os dados são apresentados com casas decimais, a situação á idêntica à anterior. A aparente ambiguidade, de à primeira vista, não se saber a que classe pertence um valor igual a um limite de classe, pode ser resolvida, considerando para amplitude de classe um valor decimal, com uma casa decimal a mais dos que os dados.

Exemplo – Na publicação do INE, Anuário Estatístico da Região de Lisboa e Vale do Tejo 2002, verifica-se que a taxa de natalidade para os diferentes concelhos desta região é a apresentada no seguinte ficheiro:

Procedemos a um agrupamento conveniente para os dados, utilizando a metodologia apresentada anteriormente, tendo obtido a tabela de frequências (absolutas) que se apresenta a seguir:

2.3 - Representação gráfica de dados

Dans le document ~ronoo COMMITTED (Page 69-74)

Documents relatifs