• Aucun résultat trouvé

Chapitre 4 : Quelques stratégies pour la construction d’un programme opératoire

2. Pré-requis de la programmation opératoire

A exactidão dos dados é considerada pela generalidade das investigações como a dimensão mais importante, mas não possui uma definição clara e consensual [Wand & Wang, 1996]. Em [Brac- kett, 1996] considera-se que não existe nenhum nível de exactidão predeterminado, cada organi- zação deverá definir o nível de exactidão desejado. Nesta dissertação recorreremos à definição abstracta exposta em [Ballou & Tayi, 1998], em que, a exactidão corresponde ao armazenamento correcto dos factos ou valores do mundo real, ou seja, consiste em possuir valores certos e de confiança [Pipino et al., 2002]. Em [Olson, 2003] defende-se que a obtenção dos dados correctos só é possível pela garantia da posse dos valores dos dados certos e pela sua representação con- sistente e insusceptível de gerar ambiguidades. Assim, é observado que num conjunto de dados constam, além dos dados correctos, os dados incorrectos e que são originados por: representa- ções erradas (e.g. Lx. e Lisboa), valores errados (e.g. o tempo de serviço de um professor é de 170 anos), valores inválidos (e.g. idade = ‘FH’) e a ausência de valores (figura 2-1).

Figura 2-1 – Constituição de um conjunto de dados [Olson, 2003].

Num outro estudo [Müller & Freytag, 2002], a exactidão é observada segundo três ópticas: sintác- tica, de cobertura e semântica. A primeira descreve as características dos formatos e valores usa- dos na representação das entidades do mundo real. Esta classe compreende a definição dos mo- delos léxicos (e.g. estruturas de dados) e do formato do domínio dos dados (e.g. unidades de me- dida diferentes). A exactidão de cobertura refere-se ao controlo dos valores ausentes das colunas ou linhas. Estas situações podem resultar em omissões sobre as entidades existentes no mundo real. Por último, no que respeita à exactidão semântica, o estudo observa a necessidade dos da- dos serem perceptíveis e não redundantes. Nesse sentido, devem ser satisfeitas, por um lado, as regras de integridade dos dados, que podem ser compostas em: integridade do valor dos dados, integridade das estruturas de dados, integridade da retenção dos dados e a integridade de deriva- ção dos dados [Brackett, 1996] (tabela 2-2). Por outro lado, devem ser efectuados esforços em vista a redução de dados redundantes (e.g. linhas duplicadas) e valores inválidos, que não repre- sentam fielmente as entidades do mundo real.

Integridade Componente Exemplo

Domínio de valores dos dados

A data inscrição de um aluno não pode ser superior à data do momento.

Integridade do valor dos

dados condicional O preenchimento do nome do aluno obrigatório. Valor dos dados

Os valores por defeito O campo nacionalidade poderá conter por defeito ‘portuguesa’. Integridade referencial Um aluno só se pode inscrever num exame que exista. Estruturas de dados

Integridade da estrutura de dados condicional

Um aluno pode estar inscrito em zero, um ou mais exames. Retenção dos dados Prevenção nas eliminações dos dados.

Derivação dos dados Idade do aluno = ano actual – ano de nascimento. Tabela 2-2 – Regras de integridade dos dados [Brackett, 1996].

Em suma, verifica-se que os assuntos envolventes a esta dimensão mostram-se dispersos e quando associados à multidimensionalidade do conceito de qualidade dos dados, resultam no aparecimento de outras dimensões. Assim, a perspectiva da exactidão como dimensão centraliza- dora dos diversos referentes aos dados tem dado lugar a outros assuntos, igualmente importantes, no respeita à qualidade dos dados e que se consubstanciam em outras dimensões.

A dimensão completude diz respeito ao armazenamento de todos os dados considerados impor- tantes, de modo a que a ausência ou a insuficiência de detalhe dos dados não seja detectada durante a tomada de decisão [Pipino et al., 2002] [Lee & Strong, 2003]. Indica o grau de presença dos valores numa colecção de dados [Fischer & Kingma, 2001]. A dimensão oportunidade corres- ponde à exigência dos dados estarem suficientemente actualizados para a execução das tarefas a tratar [Lee & Strong, 2003]. Os dados devem estar disponíveis atempadamente para influenciarem o processo de tomada de decisão [Fischer & Kingma, 2001]. A definição do tempo de apresenta- ção dos dados não pode ser encarado como universal para todas as decisões a tomar, deve de- pender das circunstâncias e necessidades sentidas pelo executor da decisão (e.g. a necessidade de dados vitais frescos, actualizados a cada 5 segundos, sobre um paciente numa operação não se verifica na execução de um plano de marketing de um produto). Doutro modo, podemos consi- derar que a oportunidade dos dados consiste no tempo dispendido desde que os dados são gera- dos pelos sistemas iniciais até ao momento que se encontram disponíveis para os utilizadores [Inmon et al., 1998]. Em [Bouzeghoub & Peralta, 2004] esta questão é tratada envolvendo um nível hierárquico superior: a frescura dos dados disponibilizados. Assim, a frescura dos dados com- preende duas dimensões: a oportunidade e a actualidade dos dados. A oportunidade descreve a idade dos dados no sistema. Enquanto, a actualidade consiste no deslocamento temporal dos dados em relação às fontes. A dimensão relevância refere-se à aplicação e utilidade que os dados possuem em vista a execução das tarefas em mãos [Pipino et al., 2002]. Confere o grau de perti-

nência dos dados no processo de tomada de decisão [Brackstone, 1999]. Assim, os dados rele- vantes podem ser usados para solucionar alguns problemas das organizações [Fischer & Kingma, 2001]. A dimensão acessibilidade responde pela disponibilização dos dados aos utilizadores, ou seja, resume-se à facilidade e rapidez que esses dados podem ser obtidos pelos utilizadores [Pi- pino et al., 2002]. A dimensão relativa à credibilidade define o grau de confiança que é depositado nos dados divulgados. A dimensão credibilidade compõe-se pela confiança nas fontes de origem dos dados e nos processos de transformação e tratamento dos dados. A dimensão consistência refere-se às anomalias sintácticas e com as contradições entre os dados [Müller & Freytag, 2002]. A interpretação dos dados consiste na disponibilidade de informação suplementar e metadados sobre os dados em vista a sua utilização e representação adequada [Brackstone, 1999].