• Aucun résultat trouvé

Conception du dispositif

Nesta seção será feita uma breve descrição sobre ontologias e sua utilização para a organização e representação da informação, no âmbito da Ciência da Informação. O objeto, aqui pretendido, é apenas apresentar esse tema, que é recorrente ao longo deste trabalho.

Ontologia é um tema já estudado a muito tempo pela Filosofia, a qual considera-a como “um ramo da metafísica que se preocupa com as coisas que existem” (BLACKBURN, 1996). Os filósofos, habitualmente, referem-se ao termo com “O” maiúsculo e compreendem “Ontologia” como uma descrição básica das coisas que verdadeiramente existem no mundo. Por outro lado, os cientistas da informação e da computação compreendem “ontologia” como um artefato de engenharia e um componente importante de sistemas de informação, referindo-se ao termo como “o” minúsculo, afim de diferenciá- lo da Filosofia.

Na presente pesquisa, a compreensão do conceito de “ontologia” vai além dessa visão simplista, geralmente adotada no mundo de sistemas de informação. A visão, aqui adotada, compreende a ontologia como um instrumento para a organização e representação da informação, capaz de capturar, mapear e compartilhar o conhecimento de domínios diversos, de forma a “estabelecer a verdade sobre a realidade, encontrando respostas para a questão ‘o que existe’” (SMITH, 2004, p. 22). Nesse sentido, compreende-se ontologias muito além do que um simples artefato da engenharia de software.

O estudo de ontologias na organização e representação do conhecimento surgiu como um ramo de pesquisa no final dos anos 80, propondo ser uma alternativa aos demais instrumentos usados para representar o conhecimento. Usadas como instrumentos para a modelização do conhecimento de domínio diversos, as ontologias apresentam uma natural proximidade com as técnicas metodológicas usadas pela Ciência da Informação para organização do conhecimento humano, estando também inseridas no arcabouço metodológico desta ciência.

No entanto, apesar da proximidade com o assunto, o interesse sobre ontologias na Ciência da Informação de fato acontece na década de 90, a partir dos trabalhos de Soergel (1997) e de Vickery (1997), que é considerado o precursor de ontologias nesta área, ao pesquisar sua aplicação no campo da biblioteconomia.

Desde então, o interesse na utilização de ontologias em Ciência da Informação aumentou consideravelmente e o seu uso já está difundindo em diversos ramos do conhecimento da área. Vickery (1997) e Smith (2004) relatam algumas aplicações na área:

52

Para dar suporte à extração de informação, por exemplo, das grandes bibliotecas médicas ou da literatura científica sobre a área de medicina, que, em grande parte, encontra-se disponível em diversas fontes na web.

Na tradução de linguagem natural, na qual as ontologias podem ser úteis para o processo de parsing e para resolver problemas de ambiguidade.

Para a integração automática de um conjunto de vocabulários padronizados ou dicionários de dados relacionados a um domínio específico. A ontologia, neste caso, pode auxiliar na construção de um único vocabulário padrão, resolvendo um problema comum em terminologias, conhecido como fusão.

Ontologias podem alimentar um banco de dados com informações sobre categorias (conceitos) existentes no mundo/no domínio, além das propriedades referentes a esses conceitos, bem como as relações existentes entre eles.

Para a integração de bancos de dados, de softwares ou de modelos de negócio.

Atualmente, as potencialidades de uso das ontologias em Ciência da Informação e em outras áreas correlacionadas estão reforçadas pelo grande volume e diversidade de dados manipulados na web e, em especial, pelo desenvolvimento e avanço das tecnologias semânticas para uso no ambiente web, as quais se inserem no contexto da web semântica.

Na literatura da área são encontradas muitas definições para o termo “ontologia” (SOWA, 2000; GRUBER, 1993; GUARINO e GIARETTA, 1995; SOERGEL, 1997; VICKERY, 1997; SMITH, 2004), as quais são concordantes em alguns pontos e discordantes em outros. Muitas das diferenças entre tais definições deve-se ao fato de que algumas delas aproximam-se mais de seu conceito na Filosofia, enquanto outras estão mais próximas de sua definição no contexto dos sistemas de informação. Na presente pesquisa, defende-se o argumento de que as ontologias devem ser fundamentadas tanto numa abordagem filosófica quanto no seu papel como um artefato da engenharia de software, não sendo ambos excludentes.

A definição de ontologia como “uma especificação explícita de uma conceitualização” (GRUBER, 1993) é uma das mais citadas na literatura. Borst (1997) acrescenta a essa definição os termos “formal” e “compartilhada”, afirmando que ontologia é “uma especificação explícita e formal de uma conceitualização compartilhada”, onde “especificação explícita” refere-se a conceitos, atributos, relações e axiomas explicitamente

53

definidos, “formal” significa legível por máquinas (computadores), “conceitualização” pode ser entendido como um modelo abstrato de algum fenômeno do mundo real e “compartilhada” significa conhecimento consensual.

O problema de tais definições está relacionado com o uso do termo “conceitualização”. Segundo Guarino e Giaretta (1995) seria incorreto considerar a noção extensional ao definir “conceitualização”. Para esses autores, a noção extensional está relacionada a um estado particular das coisas e não representa a estrutura semântica de certa realidade ou modelo pretendido. Uma melhor definição para “conceitualização”, a partir de uma noção intensional, é a de um conjunto de modelos semânticos, os quais representam certa realidade.

Pela interpretação intensional, a conceitualização precisa se comprometer em usar um vocabulário comum ou compartilhado que seja coerente com a linguagem do modelo pretendido, que é compreendido como compromisso ontológico. Assim, um conjunto de modelos compõem um conceitualização e eles são construídos por meio de uma linguagem de modelagem especificada pela ontologia.

Essa interpretação faz parte do trabalho de Guarino (1998) e é, normalmente, bem aceita na literatura da área. O autor ilustra essas relações entre linguagem, conceitualização, compromisso ontológico e ontologia, como pode ser visto na Figura 2.

Figura 2 – Representação de uma ontologia e sua relação com a conceitualização

Fonte: adaptado de Guarino (1998). Conceitualização C compromisso K = <C, £> Linguagem L Modelos M (L)

Modelos pretendidos IK (L)

Ontologia

54

Na Figura 2, é possível perceber que para uma ontologia se aproximar de um modelo pretendido deve-se obter uma conceitualização a partir de uma boa axiomatização – regras formais – um conjunto formal de conceitos e suas relações relevantes. Nesse sentido, Guarino (1998) aprimora a definição de Gruber (1993), descrevendo a ontologia constituída de um vocabulário intensional utilizado para descrever certa realidade, em conjunto com pressupostos explícitos na forma de lógica de primeira ordem, representando conceitos e relações entre eles.

Ainda considerando a relação de ontologia e conceitualização, pode-se afirmar que a conceitualização é uma das mais importantes etapas do processo de construção de ontologias, porque é nela em que se realizam atividades como identificação, análise e negociação dos conceitos de um determinado domínio, que poderão se tornar classes ou relações da ontologia (PEREIRA e SOARES 2008). Nesse sentido, em qualquer projeto que envolva o desenvolvimento de ontologias é necessário dar uma atenção especial à fase de conceitualização, cujos resultados – modelos conceituais do domínio – irão influenciar fortemente a construção dos elementos da ontologia.

A conceitualização é em geral intermediada por um responsável pela modelagem do domínio (analistas de sistemas, analistas de negócio, desenvolvedores de ontologias, etc.), mas realizado por especialistas (médicos, engenheiros, advogados, etc.) em domínios do conhecimento específicos que são de interesse para o problema analisado. Os especialistas fornecem a expertise para o entendimento e modelagem das entidades e dos processos que serão representados na ontologia do domínio. Entretanto, os diversos especialistas tem diferentes visões de mundo, o que resulta em diferentes conceitualizações concorrentes e ditas corretas (BERZEL, 2010). Dessa forma, conceitualizações colaborativas têm sido adotadas e incentivadas no ambiente web, por exemplo através de ontologias desenvolvidas colaborativamente (TUDORACHE et al., 2008), como forma de fomentar a discussão e proporcionar a produção de sistemas realmente representativos das necessidades de uma comunidade. Nesse sentido, a colaboração no processo de conceitualização é uma estratégia bastante indicada para o desenvolvimento de ontologias e que deve ser levada em consideração em projetos atuais que envolvam o ambiente web e o uso de ontologias.

Outra característica essencial de ontologias que deve ser mencionada são seus componentes básicos, os quais formam o conteúdo ontológico e serão tratados recorrentemente ao longo da presente pesquisa. De acordo com Gruber (1993) os componentes básicos de uma ontologia são: (i) classes: organização dos conceitos de um domínio, dispostas através de uma taxonomia; (ii) relações: representam o tipo de interação entre as classes do domínio; (iii) axiomas: regras formais usadas para restringir a

55

interpretação e o uso dos termos envolvidos, geralmente, especificadas em uma linguagem formal da lógica; e (iv) instâncias: exemplos ou casos particulares das classes, usadas para representar objetos específicos.

Além desses elementos citados, outra importante informação que deve estar contida em uma ontologia são as chamadas questões de competência. Segundo Uschold e Gruninger (1996), as questões de competência são utilizadas para especificar tarefas e os problemas que uma ontologia pode solucionar, antes mesmo de sua construção. Trata-se, então, de uma forma de auxiliar na definição do escopo e das características da ontologia.

As questões de competência também são importantes para uma ontologia no sentido de prover condições para avaliação da eficácia e completude da mesma. Nesse sentido, Kim, Fox e Gruninger (1999) afirmam que a competência de uma ontologia é determinada pelos seguintes passos:

• Declaração de cenário: consiste em uma narrativa sobre questões do negócio e sobre problemas que os sistemas baseados na ontologia devem ser capazes de referenciar;

• Declaração de escopo: consiste na criação de hipóteses sobre um domínio, de forma a esclarecer sua abrangência; a partir dessas hipóteses, estimam- se os objetos, as relações e os atributos que devem compor a ontologia; • Declaração de problema: consiste em estabelecer o problema geral que

justifica a construção da ontologia; trata-se de uma questão que, originada nos cenários e limitada pelo escopo, serve como base para outras questões de competência;

• Declaração de questões de competência do usuário: consiste em questões específicas de competência, motivadas pela declaração de cenário e apresentadas na forma de uma declaração de problemas; são elaboradas de acordo com as necessidades de um usuário.

Outro importante conceito que deve ser mencionado sobre esse tema refere-se aos tipos de ontologias existentes. Na literatura da área é possível encontrar diferentes classificações para as ontologias, baseadas em critérios diversos, tais como: grau de formalidade, tipo de estrutura, assunto da conceitualização, função específica, grau de rigorosidade, entre outros.

Para a presente pesquisa interessa, particularmente, três critérios de classificação das ontologias: (i) tipo de estrutura; (ii) grau de rigorosidade; e (iii) propósito ou papel da ontologia.

56

Quanto ao tipo de estrutura de uma ontologia, isto é, os tipos de classes presentes nela, os autores (HAAV e LUBI, 2001; GUARINO, 1998) classificam-nas em:

• Ontologias de alto nível, que descrevem conceitos gerais como espaço, tempo, matéria, objeto, evento, ação, etc., os quais são independentes do problema ou domínio;

• Ontologias de domínio, que descrevem o vocabulário de um domínio, por exemplo, medicina ou automóveis;

• Ontologias de tarefa, que descrevem uma tarefa ou atividade, por exemplo, diagnósticos ou compras, através da inserção de termos especializados.

A Basic Formal Ontology (BFO) e a Unified Formal Ontology (UFO) são exemplos de ontologias de alto nível (na literatura da área, também chamadas de

ontologias de fundamentação5, ontologias fundacionais ou ainda meta-ontologias),

enquanto as ontologias sobre o sangue humano, aqui desenvolvidas, são exemplos de

ontologias de domínio.

Geralmente, as ontologias de fundamentação são usadas como base ou ponto de partida para a construção de ontologias sobre domínios específicos e, como citado anteriormente, essa é uma prática científica bem aceita na literatura da área.

Já quanto ao grau de formalidade ou grau de rigorosidade, alguns autores (DING e ENGELS, 2001; GÓMEZ-PÉREZ, 2004) classificam as ontologias em:

• Ontologias leves (light-weight), que são ontologias com pouco rigor formal, geralmente, composta de classes facilmente compreensíveis e de relações mais comuns entre estas classes, não incluindo relações especiais – por exemplo, relações lógicas - entre as classes e outros tipos de primitivas de representação – por exemplo, axiomas lógicos.

• Ontologias pesadas (heavy-weight), que se referem a ontologias com alto rigor formal, incluindo além das classes e relações comuns, relações especiais e alto grau de axiomatização. Em geral, essas ontologias são especificadas com um rigoroso grau matemático e formal, baseado nas linguagens lógicas, tal como a lógica de primeira ordem.

5

Na presente pesquisa, optou-se por utilizar o termo “ontologias de fundamentação”, preferencialmente, em relação aos termos “ontologias de alto nível”, “ontologias fundacionais” ou “meta-ontologias”.

57

Por fim, as ontologias são classificadas por alguns autores (GUARINO, 1998; FONSECA, 2007) quanto ao seu papel para o desenvolvimento de sistemas de informação, ou seja, com qual propósito são criadas. Nesse caso, temos dois tipos:

• Ontologias de sistemas de informação: ontologias criadas para auxiliar a validação de ferramentas usadas na criação de modelos conceituais.

• Ontology-driven information systems ou ontologias para sistemas de informação: são criadas para explicar um dado domínio de conhecimento e, por se basearem em princípios filosóficos, tem como propósito serem usadas para geração ou validação de componentes dos sistemas de informação, tais como os esquemas conceituais.