• Aucun résultat trouvé

Le muscle élévateur de l’anus ou levator ani : [7]

V. CLASSIFICATION DES PROLAPSUS

3. L’examen clinique :

A partir do caminho mais aderente ao modelo da ontologia de domínio, o Tradutor OLAP determina os elementos construtores das operações OLAP que são: medidas, agrupamentos, filtros e ligações entre conceitos. Como o próprio nome indica, ele realiza uma tradução do melhor caminho encontrado pelo Motor de Busca por Similaridade em uma requisição OLAP, que será posteriormente executada sobre o DW pelo módulo Gerenciador de Consultas. O objetivo de determinar esses elementos da consulta OLAP (medidas, agrupamentos, filtros e ligações) é motivado no Gerenciador de Consultas oriundo do trabalho de Sell (et. al., 2008).

Com base no melhor caminho, o Tradutor OLAP especifica uma expressão (ou requisição) que é formada somente pelos conceitos da ontologia de domínio. Nessa expressão, os conceitos do domínio (classes, propriedades, relacionamentos e instâncias de classes) são organizados em medidas, agrupamentos ou projeções, filtros e suas ligações. Logo, a requisição remete diretamente às classes, propriedades e aos relacionamentos da ontologia e não aos objetos (tabelas de fato, dimensões e atributo de dimensões) do esquema estrela do DW. A associação dos conceitos da ontologia com as tabelas e dimensões do DW está definida na Ontologia BI e é aplicada pelo Gerenciador de Consultas em seguida. Note que a consulta para obtenção da resposta final não é executada sobre a base de conhecimento, tal como alguns

trabalhos relacionados fazem por meio de SPARQL. As consultas OLAP são propriamente realizadas sobre o DW ou Data Marts da organização, geralmente por meio de SQL (Structured Query Language). Dentre os construtores das operações OLAP, as medidas representam quantificações numéricas (somatório, média, mínimo, máximo, etc.) sobre um determinado conceito do domínio. Na prática, os conceitos classificados como medidas pelo Tradutor OLAP são associados aos fatos aditivos, indicadores ou medidas propriamente ditas do modelo dimensional.

Já os conceitos traduzidos como agrupamentos provêm as informações descritivas utilizadas para agrupar ou categorizar as medidas nas consultas. Esses conceitos geralmente devem ser associados aos atributos das dimensões do DW e são propriedades de classes.

Quando os conceitos são traduzidos como filtros, os valores relacionados a esses conceitos são usados como critérios de seleção na requisição OLAP. Normalmente, o elemento da pergunta é traduzido como filtro quando se refere a uma instância de classe ou quando um valor identificador de uma propriedade (nome, sigla, data, etc.) é informado. Além disso, o Tradutor OLAP encarrega-se de traduzir aqueles termos da pergunta classificados pelo Analisador Lingüístico como Função. Nesses casos, o resultado da função é usado também como valor para a criação dos filtros na requisição OLAP. A função relaciona um ou mais termos a um conceito do domínio e ao seu respectivo cálculo ou valor. Quando um termo é substituído pelo resultado da função é como se o valor resultante estivesse sido informado na pergunta. Então, o Tradutor OLAP pode tanto identificar valores como filtros diretamente na pergunta quanto aplicar funções para substituir os termos por seus valores para a criação da requisição OLAP.

Além das medidas, agrupamentos e filtros, o Tradutor OLAP deve também definir na requisição de consulta como esses itens devem ser relacionados. Cada relacionamento entre as classes denota qual a junção ou ligação que deve ser utilizada entre os objetos das fontes de dados. Todos os relacionamentos entre conceitos, inclusive aqueles provenientes dos conseqüentes de regras de inferência na fase de reformulação, devem estar presentes no caminho oriundo do Motor de Busca por Similaridade. Isso serve para que o Tradutor OLAP possa considerar por completo as entidades do modelo da ontologia de domínio que devem ser relacionadas para obtenção do cubo OLAP adiante.

A fim de realizar a tradução do caminho em uma consulta, o Tradutor OLAP utiliza um conjunto de padrões e heurísticas baseadas na distância ou posição entre os conceitos da pergunta e stop-words. Embora as palavras classificadas como stop-words sejam desprezadas pela maioria dos sistemas de RI, elas são essenciais nessa fase de tradução. Geralmente, as pesquisas de QA baseadas em respostas textuais utilizam stop-words para classificar o tipo de pergunta e também para identificar o padrão sintático para respondê-la corretamente. Neste trabalho, as stop-words além de serem úteis para determinar o tipo de pergunta, elas auxiliam também a descoberta dos elementos da consulta OLAP, como medidas, agrupamentos, filtros e junções.

Todos os padrões sintáticos e as heurísticas juntamente com a listagem de stop-words usados pelo Tradutor OLAP devem ser configurados de acordo com o idioma na base de conhecimento. Tal como nos frameworks propostos por Lopez (et. al.; 2007) e Meng e Chu (1999), essa configuração permite que expressões regulares e critérios baseados na posição ou distância entre tokens e stop-words sejam aplicados pelo Tradutor OLAP. Com isso, há uma maior flexibilidade no reconhecimento dos elementos da consulta de acordo com os padrões idiomáticos ou ainda o modo de escrita dos tomadores de decisão. Essa proposta não determina um conjunto fixo de padrões ou heurísticas para a obtenção da consulta OLAP, uma vez que há uma variedade de formas idiomáticas possíveis que podem ser utilizadas nessa tarefa. Entretanto, o capítulo 4 detalha algumas adaptações do trabalho de Meng e Chu (1999) e alguns padrões e heurísticas baseadas no estudo de Lopez (et. al., 2007) que podem ser aprimorados ou modificados conforme a necessidade.

Para realizar a tradução e configurar os padrões no Modelo e Base de Conhecimento, este trabalho adota três tipos de stop-words organizadas conforme a Tabela 3 a seguir.

Tabela 3 - Tipos de stop-words para a tradução OLAP Tipo de

Stop-word

Elemento da

consulta Descrição

Quantificação Medida Stop-words sumarização ou cálculos de valores que tratam da numéricos e quantificação de

dados. Cita-se como exemplo as expressões quanta(s), quanto(s), e suas variantes como qual a quantidade de, qual o total de, etc.

Projeção Agrupamento

São aquelas utilizadas para categorizar ou agrupar conteúdos normalmente descritivos sem necessidade de quantificá-los, tais como os atributos de dimensão. São exemplos as stop-words: por, conforme, agrupado por, segundo, etc. em perguntas como “Quantos alunos agrupados por idade e por cidade estudam no Sul?”.

Seleção Filtro

São as stop-words que participam de critérios de seleção para filtrar um conjunto de dados. Distinguem-se aqui as stop-words relacionais (operadores relacionais), como acima de, igual a, maior que, abaixo de, etc. e ainda lógicas (operadores lógicos) como, E e OU. Exemplo de pergunta com stop-words relacionais: “Quantos especialistas acima de 40 anos e abaixo de 50 anos publicaram artigos em 2010?”. Exemplo de pergunta com stop-words lógicas: “Quantos professores e discentes estudam Fisiologia Humana ou Saúde Ocupacional?”.

Conforme assinalado na delimitação de escopo deste trabalho, as perguntas, e conseqüentemente as respostas, são interpretadas para atender ao contexto de BI, onde apenas sumarizações e quantificações são possíveis. Por isso, os tipos de stop-words apontados na Tabela 3 apresentam os elementos visando à construção de consultas multidimensionais.

A requisição de consulta gerada na tradução não exige a presença de filtros, porém espera-se que ela possua pelo menos uma medida ou

um agrupamento que determine qual informação deverá ser extraída das fontes de dados. Por exemplo, na pergunta “Quantos alunos?” embora seja simples, a pergunta é considerada válida e, por conseguinte, a consulta resultante apresentaria apenas uma única medida (e.g. total de alunos), sem a presença de agrupamentos ou filtros.

No exemplo citado na Tabela 3 para as stop-words lógicas, note que os tokens E e OU podem ser usados não somente como critérios de filtros mas também para listar mais de uma projeção (no caso, Quantos professores e discentes). Isto é, ambos tokens podem ser utilizados na combinação dos elementos que devem ser retornados (medidas e agrupamentos), como podem ser também utilizados na criação de filtros na consulta. Dessa forma, as configurações de padrões e heurísticas devem ser diferenciadas no Modelo e Base de Conhecimento para esses tipos de stop-words.

Outro fato observado sobre as stop-words lógicas E e OU é que quando são utilizadas para especificar os elementos de retorno da consulta (como projeções), elas podem ser usadas indistintamente uma vez que produzem o mesmo resultado. No exemplo a pergunta “Quantos professores e discentes...” tem o mesmo efeito de “Quantos professores ou discentes...”, pois a semântica dos tokens E e OU é a mesma e por isso, ambas as informações dos conceitos (professores e discentes) devem ser projetados. O problema ocorre quando essas stop-words participam de filtros. Isto porque o uso na linguagem natural dos tokens E e OU confunde-se com os respectivos operadores lógicos. Por exemplo, na pergunta “Quantos professores estudam Fisiologia Humana e Saúde Ocupacional?” o token E pode ter sua semântica interpretada como: a) intersecção – somente os professores que estudam ambas as áreas simultaneamente ou; b) união – todos os professores que estudam tanto as duas áreas quanto apenas uma delas. Essa variação de semântica é devida ao E lingüístico ser muitas vezes diferente do operador lógico E, sendo que o seu sentido na pergunta pode estar associado na verdade ao operador lógico OU. Por motivos de simplificação, este trabalho considera a semântica dos operadores lógicos para a criação de filtros. Assim, o tomador de decisão tem as opções de intersecção ou união na seleção de conteúdo.

Assim como as funções e conclusões de regras de inferência, novas stop-words podem ser especificadas no Modelo e Base de conhecimento para que sejam utilizadas na determinação dos elementos da consulta. Logo, novas stop-words ainda não mapeadas podem ser incorporadas à arquitetura para que os padrões e heurísticas sejam configurados e tratados pelo Tradutor OLAP. A seção a seguir

apresenta o módulo Gerenciador de Consultas que faz interface com o Tradutor OLAP.