Chapitres 3.1 Diagnostic automatisé
II. Démarche et outils
Para investigar, definir e situar melhor a recuperação de conhecimento, um caminho é compará-la com outros tipos de recuperação mais conhecidos. Dessa forma, Yao et al. (2007) classificam os sistemas de recuperação em geral em três categorias: (i) sistemas de recuperação de dados (data retrieval systems – DRS), adequados para armazenamento de recuperação de dados estruturados, tal como os sistemas gerenciadores de bando de dados; (ii) sistemas de recuperação de informação (information retrieval systems – IRS), busca as informações solicitadas pelo usuário, tal como as máquinas de busca da web, porém, o usuário é quem deve ler e analisar quais são os documentos relevantes que contém conhecimento útil; (iii) sistemas de recuperação de conhecimento (knowledge retrieval systems – KRS), que tem o foco no conhecimento que fornecem, porém, ainda são um grande desafio. O Quadro 2 compara e sintetiza esses três tipos de recuperação
Por intermédio de critérios comparativos (casamento de busca, inferência, modelo, consulta, organização, representação, armazenamento e resultado recuperados), Yao et al. (2007) distinguiram os três tipos de recuperação, apresentados no Quadro 2. Porém, é possível que um sistema tenha elementos mesclados de uma ou outra coluna, não sendo puramente de um só tipo.
Existem controvérsias quanto ao escopo de atuação da recuperação de conhecimento. Por exemplo, Yao et al. (2007) observaram que alguns autores consideram que a recuperação de conhecimento é um processo da RI. Há quem considere que a recuperação de conhecimento é uma forma de inferência e acontece sobre uma base de conhecimento. Campos, Souza e Campos (2003) reconhecem a recuperação de conhecimento quando realizada por sistemas baseados em conhecimento, pois “[...] ao contrário do convencional processamento de dados, têm elementos que são mais do que dados isolados; são conceitos que descrevem objetos e suas propriedades” (p. 11). Como técnicas para avançar nos métodos para a recuperação de conhecimento, Martin e Eklund (2000) propuseram um ambiente baseado no uso de linguagens de metadados, tais como a RDF e linguagens de ontologias. Já nessa época, ano 2000, eles reconheceram o problema da escalabilidade da web e também a falta de semântica nas informações disponíveis na web.
A recuperação de conhecimento também pode ser vista como um processo que acontece com um indivíduo na sua esfera privada “[...] com o objetivo de lembrança de um dado conceito, previamente assimilado e associado a sua estrutura de conhecimentos, por meio de métodos que promovam a recuperação eficiente e efetiva destes conceitos, dentro de um domínio de conhecimento” (PONTES JUNIOR; CARVALHO; AZEVEDO, 2013, p. 14). Os autores ainda sinalizam que entender como o conhecimento é organizado permite o estabelecimento de “[...] correlações entre os processos de recuperação de conhecimento com os de recuperação de informação, objetivando a melhoria do desempenho desses últimos” (p. 14). Nessa ótica, a recuperação de conhecimento é dependente do usuário, de seus conhecimentos anteriores e como as informações recuperadas irão se relacionar com o seu conhecimento prévio.
Quadro 2 – Comparação entre recuperação de dados, de informação e de conhecimento Recuperação de dados Recuperação de informação Recuperação de conhecimento Casamento da busca
booleano parcial ou melhor parcial ou melhor
Inferência dedutiva indutiva dedutiva, indutiva, raciocínio
associativo, raciocínio analógico
Modelo determinístico estatístico e
probabilístico
semântico, de inferência
Consulta linguagem
artificial
linguagem natural estrutura de conhecimento,
linguagem natural
Organização tabela, índice tabela, índice unidade de conhecimento, estrutura de conhecimento
Representação número, regra linguagem natural,
linguagem de
marcação
grafo de conceitos, lógica de predicados, regra de produção, estrutura, rede semântica, ontologia
Armazenamento banco de dados coleções de documentos base de conhecimento Resultados recuperados conjunto de dados seções ou documentos um conjunto de unidade de conhecimento
Fonte: adaptado de Yao et al. (2007) extensão de Van Rijsberngen (1979)
2.4.4 Visualização na RI
Uma das etapas de um processo de RI é o relacionamento com a informação recuperada por parte do usuário que demandou a consulta. Esse relacionamento pode ocorrer de forma simples com o auxílio do formato textual, ou de uma forma mais elaborada, com auxílio de imagens, mapas esquemas etc., para proporcionar ao usuário a obtenção de insights sobre a informação recuperada. Essa subseção apresenta algumas áreas de estudo que têm investigado a melhoria desse processo de apresentação da informação ao usuário: visualização de informação (information visualization), visualização de conhecimento (knowledge visualization), visualização de informação na RI (information retrieval visualization) e visualização de domínio de conhecimento (knowledge domain visualization).
2.4.4.1 Visualização de informação e de conhecimento
O termo visualização refere-se à representação gráfica de dados ou conceitos, diferente do conceito antigo, que o associava a imagens mentais que as pessoas formavam enquanto pensavam (WARE, 2010). A visualização é também considerada um processo de transformação de dados, informação e conhecimento em representações gráficas para apoiar tarefas, tais como análise de dados, exploração de informação, explicação da informação, previsão de tendências, detecção de padrões, descobertas etc. (ZHANG, 2008). As visualizações estão cada vez mais presentes nas ciências e os recentes avanços na exploração do cérebro têm permitido aos pesquisadores ver quais áreas do cérebro são mais ativas quando as pessoas desempenham tarefas visuais (WARE, 2010). Normalmente as pessoas ficam mais sintonizadas com imagens e informação visual do que informação puramente textual e, a representação visual tem condições de comunicar alguns tipos de informação muito mais rapidamente e com efetividade do que outro métodos (BAEZA-YATES; RIBEIRO-NETO, 2011). O estudo de temas baseados em texto pode ser significativamente reforçado pelos benefícios da visualização da informação e espacialização (representação espacial de dados não-espaciais) (HOOK; BÖRNER, 2005). A informação é mais fácil de lembrar se ela puder ser armazenada e localizada espacialmente (MILLER, 1968; WINN, 1994 apud HOOK; BÖRNER, 2005, p. 189).
Segundo Keller e Tergan (2005), visualização de informação (information visualization) e visualização de conhecimento (knowledge visualization) são áreas de estudo distintas com desenvolvimentos próprios, apesar de ambas as áreas terem como objetivo comum a visualização de estruturas. Onde estruturas referem-se tanto elementos de conhecimento quanto de informação. A visualização de informação emergiu como um campo de estudo nos anos 90 e tem como objetivos, revelar padrões invisíveis a partir de dados abstratos e trazer novas percepções para as pessoas, e não apenas imagens bonitas (CHEN, 2013). O autor ainda enfatiza que o maior desafio é capturar algo abstrato e invisível para algo concreto, tangível e visualmente significativo.
Quadro 3 – Comparação entre visualização da informação e visualização do conhecimento
Aspectos Visualização da informação
(information visualization)
Visualização do conhecimento (knowledge visualization) Objetivo Uso de aplicações auxiliadas por
computador em tarefas
exploratórias de grande
quantidade de dados para obter novos insights.
Uso de representações visuais para
melhorar a transferência de
conhecimentos entre as pessoas e melhorar a criação de conhecimento em grupos.
Benefício Melhora o acesso à informação, recuperação e exploração de grandes bancos de dados.
Multiplica os processos de
transferência de conhecimento e de comunicação entre os indivíduos usando uma ou mais representações visuais.
Conteúdo Concentra-se em dados explícitos,
tais como fatos e números.
Cuida de conhecimentos, tais como experiências, insights, instruções, suposições e aqueles que respondem a questões ‘porque’, ‘quem’ e ‘como’.
Destinatários Auxilia um indivíduo a obter novos insights.
Auxilia um indivíduo ou um grupo na transferência ou criação de novos
conhecimentos em ambientes
colaborativos.
Influencia Fornece novas pistas para os
campos da CI, mineração de dados, análise de dados e para problemas como a exploração de
informação, recuperação de
informação, interação humano- computador e design de interface.
Fornece novas pistas para os campos de ciência da comunicação visual, gestão do conhecimento, e para problemas como a exploração, transferência, criação e aplicação de conhecimento; a aprendizagem, a qualidade da informação, sobrecarga de informação, design, design de interface e comunicação visual.
Proponentes Pesquisadores normalmente
possuem base na ciência da
Pesquisadores normalmente
computação. conhecimento, psicologia, design ou arquitetura.
Contribuição Orientada à inovações;
pesquisadores criam métodos mais técnicos.
Orientada à soluções; também cria métodos de visualização tradicionais para resolver problemas, porém,
somente na inexistência dos
métodos. Proporciona integração entre áreas isoladas oferecendo estruturas teóricas necessárias para toda a área de visualização.
Raízes Campo novo que se tornou
possível com a introdução de computadores.
Apesar do termo recente,
visualização conhecimento, é
baseada em realizações culturais e intelectuais, por exemplo, de arquitetos e filósofos.
Significados Usa métodos auxiliados por
computador.
Usa métodos de visualização auxiliados por computador ou não. Visualizações
complementares
Combina métodos diferentes de visualização usando o mesmo
meio em uma interface,
acoplando-os firmemente; este conceito é chamado de múltiplas visualizações coordenadas.
Combina diferentes métodos de visualização usando um ou mais meios diferentes (por exemplo, um software, um cartaz ou um objeto físico) para ilustrar conhecimentos em perspectivas diferentes.
Fonte: adaptado de Burkhard (2005)
A visualização de conhecimento examina o uso de representações visuais para melhorar a transferência e a criação de conhecimento entre pelo menos duas pessoas (BURKHARD, 2005). Segundo Burkhard, essa definição é aceita por especialistas das áreas de visualização de informação (information visualization) e visualização de domínio do conhecimento (knowledge domain visualizations). Keller e Tergan (2005) focam o termo visualização de conhecimento nas visualizações de estruturas que representam conhecimento conceitual. Meyer (2010) define a visualização de conhecimento como um campo de investigação com foco sobre a criação e transferência de conhecimento por intermédio de
visualizações com ou sem a ajuda de computadores, sendo ainda um mediador capaz de criar um efeito sinérgico entre várias disciplinas diferentes (MEYER, 2010).
Burkhard (2005) analisou diferenças entre as áreas visualização de informação e visualização de conhecimento. O autor observou que em ambos os casos, pesquisadores exploram habilidades inatas para processar de forma efetiva as representações visuais, mas o modo de usar essas habilidades diferem nos dois casos. Burkhard organizou as diferenças em dez aspectos, aqui sintetizadas e tabuladas, como mostra o Quadro 3.
No Quadro 3 observa-se o quanto a visualização de conhecimento é mais efetiva, do que a visualização de informação, para processos de comunicação e construção do conhecimento em meios cooperativos. Eppler e Burkhard (2004) também destacam vantagens da visualização de conhecimento, sobre a visualização de informação, benefícios cognitivos, sociais e emocionais. Os autores resumiram os pontos fortes no acrônimo ‘CARMEN’:
‘C’: coordination (coordenação) – coordenação na comunicação entre profissionais do conhecimento – benefício social;
‘A’: attention (atenção) – sensibilização e foco para a criação e transferência do conhecimento – benefício cognitivo;
‘R’: recall (recuperação) – melhoria da capacidade de memorização e, assim, fomentar a aplicação de novos conhecimentos – benefício cognitivo;
‘M’ motivation (motivação) – motivação dos usuários para engajá-los na interpretação e exploração de figura/gráfico – benefício emocional;
‘E’: elaboration – (elaboração) – maior compreensão e apreciação de conceitos e ideias e suas relações; e
‘N’: new insights – (novas percepções) – revelação de conexões escondidas – benefício cognitivo.
Eppler e Burkhard também citam exemplos de visualização do conhecimento: (i) esboço heurístico: criação de novos insights em grupo; (ii) diagramas conceituais: estruturação de informação e ilustração de relacionamentos; (iii) metáforas visuais: descrição de domínios para melhoria do entendimento; (iv) animações de conhecimento: visualizações dinâmicas e interativas; (v) mapas de conhecimento: navegação e estruturação especialista; (vi) gráficos científicos: visualização de domínio de conhecimento e estruturas intelectuais.
Dentre esses exemplos citados, é destacado aqui, devido ao contexto do presente trabalho, a estruturação de informação e ilustração de relacionamentos por intermédio de diagramas conceituais. Eppler e Burkhard explicam que eles são descrições esquemáticas de ideias abstratas com o auxílio de formas padronizadas (caixas, círculos, pirâmides, setas etc.) usadas para estruturar a informação e ilustrar relacionamentos. Além disso, segundo Huff (1990 apud EPPLER; BURKHARD, 2004), para a transferência e criação de conhecimento, os diagramas conceituais ajudam a tornar mais acessíveis os conceitos abstratos, reduzindo a complexidade das questões-chave, possibilitando a amplificação da cognição e a discussão de relacionamentos.
2.4.4.2 Visualização de informação na RI
Alguns autores contextualizam a visualização da informação na RI, referindo-se como information retrieval visualization. Zhang (2008) define essa área como um processo que transforma os dados abstratos invisíveis e suas relações semânticas em coleções de dados visíveis. Segundo o autor, esse processo é composto por dois componentes: (i) apresentação de informações visuais; e (ii) recuperação de informação visual. A apresentação de informações visuais é quem fornece a plataforma onde a recuperação de informação visual é executada ou realizada. Zhang ainda enumera sete benefícios do uso da visualização na RI que vão desde a utilização da capacidade perceptiva humana, passando pela redução da carga de trabalho cognitivo, até a melhoria na eficácia da recuperação. De forma resumida, os benefícios são:
(i) Oferece um ambiente ideal e natural para permitir a navegação;
(ii) Realiza a espacialização de um contexto informacional, isto é, torna um espaço de informação invisível e abstrato para um espaço visual;
(iii) Transforma a informação agregada num nível macro para uma coleção de dados disponível e acessível para os usuários;
(iv) Oferece caminhos diferenciados para o desenvolvimento de novos modelos de RI, diferentes dos modelos tradicionais;
(v) Fornece condições bastante favoráveis para a análise da informação, como por exemplo, a análise de conexões entre informações;
(vi) Abre amplas possibilidades para o desenvolvimento de abordagens para as apresentações visuais, principalmente pela espacialidade; e
(vii) Enriquece e eleva o nível da RI tornando o processo intuitivo e simples, e ainda deixando os usuários capazes de construir e realizar descobertas de conhecimento.
2.4.4.3 Visualização de domínio de conhecimento
A visualização de domínio do conhecimento, ou knowledge domain visualizations (KDVs) (HOOK; BÖRNER, 2005), ou ainda knowledge domain visualization (KDViz) (CHEN, 2013) tem proximidade com a área visualização de conhecimento, porém, específica para o mapeamento e delimitação de um domínio de conhecimento. Segundo Hook e Börner (2005), visualização de domínio de conhecimento são renderizações gráficas de dados bibliométricos concebidos para proporcionar uma visão global de um domínio particular, os detalhes estruturais de um domínio, e as características mais importantes de um domínio. Renderizações gráficas de dados bibliométricos são composições de informações publicadas ou conhecidas sobre o domínio de um conhecimento, apresentadas num formato gráfico condensado. Para os autores, visualização de domínio de conhecimento é também referida como mapas de domínio e o processo de sua criação como mapeamento de domínio.
No contexto da descoberta de conhecimento, ou knowledge discovery, a visualização de domínio de conhecimento pode diminuir o espaço de busca e aumentar a chance de encontrar uma linha de pesquisa promissora na investigação científica (CHEN, 2013). Chen chama atenção para o fato de que a visualização de domínio do conhecimento pode ser prejudicada em função da inexistência clara das fronteiras desse conhecimento com os demais, bem como existência de conhecimento latente, isto é, conhecimento que precisa ser descoberto ou revelado. Para essa área de estudo, ele chamou de domínio de conhecimento latente, ou latente domain knowledge.
Há provas convincentes da utilidade da visualização de domínio de conhecimento decorrentes dos campos da Psicologia Educacional, Ciência Cognitiva, Cartografia e Ciência da Informação (HOOK; BÖRNER, 2005). Para os autores, a visualização de domínio de conhecimento bem concebida tem a capacidade de facilitar a compreensão, lembrança, e para transmitir ao usuário a organização esquemática, geo-espacial, temporal, semântico, ou social do domínio subjacente. Hook e Börner ainda acreditam que visualizações domínio do conhecimento educacional podem ajudar com o acesso e a navegação, compreensão, gestão e comunicação dos espaços de informação em larga escala. Eles destacam que visualização de domínio do conhecimento, quando utilizada como uma interface para recuperação de informação, tem o potencial de transmitir a organização estrutural do domínio para o usuário.
Os autores ainda acrescentam que, esse conhecimento estrutural do domínio fornece o fundamento cognitivo com a qual o usuário pode associar detalhes adicionais sobre o domínio.