Movement Data and Their Characteristics - Basic Concepts of Movement Data

Basic Concepts of Movement Data

1.2 Movement Data and Their Characteristics

Segundo o Relatório Horizon de 2010 (García et al., 2010), a capacidade catalisadora que a web semântica pode ter na criação e recolha de conhecimento disperso ou oculto é uma das suas características mais importantes.

Podendo representar uma revolução no reaproveitamento da informação dispersa na web, com especial ênfase no papel ativo que os estudantes podem ter nisso (ver subcapítulo 3.3), ela pode potenciar a criação de novos conteúdos assistidos por ferramentas de web semântica, nomeadamente pela intervenção de motores de busca inteligentes (ver 2.1.1. - parte I - e 3. - parte II) e de outras ferramentas capazes de captar o sentido, por exemplo, dos recursos já existentes na web, proporcionando diferentes formas de conjugação desse mesmo conhecimento.

Um dos problemas inerentes ao futuro da existência de REAs é o da sua reutilização e ou modificação. Será a web semântica uma possibilidade para a reutilização de conteúdo disperso na web?

Em ambiente 2.0, o depósito de REA tem vindo a ser muito maior do que a sua reutilização ou reaproveitamento. Sabendo-se que, por definição, “Recursos educacionais abertos (REA) são materiais utilizados para apoiar a educação que podem ser livremente acedidos, reutilizados, modificados e compartilhados.”43 _{(Daniel et al.,} 2010, P. 1) e ainda que

A sua finalidade é incentivar os decisores dos governos e instituições a investir na sua produção sistemática, adaptação e utilização dos REAs a fim de os integrar no uso geral do ensino superior de modo a melhorar a qualidade dos currículos e do ensino e a reduzir custos.44 _{(Daniel et al.,}

2010, p. 1)

Intencionalmente construídos para serem reutilizados ou modificados, os REAs começam a ter um sentido amorfo e a ocuparem um espaço inútil numa rede que se diz colaborativa mas que, em grande medida, promove a individualidade do eu; cada um dos utilizadores deste espaço cria e partilha os seus recursos (normalmente em websites com espaços individuais de partilha), mas raramente reutiliza ou modifica os já

43_{“Open educational resources (OER) are materials used to support education that may be freely accessed, reused,}

modiﬁed, and shared.”

44 _{Their purpose is to encourage decision makers in governments and institutions to invest in the systematic}

production, adaptation and use of OER and to bring them into the mainstream of higher education in order to improve the quality of curricula and teaching and to reduce costs.

existentes, tornando-se incapaz de promover o resultado proveniente da intenção inicial quanto ao reuso e à modificação dos REAs já existentes.

Este é um dos casos em que a semântica se tornará uma tecnologia útil possibilitando, antes de mais, a recuperação de conhecimento disperso e gerado fora das fontes tradicionais do saber para além do encontro de REAs relevantes, retirando-os do seu amorfismo; a reutilização, no sentido da adaptação de informação dispersa na web, levará à transformação de REAs em novos objetos de aprendizagem, através de dispositivos inteligentes.

Em relação à qualidade da informação, para além da localização e contextualização dos conteúdos ou, ainda, à legitimidade, reputação e autoridade dos autores, especialmente quando estes são vários, como muitas vezes acontece nos casos de conteúdos abertos, as ferramentas semânticas poderão ter, também, segundo o relatório Horizon 2010 (García et al., 2010), um impacto positivo, visto que o contexto da informação e fatores internos inerentes ao mesmo serão mais importantes do que fatores externos, como é o caso do número de vezes a que a página foi acedida (ranking de páginas).

A tecnologia semântica não será apenas importante no rastreamento de informação contextualizada, mas será um auxílio fundamental para o utilizador que procura a qualidade dessa mesma informação dispersa na web 2.0, agora unificada em qualidade, pela contextualização que a web 3.0 proporciona.

Fatores como a qualidade da pesquisa (o importante não é uma grande quantidade de informação que trate de fatores acessórios relativamente à digitação de palavras-chave), da informação rastreada (se o motor de busca souber responder à pergunta colocada pelo utilizador em linguagem natural através dos dados constantes na web, ele será um potente crivo na separação do importante e do acessório), da autoria (pela capacidade de, a partir de fatores internos, ser capaz de perceber a qualidade relativamente ao(s) autor(es)) - através dos dados disponíveis na nuvem (Cloud) dos dados abertos ligados (Linked open Data), ao que se pode acrescentar o tornar a web numa rede viva de conhecimento que se interconecta, permitindo ao utilizador, a partir de uma simples pergunta, encontrar, não uma variedade de recursos, mas sim aqueles que são importantes para si – são agora centrais e mais facilmente acessíveis, com o auxílio da tecnologia semântica.

A web torna-se, assim, numa rede viva; a existência de uma rede aberta interconectada de dados (Big Linked Open Data) e não já redes ou ferramentas dispersas

na rede, permitirão dar indicações de partes de documentos (REAs) - dados - e de formas de as relacionar para a criação (recriação) de recursos, o que é uma mais-valia não só para o utilizador, mas para a própria rede de dados que pode, agora, em ambiente semântico, colaborar, compartilhar, reutilizar e modificar os REAs já existentes, não os tornando obsoletos, mas sim realidades vivas e em movimento.

DBpedia45 _{é um exemplo de reaproveitamento do que existe e está na nuvem} (Cloud) da informação online; ela permite fazer pesquisas na Wikipedia, ao mesmo tempo que são feitas ligações de dados existentes na web para a Wikipedia. Licenciada sob os termos Creative Commons Atribuição - Compartilhamento pela mesma licença 3.0 e GNU Free Documentation License (Bizer, 2012), a DBpedia descreve, atualmente, 3,77 milhões de coisas, das quais 2,35 milhões são classificadas segundo uma consistente ontologia com caixas de informação que cobre 359 classes (nas quais se incluem recursos, locais, pessoas, trabalho, espécies e organização) que formam uma hierarquia de subsunção descritas por 1,775 diferentes propriedades, sendo que com

(...) a versão 3.7 a ontologia é um gráfico acíclico e não uma árvore, em que as classes podem ter múltiplas superclasses importantes no mapeamento dos esquemas (schema.org); a taxonomia pode ser construída ignorando todas as superclasses exceto a que é especificada em primeiro lugar na lista e considerada a mais importante.46(Sahnwaldt, 2012, §4)

Multilingue e multifacetado, o conhecimento da DBpedia permite o questionamento em língua natural e uma pesquisa que veio revolucionar as buscas na Wikipedia. Isto foi facilitado pelas ideias provenientes da web semântica, que se centra em duas coisas:

(...) os formatos comuns para a integração e combinação de dados provenientes de diferentes fontes, onde na rede original se centrava apenas na partilha de documentos e, a linguagem que se refere à relação dos dados com o mundo dos objetos o que permite a uma pessoa, ou a uma máquina, começar por um banco de dados movimentando-se através de um conjunto interminável de bases de dados que estão ligados apenas pelo facto de serem sobre a mesma coisa.47_{(Hawke, Herman, Prud'hommeaux, 2007, §3)}

45_{In http://dbpedia.org.}

46_{Since the DBpedia 3.7 release, the ontology is a directed-acyclic graph, not a tree. Classes may have multiple}

superclasses, which was important for the mappings to schema.org. A taxonomy can still be constructed by ignoring al. superclasses but the one that is specified first in the list and is considered the most important.

47_{A afirmação na íntegra: The Semantic Web is about two things. It is about common formats for integration and}

combination of data drawn from diverse sources, where on the original Web mainly concentrated on the interchange of documents. It is also about language for recording how the data relates to real world objects. That al.ows a person, or a machine, to start off in one database, and then move through an unending set of databases which are connected not by wires but by being about the same thing.

Na realidade, existe um gráfico de informação global ligada (Linked Data) que faz uso de hiperligações como denotação de mecanismos para relações ontológicas entre conceitos (Entidade - Tipo de Entidade - Papel no modelo relacional da entidade).

A web semântica é a rede dos dados (Big Data) baseada num modelo de entidade relacional dotado de mecanismos de relacionamentos semânticos. DBpedia é um extrato de informações estruturadas da Wikipedia. Em linguagem de programação, dir-se-á que os dados estruturados podem ser recuperados usando SQL (uma linguagem de programação de banco de dados para consulta e edição de informações armazenadas em certos bancos de dados) como linguagem de consulta para RDF (padrão de codificação para metadados e outros conhecimentos sobre a Web Semântica) designada por SPARQL (define um padrão de protocolo de acesso de consulta e linguagem de dados para utilização com a descrição de recursos). Já existe um pacote de R (R é uma linguagem e ambiente para computação estatística e gráficos, também designada por GNU - sistema operacional composto por software livre -) para este tipo de consultas, nomeadas SPARQL.

De modo mais simples, poderá-se-á dizer que a arquitetura semântica de DBpedia utiliza linguagens e padrões de codificação semânticos ancorados na sua ontologia, os quais se encontram sitiadas num sistema operacional de software livre. Aquilo que ela possibilita vai muito para além da partilha, colaboração e cocriação, possibilitando-se o refinamento das pesquisas a partir dos dados que já se encontram na Wikipedia.

Os OCW são outra forma de disponibilização de REAs. Eles são cursos ou simples materiais (textos, imagens, vídeos, planos de aulas / cursos e instrumentos de avaliação) criados por entidades validadas como formadoras, especificamente por Instituições de Educação Superior. Licenciados de forma livre e aberta, eles estão disponíveis a qualquer pessoa de qualquer parte do mundo e a qualquer momento para consulta. Apesar disso, os OCW encontram-se em diferentes websites (cada website encontra-se alojado na sua Instituição), sendo o OpenCourseWare Consortium uma comunidade de milhares de Instituições de Ensino Superior e organizações afins que se encontra comprometida com o avanço global da educação e sua disseminação em ambiente aberto e livre.

Khan Academy é também um movimento em torno dos REAs e da tomada de consciência de que o conhecimento é um Bem Comum e, como tal, uma forma de disseminar a formação online. Plataformas de MOOC como Coursera, Udacity, Edx ou

OpenupEd são atualmente fortes tendências, embora com modelos de negócio diferentes, de disseminação massiva do conhecimento.

Voltando aos OCW, questiona-se: não estarão os REAs em silos fechados? O que se poderá mudar com a introdução da tecnologia semântica? O desafio de retirar aos REAs o amorfismo que foram ganhando ora com a dispersão na web, ora com a criação de silos é possível pela introdução da tecnologia semântica que será capaz de, através de pesquisas inteligentes, encontrar os dados dispersos (no caso de REAs de caráter mais individual) ou fechados (no caso de OCW) e de os apresentar de acordo com as necessidades apresentadas, através da linguagem natural do utilizador. A questão coloca-se, sempre, no domínio da pesquisa, como se compreende.

A abertura possibilitada pela web social trouxe a disseminação de REAs, partindo-se do princípio básico do reconhecimento de que o conhecimento é um bem comum a toda a humanidade; este ideal de partilha e de abertura, com base no princípio do Bem Comum, será potenciado pela web semântica.

É com o auxílio de motores de busca inteligentes e de georreferenciação (muitas vezes integrada naquele - ver estudo de caso - parte II -) que a pesquisa do útil e necessário (para cada utilizador), ora na dispersão social (web 2.0) ora em silos (como os websites das diferentes instituições de Educação Superior), potencia a personalização do ambiente de aprendizagem contribuindo, assim, para uma identidade virtual mais consolidada do utilizador - aluno -.

Mais uma vez, o redimensionamento espacial da web trará uma diferente noção de espaço ao indivíduo que navega. Agora em ‘águas mais calmas’, mas com uma diversidade de caminhos por escolher, várias são as hipóteses do utilizador, hipóteses que, com a tecnologia semântica, são potenciadas pela noção de personalização. Será, no entanto, que a tendência da personalização não obrigará o utilizador a ir por um determinado caminho, deixando a diversidade das opções disponíveis de ser apresentada?

Uma identidade virtualmente mais consolidada, capaz de navegar de forma mais serena na qualidade dos recursos que lhe são apresentados, será sinónimo de uma pessoa mais feliz, capaz de aprender de modo mais personalizado e, por isso, mais motivado, empenhado e de forma auto-determinada.

Que mudanças no plano institucional terão de ser operadas para o acolhimento desta nova forma de aprendizagem?

Dans le document Mobility, Data Mining and Privacy (Page 29-36)