• Aucun résultat trouvé

2.1 D’un Web de pages à un Web de données : rendre les ressources en ligne

2.1.2 Du Web sémantique au Web de données : définition des enjeux

Le but du Web sémantique est aussi vieux que le Web : créer un medium universel pour l’échange de données. Rendre les données sur le Web compréhensibles par les machines est devenu une priorité pour plusieurs institutions, entreprises et communautés d’individus. Le Web ne peut atteindre son véritable potentiel que s’il devient un endroit où les données peuvent être partagées et comprises par des automates et des humains.

Le problème majeur de l’Internet est la dispersion des données. Le Web sémantique permet aux ordinateurs de « comprendre » le sens des pages web en suivant les liens hypertextes des documents web vers des ontologies spécifiques. Poursuivant le développement de la toile, le Web sémantique doit être considéré dans une logique d’utilisation du Web par les machines et non exclusivement par l’homme. Ainsi toute donnée doit être accompagnée d’informations permettant à des machines de l’exploiter, d’où la nécessité d’adjoindre des métadonnées qui sont des données contenant de la sémantique car expliquant la donnée à laquelle elles se réfèrent et le contexte de celle-ci. Les métadonnées peuvent être :

 externes à l’objet, comme par exemple les « Topic Maps » étant des représentations

 internes à l’objet, ce que propose le langage RDF

Quant aux bases de données en ligne, le problème est qu’elles ne sont pas visibles par les moteurs de recherche, elles ne se sont interrogeables que par des individus et leurs ressources demeurent donc invisibles sur un Web caché. Des protocoles d’interrogation multi-sources (Z39.50, SRU/SRW, OAI-PMH) demeurent des protocoles spécifiques à la recherche sur le Web caché et non sur le Web dans sa globalité. Ainsi le Web sémantique doit permettre l’interrogation simultanée de données structurées (dans les bases de données) et non structurées (contenus des pages web) en ajoutant une « couche » structurée de métadonnées à l’ensemble de ces données, « couche » devant être compréhensible aussi bien par les machines que par les humains. Ainsi le Web sémantique tend à « décloisonner les silos d’information » afin de permettre à l’utilisateur ainsi qu’aux machines de mener une requête sur l’ensemble des silos (3, BERMES). Le Web de données entend créer un espace documentaire dans lequel les ressources du Web sont décrites et reliées entre elles : leurs liens sont « typés », c'est-à-dire qu’est renseignée la nature de la relation entre les ressources (ex : « Victor Hugo » est l’auteur de « Les Misérables »).

Le Web sémantique devrait permettre, selon Véronique Mesguich (10, MESGUICH), non seulement aux humains d’interagir entre eux, mais offrirait également une meilleure organisation de l’accès aux énormes gisements d’informations numérisées disponibles en modélisant le cheminement du cerveau humain et en donnant aux bases de données la possibilité d’échanges à travers des applications interopérables. L’enjeu du Web sémantique est de faciliter et d’améliorer la recherche d’information grâce à une représentation du sens du contenu des ressources manipulables par des programmes. Car si l’efficacité des moteurs de recherche web a pu être améliorée, le type d’indexation pratiqué par ces outils demeure en revanche fondé sur une approche typographique et non linguistique de la langue. En effet les moteurs web demeurent incapables de désambiguïser un terme ou de prendre en compte les polysémies ou les homonymies, les métadonnées incorporées dans l’en-tête des pages web ne sont donc pas toujours fiables. Or avec le Web sémantique, les documents contenus sur le Web seraient davantage structurés et formalisés et leur contenu serait décrit par un balisage adéquat. Le Web sémantique permet ainsi d’ajouter une couche de métadonnées aux informations existantes.

Les technologies du Web sémantique sont de plus en plus appliquées à un large spectre d’applications au sein desquelles une connaissance de domaine est modélisée et formalisée afin de servir de support à des traitements très diversifiés (des « raisonnements ») effectués par la machine. Ces représentations peuvent être rendues compréhensibles par l’homme pour assurer un couplage optimal entre raisonnement humain (cognitif) et mécanique

(sémantique formelle) afin de confier à l’homme et à la machine des tâches complémentaires (6, CHARLET, LEGER). Les machines deviennent donc capables d’interpréter et d’exploiter le contenu des données web car les documents web ont un sens, ils sont compréhensibles par un ordinateur et par conséquent un ordinateur est capable de comprendre le sens d’un document. Ainsi Sébastien Declercq définit le Web sémantique comme « un web offrant la possibilité d’exploiter l’entièreté des relations sémantiques entre des termes usuels » (7, DECLERQ, p. 2).

Ainsi le Web sémantique peut être considéré comme un dispositif permettant de structurer les informations du Web de façon à les rendre manipulables et « compréhensibles» par des agents logiciels. L’objectif de ces agents est de faciliter l’utilisation des informations et services du Web en libérant l’internaute d’une partie de sa charge cognitive, et de donner l’impression d’un système homogène et cohérent en mobilisant automatiquement et de manière transparente les multiples ressources, sites et services nécessaires à l’accomplissement d’une tâche. Le Web sémantique peut, dans l’idéal, proposer diverses fonctionnalités intéressantes selon Brunon Menon (63, MENON) :

 la recherche généraliste avec un moteur de recherche sémantique doté de capacités de « raisonnement » en s’appuyant sur la description formalisée et la mise en relation des différentes sources d’information pour traiter « intelligemment » les requêtes et présenter en une seule étape des résultats complets.

 l’exploitation et la combinaison de ressources pour accomplir une tâche spécialisée : des outils dédiés associent dialogue avec des sources hétérogènes, description des préférences des utilisateurs et raisonnement basé sur des connaissances métier pour synthétiser l’information requise.

 l’offre de services web plus complets, avec des outils qui identifient, activent et combinent différents services pour mener à bien des opérations plus ou moins complexes de la vie quotidienne ou professionnelle, comme l’organisation d’un voyage, la souscription d’un contrat d’assurance, etc.

 la navigation sémantique, qui profite de la sémantisation des hyperliens pour orienter l’internaute dans son parcours du réseau.

De ce fait après une période de « tissage » du Web apparaît une période de « démêlage » d’un réseau dense et complexe. Ainsi les principes du Web sémantique sont que :

 Tout objet du Web possède une étiquette

 Toute étiquette est lisible par les agents logiciels et par les êtres humains

 Toute étiquette représente fidèlement l’objet

 Toute étiquette est disposée dans un espace commun de lisibilité, espace explorable virtuellement par l’ensemble des humains et des agents logiciels

Les maîtres mots du Web sémantique sont donc sémantique, distribution, ouverture et partage. La sémantique permet une plus grande précision dans les requêtes et les réponses tandis que l’ouverture permet l’échange et le partage de ressources toujours plus complètes et toujours plus précises. Toutefois intégrer ses ressources au Web de données nécessite de lier celles-ci à des ressources extérieures d’autres acteurs/institutions spécialisés dans le même domaine.

2.1.3 Un langage pour les machines : la structuration des