• Aucun résultat trouvé

II. Du web sémantique au web des données

II.I Le projet initial : le web sémantique

Lorsque Tim Berners-Lee publie la feuille de route pour le déploiement du web sémantique en 1998 :

« le Web sémantique est alors présenté comme une extension du Web des documents qui constituerait une base de données globale à l’échelle du réseau pour permettre aux machines de mieux appréhender les données et aux personnes de mieux coopérer ».40

En d’autres termes, le web sémantique apparaît comme une surcouche du web actuel permettant aux ordinateurs d’accéder au sens sémiotique des données, de la même manière qu’un être humain. Ce faisant les machines peuvent traiter et exploiter ces données de façon

36 CHIARAMELLA, Yves et MULHEM, Philippe. op.cit. pp.12-13 37 Ibid. p.25

38 KELLER, Michael. Linked Data: a way out of the information chaos and toward the semantic web.

EDUCAUSE [en ligne]. 21 juillet 2011. [Consulté le 14 novembre 2017]. Disponible à l’adresse : https://er.educause.edu/articles/2011/7/linked-data-a-way-out-of-the-information-chaos-and-toward-the-semantic-web

39 ACCART, Jean-Philippe et RIVIER, Alexis. op.cit. p.121

40 POUPEAU, Gautier. Petite histoire du Web sémantique. Les petites cases [en ligne]. 15 août 2011. [Consulté le 21 novembre 2017]. Disponible à l’adresse : http://www.lespetitescases.net/petite-histoire-du-web-semantique

automatique. Cette définition est appuyée par Roger T. Pedauque qui présente le web sémantique comme une : « infrastructure enrichit et [qui, NDLR] s’appuie sur les standards actuels du Web et est susceptible d’en intégrer bien d’autres »41. En effet, si le web sémantique repose sur trois piliers du web traditionnel : les identifiants uniques Uri (ou URL), le protocole HTTP, le langage HTML, ainsi que sur le langage XML, il possède également des technologies propres42. En fait, le web sémantique est une infrastructure composée de six couches elles-mêmes divisées en un ou plusieurs blocs représentant ce que le W3C appelle

« la pile du web sémantique ».

Source : DELESTRE, Nicolas et MALANDAIN, Nicolas. op.cit. p.169

A ce jour seules les trois premières couches de la pile sont effectives. Les couches 4 à 6 étant encore principalement prospectives ; la couche 4 permettrait de prouver la fiabilité des inférences établies par les moteurs d’inférence tandis que la couche 5 permettrait d’attribuer un indicateur de confiance aux informations traitées par les applications de la couche 643. Par conséquent lorsque nous parlons des « technologies du web sémantique » il est généralement question du modèle RDF, un modèle de données propre exploitant les Uri sous

41 PEDAUQUE, T. Roger. La redocumentarisation du monde. Toulouse : Cépaduès, 2007. ISBN 978-2-85428-728-8. Chapitre 6 : Sur des aspects primordiaux du web sémantique, p. 100.

42 GANDON, Fabien, FARON-ZUCKER, Catherine et CORBY, Olivier. Le web sémantique : comment lier les données et les schémas sur le web ? Paris : Dunod, 2012. 206 p. ISBN 978-2-10-058140-5.

43 Ibid. pp.169-171

Illustration 2:pile du web sémantique

la forme de triplets exprimés avec le langage XML, ainsi que des langages SPARQL, RDF-S, OWL et RIF. Le premier permet l’interrogation des triplets RDF, les deux autres sont des langages de description et le dernier un langage de règles permettant la compatibilité avec des moteurs d’inférence44. Soulignons au passage la présence des Uri et du langage XML dans les deux premières couches, ce qui confirme l’idée que le web sémantique repose en grande partie sur des technologies web existantes et n’a pas vocation à supplanter le web des documents mais plutôt à exister en parallèle.

En outre il est intéressant de noter que même si seule la moitié des couches de la pile du web sémantique est pour l’instant utilisable, toutes les briques technologiques sont effectives, celles manquantes étant relatives à la question de la fiabilité des contenus des données. Nous pouvons d’ailleurs souligner que ces technologies sont surtout présentes dans des gisements de données collaboratifs dont la fiabilité repose sur les connaissances et le bon vouloir de milliers d’individus, comme GeoNames45 ou Wikidata46. En effet, reprenant l’exemple de DBpedia47, un autre gisement de données basé sur Wikipédia, Alexandre Monnin insiste sur le fait que « l’objectivité sur laquelle repose nos objets est bien une objectivité de second degré »48 ; en d’autres termes les objets décrits sur le web à travers des données ne correspondent pas à la réalité du monde physique car ils dépendent des interprétations des êtres humains qui créent et documentent ces données. Néanmoins les technologies du web sémantique se sont également développées dans des institutions comme la BNF (Bibliothèque nationale de France) avec le portail data.bnf.fr49. Or, d’après Gautier Poupeau, la preuve et la confiance dans les données sont produites par des informations de contexte50, par conséquent nous pouvons supposer que les données produites et partagées par de grandes institutions nationales ou internationales sont de qualité. Notons également la distinction entre la notion de « vérité », remise en question

44 Ibid. p.170

45 http://www.geonames.org/

46 https://www.wikidata.org/wiki/Wikidata:Main_Page 47 https://wiki.dbpedia.org/

48 MONNIN, Alexandre. Du cycle de vie des données au cycle de vie des objets. In : CALDERAN, Lisette, et. al.

Le document numérique à l’heure du web de données. Séminaire Inria Carnac, 1er-5 octobre 2012. Paris : ADBS Éditions, 2012. p.225. Sciences et techniques de l’information. ISBN 978-2-84365-142-7.

49 http://data.bnf.fr/

50 POUPEAU, Gautier. Histoire(s) de notices. In : CALDERAN, Lisette, et. al. Le document numérique à l’heure du web de données. Séminaire Inria Carnac, 1er-5 octobre 2012. Paris : ADBS Éditions, 2012. p.37. Sciences et techniques de l’information. ISBN 978-2-84365-142-7.

pour les raisons sus-citées par Alexandre Monnin, et celle de « fiabilité » qui fait partie intégrante des objectifs du web sémantique. Ainsi, pour être considérées comme fiables les données n’ont pas besoin de se rattacher à des vérités objectives du monde physique, le monde virtuel du web n’étant pas une représentation du monde physique mais plutôt une construction parallèle.51