• Aucun résultat trouvé

CHAPITRE III : APPROCHE ET SOLUTIONS PROPOSEES

C.2 Les réponses apportées sur la structuration des connaissances

La plupart des outils web n'imposent pas de contraintes dans la gestion de leur contenu. Les connaissances sont cachées dans le code HTML qui est un langage de présentation des données. Les balises utilisées par ce langage servent à la mise en forme des documents. De fait, le contenu est difficile à identifier. Avec ce type de langage, seul l'être humain peut retrouver et traiter les connaissances. Il existe dorénavant une approche qui structure le contenu. Ainsi, une solution est d'annoter les documents. Une annotation pose des métadonnées sur des ressources, i.e. des données sur des données pour faciliter leur repérage. Nous verrons ci-dessous qu'il existe deux types d'annotation.

L'annotation du type web social est fondée sur le taggage de documents. Le tag est un marqueur lexical que l'on associe à une ressource. L'outil de recherche va ainsi retrouver toutes les ressources (document, photo, vidéo...) associées au tag sélectionné. Un tag peut être raccordé à un thésaurus qui regroupe une liste de termes sur un domaine de connaissances. Ces termes y sont éventuellement reliés entre eux par des relations synonymiques, hiérarchiques ou associatives du type "Voir aussi". Un thésaurus est un langage contrôlé et mis à jour, par exemple, par des documentalistes. L'annotation du type web social n'autorise pas un ordinateur à inférer sur ces ressources.

Par contre, le second type d'annotation associé au web sémantique facilite l'usage des connaissances par les machines. L'initiative du web sémantique est soutenue par le W3C. Nous avons présenté une première approche du web sémantique dans le paragraphe II-2-2E.2 De l'explicite à l'explicite: le partage. Nous la complétons ici. Le web sémantique utilise plusieurs couches regroupées dans la Figure III-24. Elles sont issues pour l'essentiel de l'article fondateur sur le web sémantique de (Berners-Lee, Hendler et al. 2001).

Une adresse URI170 identifie et/ou localise les ressources.

Le langage XML propose une syntaxe pour structurer tous les types de contenu. Les ordinateurs échangent entre eux grâce à ce langage à balise. Il est neutre par rapport au contenu de l'échange.

RDF et RDFS représentent des connaissances par des triplets de la forme <sujet, prédicat, objet>. Le sujet est une ressource. Le prédicat est la propriété du sujet alors que l'objet est la valeur de la propriété. Ainsi, dans l'exemple de la Figure III-25, "Pommes de terre", A pour adventice" et "Chardon" constituent un tel triplet. Ce triplet peut s'écrire avec le langage à balise XML. Chaque concept de ce triplet peut être localisé dans une URI sachant que cet identificateur est obligatoire pour le sujet.

Ces triplets sont à la base du langage formel de description OWL171 et de SKOS172.

o OWL décrit une ontologie. Pour un domaine donné, les classes, leurs propriétés173, ainsi que la logique de description qui les représente, constituent un ensemble cohérent intitulé ontologie du domaine. De plus, OWL est capable d'instancier des classes, ce qui accroît sa puissance de

170

URI : Identifiant de Ressource Universelle

171

OWL : Ontology Web Language ; OWL est reconnu par le W3C.

172

SKOS : Simple Knowledge Organization System ; SKOS est également reconnu par le W3C Voir http://www.w3.org/TR/skos-reference/ :

173

OWL comprend deux types de propriétés : l'ObjectProperty qui exprime la relation entre deux catégories et la DataProperty qui relie une catégorie à un type de donnée.

Page 169 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

description d'une réalité. Dans le domaine de la recherche documentaire, l'objectif est d'éviter l'ambiguïté sémantique. Or, OWL a la faculté d'inférer sur les bases de connaissance, i.e. de replacer automatiquement les classes et les instances au sein de l'ontologie. Ce langage a des bases mathématiques. Pour cette raison, OWL est manipulable par un ordinateur. Sa valeur ajoutée est d'offrir des outils de comparaison des classes et des propriétés (Lacot 2005) afin de réduire notamment cette ambiguïté. Deux types de relation dominent : la relation de généralisation174 et la relation tout-partie175. Enfin, une ontologie peut faire référence, ce qui facilite les échanges entre les ordinateurs.

o SKOS est un modèle de représentation de connaissances sur le Web. SKOS n'est pas un langage formel. Il est recommandé depuis 2009 par le W3C pour décrire des thésaurus. SKOS exploite également RDF/RDFS.

SPARQL est un outil d'interrogation des éléments enregistrés de connaissance. Il est l'équivalent du langage SQL pour les bases de données.

Un système de preuves garantit la confiance de l'usager vis-à-vis des éléments de connaissance sélectionnés par l'ordinateur. Des blocs encryptés garantissent également la fiabilité des sources (Berners-Lee, Hendler et al. 2001).

Figure III-24 : le "mille-feuilles" du web sémantique d’après (Haslhofer 2009)

Le web sémantique propose des métadonnées qui vont caractériser des éléments de connaissance. Pour les retrouver facilement, les connaissances sont formalisées par des langages de description. Ces langages respectent une logique. Ils sont interprétables par des machines. Le raisonnement est rendu possible sur des connaissances ainsi

174

Relation du type : '"est un"

175

Page 170 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

formalisées. Un moteur d'inférence trouve des faits par application de règles d'inférence aux instances de l'ontologie et à l'ontologie elle-même. Il entérine aussi l'intégrité sémantique d'une ontologie. Le web sémantique accroît l'accessibilité au contenu. Cela permet une comparaison de documents, l'utilisation de plusieurs types de ressources. Il est une garantie sur la qualité et sur l'authenticité des sources d'information grâce au contrôle du contenu par le producteur. Ainsi, dans l'exemple présenté dans la Figure III-25, nous avons comparé la recherche de "la méthode de lutte biologique contre le chardon dans un champ de pommes de terre" selon les deux approches "Hypertexte" et "Web sémantique". Dans le cadre d'une modélisation hypertexte, des liens hypertextes autorisent une approche par des étapes non intuitives. Ces liens sont statiques et leur sémantique n'est pas précisée. A l'inverse, une annotation sémantique permet à l'ordinateur, grâce à une requête sémantique, d'atteindre la bonne connaissance. Ces requêtes sémantiques viennent enrichir et compléter les requêtes syntaxiques.

Thistle Painted lady Potatoe Thistle Hyperlink Hyperlnk

Hyperlink pattern

Potatoe has weed Painted lady Sub Classof Bioagressor is fought Page dcterms:subject

Semantic annotation

Thistle Painted lady Painted lady Potatoe Potatoe Thistle Hyperlink Hyperlnk

Hyperlink pattern

Potatoe has weed Painted lady Sub Classof Bioagressor is fought Page dcterms:subject

Semantic annotation

Figure III-25 : comparatif des modèles "hypertexte" et "web sémantique"

Une démarche d'annotation des documents va donc faciliter leur recherche, ce qui constitue la seconde propriété de KOFIS : la dimension sémantique de l'outil.

Par ailleurs, nous proposons que le système raisonne sur le contenu sémantique associé à l'identification de chaque agriculteur en vue de créer les communautés les plus adéquates selon une logique qui ne soit pas que de proximité géographique. Selon leurs centres d'intérêts, les utilisateurs se retrouvent grâce à un appariement de profil. Cette capacité de construction des communautés pertinentes est la troisième propriété. Que cela soit pour rechercher des pages de connaissances ou pour créer des communautés pertinentes, nous avons besoin d'un outil qui structure ces savoirs. KOFIS a donc deux composantes web [I] et [K]. De surcroît, chacun de ces deux espaces doit proposer une fonctionnalité d'annotation sémantique aux usagers.

Page 171 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

D Explicitation des cinq groupes d'utilisateurs et de leurs principaux

besoins fonctionnels

D.1 Les besoins fonctionnels des acteurs du <système de connaissance agricole> et de