C Les réponses apportées - Système informatique de capitalisation de connaissances et d'innovat

Deux demandes fonctionnelles importantes émergent. La première demande s'exprime autant autour de la capitalisation de la connaissance que sur la résolution de problèmes. La seconde requête contient la question de l'organisation et de la structuration des connaissances explicites et tacites en vue de les mobiliser efficacement. Nous savons que la théorie C-K répond à la première demande. Nous allons voir comment l'usage du web sémantique répond à la seconde exigence.

C.1 La dimension capitalisation et innovation

Nous revenons sur la théorie C-K de la conception (Hatchuel et Weil 2002) pour mieux comprendre ses conséquences possibles en terme de construction d'une architecture informatique. Cette méthode a été présentée dans le paragraphe II-3-2C . Elle reflète le raisonnement humain face à un problème. En effet, afin d’avancer dans sa résolution, nous nous appuyons sur des connaissances acquises pour les différents termes de ce problème. La recherche de solutions se situe dans l’espace de concept et les connaissances utilisées pour résoudre le problème appartiennent à l’espace de connaissances. Lorsque le problème est résolu, la solution est validée en tant que connaissance. Par convention, nous appelons [I] l'espace de concept, que nous renommons espace d'innovation, et [K] l'espace de connaissances. Dans la Figure III-23, nous proposons de partir d'un problème concret pour expliciter les différentes opérations entre [I] et [K].

L'objectif est de traiter le problème de la présence de chardons dans un champ de pommes de terre selon les principes de l'agriculture biologique.

• La disjonction K-C : elle marque le début du raisonnement de conception. Un problème donné -ici la présence de chardons dans un champ de pommes de terre- est transformé en concept : un champ de pommes de terre sans chardon. L'objet "champ de pommes de terre" a donc une propriété non logique "l'absence de chardon".

• La départition : si le concept initial est sans solution apparente, la départition mobilise des connaissances pour établir un second concept sur lequel des raisonnements sont possibles. La connaissance des types de lutte contre les bioagresseurs en agriculture biologique nous conduit à un concept plus large : l'élimination des chardons en agriculture biologique, voire l'élimination des adventices en agriculture biologique. Quatre types de lutte y sont mobilisés : la lutte biologique, la lutte mécanique, la lutte culturale et la lutte génétique.

Page 167 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

Espace d’innovation Espace des connaissances

Départition

Lutte contre les bioagresseurs en agriculture biologique K2 Lutte génétique Lutte biologique ^Lutte mécanique Partition restrictive

x

K1 Disjonction Conduite de la pomme de terre en AB Lutte culturale Conjonction Test Evaluation Nouvelle connaissance ? Elever la chenille de la

belle-dame Proposition 1 Partition expansive

?

Ecimage L’élimination des chardons en agriculture biologique

Créer les conditions pour que les auxiliaires se développent La pomme de terre conduite en AB sans chardon

Mise à jour connaissance ? Les auxiliaires

du chardon

Figure III-23 : exemple de la lutte contre le chardon illustrant les deux espaces [I]/[K]

• La partition comprend deux opérateurs : la partition restrictive et la partition expansive. La partition restrictive restreint l'espace des possibles. Ainsi, aucune variété de pomme de terre n'est capable d'empêcher l'apparition du chardon. La solution de la lutte génétique est éliminée. La partition expansive propose de nouvelles solutions. Des propriétés sont rajoutées au concept. Ce processus est créatif mais les nouvelles propositions, pour être crédibles, sont construites à partir de connaissances. Ces propositions sont parfois très éloignées du sujet traité. L'invention ou la surprise peuvent alors surgir du raisonnement. Ce processus aboutit à une ou plusieurs propositions. Dans notre exemple, la connaissance des auxiliaires du chardon rend possible une proposition originale rajoutée à la lutte biologique : l'élevage de la chenille de la belle-dame qui se nourrit de chardon.

• La conjonction C-K arrête le raisonnement de conception. Si la proposition finale a été évaluée positivement, elle transite de l'espace d'innovation vers celui des connaissances. Elle devient une connaissance. L'expansibilité s'applique également aux connaissances. Dans l'exemple présenté, les résultats obtenus devront être évalués pour devenir une connaissance.

Ces quatre opérations ne sont pas automatiques. Leur mise en œuvre est humaine. Mais l'un des mérites de la théorie C-K est de spécifier le raisonnement de conception dans les deux espaces [I] et [K]. KOFIS doit tracer ce raisonnement pour en exploiter toute la richesse. KOFIS a donc deux composantes web : une composante d'échange [I] où les quatre opérateurs de la théorie C-K s'inscrivent et une composante de capitalisation de la connaissance [K]. La première propriété de l'outil est sa capacité à aider le

Page 168 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

C.2 Les réponses apportées sur la structuration des connaissances

La plupart des outils web n'imposent pas de contraintes dans la gestion de leur contenu. Les connaissances sont cachées dans le code HTML qui est un langage de présentation des données. Les balises utilisées par ce langage servent à la mise en forme des documents. De fait, le contenu est difficile à identifier. Avec ce type de langage, seul l'être humain peut retrouver et traiter les connaissances. Il existe dorénavant une approche qui structure le contenu. Ainsi, une solution est d'annoter les documents. Une annotation pose des métadonnées sur des ressources, i.e. des données sur des données pour faciliter leur repérage. Nous verrons ci-dessous qu'il existe deux types d'annotation.

L'annotation du type web social est fondée sur le taggage de documents. Le tag est un marqueur lexical que l'on associe à une ressource. L'outil de recherche va ainsi retrouver toutes les ressources (document, photo, vidéo...) associées au tag sélectionné. Un tag peut être raccordé à un thésaurus qui regroupe une liste de termes sur un domaine de connaissances. Ces termes y sont éventuellement reliés entre eux par des relations synonymiques, hiérarchiques ou associatives du type "Voir aussi". Un thésaurus est un langage contrôlé et mis à jour, par exemple, par des documentalistes. L'annotation du type web social n'autorise pas un ordinateur à inférer sur ces ressources.

Par contre, le second type d'annotation associé au web sémantique facilite l'usage des connaissances par les machines. L'initiative du web sémantique est soutenue par le W3C. Nous avons présenté une première approche du web sémantique dans le paragraphe II-2-2E.2 De l'explicite à l'explicite: le partage. Nous la complétons ici. Le web sémantique utilise plusieurs couches regroupées dans la Figure III-24. Elles sont issues pour l'essentiel de l'article fondateur sur le web sémantique de (Berners-Lee, Hendler et al. 2001).

• Une adresse URI¹⁷⁰ identifie et/ou localise les ressources.

• Le langage XML propose une syntaxe pour structurer tous les types de contenu. Les ordinateurs échangent entre eux grâce à ce langage à balise. Il est neutre par rapport au contenu de l'échange.

• RDF et RDFS représentent des connaissances par des triplets de la forme <sujet, prédicat, objet>. Le sujet est une ressource. Le prédicat est la propriété du sujet alors que l'objet est la valeur de la propriété. Ainsi, dans l'exemple de la Figure III-25, "Pommes de terre", A pour adventice" et "Chardon" constituent un tel triplet. Ce triplet peut s'écrire avec le langage à balise XML. Chaque concept de ce triplet peut être localisé dans une URI sachant que cet identificateur est obligatoire pour le sujet.

• Ces triplets sont à la base du langage formel de description OWL¹⁷¹ et de SKOS¹⁷².

o OWL décrit une ontologie. Pour un domaine donné, les classes, leurs propriétés¹⁷³, ainsi que la logique de description qui les représente, constituent un ensemble cohérent intitulé ontologie du domaine. De plus, OWL est capable d'instancier des classes, ce qui accroît sa puissance de

170

URI : Identifiant de Ressource Universelle 171

OWL : Ontology Web Language ; OWL est reconnu par le W3C. 172

SKOS : Simple Knowledge Organization System ; SKOS est également reconnu par le W3C Voir http://www.w3.org/TR/skos-reference/ :

173

OWL comprend deux types de propriétés : l'ObjectProperty qui exprime la relation entre deux catégories et la DataProperty qui relie une catégorie à un type de donnée.

Page 169 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

description d'une réalité. Dans le domaine de la recherche documentaire, l'objectif est d'éviter l'ambiguïté sémantique. Or, OWL a la faculté d'inférer sur les bases de connaissance, i.e. de replacer automatiquement les classes et les instances au sein de l'ontologie. Ce langage a des bases mathématiques. Pour cette raison, OWL est manipulable par un ordinateur. Sa valeur ajoutée est d'offrir des outils de comparaison des classes et des propriétés (Lacot 2005) afin de réduire notamment cette ambiguïté. Deux types de relation dominent : la relation de généralisation¹⁷⁴ et la relation tout-partie¹⁷⁵. Enfin, une ontologie peut faire référence, ce qui facilite les échanges entre les ordinateurs.

o SKOS est un modèle de représentation de connaissances sur le Web. SKOS n'est pas un langage formel. Il est recommandé depuis 2009 par le W3C pour décrire des thésaurus. SKOS exploite également RDF/RDFS.

• SPARQL est un outil d'interrogation des éléments enregistrés de connaissance. Il est l'équivalent du langage SQL pour les bases de données.

• Un système de preuves garantit la confiance de l'usager vis-à-vis des éléments de connaissance sélectionnés par l'ordinateur. Des blocs encryptés garantissent également la fiabilité des sources (Berners-Lee, Hendler et al. 2001).

Figure III-24 : le "mille-feuilles" du web sémantique d’après (Haslhofer 2009)

Le web sémantique propose des métadonnées qui vont caractériser des éléments de connaissance. Pour les retrouver facilement, les connaissances sont formalisées par des langages de description. Ces langages respectent une logique. Ils sont interprétables par des machines. Le raisonnement est rendu possible sur des connaissances ainsi

174

Relation du type : '"est un" 175

Page 170 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

formalisées. Un moteur d'inférence trouve des faits par application de règles d'inférence aux instances de l'ontologie et à l'ontologie elle-même. Il entérine aussi l'intégrité sémantique d'une ontologie. Le web sémantique accroît l'accessibilité au contenu. Cela permet une comparaison de documents, l'utilisation de plusieurs types de ressources. Il est une garantie sur la qualité et sur l'authenticité des sources d'information grâce au contrôle du contenu par le producteur. Ainsi, dans l'exemple présenté dans la Figure III-25, nous avons comparé la recherche de "la méthode de lutte biologique contre le chardon dans un champ de pommes de terre" selon les deux approches "Hypertexte" et "Web sémantique". Dans le cadre d'une modélisation hypertexte, des liens hypertextes autorisent une approche par des étapes non intuitives. Ces liens sont statiques et leur sémantique n'est pas précisée. A l'inverse, une annotation sémantique permet à l'ordinateur, grâce à une requête sémantique, d'atteindre la bonne connaissance. Ces requêtes sémantiques viennent enrichir et compléter les requêtes syntaxiques.

Thistle Painted lady Potatoe Thistle Hyperlink Hyperlnk Hyperlink pattern Potatoe has weed Painted lady Sub Classof Bioagressor is fought Page dcterms:subject Semantic annotation Thistle Painted lady Painted lady Potatoe Potatoe Thistle Hyperlink Hyperlnk Hyperlink pattern Potatoe has weed Painted lady Sub Classof Bioagressor is fought Page dcterms:subject Semantic annotation

Figure III-25 : comparatif des modèles "hypertexte" et "web sémantique"

Une démarche d'annotation des documents va donc faciliter leur recherche, ce qui constitue la seconde propriété de KOFIS : la dimension sémantique de l'outil.

Par ailleurs, nous proposons que le système raisonne sur le contenu sémantique associé à l'identification de chaque agriculteur en vue de créer les communautés les plus adéquates selon une logique qui ne soit pas que de proximité géographique. Selon leurs centres d'intérêts, les utilisateurs se retrouvent grâce à un appariement de profil. Cette

capacité de construction des communautés pertinentes est la troisième propriété.

Que cela soit pour rechercher des pages de connaissances ou pour créer des communautés pertinentes, nous avons besoin d'un outil qui structure ces savoirs. KOFIS a donc deux composantes web [I] et [K]. De surcroît, chacun de ces deux espaces doit proposer une fonctionnalité d'annotation sémantique aux usagers.

Page 171 sur 248 Système informatique de capitalisation de connaissances et d’innovation pour la conception et le

pilotage de systèmes de culture durables

D Explicitation des cinq groupes d'utilisateurs et de leurs principaux

Dans le document Système informatique de capitalisation de connaissances et d'innovation pour la conception et le pilotage de systèmes de culture durables (Page 167-172)