• Aucun résultat trouvé

III. Les systèmes d’organisation des connaissances dans le web des données

III.I Les systèmes d’organisation des connaissances

L’organisation des connaissances est une discipline scientifique s’intéressant initiallement à :

« l’ordonnancement des sujets traités dans les documents, grâce à des plans de classement, des thésaurus, des listes de mots-clés et des systèmes d’organisation des connaissances »77. Fondée en 1989 par un groupe de chercheurs allemands réunis sous la bannière de l’Isko (International Society for Knowledge Organization), cette discipline est structurée autour de quatre axes : la théorie de l’organisation des connaissances, les systèmes d’organisation des connaissances, la représentation de l’organisation des connaissances, et les applications d’organisation des connaissances.78 Pour les besoins de ce mémoire nous nous intéresserons plus particulièrement au second axe dans sa globalité, au troisième à travers le langage Skos

74 Ibid. pp.122-125

75 ACCART, Jean-Philippe et RIVIER, Alexis. op.cit. p.119 76 AUSSENAC-GILLES, Nathalie. op.cit. p.237

77 GNOLI, Claudio. Chapitre 2 : Des métadonnées représentant quoi ?. In : EL HADI Widad Mustafa.

L’organisation des connaissances : dynamisme et stabilité. Paris : Lavoisier, 2012. p.51. Traité des sciences et techniques de l’information. ISBN 978-2-7462-3227-3

78 Ibid. p.52

et au quatrième pour ce qui concerne le rôle des systèmes d’organisation des connaissances dans le contexte de la recherche d’information dans le web des données.

Les systèmes d’organisation des connaissances (souvent abrégés « Soc » ou « KOS » pour

« Knowledge Organization Systems ») servent à organiser l’information dans des domaines plus ou moins larges en formalisant l’expression des constituantes du domaine en question de façon à ce qu’elles puissent être efficacement comprises et réutilisées par son audience cible.79 Une autre caractéristique des systèmes d’organisation des connaissances semble être la présence d’une organisation de ses composantes de différentes natures : terminologique, sémantique80 ou encore hiérarchique, associative, etc.81 Toutefois, contrairement aux points précédents, celui-ci semble ne pas faire l’unanimité étant donné que par exemple Manuel Zacklad considère que les Soc ne possèdent pas forcément de règles d’association explicites.82 Néanmoins cette position peut se comprendre par le fait que cet auteur adopte une conception large des systèmes d’organisation des connaissances qu’il divise en six catégories : les classifications bibliothéconomiques, les langages documentaires et les thésaurus, les ontologies formelles et le web sémantique, les approches multidimensionnelles, les annuaires de ressources internet et les folksonomies, et enfin, les index automatiques des moteurs de recherche83. Il est d’ailleurs intéressant de noter que la typologie de Manuel Zacklad établit une distinction entre « les classifications épistémiques universelles de la bibliothéconomie et les approches à facettes universelles » et « les langages documentaires et les thésaurus » alors même que les classifications sont généralement considérées comme un type de langage documentaire au même titre que les

79 MASTORA, Anna. et. al. SKOS Concepts and Natural Language Concepts: an Analysis of Latent Relationships in KOSs, Journal of Information Science. 2017/4, Vol.43, p.4. Également disponible en ligne à l’adresse : https://www.researchgate.net/publication/303322229_SKOS_Concepts_and_Natural_Language_Concepts_

an_Analysis_of_Latent_Relationships_in_KOSs

« KOSs are meant to organize information, either for a particular domain or with a broader coverage, serving, in any case and in principle, as a convention for expressing an area of interest in a way that its constituents are effectively communicated towards and among the targeted audience. »

80 ISAAC, Antoine. Entre thésaurus et ontologies : une affaire d’interopérabilité et d’alignement, Documentaliste – Sciences de l’Information. 2011/4, Vol.48, p.49. Également disponible en ligne à l’adresse : https://www.cairn.info/revue-documentaliste-sciences-de-l-information-2011-4-page-42.htm

81 MASTORA, Anna. et. al. op. cit. p.4

82 ZACKLAD, Manuel. Évaluation des systèmes d'organisation des connaissances, Les Cahiers du numérique.

2010/3, Vol.6, p.135. Également disponible en ligne à l’adresse : https://www.cairn.info/revue-les-cahiers-du-numerique-2010-3-page-133.htm

83 Ibid. pp.136-145.

listes de vedettes-matière et les thésaurus.84 Cette distinction serait due au fait que les classifications portent sur les sujets des documents tandis que les thésaurus représentent des concepts85 ; leur objet étant différent cela donne lieu à deux catégories de systèmes d’organisation des connaissances différentes. Concernant les autres catégories, les ontologies dites « formelles » renvoient à des modèles de représentation de concepts permettant leur manipulation par des machines86 ; cependant cette définition vague et l’essor des ontologies permis par celui du web sémantique font que ce terme est souvent utilisé de façon abusive pour faire référence à toute classification partageable sur le web grâce aux formats XML et RDF87 auxquels nous pouvons également ajouter OWL, trois standards du web sémantique promus par le W3C. Les approches multidimensionnelles regroupent les ontologies dites

« sémiotiques », qui sont des schémas de classification regroupant des expressions contextualisées dans un cadre transactionnel donné88, et les approches à facettes locales. Ces deux outils s’inscrivent dans la logique du web « socio sémantique » visant à aider l’usager dans sa recherche d’information via des activités communicationnelles de coopération à plus ou moins grande échelle, par opposition au web sémantique « formel » proposé par Tim Berners-Lee, c’est-à-dire orienté vers l’exploitation automatique du web par les machines.89 Cette vision axée sur la collaboration des usagers se retrouve également dans la cinquième catégorie de Soc qui réunit les annuaires de ressources internet collaboratifs et les folksonomies. Enfin, la sixième et dernière catégorie de Soc représentée dans la typologie de Manuel Zacklad concerne les index automatiques des moteurs de recherche dont le fonctionnement n’est pas sans rappeler celui des systèmes de recherche d’information abordés en première partie de ce mémoire.

Rappelons tout de même qu’il n’existe pas de liste standardisée des différents types de systèmes d’organisation des connaissances existants et qu’en raison de leur définition très

84 FEYLER, François. Vocabulaires contrôlés. Savoirs CDI, [en ligne]. Avril 2009. [Consulté le 05 juin 2018].

Disponible à l’adresse : https://www.reseau-canope.fr/savoirscdi/societe-de-linformation/tic-et-documentation/veille-technologique/formats-normes-et-standards/vocabulaires-controles.html

85 ZACKLAD, Manuel. op. cit. pp.136-137

86 MENON, Bruno. Les langages documentaires. Un panorama, quelques remarques critiques et un essai de bilan, Documentaliste-Sciences de l'Information. 2007(b)/1, Vol.44, p.26. Également disponible en ligne à l’adresse : https://www.cairn.info/revue-documentaliste-sciences-de-l-information-2007-1-page-18.htm 87 ZACKLAD, Manuel. op. cit. p.140

88 ZACKLAD, Manuel. Introduction aux ontologies sémiotiques dans le Web Socio Sémantique. 2005. p.4 et 8.

Disponible en ligne à l’adresse :

https://archivesic.ccsd.cnrs.fr/file/index/docid/62630/filename/sic_00001479.pdf 89 Ibid. pp.2-3 et ZACKLAD, Manuel. 2010. op. cit. p.141

large de nombreux outils peuvent être considérés comme des Soc. Par conséquent les typologies des systèmes d’organisation des connaissances semblent dépendre de leur contexte de création et d’utilisation. Ainsi la typologie proposée par Manuel Zacklad est fortement marquée par le contexte du web socio-sémantique faisant parti de ses objets de recherche, tandis que par exemple celle de la CLIR (Council on Library and Information Resources) est axée bibliothèque. Elle comprend ainsi trois grandes catégories elles-mêmes divisées en sous-catégories : les listes de termes réunissant les fichiers d’autorités, les glossaires, les dictionnaires et les index géographiques, les classifications et catégories qui comprennent les listes de vedettes-matière, les schémas de classification et de catégorisation ainsi que les taxonomies, et enfin les listes relationnelles, c’est-à-dire les thésaurus, les réseaux sémantiques et les ontologies.90 Toutefois si nous comparons cette typologie à celle de Manuel Zacklad nous pouvons remarquer que bien que le nombre et les intitulés des catégories diffèrent une partie de leur contenu est semblable ; nous pouvons donc noter la présence des classifications, des thésaurus et des ontologies dans les deux typologies. Si les classifications et les thésaurus semblent faire unanimement partis des Soc, le cas des ontologies formelles, souvent appelées simplement « ontologies », fait davantage débat, ainsi certains auteurs, comme Antoine Isaac, considèrent qu’il ne s’agit pas de systèmes d’organisation des connaissances.91 Par conséquent la prochaine sous-partie réalisera un focus sur les langages documentaires en tant que systèmes d’organisation des connaissances.