• Aucun résultat trouvé

L'informatisation de Libération date de 1994 et la mutation numérique du journal commence en 1995 avec l'ouverture du site. En France, il fait partie des premiers sites web de presse créés avec celui du Monde et des Echos. Toute la gestion du contenu du journal fonctionne avec deux systèmes principaux : Méthode (système éditorial EidosMédia assurant le

processus de la production, workflow, des journalistes) et Quai (le back-office du site permettant la relation avec les internautes).

Dans un premier temps, le site web reprenait tout simplement les articles du support papier.

Au fur et à mesure, le site s'est différencié du journal papier, il est devenu complémentaire tout en assurant la fonction d'archives des articles papier et web. Les abonnés du journal ont aujourd’hui accès à tous les articles publiés instantanément après la publication et les non-abonnés peuvent consulter les articles dans les 24 heures à compter de la publication. En moyenne, parmi 300 nouveaux objets quotidiens sur le site, il y a 100 articles papier, 50 articles web, 100 dépêches et 50 objets média1. Les articles web ne relèvent pas du même genre éditorial que ceux du papier ; il s’agit avant tout d’enquêtes rapides. Les journalistes du web ne sont pas spécialisés dans tel ou tel domaine, comme c’est le cas des journalistes papier.

Les actualités du jour sur le site sont réparties en 12 rubriques2 principales qui correspondent à celles du support papier. Quant à la recherche d’une information précise, on s’aperçoit assez rapidement que le lecteur ne peut pas aisément naviguer et chercher l’article de la base de données en fonction des thèmes ou des sujets.

Recherche simple : tri des résultats par pertinence

L'utilisateur du site, après avoir posé sa requête, peut trier les résultats par date ou « par pertinence », mais ce choix n'est pas systématique. Le principe du classement des résultats est celui de l'occurrence, c'est-à-dire d’un critère statistique (combien de fois un mot dans la requête apparaît-il dans le document), et sans traitement linguistique (singulier/pluriel, féminin/masculin, synonymes, fautes d’orthographe).

Le tri des résultats « par pertinence » est désactivé quand les requêtes sont trop générales et remontent trop de résultats, - ce « qui coûte cher en ressources [informatiques] » (selon le responsable informatique) -, c’est-à-dire que la pondération3 de l’article par rapport à l’ensemble des articles n’est plus effectuée. En effet, une telle opération nécessite le traitement d'une grande quantité d'articles et cela pose un problème de gestion du serveur hébergé à l'extérieur (PilotSystem).

Alors que c'est surtout à ce moment-là - quand le sujet est très large et les résultats nombreux - que l'utilisateur a besoin d'être aidé et que l'option par pertinence s'avère nécessaire.

L'utilisateur est tout simplement noyé dans des centaines, voire des milliers d'articles. Il n'a pas la possibilité d'affiner sa recherche.

1 Information recueillie auprès de la responsable du Service de la documentation de Libération.

2A la Une, Edito, Politiques, Société, Monde, Economie, Médias, Vous, Sport, Terre, Sciences, Désintox

3 Certains champs (titres, sous-titres) ont plus de poids que le contenu de l'article. La pondération de l'article (calcul du poids d’un article reposant sur l’occurrence) est déterminée en fonction de l'algorithme statistique du moteur de recherche.

Recherche avancée

Dans le cas où l'utilisateur opte pour la recherche avancée, il est également très limité par rapport à la définition du sujet. La recherche avancée porte uniquement sur les trois critères:

 période (aujourd'hui / depuis 6 mois / depuis 1994 / à une date précise)

 source (journal papier / site web / tout)

 rubrique (25 au total) : choix des rubriques « papier » et « web » confondues

La possibilité d'affiner la recherche par sujet (ou mot-clé) n'est pas proposée sur le site : elle n'est possible ni via un formulaire de recherche, ni via la navigation par mots-clés.

La recherche par sujet peut être aujourd’hui effectuée grâce aux outils linguistiques, appelés vocabulaires contrôlés, qui permettent la structuration de l’information ainsi que la gestion de l’information.

Je rappelle rapidement dans la partie suivante les origines de la création des bases de données, parallèlement à la constitution des bases de connaissances.

2 Des classifications du savoir à la gestion des bases de connaissances

Les grandes classifications émergent au XIXe siècle et ont connu un grand essor surtout dans la première moitié du XXe siècle. La raison de leur développement est liée au besoin de classer des grandes bibliothèques pour organiser le savoir et retrouver les documents. Ce besoin de classer le savoir existe depuis l’Antiquité et on doit les premières classifications bibliographiques durables à Francis Bacon qui classe le savoir en trois grands domaines : l’histoire, la poésie et les arts, la philosophie et les sciences.

Les limites des grandes classifications

Les classifications d’aujourd’hui sont issues de quelques grands modèles. Avec l’accroissement et le développement des bibliothèques, les besoins des bibliothécaires aux USA aboutissent aux importantes classifications comme la classification Dewey ou la CDU.

Les grandes classifications, en répertoriant et en classant les domaines du savoir, ont certes permis de définir des sujets traités dans la représentation des connaissances de l’homme, mais elles se limitent à classer le savoir par grands domaines universels seulement. L’apport des premières classifications est donc avant tout dans cette première organisation des connaissances, dans le classement par domaines qui correspondent aux thèmes ou aux sujets d’un document. Ces classifications étaient et restent destinées avant tout à l’usage des bibliothécaires et s’avèrent insuffisantes dans l’organisation des bases de connaissances des autres secteurs.