• Aucun résultat trouvé

2 Usages des mots-clés pour la recherche d’information sur Internet .3

2.2 Aide à la recherche et à la navigation

« Les méthodes d’aide à la navigation reposent sur un certain nombre d’éléments pouvant guider l’utilisateur, comme des termes liés provenant d’un thésaurus ou extraits automatiquement des textes, des catégories prédéfinies, des documents proches de celui qui est regardé, la visualisation d’éléments importants ou petits résumés.

L’utilisation des moteurs de recherche sur les documents en plein texte a conduit à travailler sur l’interaction automatique entre utilisateur et système, avec propositions d’expansion ou d’affinement de requêtes, procédés visant à résoudre le problème de vocabulaire. » ([22], Grivel, chap.5).

Nous allons maintenant voir quelles sont les aides à l’utilisateur les plus fréquentes sur les sites Web.

2.2.1 Filtrage des résultats par catégories

Le filtrage consiste à affiner les résultats d’une recherche par mot-clé, lorsqu’ils sont dispatchés dans des catégories par facettes, en sélectionnant une ou plusieurs de ces catégories. Cette utilisation est particulièrement développée dans le commerce électronique.

La difficulté porte surtout sur :

- le choix et l’identification des facettes, qui doivent être caractéristiques des unités documentaires de la collection,

- la création d’une hiérarchie ou d’une liste de valeurs pour chaque facette, le nombre et l’ordre d’affichage,

- la classification des éléments de la collection dans les facettes ([22], Grivel, chap.5).

Un document peut être classé dans plusieurs facettes, contrairement à d’autres langages contrôlés.

Le design sur le site a un impact majeur sur l’utilisation et les performances des sélections proposées. Les consignes pour l’utilisation des facettes sont :

- de les présenter dans un panneau latéral à gauche de l’écran, à côté de la liste des résultats,

- de les nommer de façon intuitive et univoque (la longueur des noms des catégories a également une importance car ils risquent d’être tronqués sur le site pour ne pas avoir une colonne trop large),

- de ne présenter que les plus importantes si elles sont nombreuses, avec possibilité de cliquer pour voir les catégories suivantes,

- d’avoir la possibilité de sélectionner une ou plusieurs valeurs et de les croiser entre elles.

- de supprimer dans la liste la catégorie qui a été sélectionnée et de l’afficher dans le fil d’Ariane.

Evaluer la qualité d’un système de facette est difficile. On regarde en général si tous les éléments du fonds entrent bien dans les catégories définies et le nombre de clics pour atteindre un élément. On peut également suivre leur utilisation à partir des traces des utilisateurs sur le site.

Des études montrent que l’on retrouve plus de documents pertinents sur un temps fixe et que l’on consulte moins de documents non pertinents en utilisant les facettes ([22], Grivel, chap.5), ([23], Hearst), ([24], Hearst).

L’idéal serait de pouvoir activer des filtres différents selon l’intérêt de l’utilisateur.

Les filtres rencontrés le plus souvent utilisent des tris par concepts (discipline, fonctionnalité,

…), par date ou par entités nommées.

2.2.2 Extension de requête par suggestion cliquable

L’indexation des articles permet d’afficher, en complément des résultats de requête, des termes auxquels l’internaute ne pense pas spontanément, qui peuvent l’intéresser et lui permettre de relancer sa recherche.

L’utilisation de listes de synonymes ou de parenté directe permet de faire des suggestions pertinentes de termes (voir aussi…) à partir des mots saisis dans le moteur de recherche.

En enregistrant les historiques de requête rattachés à un article, on peut également donner des propositions telles que « les personnes qui sont allées voir cet article ont également vu ou recherché… ».

Pour les tags, on affiche souvent les mots les plus utilisés mais on peut également faire ressortir, par exemple, les derniers mots entrés (les plus récents).

Grâce aux métadonnées, on peut associer un document contenant une liste de mots-clés aux autres documents partageant les mêmes mots-clés. Ces derniers peuvent apparaître en suggestion pour l’utilisateur.

Les métadonnées permettent également de faire des propositions sur des documents liés tels que fiche bibliographique, autres articles du même auteur ou commentaires sur l’article.

2.2.3 Accès à des langages contrôlés

Comme nous l’avons mentionné page 21, les thésaurus sont les langages documentaires les plus utilisés sur le Web.

« Le thésaurus a été largement utilisé à la recherche d’information en miroir du thésaurus à l’indexation : les documents indexés avec un thésaurus étaient utilisés avec le même thésaurus à la recherche. » ([19], Dalbin).

Avec l’expansion de la recherche en texte intégral et du traitement automatique de l’indexation, les choses ont évolué. De plus, les internautes ne veulent plus perdre de temps à chercher des mots dans une liste complexe.

Associés aux moteurs de recherche, les langages contrôlés sont maintenant utilisés de manière transparente plutôt que mis à disposition des internautes. On peut ainsi associer automatiquement à la requête les synonymes ou termes définis comme équivalents. On peut également proposer à l’internaute d’élargir ou de restreindre sa requête en prenant en

compte termes génériques ou spécifiques. Ceci permet d’améliorer les résultats de recherche sans demander d’efforts à l’utilisateur.

Les classifications peuvent aussi être utilisées sur le Web pour la navigation. Elles apportent alors une possibilité agréable de parcourir la collection. L’inconvénient est que la structure est figée et ne donne qu’une seule possibilité de parcours.

Nous venons de voir comment l’indexation peut améliorer la recherche de l’internaute lorsqu’il est sur un site Web. Dans le prochain sous-chapitre, nous montrons que les mots-clés doivent aussi permettre d’amener l’utilisateur sur le site.