• Aucun résultat trouvé

Le modèle fondé sur la prise en compte de l’utilisateur

4.3.2 Le veilleur et le système de recherche d’information

4.3.2.2 Les principaux modèles de système de recherche d’information

4.3.2.2.6 Le modèle fondé sur la prise en compte de l’utilisateur

Ce dernier modèle de SRI que nous présentons utilise une représentation expli-cite des connaissances sur l’utilisateur appelée ‘modèle de l’utilisateur’. L’utilisation d’un modèle de l’utilisateur, permet notamment que les résultats produits par le SRI puissent être personnalisés pour un utilisateur (ou une ca-tégorie d’utilisateurs) en s’adaptant au mieux à ses connaissances, à ses préfé-rences et à son besoin. Pour pouvoir implanter un tel modèle, il est nécessaire que le concepteur du SRI sache comment percevoir l’utilisateur et selon quels critères. Ainsi pour Daniels [DAN86], il existerait deux grandes catégories de modèles de l’utilisateur :

Les modèles quantitatifs et empiriques qui se fondent sur l’étude du

com-portement externe de l’utilisateur et de ses interactions avec le SRI ;

Les modèles analytiques et cognitifs qui s’intéressent à la modélisation du

comportement interne de l’utilisateur et qui recherchent à modéliser ses connaissances (savoirs et savoir-faire) et ses processus cognitifs.

Rich [RIC99] distingue parmi ces modèles cognitifs, ceux qui prennent en compte des caractéristiques stéréotypiques (représentatives de l’ensemble des utilisateurs du SRI), persistantes (informations sur l’utilisateur qui ont une va-lidité à long terme) ou explicites (construits et adaptables par l’utilisateur lui-même). Koch [KOC99] [KOC00], quant à lui, propose de classer les modèles des utilisateurs en fonction de la connaissance qu’ils véhiculent. Trois catégories de modèles sont ainsi mises en évidence :

286 Ce problème est déjà reconnu par les analystes de l’audiovisuel qui décrivent la manière dont les médias audiovisuels provoquent selon l’expression de Porcher une « culture mosaïque » [POR76] où les éléments d’information sont certes vus et parfois même connus, mais ne constituent pas pour autant un savoir cohérent.

287 Selon Furnas [FUR86], deux méthodes permettent de circonscrire ce problème : Etablir un filtre qui ne propose sur la carte qu’un cer-tain nombre de nœuds, reliés par des liens d’un cercer-tain type et proposer une vue particulière à courte focale (dite en « Fish eye view ») de l’hypertexte, centrée sur le noeud en cours de lecture)

processus

Les modèles fondés sur les connaissances du domaine qui maintiennent la

connaissance que l’utilisateur possède sur le domaine concerné ;

Les modèles des connaissances indépendantes du domaine qui s’intéressent

aux connaissances générales ou non spécifiques au domaine, les centres d’intérêt, les acquis de l’utilisateur d’une manière globale et que nous

pour-rions caractériser « d’acquis transversaux288».

Les modèles psychologiques ou cognitifs qui font se rapportent aux

préfé-rences, aux capacités et traits de personnalité de l’utilisateur. De tels mo-dèles sont notamment utilisés dans le domaine éducatif pour représenter les styles d’apprentissage, types de raisonnement, capacités de concentra-tion ou dans le domaine de l’intelligence économique pour modéliser un dé-cideur [BOU05] par exemple.

Généralement dans les modèles fondés sur les connaissances de l’utilisateur, celles-ci sont représentées par un sous-ensemble de connaissances ‘idéales’ qu’exploite le SRI et exprimées par un modèle qui fait référence. Ce modèle peut être établi par un expert du domaine et correspond, soit à l’ensemble des concepts manipulés par le système, soit défini par ce que l’on attend de l’utilisateur ou encore par les connaissances qu’on souhaite le voir acquérir. Le modèle de l’utilisateur peut alors prendre la forme d’un ensemble de couples (item, valeur), où l’item représente une connaissance élémentaire et la valeur associée indique le degré de maîtrise que l’utilisateur a de cette connaissance. Cette valeur est généralement exprimée par un booléen, sur un domaine discret (notation sur un intervalle donné), à l’aide de valeurs nominales (par exemple novice, avancé, expert,…) ou encore à l’aide de probabilités qui expriment une croyance du système à l’égard d’une connaissance de l’utilisateur. Les profils utilisateur sont des modèles également fondés sur ces couples (items, valeurs) mais ne font pas nécessairement référence à un modèle de connaissances préé-tabli. Les items auxquels sont associées ces valeurs permettent de représenter aussi bien des connaissances du domaine, que des préférences, des capacités, des actions précédentes, c’est-à-dire qu’ils vont caractériser ‘une représentation’ des centres d’intérêt de l’utilisateur [BAL95] [CHA99]. Par exemple, le profil d’intérêt utilisé dans Letizia [LIE95] est constitué d’une liste de mots-clés qui représente les éléments pertinents pour un utilisateur. Dans le système de Bol-lacker et coll. [BOL99], le profil est constitué de multiples représentations

(ex-tractions de mots-clés, de liens ou de citations) de ce qu’est un « article

intéres-sant » aux yeux d’un utilisateur. Dans le prototype ‘SySKILL & WEBert’ de

Pazzani et coll. [PAZ96], c’est la probabilité qu’un mot-clé appartienne à un do-cument pertinent ou non-pertinent est déterminé pour chaque utilisateur. Des travaux tels que ceux présentés dans [PRE99] proposent une représenta-tion plus élaborée de l’intérêt de l’utilisateur qui s’appuie sur une hiérarchie de concepts construite à partir des pages visitées et du temps passé sur chacune d’elles. Certaines approches ajoutent une évaluation fournie explicitement par l’utilisateur auquel il est demandé de classer des pages visitées par ordre de préférence [PAZ96], la fréquence à laquelle l’utilisateur accède à la page,

288 Les acquis ou savoirs transversaux s’opposent aux savoirs spécifiques. Ce sont l’ensemble des savoirs qui permettent de traiter la com-plexité des situations rencontrées et qui sont spécifiés par les liens qui unissent l’individu au contexte dans lequel il se trouve. Situés à mi-chemin entre savoir (connaissance à caractère universel acquise par l’étude) et expérience (connaissance singulière acquise dans la pra-tique), les savoirs transversaux sont considérés comme fondateurs de compétences.

processus l’appartenance ou non aux ‘favoris’, la durée de la visite de cette page, la date, le pourcentage de liens de cette page qu’a déjà visités l’utilisateur.

Parmi les SRI intégrant un modèle (ou un profil) de l’utilisateur, plusieurs d’entre eux ont retenu notre attention :

Le système Amalthaea [MOU97] combine le jugement et la détection automa-tique des centres d’intérêt de l’utilisateur. Ce système élabore et fait évoluer le profil de l’utilisateur, constitué d’un ensemble de mots-clés pondérés aussi bien à partir des actions passées de l’utilisateur, des informations contenues dans les listes de sites sélectionnés et historisés, que d’une évaluation explicite de la part de l’utilisateur.

Dans Profildoc de Lainé-Cruzel [LAI99], le modèle de l’utilisateur prend en compte divers paramètres comme son niveau d’étude, le domaine d’application, le but de la recherche (par exemple la constitution d'une bibliographie, l’interprétation des données, etc.) et le type de recherche (pointue ou généra-liste). L’exploitation du modèle est faite par un système de filtrages successifs [BEN97] qui sélectionne les documents ‘pertinents’ à présenter à l’utilisateur. Dans la seconde adaptation du prototype Metiore, Bueno [BUE03] [KIS00a] propose de présenter, dans une thématique donnée, les articles issus d’une base bibliographique selon un ordre de pertinence qui est calculé à partir de statis-tiques bayésiennes sur des évaluations antérieures réalisées par les chercheurs d’un laboratoire (‘oui’ ce document m’intéresse, ‘non’, ‘je ne sais pas’ et ‘non éva-lué’). Avec ce système, il est également possible de découvrir les centres d’intérêts des chercheurs par l’exploration des historiques de recherche.

D’autres modèles intègrent à la fois un modèle de l’utilisateur et sont structu-rés autour d’un entrepôt de données. L’un des plus anciens que nous ayons

trouvé est le projet « Information Manifold » [KIR95] [LEV96b] développé à

AT&T, pour l’acquisition et l’intégration d’informations émanant de sources disparates. Ce SRI est conçu autour d’un modèle riche du domaine qui permet de décrire plusieurs propriétés des sources d’information, allant du domaine d’application concerné aux caractéristiques de ces sources. L’utilisateur dispose ainsi d’un environnement lui permettant de spécifier des requêtes pour extraire des informations à partir des différentes sources.

WHIPS289[WIE96] [HAM96] est un système de gestion d’entrepôts de données

utilisé comme banc d’essais. Le but de ce projet est de développer des algo-rithmes pour collecter, intégrer et maintenir des informations émanant de sources hétérogènes et autonomes. L’intérêt majeur que nous voyons dans ce système est que l’architecture du prototype est construite autour d’un ensemble de modules spécifiques interreliés permettant d’utiliser différents modèles de données pour l’utilisateur (ou ‘vues’), à la fois pour chacune des sources et pour les données de l’entrepôt.

Le projet TSIMMIS[CHA94] [ULL97] est un système d'intégration de l'infor-mation à partir de sources hétérogènes qui fournit aux utilisateurs comme pour le système WHIPS des vues intégrées de ces données. Il utilise de plus dans son architecture un 'médiateur' [WEI92] (agent uniquement informatique) qui

processus duit une requête d'un utilisateur (en langage logique) vers des sources d'infor-mations pertinentes. L'un des grands intérêts de TSIMMIS est qu'il implante un modèle de données et un langage de requête qui permettent la combinaison d'information en provenance à la fois de sources structurées et semi-structurées.

Enfin, nous terminerons par le projet InfoSleuth290 [BAY97][NOD99] qui

pré-sente l’intérêt d'implémenter un ensemble d'agents coopératifs qui découvrent, intègrent et organisent l'information en fonction des besoins d'un utilisateur au sein d'une interface unique. Cette information est recherchée à travers des sources d'information distribuées et hétérogènes aussi bien sur l’entrepôt lui-même que sur Internet. L'utilisateur peut ainsi rechercher de l'information d'une manière simple et uniforme sans forcément connaître la complexité de la structuration du système grâce à l’aide de deux agents principaux :

Un agent ‘utilisateur’ qui assiste l'utilisateur dans la formulation de ces

re-quêtes et affiche les résultats en tenant compte du domaine d'intérêt de ce-lui-ci ;

Un agent ‘ontologie’ qui décrit un réseau de concepts pour chaque domaine

d'intérêt et sert à la production d'un langage commun à l'utilisateur et au système.

Nous avons vu à travers ces différents exemples que l’implantation d’un modèle de l’utilisateur permet de mieux caractériser son besoin d’information et donc d’obtenir une pertinence système qui tend à se rapprocher de la pertinence uti-lisateur, c’est du moins l’objectif visé par les concepteurs de ces modèles. De plus, celui-ci permet un accès personnalisé à l'information et un ciblage de la recherche d’information surtout quand elle s’étend sur des sources d’informations volumineuses et hétérogènes. Sa finalité est de délivrer l’information pertinente de manière individualisée en fonction des préférences de l’utilisateur, d’adapter les résultats le plus fidèlement possible à ses at-tentes, voire idéalement, comme le souligne Zemirli et coll. [ZEM05], de les pré-céder.