• Aucun résultat trouvé

- La recherche d’information : une activité technique

Dans mes premières publications, la recherche d’information est entendue comme une activité dont la finalité est de mettre en regard une information et un utilisateur. Cette conception selon laquelle cette activité donne l’occasion à un utilisateur d’accéder à une information (un document, une partie de document, des données) consignée sur un support, information qui va lui permettre de mettre à jour ses connaissances ou de réaliser une tâche, place comme objectif premier l’appariement d’une requête avec des données.En collaboration avec Maria-Caterina Manes-Gallo, j’écrivais ainsi en 2003 :

57

« La recherche d'information est une activité dont la finalité est de mettre en regard une information et un utilisateur. C'est une activité par laquelle un utilisateur accède à une information (un document, une partie de document, des données) consignée sur un support, information qui va lui permettre de mettre à jour ses connaissances ou de réaliser une tâche. »78

C’est ce type d’approche qui a guidé mon travail de doctorat79, dans lequel j’ai appréhendé la recherche d'information dans des documents techniques volumineux, sous l’angle restrictif de l’interrogation de systèmes automatisés de recherche d’information dans des guides d’utilisation ou autres manuels techniques. Il me paraissait alors évident que cette activité d’interrogation consistait en un appariement entre des requêtes formulées par des utilisateurs et des données représentées et consignées dans des bases informatiques. Tout l’enjeu de cette activité m’apparaissait alors clairement comme d’une part la question de la formulation des requêtes, et d’autre part la question de la représentation des informations. Cette approche, développée au sein du CRISS puis de l’axe Cristal du GRESEC, supposait alors un recours à la psychologie cognitive pour appréhender les utilisateurs (attentes, formulation de requêtes, comportements, stratégies,..) et à la linguistique automatique pour l’indexation et la représentation des informations. Toutefois, l’information était définie, dans mes travaux, comme une construction :

« L’information est construite par l’utilisateur. C’est l’utilisateur qui donne du sens au texte et le fait devenir information ».80

Cette définition me permettait de placer l’usager au cœur de l’activité de recherche d’information.

78 Paganelli Céline et Maria-Caterina Manes-Gallo (2003). La représentation des connaissances entre intelligence artificielle et psychologie cognitive, Les enjeux de l’information et de la communication, Gresec , 2003.http://www.u-grenoble3.fr/les_enjeux. 1

79 Paganelli Céline (1997) La recherche d'information dans des bases de documents techniques en texte

intégral. Étude de l'activité des utilisateurs. Thèse de doctorat en Sciences de l’Information et de la Communication, sous la direction de Jacques Rouault, Université Stendhal, Grenoble.1

58

- La recherche d’information : une approche pluri-disciplinaire

Cette conception se retrouve également dans l’ouvrage que j’ai dirigé en 2002 aux éditions Hermès Sciences Publications81. A ce moment-là, il m’a semblé opportun d’appréhender l'interaction homme-machine pour la recherche d'information du point de vue de différentes disciplines : les sciences de l'information et de la communication, la linguistique, la psychologie cognitive et l’informatique. Comme je l’écrivais en introduction de cet ouvrage :

« Ce volume, qui prend place au sein du traité des sciences et des techniques de l’information, sera l’occasion de montrer que l’interaction homme-machine dans le cadre d’une recherche d’information représente un enjeu et un thème de recherche privilégié par différentes disciplines que sont les sciences de l’information, la linguistique, la psychologie cognitive ou l’informatique »82.

Plusieurs présupposés ont conduit, à l’époque, à l’organisation intellectuelle de cet ouvrage :

• L’activité de recherche d’information s’étend et s’élargit.

En premier lieu, la conception d’une recherche d’information spécialisée menée uniquement par des utilisateurs avertis, conception qui a longtemps dominé les recherches sur le sujet, est dépassée. En effet, la recherche d'information n'est plus réservée à un groupe d'utilisateurs experts mais concerne un public beaucoup plus large : aux chercheurs et aux professionnels de l'information, spécialistes depuis longtemps de cette activité, sont venus se joindre des ingénieurs, techniciens ou simples citoyens. Ainsi, l'activité de recherche d'information se diversifie et elle peut être opérative, de loisirs ou de type résolution de problèmes.

Parallèlement, la recherche d'information s’étend dans les activités qui la composent. Considérée majoritairement dans sa dimension interrogation de ressources, elle tend à n'être plus seulement une activité de collecte d'information mais également de traitement, d'annotation, d'évaluation et de gestion des données recueillies.

81 Paganelli Céline (sous la direction de) (2002). Interaction homme-machine et recherche d’information, Paris : Hermès Sciences Publications, 2002, 334p.1

59

Enfin, les attentes en matière d'interfaces de recherche d'information sont de plus en plus exigeantes. Les usagers, devenus familiers des outils disponibles sur le web, demandent à la fois un outil simple et performant en termes de rapidité et de fiabilité et de fonctionnalités allant au-delà du recueil de l'information.

• C’est le recours à différentes disciplines qui permet de cerner dans sa globalité l’activité de recherche d’information, à la fois dans un objectif d’établissement de connaissances stabilisées mais également avec une visée plus applicative.

Il me paraissait donc à l’époque nécessaire de s'interroger sur les interfaces de recherche d'information du point de vue informatique (développement de fonctionnalités), sous l’angle de la psychologie cognitive (connaissance des utilisateurs, de leurs attentes et comportement en fonction de leurs caractéristiques et des tâches qu’ils ont à mener), de la linguistique (traitement automatique de textes) et enfin du point de vue des sciences de l’information (représentation et caractérisation des unités d’information, lien entre usages et traitements).

Dix ans après, l’intérêt de cette approche pluridisciplinaire, que j’évoquais en introduction de l’ouvrage publié aux Editions Hermès Science Publications, demeure puisqu’elle permet une appréhension globale de l’activité de recherche d’information, la mise en évidence des dimensions sociales et techniques qui la structurent, et, plus largement, l’affirmation d’intérêts partagés entre les sciences humaines et sociales et les sciences et techniques pour cette activité.

Toutefois, l’inconvénient de ce type d’approche est inévitablement le risque de juxtaposition de connaissances sans que l’interaction entre les différentes disciplines et leurs apports mutuels n’apparaissent clairement. Par ailleurs, la spécificité d’une approche en sciences de l’information et de la communication n’est pas mise en évidence et la discipline apparaît alors uniquement comme un carrefour, un lieu de rencontres d’autres disciplines autour de préoccupations scientifiques partagées.

60

- La recherche d’information : des usages vers les traitements

Dans cet ouvrage, j’ai co-écrit un chapitre83 qui propose une réflexion sur la mise en œuvre d’un système de recherche d’information dans des documents techniques. L’étude des interactions entre l’usager et le système apparaît comme un préalable à des préconisations pour l’établissement d’un système de recherche d’information. Cette approche a guidé un grand nombre de nos travaux. L’observation et l’analyse des interactions entre les usagers et le système s’orientent précisément autour des attentes des usagers préalablement à l’interrogation des systèmes de recherche d’information, de la formulation des requêtes adressées aux systèmes, des stratégies d’interrogation mises en œuvre, de la consultation des documents retrouvés, de la sélection des informations pertinentes, et enfin de l’évaluation par l’usager de la recherche qu’il a menée.

« Le système Sysrit (système de recherche d’informations techniques) est un système de recherches d’informations dans des documentations techniques. Les fonctionnalités de l’interface sont définies en premier lieu à partir des caractéristiques des utilisateurs. La conception globale du système n’intervient qu’en second lieu, par déduction des contraintes imposées par l’interface »84.

Les résultats de ces expérimentations et observations sont alors considérés comme des points de départ permettant de définir les fonctionnalités des interfaces de systèmes de recherche d’information. J’ai ici travaillé avec des techniciens experts de leur domaine (informaticiens, électriciens travaillant dans des entreprises grenobloises ou lyonnaises et ayant aimablement accepté de me recevoir pour se plier à nos demandes d’entretiens ou d’observations)85, dans leurs interactions avec un système de recherche d’information donnant accès à une collection de documents techniques. J’ai d’une part analysé la manière dont ils expriment leurs recherches (d’abord en langue naturelle puis sous la forme de requêtes) et d’autre part étudié ce qu’ils considèrent comme des informations pertinentes (en termes d’unités de texte). Les résultats de ces observations

83 Paganelli Céline et Evelyne Mounier (2002). Vers un système de consultation des documents techniques volumineux par des utilisateurs experts : le système Sysrit , in Interaction homme-machine et

recherche d’information, Paris : Hermès Sciences Publications, 2002, p.195-228.

84 Paganelli Céline (2002), p.195.1

85 L’entreprise Bull à Echirolles, le centre de formation du Greta à Grenoble, la société de matériel électrique Legrand à Lyon, le centre de ressources informatiques de l’Université Grenoble 1. 1

61

m’ont amenée à élaborer certaines propositions en lien avec les fonctionnalités de recherche de l’interface et les modalités de restitution des réponses.

Dans cette approche, la modélisation des connaissances utiles aux interfaces de recherche d’information doit être fondée à la fois sur des études relevant de la psychologie cognitive, mais également de la linguistique. D'après la première perspective, on part de données empiriques sur le comportement de l'utilisateur afin de proposer d’adapter le système à ses attentes. Comme je l’écrivais dans ma thèse :

« Nous formulons l’hypothèse qu’une analyse préliminaire des besoins des utilisateurs permettra de déterminer les modes privilégiés d’expression des requêtes, la conception qu’ils ont de l’unité de texte pertinente […]. Nous faisons le choix d’une approche utilisant les méthodes de la psychologie cognitive pour effectuer une étude des utilisateurs et connaître leurs besoins en matière de recherche d’information, leurs comportements en situation de recherche d’information, les caractéristiques de l’unité de texte pertinente qu’ils souhaiteraient obtenir en réponse à une recherche ».86

Tandis que d'après la seconde perspective, on essaie de modéliser les connaissances linguistiques nécessaires au système pour interpréter la langue en fonctionnement dans un texte, le plus indépendamment possible du domaine de référence de ce dernier. Nous indiquions alors : 87

« Le but de l'utilisateur est d'accéder à une information qui va lui permettre de mettre à jour ses connaissances ou de réaliser une tâche. Les modes d'expression des objectifs de l'utilisateur peuvent être multiples (graphique, parole, gestuel, écrit). L'intérêt du mode langue naturelle est de lui permettre de formuler ses requêtes et de poursuivre l'interaction avec l'interface selon une forme qui lui est plus familière que celle d'un langage de commandes. L'utilisateur ne devra pas préalablement intégrer une connaissance sur les fonctionnalités du logiciel d'interrogation ou sur le type d'information que peut fournir le

86 Paganelli Céline (1997) La recherche d'information dans des bases de documents techniques en texte

intégral. Étude de l'activité des utilisateurs. Thèse de doctorat en Sciences de l’Information et de la Communication, sous la direction de Jacques Rouault, Université Stendhal, Grenoble, p.25. 1

87 Paganelli Céline et Maria-Caterina Manes-Gallo (2003). La représentation des connaissances entre intelligence artificielle et psychologie cognitive, Les enjeux de l’information et de la communication, Gresec , 2003.http://www.u-grenoble3.fr/les_enjeux.

62

système. Ce qui a l'avantage de diminuer le coût cognitif sous-jacent à l'activité de s'informer. »

Une relecture de cette approche met en évidence un certain nombre de limites et soulève quelques interrogations.

La question du recueil des données se pose en premier lieu. J’ai mobilisé une approche méthodologique issue de la psychologie cognitive, sous la forme d’observations et d’expérimentations destinées à mettre à jour les mécanismes et processus mentaux mis en œuvre lors de la recherche d’information. Dans ce cadre, l’interaction homme/système est donc envisagée uniquement dans une perspective individuelle, la dimension sociale étant totalement absente des études menées. C’est notamment ce qu’indiquent Peter Ingwersen et Kalervo Järvelin [2005 : 4] lorsqu’ils relèvent que, pour cette raison, le point de vue cognitif a été largement critiqué dans le champ des études sur la recherche d’information.

Les données recueillies doivent ensuite être formalisées et traduites en fonctionnalités de l’interface. Ce passage résulte nécessairement d’une interprétation qui peut s’avérer discutable.

Enfin, la question de la généralisation des propositions fait également débat. Comment dépasser le cadre étudié pour que les propositions émises ne soient pas uniquement liées à un contexte spécifique (ici les experts d’un domaine technique en situation de travail) ?

11 La conception de l’accès à l’information que j’ai développée dans les travaux précédemment cités présente les caractéristiques suivantes :

• La recherche d’information y est envisagée essentiellement dans sa dimension technique, comme un processus pour lequel le point central est l’appariement d’une requête formulée par un usager avec des ressources représentées via un système informatique.

• L’attention est portée sur les interactions entre l’usager et le dispositif et plus précisément sur la formation des requêtes, les stratégies d’interrogation, la consultation des documents trouvés ou encore la sélection des informations jugées pertinentes.

63

• L’accès à l’information est considéré dans une acception restrictive : il s’agit précisément de la récupération d’informations via l’interrogation de systèmes informatisés.