• Aucun résultat trouvé

synthèse d'information

3.2 Point de vue adopté sur la synthèse .1 Introduction.1 Introduction

3.2.2 Une notion complexe

3.2.2.1 Une notion aux multiples facettes

Comme vu précédemment, la synthèse est considérée comme une activité de col-lecte, agrégation, organisation, présentation d'informations hétérogènes dans un ob-jectif précis, pour un public particulier. La synthèse est donc une opération complexe qui se décompose en un ensemble d'activités très diverses.

Tout d'abord, la synthèse implique des activités de dénition de l'objectif pour-suivi par le chercheur engagé dans une telle opération. Cette dénition d'objectif peut être rapprochée de la formulation de requête de la Recherche d'Information. Cette formulation doit dépasser la simple liste de mots clés, pour permettre l'expres-sion d'une tâche de synthèse complexe spécialisée pour une étude spécique d'un domaine d'application particulier.

Deuxièmement, la synthèse requiert la mise en ÷uvre d'activités de collecte de documents et données pertinents. Collecter des informations pertinentes est le c÷ur des processus de Recherche d'Information, par l'application de fonctions de corre-spondance. Mais la simple mise en correspondance entre requête et documents ne sut pas dans le contexte de la synthèse, et cette recherche d'informations perti-nentes devient alors une étape du processus de synthèse.

Ensuite, la synthèse sous-tend des activités d'extraction d'informations utiles au sein des éléments pertinents sélectionnés. Cette extraction d'informations rap-pelle fortement le c÷ur de métier de la fouille de données, mais ne s'y limite pas, puisqu'elle pourrait aussi consister en la sélection plus précise de parties d'entités pertinentes. Un exemple pourrait être la recherche de passages en Recherche d'Infor-mation, qui propose la construction d'une liste d'extraits de documents pertinents plutôt qu'une liste de documents pertinents.

Puis, la synthèse induit des activités d'organisation conceptuelle des informations utiles, ce qui suggère une notion de classication telle qu'elle se retrouve en fouille de données ou dans les propositions de présentation de résultats de Recherche d'Infor-mation les plus avancées. Mais cette classication n'est pas forcément réalisée dans l'absolu, an d'obtenir les groupes reétant le mieux la structure du jeu de données : elle peut aussi être guidée par l'objectif de la synthèse.

Par la suite, la synthèse suppose des activités de disposition des éléments au sein d'un document qui reète de façon structurelle l'organisation conceptuelle dénie, problématique qui relève de l'analyse visuelle des données, et surtout de la Visuali-sation d'Information, dont les représentations sont plus évoluées. Mais tous les types de représentations ne sont sans doute pas adaptés à la problématique de synthèse, et le volume de données à présenter dans un espace réduit suggère de privilégier

les représentations les plus compactes, dans un souci d'adaptation tout à la fois au problème et à l'usager.

Ultérieurement, la synthèse inclut des activités de mise en forme du document nal, mise en forme qui repose sur la construction d'un document multimédia com-plexe. Cette construction est de plus en plus personnalisée dans les applications actuelles et cette adaptation de la forme est le propre des systèmes adaptatifs.

Ensuite, la synthèse nécessite des activités de vérication de la qualité des pro-ductions réalisées au cours des autres phases. Cette notion de qualité se rapproche de la notion de pertinence de la Recherche d'Information, en y incluant non seulement une évaluation de la liste des éléments sélectionnés, mais encore une évaluation de leur organisation et du rendu de cette organisation. Mais cette mesure n'est pas su-isante, et un processus d'évaluation complet de l'ensemble du système d'assistance à la synthèse doit être envisagé, comme pour toute production issue de l'ingénierie logicielle.

Enn, la résolution du problème de synthèse est une activité complexe, qui mo-bilise connaissances et méthodes variées : connaissances du domaine étudié, con-naissances des procédures expérimentales spéciques de ce domaine, préférences ou expériences personnelles et comportements typiques issus de la formation des chercheurs. Ceci sous-tend des représentations formelles de l'ensemble de ces en-tités, par le biais non seulement d'ontologies, mais aussi de prols utilisateurs et de représentations de problèmes, problématiques qui relèvent tout à la fois des systèmes adaptatifs et systèmes à base de connaissances de l'Intelligence Articielle.

La synthèse est donc une activité multiple par les diverses facettes qu'elle présente, tel qu'illustré par la Fig.3.1. Mais cette multiplicité ne se limite pas à cette dimension pluridisciplinaire et couvre aussi une dimension intrinsèque à la notion de synthèse : la multiplicité des problématiques qu'elle fédère, présentée plus en détails dans le prochain paragraphe.

3.2.2.2 Une notion fédératrice pour une multitude de problèmes

La synthèse, dans l'assertion considérée, est une opération intellectuelle visant à réunir les diverses parties d'un ensemble au sein d'une vue uniée. Cette construction est réalisée dans un objectif particulier. Or cet objectif est loin d'être unique : en un sens, il n'y a pas une synthèse mais des synthèses.

En eet, dans un contexte de synthèse dans une visée scientique, les chercheurs peuvent adopter des points de vue très variables sur les documents ou données disponibles, points de vue qui dépendent de l'objectif qu'ils ont en tête. La syn-thèse peut alors être considérée, de manière simpliée, comme une transformation

Fig. 3.1: La synthèse, une activité multifacettes - Les diverses activités successives (à droite de l'encadré Synthèse) ou servant de support aux autres (à gauche de l'encadré Synthèse), qui sont impliquées dans la synthèse sont supportés par les disciplines exposées de l'encadré Disciplines impliquées. Chaque activité peut être associée à des techniques dont le domaine d'appartenance

est indiqué verticalement.

des informations disponibles. Chaque point de vue peut alors être regardé comme résultant d'une transformation particulière, correspondant à une tâche de synthèse précise. La multiplicité de la synthèse réside ensuite aussi au niveau des éléments subissant une transformation donnée, le résultat nal dépendant des documents sur lesquels elle est appliquée.

Métaphoriquement, cette transformation peut être assimilée à l'eet d'une lentille en optique. La déviation des rayons lumineux par la lentille dépend de la forme de la lentille : sa taille, son épaisseur, son rayon de courbure. L'ensemble des formats de lentilles possibles représente alors la notion de synthèse en général. Une lentille aux caractéristiques particulières peut être assimilée à une tâche de synthèse spéci-que. De plus, en optique, l'image obtenue après passage des rayons lumineux au travers de la lentille dépend de l'objet observé. Cette sensibilité à l'objet étudié peut être considérée comme une image de la multiplicité de la synthèse en rapport aux éléments étudiés.

Cette métaphore optique illustrant la multiplicité de la synthèse, est schématisée Fig. 3.2. Mais bien qu'elle rende compte de la double démultiplication du prob-lème de synthèse, par les diverses tâches et divers corpus documentaires, elle reste limitée : une image optique reste très similaire à l'objet d'origine, alors que la syn-thèse implique une transformation complexe, par sélection et agrégation d'entités, qui déforme l'objet/l'espace informationnel observé au sein de son image/résultat de synthèse.

Fig. 3.2: La synthèse, fédération de multiples problèmes - Les divers ensembles informationnels étudiés sont représentés par des objets diérents. Ils sont transformés par diverses tâches de syn-thèse, dont le fonctionnement est assimilé à celui d'une lentille optique. La transformation de chaque objet par chaque lentille conduit à une image résultat unique, de la même façon qu'une tâche de

synthèse réalisée à partir d'un jeu de documents induit un document synthétique particulier.

La synthèse fédère donc un espace complexe de problèmes, par la multitude des tâches qu'elle regroupe et par la multitude de contextes d'application, domaines d'étude ou documents utilisés, qui peuvent être envisagés pour chaque tâche. Mais contrairement à l'optique où des lois bien connues régissent la construction de l'image d'un objet par une lentille, la synthèse est une notion dont le mode de résolution est mal déni car elle est dicile, comme exposé dans le prochain paragraphe.

3.2.2.3 Une notion dicile

Le processus de synthèse implique de nombreuses activités qui relèvent de di-verses disciplines. Or, chacune de ces activités est en soit un problème complexe. Ainsi, par exemple, la sélection d'entités pertinentes par des méthodes de Recherche d'Information est un domaine de recherche toujours très actif car les résultats des systèmes de Recherche d'Information actuels sont satisfaisants mais pas parfaits : certains documents pertinents ne sont pas retrouvés alors que des documents hors sujet sont retournés.

De plus, il s'agit d'une notion fédératrice pour de multiples tâches, qui peuvent être réalisées dans diérents contextes sur des collections documentaires variés. Cette multiplicité des instances du concept de synthèse suggère qu'il n'y a pas de solution unique au problème de synthèse, mais plutôt que chaque tâche peut être considérée comme un problème à part entière.

La synthèse est donc une opération dicile, et se pose alors le problème de sa ré-solution. Comme on l'a vu précédemment, la construction de systèmes informatiques réellement intelligents est encore loin de notre portée et la procédure classiquement utilisée en Intelligence Articielle est de simuler l'intelligence. An d'apporter une assistance aux chercheurs qui réalisent une synthèse, il s'agit alors de simuler par-tiellement le processus manuel, en proposant un support informatique à l'ensemble des activités impliquées.

La résolution d'un problème de synthèse induit tout d'abord d'apporter une as-sistance à la description du problème, soit de mettre en place un système de saisie de requête permettant la représentation non seulement des entités d'intérêt mais aussi de l'objectif poursuivi.

Le système doit ensuite être en mesure de construire un document de synthèse selon un processus qui doit reéter les opérations conduites par les chercheurs en-gagés dans une synthèse. Il s'agit alors de mener une combinaison d'activités, com-binaison qui dépend du type de synthèse. Celle-ci peut être imaginée comme l'ap-plication d'un modèle de tâche générique, spécique du type de synthèse considéré. Cette combinaison d'activités est menée en prenant en compte les spécicités du chercheur et du thème étudié, orientée par la requête, an de construire un document de synthèse. Ce document apporte une vue d'ensemble sur les documents ou les données et leur contexte.

La résolution du problème de synthèse telle qu'évoquée ici se rapproche beaucoup de la résolution d'un problème de Recherche d'Information, par son entrée par une requête, la sélection d'éléments pertinents d'un corpus, la construction de résultats en fonction de la requête. Mais la requête est une requête structurée décrivant une

tâche de synthèse spécialisée, le document de synthèse organisé dépasse la simple liste ordonnée par l'ajout de Visualisation d'Information à la Recherche d'Information classique et la sélection de documents pertinents n'est qu'une étape parmi d'autres de la résolution du problème de synthèse. Cette Recherche d'Information augmentée de ces divers concepts devient ce que j'appelle Recherche d'Information orientée tâche. Mais une vue Recherche d'Information orientée tâche, si elle fournit des pistes pour aider à la résolution du problème de synthèse, n'est pas susante. En eet, le nombre de tâches de synthèse qui peuvent être considérées ainsi que la multiplicité des domaines d'application et la multitude de formes que peut prendre le corpus documentaire en font un champ trop vaste pour être traité de manière exhaustive dans le cadre d'une thèse.

Ancrer la question de synthèse dans le domaine applicatif, et dans le cas présent l'orienter selon la problématique d'appréhension des données Tissue MicroArrays, est la solution envisagée ici pour limiter l'espace d'interrogation. Les restrictions sur le problème de synthèse posées par le domaine des Tissus MicroArrays sont analysées plus en détails dans les prochains paragraphes.

3.2.3 Une approche ancrée dans la problématique