Syst` eme de m´ ediation

2.2 Approches d’int´ egration

Schéma Source 1 Schéma Source 2 Schéma Source n

2.2 Approches d’int´ egration

2.2.3 Approches avanc´ ees

2.2.3.3 Syst` eme de m´ ediation

2.2.3.3.1 Architecture des syst`emes de m´ediation. Cette approche [Wiederhold 92],

´

egalement non matérialisée, consiste à laisser les données dans les sources et fournir un schéma

global donnant une vue réconciliée, intégrée et virtuelle sur ces sources. Les utilisateurs posent

leurs requêtes dans les termes du schéma global qui les redéfinit dans les termes des schémas

des sources pertinentes. Il est donc nécessaire dans ce type de systèmes de définir une mise en

correspondance entre les schémas locaux et le schéma global. Cet aspect est un point clé dans un

tel système puisqu’il influe sur la reformulation de la requête. Les différents éléments constituant

l’architecture des syst`emes de m´ediation sont les suivants (Figure 2.7 page suivante) :

– lessch´emas des sources regroupent un certain nombre d’informations n´ecessaires pour

décrire les sources, c’est-à-dire des méta-données comme leurs nom et URL d’interrogation

mais aussi leurs entités et attributs auxquels des données sont associées. Des références

croisées (voire même des références d’autres types) vers d’autres sources sont parfois pr´

e-sentes ;

– lemédiateur ou schéma globaljoue le rôle d’interface entre les utilisateurs et les sources.

Il regroupe l’ensemble des prédicats modélisant le domaine d’application du système de

médiation et fournit donc un vocabulaire structuré servant de support à l’expression de

Base de

connaissanc

es du doaine

Schéma

global

Adaptateur Adaptateur Adaptateur

Source de

données 1 Source dedonnées 2 • • • Source de données n

Fig. 2.7 – Composants d’un système de médiation.Les flèches pointillées représentent la

transmission des requˆetes aux adaptateurs. Les fl`eches unidirectionnelles pleines correspondent

aux résultats récupérés dans les sources au travers de leur adaptateur qui les fournit au schéma

global. Les fl`eches bidirectionnelles indiquent l’interaction existant entre les sources locales et

les adaptateurs : l’envoi d’une requête dans le langage de la source associée et la récupération

du r´esultat dans la source.

requˆetes [Rousset 02]. Ainsi, les utilisateurs posent leurs requˆetes dans les termes du m´

e-diateur qui les reformulent avant de les transmettre aux adaptateurs des sources identifi´ees

comme pertinentes. Finalement, c’est à travers de ce médiateur qu’est réalisée la fusion des

résultats obtenus à partir de chacune des sources avant de rendre une réponse homogène

et globale aux utilisateurs ;

– lesadaptateurs associés à chaque source permettent d’interroger la source qu’ils gèrent

dans son langage spécifique afin d’y récupérer les données pertinentes. Ils fournissent en

retour au m´ediateur les r´esultats obtenus dans les sources.

Comme présenté en détail dans [Lenzerini 02], modéliser la correspondance entre les schémas

locaux et le schéma global est un point crucial. C’est ce qui permet de traiter une requête posée

sur le sch´ema global par reformulation en un ensemble de requˆetes dans les sources. La mise

en correspondance vise à établir la connexion entre les éléments du schéma global et ceux des

schémas locaux. Deux approches ont été proposées dans ce cadre :Global-As-View (GAV) où le

schéma global est défini dans les termes des schémas des sources et Local-As-View (LAV) où le

sch´ema global se veut ind´ependant des sources, et dans ce cas, les relations de correspondance

existant entre le schéma global et les schémas des sources sont établies en définissant chaque

source comme des vues du sch´ema global.

– L’approche GAV consiste à définir le schéma global en fonction des schémas des sources,

donc dans les termes propres `a ces derni`eres. Cela implique donc que les sources soient

connues et suffisamment stables. Cette approche favorise le traitement des requˆetes puisque

la ré-écriture des requêtes posées sur le schéma global se fait directement au travers des

mises en correspondance préalablement définies et exprimant les éléments du schéma

glo-bal dans les termes des schémas locaux. En revanche, l’expansion d’un système basé GAV

pose des probl`emes puisque l’ajout d’une nouvelle source peut avoir un impact sur la d´

e-finition de certains éléments du schéma global.

– L’approche LAV est inverse ; ce sont les sch´emas des sources qui sont d´efinis au moyen de

termes du schéma global. Une bonne organisation et une stabilité du schéma global est n´

e-cessaire, les systèmes d’intégration utilisant une ontologie comme schéma global sont ainsi

bien adaptés à LAV. Contrairement à l’approche GAV, le traitement des requêtes ici est

complexe. En effet, les seules connaissances dont on dispose sur les donn´ees dans le sch´ema

global sont uniquement accessibles au travers des vues repr´esentant les sources,

fournis-sant des informations partielles sur les données. Par contre, l’évolution de tels systèmes

est particuli`erement favoris´ee par l’approche LAV puisqu’ajouter une nouvelle source au

système nécessite simplement de compléter les relations de correspondance de manière à

représenter le nouveau schéma avec des termes du schéma global, sans aucune autre

mo-dification. La suppression se fait d’une mani`ere aussi simple ; le sch´ema global n’est pas

modifié, seules certaines relations sont supprimées, n’affectant pas le reste du système.

Une approche hybride a été proposée dans [Friedman 99]. Global-Local-As-View (GLAV)

consiste à combiner la méthode de définition des relations de correspondance entre le schéma

global et les sch´emas locaux de chacune des approches GAV et LAV pour en retirer une meilleure

expressivit´e. Nous n’entrons pas plus dans les d´etails de cette approche.

2.2.3.3.2 Avantages des systèmes de médiation. Tout d’abord, la médiation a des

avan-tages communs à l’approche navigationnelle puisqu’elles sont toutes deux non matérialisées.

L’autonomie locale est préservée, ce qui évite de perturber les sources, chacune ayant un

contrˆole sur ses propres donn´ees et garantissant aux utilisateurs que les informations auxquelles

données 1 ^{Source de}données 2 • • • ^{Source de}données n

des-cription GRAIL²⁵ (GALEN Representation And Integration Language) et ses composants sont