• Aucun résultat trouvé

a tr`es grande ´echelle.

Ce chapitre est organis´e comme suit. La section 2 constitue la probl´ematique `a partir de laquelle notre approche a ´et´e d´evelopp´ee. Dans la section 3, nous pr´esentons d’une fa-¸con g´en´erale l’architecture de notre syst`eme int´egr´e. Les sections 4, 5, 6 visent `a d´ecrire les trois sc´enarios d’int´egration correspondant `a trois op´erateurs alg´ebriques de composition de BDBO que nous consid´erons dans notre ´etude. Pour chaque sc´enario, nous pr´ esente-rons tout d’abord son contexte, puis l’algorithme d’int´egration qui lui correspond, et enfin son application dans le commerce ´electronique professionnel. Avant de conclure ce cha-pitre, la section 7 pr´esentera la mise en oeuvre de notre approche d’int´egration. Il s’agit d’impl´ementer dans PLibEditor une extension qui permet d’int´egrer automatiquement des catalogues ´electroniques (conformant au mod`ele d’ontologie PLIB) au sein d’un entrepˆot de composants techniques.

4.2 Probl´ematique

Avec la croissance exponentielle du nombre de sources de donn´ees apparaissant sur le Web, les m´ethodes d’int´egration traditionnelles imposant une activit´e manuelle de l’ad-ministrateur central apparaissent de moins en moins faisables ou acceptables. En ce qui concerne les donn´ees semi-structur´ees, le besoin d’int´egration automatique est adress´e `

a travers la notion de m´eta-donn´ees repr´esent´ee par exemple en RDF 12 ou RDFS 13. L’id´ee qui pr´eside `a cette approche est que, si le travail s´emantique d’int´egration ne peut ˆetre r´ealis´e a posteriori, alors elle doit s’effectuer a priori par les auteurs de sources do-cumentaires. Ceci en ajoutant `a des documents (s´emantiquement et terminologiquement h´et´erog`enes) des m´eta-donn´ees qui r´ef´erencent une ontologie commune et fournissent donc une interface int´egr´ee et homog`ene destin´ee `a la recherche de documents pertinents pour une requˆete appartenant au domaine de l’ontologie.

12http://www.w3.org/TR/rdf-primer 13http://www.w3.org/TR/rdf-schema

4.2. Probl´ematique L’approche d’int´egration que nous proposons correspond `a la mise en oeuvre de la mˆeme id´ee dans l’univers des bases de donn´ees. D`es lors qu’un responsable de base de donn´ees connecte celle-ci au Web, c’est pour en rendre le contenu facilement accessible. A partir du moment o`u des ontologies de domaine existent et sont accept´ees (e.g., ce sont normalis´ees) c’est bien dans les termes de ces ontologies qui fournissent une interface g´en´erique, que les utilisateurs vont rechercher l’information. En effet, dans un nombre important de domaines, des ontologies de domaine consensuelles commencent `a exister. C’est en particulier le cas dans de nombreux domaines techniques, o`u des ontologies de domaine normalis´ees sont en train d’´emerger (par exemple, un ensemble d’ontologies techniques normalis´ees est disponibles sur le site www.oiddi.org). Dans ces domaines, il est ´egalement fr´equent que les concepteurs de base de donn´ees souhaitent rendre l’acc`es

le plus facile possible `a des ensembles d’utilisateurs les plus vastes possibles.

C’est en particulier le cas du commerce ´electronique, o`u chacun souhaite que son catalogue ´electronique soit tr`es largement consult´e, exploit´e et compris.

Ebay (www.ebay.com), par exemple, est un e-march´e supportant l’e-commerce dans plusieurs domaines. Il organise les produits selon une hi´erarchie de cat´egories de produits. Pour mettre en vente un produit, son fournisseur doit d’abord choisir la cat´egorie `a laquelle ce produit est associ´e. Puis il d´ecrit son objet `a l’aide des propri´et´es standards fournies par Ebay, qui caract´erisent la cat´egorie choisie. Enfin, le vendeur peut ajouter des informations compl´ementaires (images, commentaires textuels, etc) sur la description de son produit. Lorsque le fournisseur compl`ete les champs caract´erisant son objet, les utilisateurs qui explorent la cat´egorie de mise en vente de son objet ont acc`es `a un menu tr`es pratique qui leur permettra de rechercher des objets en fonction de leurs attributs. D’apr`es Ebay, cet aspect d’utilisation de propri´et´es standards est consid´er´e comme tr`es important dans la mesure o`u :

– chaque fournisseur gagne du temps lors de la r´edaction des descriptions – chaque objet est d´ecrit de fa¸con claire et compr´ehensible par les utilisateurs. – les utilisateurs disposent ainsi d’un moyen simple et rapide de trouver les objets

recherch´es ;

Notons que l’e-march´e Ebay est r´eparti sur plusieurs pays, et des pays diff´erents peuvent utiliser non seulement des langages diff´erents, mais ´egalement des propri´et´es l´eg`erement diff´erentes pour caract´eriser une cat´egorie de produits (voir la figure 4.1). Par contre, les fournisseurs ne peuvent utiliser que les cat´egories et les propri´et´es fournies par Ebay pour d´ecrire leurs objets ce qui n’est pas acceptable dans le march´e professionnel o`u chaque vendeur essaye pr´ecis´ement d’individualiser son produit par des caract´eristiques sp´ecifiques.

Dans l’exemple de l’e-march´e Ebay ci-dessus, on constate que les fournisseurs n’ont pas beaucoup d’autonomie sch´ematique comme par exemple l’ajout de nouvelles cat´egories. Ce probl`eme se pose aussi pour les applications d’e-commerce existantes et c’est d’apr`es nous, une des raisons de leur d´emarrage assez lent dans le domaine professionnel. Notre

Ebay.fr Ebay.com

Fig. 4.1 – Exemples des propri´et´es standards caract´erisant la cat´egorie ”Ordinateur por-table” sur les deux sites : Ebay fran¸cais et Ebay am´ericain

approche d’int´egration s’inscrit ´egalement dans le contexte d’int´egration des catalogues de composants d’un syst`eme d’e-commerce professionnel B2B autour d’une ontologie partag´ee. Mais elle est bas´ee sur trois principes :

1. chaque source participante au processus d’int´egration doit contenir sa propre ontolo-gie (appel´ee base de donn´ees `a base ontologique (BDBO) pr´esent´ee dans la chapitre 3),

2. chaque ontologie locale s’articule a priori avec une (ou des) ontologie(s) partag´ee(s), 3. chaque ontologie locale ´etend l’ontologie partag´ee pour satisfaire ses besoins.

A notre connaissance, notre travail est le premier `a traiter du probl`eme d’int´egration en proposant qu’une ontologie conceptuelle soit explicitement repr´esent´ee dans chaque source de donn´ees, et que les articulations avec les ontologies partag´ees soient d´efinies a priori. Dans cette th`ese, comme dans [69], l’articulation entre l’ontologie globale et les ontologies locales sont exprim´ees par un ensemble de relations de subsomption.

Pour mieux comprendre notre probl`eme, nous consid´erons ci-dessous l’exemple d’un e-march´e de catalogues de composants industriels.

Exemple 8 : Un march´e B2B consiste `a permettre l’´echange des donn´ees de composants

du domaine des mat´eriaux informatiques. Les composants du march´e sont issus de diff´ e-rents fournisseurs. Ils sont d´ecrits dans les catalogues (repr´esent´es sous forme d’une base

4.3. Architecture du syst`eme d’int´egration de BDBOs