Les approches non-logiques - Les approches de la découverte sémantique

Coordination de Services Web Sémantiques

3.2 Découverte de Services Web Sémantiques

3.2.2 Les approches de la découverte sémantique

3.2.2.1 Les approches non-logiques

La découverte basée sur l’appariement non logique, trouve ses origines dans les mécanismes de recherche d’information se basant souvent sur des hypothèses et font face à leurs limites dès que les descriptions de services ne respectent pas les hypothèses posées. Les approches de découverte non logiques exploitent la sémantique implicite plutôt que la sémantique explicite, de ce fait l’appariement non logique repose sur des mécanismes syntaxiques, structurels et numériques issus des mécanismes de recherche d’information... Pour assurer cela, de tels

1. www-ags.dfki.uni-sb.de/~klusch/s3/

Figure 3.2 – Classification des approches pour la mise en correspondance [^{Klusch 2012}^]

mécanismes d’appariement utilisent les fréquences des termes, la distance numérique entre concepts, les appariements de graphes structurés, sous-graphes, etc.

OWLS-iMatcher1 [Kiefer et al. 2007b] est un matchmaker syntaxique basé sur la signature du service (entrée/sortie). Ces derniers sont stockés sous forme de graphes RDF sérialisés dans une base de données RDF interrogeable avec l’extension de RDQL [Seaborne 2004], appelée iRDQL [Bernstein & Kiefer 2005]. Le calcul du degré de correspondance est effectué à partir de quatre métriques de similarité syntaxique issues de domaine de la recherche d’information [Moreau et al. 2008] : TFIDF (Term Frequency-Inverse Document Frequency), la distance de similarité de Levenshtein, la mesure du vecteur Cosinus, la mesure de divergence de Jensen-Shannon. Les scores numériques issus de ces mesures de similarités syntaxiques sont classés en fonction d’un seuil prédéfini par l’utilisateur. OWLS-iMatcher a été développé par Christoph Kiefer et Abraham Bernstein (Université de Zurich, Suisse) et a réalisé sa meilleure précision. Le successeur hybride d’iMatcher1, est iMatcher2 qui sera présenté plus tard. 3.2.2.2 Les approches logiques

Ces approches de découverte utilisent des descriptions sémantiques de services et des requêtes spécifiées en langages basés sur des formalismes logiques, telles que la logique de description, la logique de premier ordre, etc. Cette catégorie utilise des concepts d’ontologies et des règles logiques. Les degrés d’appariement sont déterminés de différentes façons et en fonction de la sémantique des éléments des descriptions à apparier. Il existe principalement

trois approches d’appariement :

— La signature (IO-matching) : Ce type d’appariement est déterminé à partir des données sémantiques des paramètres de service : les entrées : inputs (I) et les sorties : outputs (O).

— La spécification (PE-matching) : Ce type d’appariement est déterminé à partir d’ap-pariements sur des préconditions (P) et des effets (E) des services et des requêtes. — service profile intégrale (IOPE-matching) : Ce type d’appariement est déterminé à

partir d’appariements sur les données sémantiques des inputs (I), des outputs (O), des préconditions (P) et des effets (E) des services et des requêtes.

Le matching basé sur la similarité consiste à établir des correspondances entre deux ou plusieurs services en calculant des valeurs de similarité indiquant le degré de rapprochement entre leurs descriptions respectives. Le calcul de similarité peut être basé sur des données syntaxiques ou sémantiques plus expressives. Dans la suite nous résumons les approches décrites dans la littérature.

Dans [Pilioura et al. 2003], les auteurs étendent le modèle UDDI pour prendre en compte des descriptions OWL-S. L’objectif est de permettre le stockage des fonctionnalités des ser-vices désignées par capacités afin de rendre la découverte plus précise. Bien que UDDI permet une grande variété de recherches par catégories (par nom, localisation, métier ou autres), UDDI est limité à la recherche par mots clés, ne permettant aucun raisonnement ni inférence par rapport à des taxonomies sur la possibilité de correspondance entre une description et une requête utilisateur. Ils présentent un composant, qui assure le raisonnement logique nécessaire pour inférer la correspondance entre le profil d’un service publié par UDDI et le profil d’un besoin décrivant la requête utilisateur. Ils décrivent une implémentation basée sur jUDDI3 et le raisonneur Racer [Haarslev & Möller 2001]. Quelques résultats préliminaires sont proposés. Cette approche bien que riche sémantiquement ne traite pas l’aspect automatisation de la découverte et repose sur un UDDI centralisé. Dés lors, [Li & Horrocks 2003] étendent l’al-gorithme de [Pilioura et al. 2003] en insérant un cinquième degré de correspondance intitulé intersection, ce dernier permet de repérer les services ayant des concepts chevauchant ceux de la requête. Dans [Srinivasan et al. 2006], ils présentent une approche distribuée pour la découverte de services qui sont supposés être décrits par des service profils de l’ontologie OWL-S. Le protocole pair-à-pair adopté pour la recherche d’information est le Gnutella. En combinant ces deux modèles, OWL-S et Gnutella, les auteurs estiment pouvoir allier la pré-cision de description de l’approche OWL-S et l’efficacité de la technique de recherche et de localisation Gnutella. Les détails de l’implémentation ne sont pas discutés.

[Benatallah et al. 2005] proposent de formaliser la découverte comme un problème de réécriture de concepts en logique descriptive. Ils décrivent un algorithme pour découvrir la meilleure couverture sémantique d’une requête par les concepts d’une ontologie donnée. Ils démontrent que le problème de découverte de la meilleure couverture sémantique présente des similitudes avec le problème de calcul, à coût minimal, des transversales minimes d’un hypergraphe attribué (computing the minimal transversals with minimum cost of a weigh-ted hypergraph). Les résultats expérimentaux sont présentés dans [Benatallah et al. 2005] . Les auteurs affirment que l’approche décrite n’est pas encore adaptée pour traiter un grand nombre d’ontologies hétérogènes, néanmoins les premières expériences présentées sont pro-metteuses.

Dans [Mandell & McIlraith 2003], les auteurs réutilisent les technologies service existantes et les combine avec celle du web sémantique en étendant BPEL [Juric 2010]. Dans le document BPEL, une description OWL-S de type service profile remplace la référence statique aux services impliqués. Ils mettent en place un service de découverte sémantique (SDS) décrit par un service profile OWL-S. SDS utilise le raisonneur JTP (Java Theorem Prover) pour générer des requêtes DQL. Au cours de l’interprétation du document BPEL, le service SDS intervient et envoie des requêtes DQL générées à partir des services profile du process BPEL vers un annuaire contenant des services sémantiquement décrits en OWL-S. De cette façon chaque service sera découvert juste avant son invocation durant l’exécution du processus composite. Dans [Sabou & Pan 2005], les auteurs étudient les lacunes des systèmes de découverte de services proposés et présentent les annuaires disponibles en ligne. Ils concluent que la recherche de services dans ces annuaires n’est pas suffisamment précise car elle consiste à faire correspondre les mots clés d’une requête avec une classification des services publiés. Ils ajoutent qu’il est difficile de maintenir à jour les classifications des services car ils évoluent rapidement. Ils proposent alors les bases d’une approche semi-automatique pour la décou-verte de services qui repose sur des techniques empruntées au web sémantique. Elle consiste, d’abord, à adapter les techniques d’apprentissage à base d’ontologies pour permettre une mise à jour automatique des schémas de classification des services. Des ontologies seront générées à partir de ces schémas. Un utilisateur "expert" peut intervenir. A ce niveau pour vérifier la cohérence des ontologies générées. Elle consiste, ensuite, à réutiliser les techniques de matching entre ontologies pour comparer ces schémas et les intégrer en méta-schémas. Elle utilise, finalement, des méthodes de visualisation pour représenter les services par rapport aux méta-schémas générés.

Dans [Jaeger et al. 2005] Offrent un appariement IOPE-matching qui recherche les corres-pondances sémantiques entre les paramètres fonctionnels définis dans les descriptions OWL-S et les paramètres introduits dans la requête. Le processus d’appariement comporte quatre tâches : entrées correspondants, sorties correspondants, les catégories de services correspon-dant et un quatrième tâche au cours de laquelle les contraintes et les caractéristiques prédé-finies sont appliquées par l’utilisateur. L’algorithme calcule le degré de correspondance dans chacune des trois premières tâches et effectue le quatrième enfin agréger les résultats et de retourner le rang des WS appariés si elle est choisie comme un service qui répond à la requête. Ce cours de classement le service en fonction de son degré de correspondance entre tous WS découvert.

Dans [Stollberg et al. 2005], les auteurs proposent un modèle de découverte sémantique et automatiques appelée SLA (localisation automatique des Services). Ce modèle utilise des ob-jectifs et des abstractions de services prédéfinis pour finalement découvrir les services concrets répondant à une requête. L’approche proposée distingue cinq niveaux de diplômes correspon-dants appelés degrés de correspondance intentionnelle (Match, parMatch, PossMatch, No-Match et PossParNo-Match). GR (Graded pertinences) est une extension de la SLA en termes de degrés correspondant. GR ajoute deux autres degrés de correspondance : RelationMatch et ExcessMatch.

CASD (Context Aware de Service Discovery) [Doulkeridis et al. 2005] est une approche de découverte orienté contexte qui utilise une ontologie de domaine permettant de filtrer sé-mantiquement les services en fonction de la requête utilisateur. Pour cela, l’utilisateur fournit

une requête (Q) en termes de mots-clés nécessaire à la recherche et exprimé en SPARQL. SPARQL (SPARQL Protocole et RDF Query Language) est un langage d’interrogation com-patible avec les ontolgies OWL. L’architecture CASD génère une nouvelle requête enrichie (Q’) servant de filtre à la sélection de servies et répondant au contexte de l’utilisateur. L’ap-proche Schulzrinne et Arabshian propose une version distribué de CASD appellé DCAASD (Contexte Distributed Service Aware Discovery Agent pour l’architecture).

SPARQLent [Sbodio 2012] est un matchmaker basé sur le profil complet du service qui se focalise sur les préconditions et les effets principalement et sont formalisés en graphe SPARQL. Le calcul de similarité se base sur le confinement de la requête en appliquant l’entailment RDF sur les concepts d’Entrées/Sorties à base d’ontologies OWL. SPARQLent a été développé par Marco Luca Sbodio (Hewlett-Packard CPN, Italie) et atteint une précision moyenne élevée avec notamment un faible temps de réponse moyen.

Le matchmaker EMMA [García et al. 2012] procède par contre à un pré-filtrage en propo-sant deux filtres exprimé en requêtes SPARQL concrètes le premier filtre cherchant unique-ment le web service qui staffait toutes les exigences de la requête par contre le deuxième filtre permet de rechercher un ensemble de services répondant à la requête de l’utilisateur en vue d’une composition future permettant ainsi de réduire l’espace de recherche et optimisant ainsi le temps d’exécution logique de services avant d’appeler un matchmaker externe notamment le OWLS-MX.

Dans le document Empaquetage Dynamique à Base de Services Web Sémantiques (Page 83-87)