• Aucun résultat trouvé

Illustration de l’approche de r´ e´ ecriture

5.3 Interroger plusieurs bases de connaissances

5.3.2 Illustration de l’approche de r´ e´ ecriture

a limiter l’intervention humaine au moment de l’interrogation en exploitant des correspon-dances complexes pr´ealablement exprim´ees.

5.3.2 Illustration de l’approche de r´e´ecriture

Nous avons propos´e dans Thi´eblin et al. (2016) une approche permettant la r´e´ecriture de requˆetes `a partir de correspondances complexes. La figure5.21 donne une vue globale de l’approche. Nous en pr´esentons ici les principes.

Notre approche repose sur l’hypoth`ese selon laquelle des correspondances complexes exis-tent. Ces correspondances peuvent ˆetre g´en´er´ees `a partir d’approches de la litt´erature que nous avons classifi´ees dans Thi´eblin et al. (2019). Dans les travaux pr´esent´es dans Thi´eblin et al. (2018) et Thi´eblin et al. (2017a), elles ont ´et´e g´en´er´ees manuellement et repr´esent´ees en EDOAL.

Les requˆetes initiales consid´er´ees par l’approche sont du type Qo1 = SELECT DIST IN CT? (V ar + | 00)W HERE {TQo

1}, o`u V ar correspond `a l’ensemble des variables utilis´ees comme attributs de projection et TQo

1 un ensemble de

Agronomic Taxon DBpedia TAXREF-LD

SELECT ?specy WHERE{ SELECT ?specy WHERE{ SELECT ?specy WHERE{

?specy rdf :type agtx :Taxon.

?specy rdf :type dbo :Species. ?specy txrfp :hasRank ?va-riable temp0. ?va?va-riable temp0 rdf :type txrfrk :TaxonomicRank.

?taxon agtx

:prefScientific-Name ?label. ?taxon rdfs :label ?label. ?taxon skos :prefLabel ?label.

?taxon agtx

Tableau 5.2 – Requˆete initiale exprim´ee sur Agronomic Taxon pour retrouver les sous-taxons de Triticum et les requˆetes pour DBpedia et TAXREF-LD obtenues par r´ecriture automatique.

triplets exprim´es pour une base de connaissances o1. Con¸cue pour les requˆetes g´en´er´ees par Swip, l’approche ne consid`ere que les requˆetes dont les triplets appartenant `aTQo1 ont pour sujet une variable.

L’algorithme d´etaill´e dans Thi´eblin et al. (2016) produit, `a partir de TQo1 et de l’ali-gnement complexe Ao1→o2, TQo

2 qui contiendra les triplets exprim´es `a partir d’entit´es de o2.

L’algorithme prend en compte les diff´erents types d’expressions qui peuvent ˆetre exprim´ees dans les correspondances complexes mais se limite aux correspondances ´etablies pour des expressions simples (c’est `a dire exprim´ees `a partir de l’identifiant) deo1.

L’algorithme traduit it´erativement chaque triplet en mettant en place un processus de transformation d´ependant du fait que la correspondance porte sur une classe ou sur une propri´et´e.

Pour la requˆete pr´esent´ee dans le tableau5.1, le premier triplet( ?specy rdf : type agtx : Taxon) est r´e´ecrit en utilisant la correspondance (1) pour DBpedia et (2) pour TAXREF-LD. Le se-cond triplet est g´en´er´e `a partir des correspondances (5) et (6) alors que le dernier l’est `a partir des correspondances (3) et (4). Les clausesFILTERetSELECTsont identiques car elles n’impliquaient aucun ´el´ement mis en correspondance. Le tableau 5.2 pr´esente le r´esultat du processus de r´e´ecriture.

5.3.3 Evaluations´

Le syst`eme de r´e´ecriture de requˆetes et l’ensemble des correspondances complexes consi-d´er´ees utilis´es pour ´evaluer l’approche sont disponibles en ligne21.

Nous avons ´evalu´e notre approche sur la transformation de requˆetes correspondant `a 5 be-soins en information d’experts de l’agronomie. Nous avons consid´er´e 4 bases de connaissances correspondant aux bases de connaissances pr´ealablement pr´esent´ees, ainsi qu’AGROVOC22.

21. https://framagit.org/IRIT_UT2J/sparql-translator-complex-alignment 22. http://aims.fao.org/aos/agrovoc

L’ensemble des requˆetes (initiales et g´en´er´ees) sont disponibles en ligne23. Ces ´evaluations ont montr´e que des informations compl´ementaires ´etaient contenus dans les sources et que l’approche permettait de facilement les retrouver. Pour pallier les diff´erents niveaux de granu-larit´e des mod´elisations, des correspondances d´efinies `a partir de la relation de subsomption ont ´et´e consid´er´ees. Prendre en compte les correspondances ´etablies pour des entit´es plus sp´ecifiques que celles de la requˆete initiale permet d’obtenir des r´esultats, mˆeme si ceux-ci ne couvrent qu’une partie du besoin. Prendre en compte des entit´es plus g´en´erales permettait

´egalement de retrouver des r´esultats pertinents, car la transformation des autres triplets de la requˆete avait pour effet de contraindre la description de ces entit´es.

Plusieurs limites de notre approche ont ´et´e identifi´ees. Tout d’abord, les requˆetes obtenues automatiquement ne sont pas optimis´ees, ce qui peut poser probl`eme pour l’interrogation de grandes bases de connaissances. Une interpr´etation globale de la requˆete en lieu et place d’une interpr´etation triplet par triplet permettrait de contourner cette limite. Une autre limite vient du fait que certaines requˆetes attendent comme r´eponse des classes dans un certain cas et des instances dans d’autres, alors que les correspondances complexes que nous consid´erons sont ´etablies entre entit´es de mˆeme nature (classe avec classe, propri´et´e d’objet avec propri´et´e d’objet). Ce type de correspondance n’a a priori pas de sens d’un point de vue logique et traduire la requˆete dans sa globalit´e permettrait, l`a encore, de prendre en compte cet aspect.

5.4 Conclusion

Dans cette section, nous avons pr´esent´e l’approche que nous avons con¸cue pour permettre aux utilisateurs d’interroger des bases de connaissances repr´esent´ees en termes de graphes ´ eti-quet´es. Cette approche est impl´ement´ee dans le syst`eme Swip et se caract´erise principalement par l’utilisation de patrons de requˆetes permettant l’interpr´etation de la requˆete utilisateur en langue naturelle et sa traduction en une requˆete graphe formelle.

Nous avons justifi´e l’utilisation de patrons de requˆetes et d´etaill´e notre processus d’inter-pr´etation en deux ´etapes, cette d´ecomposition facilitant le multilinguisme. Nous nous sommes

´egalement concentr´es sur notre impl´ementation qui exploite les fonctionnalit´es de SPARQL en proposant une ontologie pour repr´esenter les requˆetes et une ontologie pour repr´esenter les patrons. Nous avons donn´e un aper¸cu des r´esultats de notre participation au d´efi QALD.

Forts des r´esultats encourageants obtenus, nous avons ´etendu l’approche en suivant diff´erentes directions. Nous avons propos´e :

— une approche prenant en compte les agr´egats lorsque ceux ci sont exprim´es au niveau des attributs de projection de la requˆete ;

— une approche permettant de reformuler automatiquement la requˆete g´en´er´ee pour que celle-ci s’adapte `a de nouvelles bases de connaissances `a partir de correspondances complexes.

Nous avons ´egalement commenc´e `a travailler sur des extensions `a ces travaux dans le cadre de deux collaborations. Avec Mari Carmen Su´arez-Figueroa de l’Ontology Engineering Group de l’Universit´e Polytechnique de Madrid24, nous avons utilis´e Swip dans une activit´e de v´erification de la conformit´e de l’ontologie aux exigences ´etablies lors de la conception de celle-ciSuarez De Figueroa Baonza et al.(2012). Pour cela nous avons (a) transform´e les exigences fonctionnelles exprim´ees par des questions de comp´etences en langue naturelle en requˆetes SPARQL et (b) demand´e `a un expert de v´erifier si les requˆetes g´en´er´ees retournaient les r´eponses attendues. Pour mettre en œuvre Swip, nous avons propos´e une premi`ere approche permettant de g´en´erer semi-automatiquement les patrons de requˆetes en analysant les entit´es de l’ontologie mentionn´ees fr´equemment dans les questions de comp´etences et en proposant des patrons `a partir de la connaissance repr´esent´ee pour ces entit´es dans l’ontologie.

23. https://framagit.org/IRIT_UT2J/sparql-translator-complex-alignment/tree/master/mtsr2017/

24. http://www.oeg-upm.net/

Dans le cadre de notre collaboration avec l’´equipe SARA du LAAS, nous avons ´egalement utilis´e Swip pour interroger une base de connaissances25d´ecrivant les donn´ees collect´ees par les capteurs d´eploy´ees dans le bˆatiment ADREAM26 Lannes et al. (2017). Ce bˆatiment est un “laboratoire vivant”, ´equip´e de plus de 6500 capteurs, qui sert de support `a une recherche pluridisciplinaire entre gestion de l’´energie (en particulier solaire), calcul haute performance, objets connect´es, drones et robots mobiles. Une premi`ere ´evaluation nous a permis de mettre en ´evidence que des traitements plus fins devaient ˆetre mis en œuvre pour adapter Swip aux requˆetes ayant une dimension spatio-temporelle. Swip n’est par exemple pas adapt´e au traitement des requˆetes du type“Quelle est la consommation journali`ere moyenne en

´

electrict´e le mois dernier pour les objets d´eploy´es pr`es de panneaux solaires ?”. La prise en compte de l’ambiguit´e des termes“le mois dernier”(s’agit-il des 30 jours qui pr´ec`edent la requˆete ou bien du mois pr´ec´edent ?) et de“pr`es de”n´ecessiterait d’enrichir l’approche.

Nous avons pr´evu d’´etendre notre travail dans plusieurs directions :

— exp´erimenter la facilit´e d’adaptation `a diff´erentes langues d’utilisateurs ; nous n’avons jusqu’ici consid´er´e que le fran¸cais et l’anglais et souhaitons participer `a des tˆaches portant sur le multilinguisme comme celles propos´ees dans le cadre des diff´erentes cam-pagnes QALD27;

— exp´erimenter des m´ethodes pour automatiser ou faciliter la conception de patrons de requˆetes. Nous voulons d’abord d´eterminer automatiquement les structures de patrons en analysant des exemples de graphes requˆetes, puis confronter les m´ethodes d´evelopp´ees

`

a une approche fond´ee sur l’apprentissage de requˆetes en langue naturelle ;

— explorer de nouvelles pistes pour que l’approche ´evolue et se concentre davantage sur les donn´ees elles-mˆemes plutˆot que sur l’ontologie, afin d’obtenir de meilleurs r´esultats sur les jeux de donn´ees provenant du Web de donn´ees li´ees, tels que DBpedia. Les tˆaches des campagnes d’´evaluation comme QALD se concentrent maintenant sur ce type de donn´ees.

25. https://syndream.laas.fr:8082/

26. https://www.laas.fr/public/fr/le-projet-adream 27. http://qald.aksw.org/

CHAPITRE 6

Le Web S´ emantique pour les objets connect´ es

Sommaire

6.1 Introduction . . . . 71 6.2 Le Web S´emantique pour l’IoT : notre vision . . . . 72 6.2.1 Motivations . . . . 72 6.2.2 Les nœuds. . . . 73 6.2.3 Les fonctions . . . . 74 6.2.3.1 Les fonctions centr´ees contenu . . . . 74 6.2.3.2 Les fonctions centr´ees communication . . . . 76 6.2.3.3 Bilan . . . . 79 6.2.4 Adaptation des technologies du Web S´emantique aux contraintes de

l’IoT . . . . 79 6.3 Distribuer les traitements sur des nœuds Fog . . . . 80 6.3.1 Motivation . . . . 80 6.3.1.1 Sc´enario illustratif dans une usine connect´ee . . . . 80 6.3.1.2 Des r`egles pour r´epr´esenter un besoin applicatif . . . . 82 6.3.2 Vue g´en´erale de l’approche . . . . 83 6.3.2.1 Hypoth`eses faites sur l’architecture . . . . 83 6.3.2.2 Principes de l’approche EDR . . . . 84 6.3.2.3 Circulation des messages dans le r´eseau . . . . 85 6.3.3 Les r`egles EDR et leur propagation. . . . 86 6.3.3.1 Structure modulaire des r`egles . . . . 86 6.3.3.2 Description des 4 modules d’une r`egle EDR . . . . 88 6.3.3.3 Activation dynamique des modules d’une r`egle EDR . . . . 88 6.3.4 EDRT : une strat´egie de propagation pour EDR . . . . 89

6.3.4.1 Une strat´egie centr´ee sur les types de propri´et´es de l’envi-ronnement . . . . 89 6.3.4.2 Description des nœuds pour EDRT . . . . 91 6.3.4.3 R`egles dans EDRT. . . . 92 6.3.5 Evaluations´ . . . . 93 6.4 Conclusion . . . . 93

6.1 Introduction

L’Internet s’est r´ecemment transform´e en un milieu dans lequel nous sommes globale-ment connect´es au travers d’objets d´eploy´es dans notre environnement. Comme nous l’avons

pr´esent´e dans le chapitre 2, le SWoT a pour objectif de favoriser l’interop´erabilit´e s´ eman-tique dont ce nouvel Internet a besoin. L’utilisation de vocabulaires d´er´ef´eren¸cables permet d’associer un contexte aux messages ´echang´es entre objets, ce contexte ´etant repr´esent´e dans un format intelligible pour ces derniers Corcho and Garc´ıa-Castro (2010), Murdock(2016).

L’objectif est de faciliter la communication machine `a machine, en gommant l’h´et´erog´en´eit´e des donn´ees recueillies, des objets, des plates-formes et des applications d´eploy´ees.

L’interop´erabilit´e est justement une des finalit´es majeures du Web S´emantique. Les tra-vaux du domaine se consacrent `a faciliter l’exploitation des donn´ees et des informations au contenu h´et´erog`ene stock´ees sur des serveurs Web, dans l’objectif de proposer des applica-tions `a destination des humains. Le domaine du SWoT propose une nouvelle perspective `a ces travaux en les pla¸cant dans le contexte d’´echanges entre machines d´eploy´ees dans des architectures aux composants plus divers que ceux des architectures clients-serveur classiques du Web. Ce domaine replace l’usage des ontologies dans un contexte initialement envisag´e par Tim Berners-Lee dans l’article fondateur du Web S´emantiqueBerners-Lee et al.(2001) : la communication entre agents logiciels, qui peuvent ˆetre vus aujourd’hui comme des objets connect´es.

Une dizaine d’ann´ees apr`es l’apparition du SWoT Scioscia and Ruta (2009), Pfisterer et al. (2011), il est important d’´evaluer les apports concrets du Web S´emantique pour l’IoT.

Nous proposons pour cela de tracer les grandes lignes d’un panorama actuel des travaux dans lesquels les ontologies sont utilis´ees pour favoriser l’interop´erabilit´e au sein d’un r´eseau d’objets. Nous mettons l’accent sur le type d’objets du r´eseau sur lesquels les traitements

“s´emantiques” sont actuellement mis en œuvre.

Forts de ces analyses, nous avons propos´e une approche g´en´erique permettant la distribu-tion dynamique de r`egles de d´eduction dans un r´eseau IoT. Cette approche exploite aussi bien les objets aux capacit´es de calcul et de stockage importantes (tels que les serveurs consid´er´es dans la programmation “dans le nuage” ouCloud computing) que les objets aux capacit´es plus restreintes (telles que les passerelles utilis´ees dans la programmation dite “dans le brouillard”

ou Fog computing). L’approche est g´en´erique dans le sens o`u elle peut ˆetre sp´ecialis´ee pour soutenir diff´erentes strat´egies de distribution li´ees aux exigences des applications cibl´ees.

L’ensemble de ces travaux ont ´et´e men´es en collaboration avec l’´equipe Sara du LAAS, dans le cadre du co-encadrement de la th`ese de Nicolas SeydouxSeydoux(2018). Ces travaux ont donn´e lieu `a plusieurs publications : Seydoux et al. (2018b), Seydoux et al. (2018c), Seydoux et al.(2019a) et Seydoux et al.(2017a).