Chapitre 3 : Le Social Computing comme support des communautés
3.2 Technologies : de la sémantique pour le Social Computing
3.2.2 Ontologies pour le social computing
L’utilisation de vocabulaires et d'ontologies de représentation des connaissances rend
les données interopérables entre les applications sociales, les groupes, les personnes, les sites,
etc. Cependant, les entités utilisées dans les applications sociales sont variées, complexes et
hétérogènes. Ces entités peuvent représenter des personnes physiques ou morales, du temps,
de l’espace, des services, des ressources physiques ou logicielles, du contenu, etc. Un certain
nombre de vocabulaires du web sémantique sont déjà disponibles pour représenter un champ
d’action spécifique, ses entités connexes et ses relations (e.g. Foaf pour les profils des
utilisateurs, Owl-Time pour les entités temporelles, etc.).
Certains vocabulaires sont des standards, d’où notre intérêt pour les utiliser dans notre
modèle de communautés à base d’ontologies. Assembler les différents vocabulaires dans un
seul modèle permet de prendre en compte les différentes entités, composantes d’une
application du social computing. Les organismes de normalisation comme W3C ont fait en
sorte d’optimiser le rapprochement de ces vocabulaires.
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 50
3.2.2.1 Représentation sémantique pour les réseaux sociaux
Les réseaux sociaux sont une source riche d’informations permettant à toute personne
de créer et d’échanger du contenu. Définir une ontologie qui décrit l’ensemble des objets
échangés sur les réseaux sociaux permet de normaliser les échanges et d’interconnecter les
"jardins clos" de manière simple et efficace. Une combinaison très utilisée pour décrire les
acteurs des réseaux sociaux, ainsi que les contenus échangés, est la combinaison Foaf
23, Sioc
24et Skos
25(cf. Figure 6).
Figure 6: La combinaison Sioc, Foaf et Skos.
La Figure 6 illustre les principales interactions entre les trois vocabulaires, mais il
existe bien d’autres ontologies qui collaborent avec celles-ci comme Dublin Core
26, RSS
27,
etc.
23 http://www.foaf-project.org/ 24 http://www.w3.org/Submission/Sioc-spec/ 25 http://www.w3.org/2004/02/skos/ 26 http://dublincore.org/ 27 http://web.resource.org/rss/1.0/
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 51
Sioc (Semantically-Interlinked Online Communities) est un vocabulaire permettant de
décrire les concepts du web social et leurs relations (Breslin et al. 2005) . Il repose sur le
langage RDF
28(Resource Description Framework). L’ontologie principale (cf. Figure 7),
extensible par d’autres modules, décrit des concepts comme UserGroup, Space, Item,
Container, Post, UserAccount, Role, etc.
Figure 7: L'ontologie Sioc.
Sioc fait partie du jeu de modélisation sémantique des applications du social
computing tout en collaborant avec d’autres vocabulaires comme Foaf pour gérer les
utilisateurs, et Skos pour définir des thésaurus d’un domaine particulier.
Foaf (Friend of a Friend) est aussi un vocabulaire RDF. C’est la première brique de
sémantisation des réseaux sociaux. Il permet de décrire les personnes et les liens qu’elles
entretiennent entre elles. Cette ontologie (cf. Figure 8) décrit le concept de personne et les
concepts connexes comme ses groupes, ses organisations, ses documents, ses contacts, etc.
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 52
Figure 8: L'ontologie Foaf.
Dans le même cadre, Skos (Simple Knowledge Organization System) est un
vocabulaire en RDF permettant de formaliser la publication des thésaurus (cf. section
3.2.1.1), des classifications ou d'autres types de formalisme de représentation. Skos permet
d’aider à réaliser une représentation conceptuelle d’un domaine particulier utilisé par les
applications sociales.
La facilité d’utilisation, ainsi que la standardisation, sont les principaux arguments qui
plaident en faveur de cette combinaison de vocabulaires.
3.2.2.2 Représentation sémantique du temps
La notion de temps est fondamentale pour la description de la dimension temporelle de
ressources partagées au niveau des applications sociales pour faciliter leur exploitation
ultérieure.
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 53
Le vocabulaire OWL-Time
29a été proposé pour décrire les entités temporelles et leurs
propriétés pour le web sémantique. Ce vocabulaire prend en compte les deux
notions suivantes : l’instant et l’intervalle. Instant et Interval représentent deux sous classes
de la classe TemporalEntity. Un instant représente un moment infinitésimal tandis qu'un
intervalle représente un espace de temps compris entre deux instants : l'instant initial et
l'instant final. D’autres concepts ont été définis pour décrire la durée d’une entité temporelle
DurationDescription et DateTimeDescription, les intervalles implicites, etc. De même, des
propriétés-liens ont été définis pour décrire les relations entre les différents concepts de
l’ontologie (hasBeginning, ProperInterval, etc.). La Figure 9 illustre les composants associés
à l’ontologie Owl-Time.
Figure 9: L'ontologie Owl-Time (Miron 2009).
Le temps et la localisation sont des entités fortement corrélées. Tout comme le temps,
la représentation sémantique de l’espace a fait l’objet de plusieurs vocabulaires dédiés.
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 54
3.2.2.3 Représentation sémantique de l’espace
Plusieurs ontologies ont été proposées pour représenter l’entité spatiale comme
l’ontologie WGS84 Geo Positioning
30, un vocabulaire RDF qui permet de représenter des
concepts spatiaux clés comme la latitude, la longtitude, la localisation des objets dans
l’espace. Pour des applications nécessitant des niveaux d’abstraction de l’entité spatiale plus
élevés et plus sophistiqués, d’autres représentations sémantiques de l’espace ont été
proposées. Parmi celles-ci GeoRSS est recommandée par le W3C comme vocabulaire de
référence pour décrire les données spatiales. La version allégée du modèle GeoRSS est
GeoRSS-Simple
31(cf. Figure 10) qui permet de décrire les propriétés géospatiales des objets
d’une façon simple et facile à intégrer dans les applications sociales. Le concept principal de
l’ontologie est gml :_Feature qui regroupe tous les types d’éléments spatiaux (e.g. lat, long,
floor, radius, etc.) et qui est relié au concept gml :_Geometry qui spécifie des géométries
concrètes comme box, point, line et polygon.
Figure 10: L'ontologie GeoRSS-simple (Miron 2009).
30 http://www.w3.org/2003/01/geo/
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 55
3.2.2.4 Représentation sémantique de services
Owl-S
32(Semantic Markup for Web Services) est une ontologie pour décrire la
sémantique des services, basée sur le langage OWL
33(recommandation du W3C) et fondée sur
les principes de WSDL
34(Web Services Description Language). L’ontologie supérieure (i.e.
upper ontology) de Owl-S fournit trois types d’information essentiels (cf. Figure 11) : le profil
du service (ServiceProfile) qui décrit ses capacités, le modèle du service (Service Model) qui
décrit son fonctionnement, et le Service Grounding c’est-à-dire les informations nécessaires
pour accéder au service.
Figure 11: L'ontologie Owl-S.
Le profil du service contient les informations suivantes:
− Les propriétés non fonctionnelles comme le nom du service, les contacts et la
description textuelle.
− Les propriétés non fonctionnelles "IOPE" (inputs, outputs, préconditions, effets).
− La classification selon une taxonomie industrielle et une description de qualité.
Le modèle de service contient des informations sur le modèle de processus :
− AtomicProcess permet d’invoquer le service et d’obtenir le résultat en une seule
interaction.
32 http://www.daml.org/services/owl-s/
33 http://www.w3.org/2001/sw/wiki/OWL
Ghada BEN NEJMA | Thèse de doctorat | Université de Pau et des Pays de l’Adour | 2015 56