• Aucun résultat trouvé

Nous venons d’ ´etudier les approches majeures de la mod ´elisation spatio-temporelle. Toutes ces approches se basent sur l’emploi de bases de donn ´ees traditionnelles. Toute-fois, il est `a noter que les approches les plus r ´ecentes tendent `a repr ´esenter l’information spatio-temporelle `a l’aide d’un graphe. Dans le cadre de cette th `ese, nous adh ´erons `a l’usage de graphe dans le cadre de la mod ´elisation. Cependant, notre approche se distingue par la volont ´e de s ´emantiser le graphe afin d’augmenter les capacit ´es de repr ´esentation du syst `eme ainsi que de fournir des m ´ecanismes d’inf ´erences valides capables de faire ´emerger des connaissances `a partir de celles d ´ej `a existantes. Pour cela, nous proposons d’ ´etudier les bases de connaissances comme support de l’informa-tion spatio-temporelle. Dans cette secl’informa-tion, nous introduirons les bases de connaissances ainsi que les logiques descriptives qui font autorit ´e dans le cadre de la cr ´eation de bases de connaissances. Enfin, nous pr ´esenterons les diff ´erents types de raisonnement qui peuvent ˆetre appliqu ´es sur une base de connaissances en logique de description.

2.3.1/ BASE DE CONNAISSANCES

Une base de connaissances regroupe des connaissances sp ´ecifiques `a un domaine sp ´ecialis ´e donn ´e, sous une forme exploitable par un ordinateur gr ˆace `a sa d ´efinition bas ´ee sur les logiques de description [Staab et al., 2013], [Baader et al., 2003]. Elle peut contenir des r `egles (dans ce cas, on parle de base de r `egles), des faits ou d’autres repr ´esentations. Si elle contient des r `egles, un moteur d’inf ´erence - simulant les raison-nements d ´eductifs logiques - peut ˆetre utilis ´e pour d ´eduire de nouveaux faits.

Une base de connaissance en logique descriptive se compose d’une TBox repr ´esentant la terminologie du domaine et une ABox qui d ´eclare les assertions et instances de ce domaine.

2.3.1.1/ TBOX :TERMINOLOGIE

La terminologie a pour objet l’ ´etude th ´eorique des d ´enominations des objets ou concepts utilis ´es pour d ´ecrire un domaine particulier. Pour cela, la TBox d’une base de connais-sance s’appuie sur le concept d’axiome terminologique qui peut se r ´esumer `a deux types de formules d ´ecrites par la formule 2.1 :

Cv D ou C≡D (2.1)

La premi `ere formule d ´efinit que toute instance de la classeC appartient ´egalement `a la classe Dtandis que la seconde indique que les conceptsCetDsont ´equivalents, c’est-`a-dire que toute instance de la classeC appartient ´egalement `a la classeDet que toute instance de la classe Dappartient ´egalement `a la classeC. En se basant sur ces deux formules, il est alors possible de construire des d ´efinitions pour d ´ecrire des concepts complexes. Par exemple, le concept deTissus Urbain Discontinupeut se d ´ecrire la fac¸on suivante :

Ainsi, une parcelle de tissu urbain discontinu repr ´esente un territoire sur lequel coexiste des zones urbaines ainsi que des for ˆets. La terminologie, ou TBox peut ainsi ˆetre d ´ecrite comme un ensemble de d ´efinitions tel qu’un concept n’apparait jamais deux fois du c ˆot ´e gauche. En d’autre terme, chaque concept n’est d ´efinit qu’une seule fois dans la base de connaissances.

2.3.1.2/ ABOX:DESCRIPTION DU MONDE

La deuxi `eme composante d’une base de connaissances est la ABox et permet une

des-cription du monde. La ABox permet de d ´efinir des individus en sp ´ecifiant leurs noms, les

concepts auxquels ils appartiennent, et leurs relations avec d’autres individus. L’instan-ciation d’un concept se d ´efinit sous la formeC(a) avecCle concept et al’instance de ce concept. Par exemple :

Region´ (Bourgogne) (2.3)

La formule ci-dessus d ´efinit que laBourgogneest une instance de la classeRegion´ De fac¸on similaire, l’instanciation d’une relation se d ´efinit sous la forme R(b,c)avecRla relation etbetcles instances li ´ees par cette relation. Par exemple :

sontAd jacentes(Bourgogne,Champagne−Ardenne) (2.4) La formule d ´efinit `a pr ´esent que les instances Bourgogne et Champagne− Ardenne sont adjacentes. Les deux exemples cit ´es pr ´ec ´edemment sont appel ´es des faits. L’ensemble des faits d’une base de connaissances offre une description du monde mod ´elis ´e au sein du syst `eme.

FIGURE2.13 – Illustration d’une base de connaissances [Baader et al., 2003]

Nous venons de voir qu’une base de connaissances (K) se compose d’une termino-logie, ou TBox (Tbox) ainsi qu’un ensemble d’individus (ABox : (Abox)) d ´efinis dans le respect de cette terminologie tel que K = (Tbox,Abox) . Comme illustr ´e par la figure 2.13, une base de connaissances se base sur un langage de description capable de

repr ´esenter les classes et les relations aussi bien pour la TBox que la ABox. D’autre part, une base de connaissances se caract ´erise par sa capacit ´e `a supporter des t ˆaches de raisonnement telles que le test de subsomption, d’instanciation ou de satisfiabilit ´e. Ces op ´erations d’inf ´erence s’appliquent aussi bien sur la TBox que sur le ABox. L’annexe B pr ´esente d’une part, les familles des logiques de description comme langage formel pour repr ´esenter les connaissances et, d’autre part, les raisonnements applicables sur ces connaissances qui constituent un apport majeurs des logiques de description par rapport aux autres langages de repr ´esentation des connaissances [Baader et al., 2003].

OWL est un langage de repr ´esentation des connaissances permettant la d ´efinition d’ontologie. Depuis 2004, OWL est une recommandation du consortium W3C [McGuinness et al., 2004]. Il est bas ´e sur les travaux ayant eu lieu dans le domaine des logiques de description que nous avons ´etudi ´e `a la section pr ´ec ´edente. OWL h ´erite des logiques de description la possibilit ´e de mettre en place des processus de v ´erification de la consistance et de la coh ´erence ainsi que de d ´eduction de connaissances `a partir des connaissances d ´ej `a existantes. Les ontologies sont des outils largement utilis ´es pour permettre de r ´ealiser des bases de connaissances.

2.3.2/ D ´EFINITION ET USAGE DONTOLOGIE EN INFORMATIQUE

Au sens informatique, une ontologie repr ´esente un graphe structur ´e de concept pour lequel les relations peuvent ˆetre des relations s ´emantiques ou des relations de subsomp-tion. L’objectif premier d’une ontologie est de mod ´eliser un ensemble de connaissance dans un domaine donn ´e, c’est pourquoi l’ontologie est souvent assimil ´ee `a une base de connaissances. Pourtant, il existe une diff ´erence fondamentale entre une ontologie et une base de connaissance. Une ontologie fournit la structure de base autour de la-quelle une base de connaissances peut ˆetre construite. Une ontologie fournit un en-semble de concepts et de termes pour d ´ecrire un certain domaine, tandis qu’une base de connaissances utilise ces termes pour repr ´esenter ce qui est vrai sur un monde r ´eel ou hypoth ´etique [Swartout et al., 1999].

Il existe de nombreuses d ´efinitions de l’ontologie, toutefois une des d ´efinitions faisant autorit ´e dans le domaine est celle de Gruber [Gruber, 1995] :

Une ontologie est la sp ´ecification explicite d’une conceptualisation d’un domaine de connaissance.

Cette d ´efinition fait intervenir les notions de sp ´ecification et de conceptualisation qui n ´ecessitent d’ ˆetre explicit ´ees davantage pour une meilleure compr ´ehension. Une concep-tualisation est une vue simplifi ´ee et abstraite du monde que l’on souhaite repr ´esenter sous certains aspects. En somme, une conceptualisation est un choix quant `a la mani `ere de d ´ecrire un domaine particulier. La sp ´ecification, quant `a elle, repr ´esente la des-cription formelle de cette conceptualisation pour la rendre utilisable par un ordinateur [Studer et al., 1998]. Ainsi, de fac¸on plus d ´etaill ´ee, une ontologie peut se d ´efinir comme un vocabulaire commun pour le partage de l’information d’un domaine, incluant des d ´efinitions lisibles en machine des concepts de base de ce domaine et des relations entre ces concepts. Sur les bases de cette d ´efinition, il existe une confusion fr ´equente entre vocabulaire contr ˆol ´e, taxonomie, th ´esaurus et ontologie [Gilchrist, 2003] du fait de d ´efinitions partiellement identiques. En effet, chacun d’entre eux permet de structurer, classifier, mod ´eliser et repr ´esenter des concepts et relations d’un domaine particulier.

´

termes soient employ ´es pour les m ˆemes usages pour une communaut ´e donn ´ee. Toute-fois, il existe des diff ´erences majeures entre ces approches en fonction du degr ´e de signification des termes sp ´ecifi ´es, de la notation ou du langage utilis ´e pour sp ´ecifier la signification des termes, et en fonction des finalit ´es d’usage de chacun d’eux.

Levocabulaire contr ˆol ´epeut n’avoir aucune signification sp ´ecifi ´ee, par exemple, il peut se r ´esumer en une liste de termes d’usage sur lesquels les gens d’un domaine se sont mis d’accord et pour lesquels la signification est compr ´ehensible. Ou bien un vocabulaire contr ˆol ´e peut offrir des d ´efinitions tr `es d ´etaill ´ees pour chacun des termes.

Lataxonomiepermet de donner plus de sens aux termes sp ´ecifi ´es gr ˆace `a la relation de subsomption (ou relation hi ´erarchique). Historiquement, la signification d’une relation de subsomption peut se d ´ecrire comme est un type de, par exemple :un chien est un type

d’animal. Cependant, de nos jours, le concept de taxonomie r ´ef `ere `a d’autres types de

hi ´erarchie avec d’autres significations pour la relation, comme la relationfait partie de, par exemple :la ni `evre fait partie de la Bourgogne. Les taxonomies d ´efinies de mani `ere vague ne permettent pas d’identifier clairement le type de relation de la hi ´erarchie. Cependant, les taxonomies poss ´edant une d ´efinition tr `es claire des diff ´erents types de lien de la hi ´erarchie se rapprochent des ontologies.

Le th ´esaurus poss `ede les m ˆemes capacit ´es que la taxonomie pour d ´efinir des hi ´erarchies `a l’aide de relations, mais se distingue par sa capacit ´e `a fournir d’autres types de relations que les relations hi ´erarchiques. Cependant, ces relations peuvent n’avoir au-cune signification autre que :il existe une relation entre ces deux termes.

Le motontologieest souvent utilis ´e pour faire r ´ef ´erence `a des choses diverses et vari ´ees comme des glossaires, des th ´esaurus, des taxonomies, des bases de connaissances, etc. Une ontologie formelle est un vocabulaire contr ˆol ´e exprim ´e dans un langage de repr ´esentation d’ontologie. Ce langage poss `ede une grammaire permettant d’utiliser les termes de vocabulaire pour exprimer des choses poss ´edant une signification au sein d’un domaine particulier. La grammaire contient des contraintes formelles permettant de sp ´ecifier ce qu’est une assertion, une d ´eclaration correctement form ´ee, une requ ˆete, etc. Ainsi cette grammaire d ´efinit comment les termes du vocabulaire contr ˆol ´e peuvent ˆetre utilis ´es ensembles. Les taxonomies et les th ´esaurus peuvent ˆetre vu comme des lan-gages simples pouvant donner lieu `a une grammaire. Cependant, de mani `ere g ´en ´erale, ce n’est pas le cas.

En somme, ce sont la combinaison de l’ensemble riche de relations et de la grammaire du langage de repr ´esentation qui conf `ere `a l’ontologie son caract `ere unique.

2.3.3/ LE LANGAGE DE REPRESENTATION DES ONTOLOGIES´ : OWL

Nous venons d’ ´etudier la notion d’ontologie. Les ontologies sont utilis ´ees au sein de plusieurs communaut ´es informatiques comme l’intelligence artificielle, le g ´enie logiciel, l’informatique biom ´edicale, etc. mais c’est au sein du Web S ´emantique que naitra le lan-gage OWL qui fait aujourd’hui autorit ´e dans le domaine de la repr ´esentation d’ontolo-gie. Le Web S ´emantique est un mouvement collaboratif guid ´e par le W3C pour favoriser l’ ´echange des donn ´ees et aider `a l’ ´emergence de connaissance en s’appuyant sur celles d ´ej `a pr ´esentes sur internet.

Tim Berners-Lee d ´ecrit le Web S ´emantique comme ”un mod `ele qui permet aux donn ´ees d’ ˆetre partag ´ees et r ´eutilis ´ees entre plusieurs applications, entreprises et groupes

d’uti-lisateurs” [Van Rijmenam, 2014]. A l’origine, le Web S ´emantique fut cr ´e ´e dans l’optique d’orienter l’ ´evolution du web actuel pour permettre aux utilisateurs de trouver, partager et combiner l’information plus facilement et sans interm ´ediaire. Bien que cet objectif soit rest ´e intact, le terme de ”Web S ´emantique” est aujourd’hui ´egalement souvent utilis ´e pour d ´esigner les formats et technologies qui ont ´et ´e conc¸us pour permettre son ´emergence. La liste des technologies du Web S ´emantique est fr ´equemment illustr ´ee par une archi-tecture appel ´ee ”pile du Web S ´emantique” (voir figure 2.14). Dans ces travaux, nous ne donnerons pas une description d ´etaill ´ee de chacune de ces technologies et nous conten-terons des br `eves d ´efinitions donn ´ees ci-apr `es :

FIGURE2.14 – Pile du Web S ´emantique

• Les URI/IRI permettent d’identifier de mani `ere unique les ressources du Web S ´emantique.

• Le XML fournit une syntaxe ´el ´ementaire, pour la structure du contenu dans les documents, mais il ne d ´ecrit pas la s ´emantique du document. XML n’est pas `a l’heure actuelle une composante n ´ecessaire des technologies du Web S ´emantique dans la plupart des cas.

• LeRDF est un langage simple destin ´e `a d ´ecrire de fac¸on formelle les ressources web et leurs m ´etadonn ´ees sous forme de triplets de la forme ”sujet pr ´edicat -objet”. Un mod `ele bas ´e sur RDF peut ˆetre repr ´esent ´e `a travers plusieurs syntaxes d’ ´echanges, par exemple, RDF/XML, N3, Turtle, et RDFa. RDF est une norme fon-damentale consid ´er ´ee comme le langage de base du Web S ´emantique. Il permet la mise en oeuvre du web de donn ´ees qui consiste `a lier et structurer l’information sur internet pour acc ´eder simplement `a la connaissance.

de structures conceptuelles et d’ontologies simples avec description hi ´erarchique des concepts et des propri ´et ´es.

OWLajoute plus de vocabulaire pour d ´ecrire les propri ´et ´es et les classes : comme avec les relations entre les classes, la cardinalit ´e, l’ ´egalit ´e, le typage des propri ´et ´es, les caract ´eristiques de propri ´et ´es (par exemple la sym ´etrie), etc. En outre, OWL permet d’effectuer des raisonnements.

SPARQLest un langage de requ ˆete et un protocole qui permettra de rechercher, d’ajouter, de modifier ou de supprimer des donn ´ees RDF disponibles dans le Web

`a travers l’Internet.

RIFest le langage d’expression de r `egles et d ´ecrit les relations qui ne peuvent l’ ˆetre en OWL.

• La logique d’unification repr ´esente les raisonnements logiques permettant d’inf ´erer de nouveaux faits ou de v ´erifier la consistance de l’ontologie.

• La preuve donne l’explication des raisonnements logiques fournit par la couche ”logique d’unification”.

• La cryptographie prot `ege les donn ´ees RDF gr ˆace `a un chiffrement et valide la source des faits par une signature digitale des donn ´ees RDF.

• Laconfianceassure l’authenticit ´e des sources et la fiabilit ´e des faits d ´eriv ´es. Si l’ ´evolution du web actuel vers le Web S ´emantique semble toujours attendue bien que n’ayant pas encore r ´eellement eu lieu [Berners-Lee et al., 2001] et restant une id ´ee lar-gement inexploit ´ee [Shadbolt et al., 2006], les technologies du Web S ´emantique ont tou-tefois r ´eussi `a s’imposer dans le domaine de l’ing ´enierie des connaissances gr ˆace no-tamment au standard OWL. Dans ces travaux, les technologies du Web S ´emantique sont utilis ´ees afin de d ´efinir une ontologie comme mod `ele de donn ´ees spatio-temporelles. Ainsi, les objectifs de ces travaux ne sont que partiellement conjoints `a ceux du Web S ´emantique, notre int ´er ˆet pour le Web S ´emantique ´etant guid ´e principalement par l’usage des technologies qui y sont associ ´ees. La figure 2.15 illustre la relation entre les ontolo-gies, le Web S ´emantique et les m ´etadonn ´ees.

FIGURE2.15 – Relation entre le Web S ´emantique, les ontologies et les m ´etadonn ´ees

Parmi les technologies du Web S ´emantique, notre attention sera port ´ee essentielle-ment sur le langage de repr ´esentation des connaissances OWL, bas ´e sur le mod `ele de donn ´ees de RDF. En outre, OWL est un standard informatique mettant en oeuvre cer-taines logiques de description permettant ainsi aux outils comprenant OWL de travailler avec ces donn ´ees ainsi que de fournir des raisonnements tels que la v ´erification de la

consistance de l’ontologie ainsi que l’inf ´erence de nouvelles connaissances `a partir de celles d ´ej `a existantes. Le langage OWL est compos ´e de trois sous-langages : OWL-Lite, OWL-DL et OWL-Full. OWL-Lite correspond essentiellement `a la famille SH IF, alors que OWL-DL (DL signifie ”Description Logic”) correspond essentiellement `a la famille SH OIN. Plus pr ´ecis ´ement, il s’agit des famillesSH IF(D)etSH OIN(D)car OWL dis-tingue deux types de r ˆoles. Les r ˆoles qui lient deux individus (appel ´esObject Property), comme ceux que nous avons vu dans tous les exemples jusqu’ `a pr ´esent, et les r ˆoles qui associent un individu avec un litt ´eral (appel ´es Datatype Property, d’o `u le (D)). Un litt ´eral est une valeur poss ´edant un type donn ´e commeInteger,String,Boolean, etc. Les sous-langages OWL-Lite et OWL-DL ne sont pas des extensions de RDF, dans le sens qu’un triplet RDF n’est pas n ´ecessairement valide dans ces deux sous-langages. C’est pour cette raison que le sous-langage OWL-Full a ´et ´e ajout ´e, et comprend tout OWL-DL, avec en plus tout RDF. En revanche, OWL-Lite est un sous-langage de OWL-DL. En-fin, OWL-DL est la version d ´ecidable du langage OWL. Il permet donc la r ´ealisation de raisonnements, contrairement `a OWL-Full qui est beaucoup trop expressif.

Depuis 2009, le consortium a officiellement lanc ´e OWL 2, qui se distingue de la premi `ere version par un pouvoir expressif augment ´e et une ´elimination de la d ´ecomposition en trois sous-langages. On parle plut ˆot de profils, en ´eliminant de OWL 2 certains ´el ´ements du langage, limitant ainsi son pouvoir expressif. Ainsi, OWL-Full n’existe plus, alors que OWL-Lite et OWL-DL peuvent ˆetre consid ´er ´es comme des profils de OWL 2. De-puis 2012, OWL 2 est recommand ´e par le W3C et permet l’expressivit ´e de la logique SROIQ(D) [Staab et al., 2013], [Baader et al., 2003]. L’ ´evolution de l’expressivit ´e depuis les logiques descriptives les moins expressives jusqu’aux logiques les plus complexes utilis ´ees dans le domaine du Web S ´emantique en lien avec les sous-langages d’OWL a

´et ´e pr ´esent ´ee sur la figure B.1.

Constructeurs OWL Syntaxe Exemple

intersectionOf C1uC2 HumainuHomme

unionOf C1tc2 DocteurtAvocat

complementOf ¬C ¬Homme

oneOf {a1. . .an} {,Georges,Patrick,S arah}

allValueFrom ∀R.C ∀possedeEn f ant` .Docteur

someValueFrom ∃R.C ∃possedeEn f ant` .Avocat

hasValue ∃R.a ∃citoyenDe.France

minCardinality ≥nR ≥2possedeEn f ant`

maxCardinality ≤nR ≤1possedeEn f ant`

inverseOf R possedeEn f ant`

TABLE2.1 – Les constructeurs OWL

Comme vu pr ´ec ´edemment, OWL-DL et OWL-Lite se basent respectivement sur les lo-giquesSH OIN etSH IF qui sont une augmentation de l’expressivit ´e de la logiqueSH, elle-m ˆeme bas ´ee surS `a laquelle la gestion des hi ´erarchies de r ˆoles a ´et ´e ajout ´ee. Les tableaux 2.1 et 2.2 pr ´esentent les constructeurs du langage OWL et les axiomes du lan-gage OWL 2 ainsi que leur correspondance en logique de description.

Sur la base de ces axiomes et constructeurs plusieurs raisonnements d’inf ´erence sont possibles en OWL et d ´erivent des principes de raisonnement ´enonc ´es en logique de description. L’annexes D d ´etaillent toutes les r `egles d’implications de RDFS et OWL, et donne plusieurs exemples d’inf ´erence en OWL sur la TBox ainsi que sur la ABox. Outre ces implications propres au langage OWL, il est ´egalement possible de d ´efinir ses propres