• Aucun résultat trouvé

Continuum : un modèle spatio-temporel et sémantique pour la découverte de phénomènes dynamiques au sein d’environnements géospatiaux

N/A
N/A
Protected

Academic year: 2021

Partager "Continuum : un modèle spatio-temporel et sémantique pour la découverte de phénomènes dynamiques au sein d’environnements géospatiaux"

Copied!
218
0
0

Texte intégral

(1)

Continuum : un mod `ele

spatio-temporel et s ´emantique pour la d ´ecouverte de ph ´enom `enes

dynamiques au sein

d’environnements g ´eospatiaux

B ENJAMIN H ARBELOT

(2)
(3)

Thèse de Doctorat

é c o l e d o c t o r a l e s c i e n c e s p o u r l ’ i n g é n i e u r e t m i c r o t e c h n i q u e s

U N I V E R S I T É D E B O U R G O G N E

TH ` ESE pr ´esent ´ee par

B ENJAMIN H ARBELOT

pour obtenir le

Grade de Docteur de l’Universit ´e de Bourgogne

Sp ´ecialit ´e :Informatique

Continuum : un mod `ele spatio-temporel et s ´emantique pour la d ´ecouverte de ph ´enom `enes dynamiques au sein d’environnements g ´eospatiaux

Unit ´e de Recherche :

Equipe Checksem, Le2i, UMR CNRS 6306, Universit ´e de Bourgogne´

Soutenue publiquement le 17 d ´ecembre 2015 devant le Jury compos ´e de :

MMEANNERUAS Rapporteur Directrice de recherche, IFSTTAR

M. FRANKBOOCHS Rapporteur Pr., I3MAINZ

M. GILLESGESQUIERE Examinateur Pr., Universit ´e Lumi `ere Lyon 2

MMESANDRABRINGAY Examinateur MCF, Universit ´e de Montpellier

M. CHRISTOPHECRUZ Directeur de th `ese MCF HDR, Universit ´e de Bourgogne

(4)
(5)

Je souhaite exprimer mes plus sinc `eres remerciements `a mon directeur de th `ese, le Docteur Christophe Cruz, pour m’avoir fait partager son exp ´erience et ses comp ´etences ainsi que pour tout le temps et l’attention port ´ee `a mes travaux. Je souhaite ´egalement le remercier pour son soutien et sa confiance. Sa grande disponibilit ´e, tant sur le plan personnel que professionnel, a grandement contribu ´e `a la qualit ´e de ces travaux et a permis de faire de cette th `ese une exp ´erience enrichissante.

Je voudrais remercier la Direction G ´en ´erale de l’Armement pour avoir financer les travaux pr ´esent ´es dans cette th `ese.

J’adresse un remerciement particulier `a Yoan Chabot pour ces nombreuses ann ´ees d’amiti ´e sans faille. Son soutien r ´egulier et sa bonne humeur quotidienne ont contribu ´e `a mon bien- ˆetre au sein de l’ ´equipe Checksem.

Je tiens `a remercier mes coll `egues et amis de l’ ´equipe Checksem : Tarcisio Mendes de Farias, Thomas Hassan, David Werner, Rafael Peixoto, Anett Hoppe, Helbert Arenas pour la bonne ambiance de travail et les bons moments pass ´es pendant ces trois ann ´ees. Je remercie ´egalement les membres permanents de l’ ´equipe Checksem : Ana Roxin, Aur ´elie Bertaux et Ouassila Narsis pour leur bonne humeur.

Je tiens `a remercier vivement le Professeur Christophe Nicolle pour m’avoir accueilli au sein de son ´equipe et dont le savoir et l’exp ´erience m’ont ´et ´e tr `es favorable.

Je souhaite remercier tr `es sinc `erement Guillaume Broux pour son amiti ´e. Ses r ´eflexions et ses conseils m’ont toujours ´et ´e b ´en ´efiques.

Je voudrais remercier ´egalement ma famille et les amis fortement assimil ´es au r ´eseau familiale pour l’int ´er ˆet manifest ´e `a maintes occasions. Trop nombreux pour ˆetre tous cit ´es, j’esp `ere qu’ils se reconnaitront. J’adresse un remerciement particulier `a mes parents qui ont toujours cru en moi.

Pour finir, je remercie Charlotte Blouzard pour son attention, son soutien et sa bonne humeur quotidienne.

v

(6)
(7)

I Contexte et Probl ´ematiques 1

1 Introduction 3

1.1 Contexte . . . 4

1.1.1 R ´ealit ´e physique et r ´ealit ´e observable . . . 5

1.1.2 Une compr ´ehension partag ´ee pour la d ´efinition des jeu de donn ´ees 6 1.1.3 D ´efinition du mod `ele pour la d ´ecouverte de connaissance : de la donn ´ee `a la d ´ecision . . . 7

1.2 Limites . . . 12

1.3 Verrous . . . 13

1.4 Contribution . . . 14

1.4.1 L’ontologie : une mod ´elisation flexible, accessible et compr ´ehensible sans perte s ´emantique . . . 14

1.4.2 L’ontologie comme support de l’information spatio-temporelle . . . . 15

1.4.3 Analyse qualitative et causalit ´e . . . 16

1.4.4 Aide `a la d ´ecision . . . 18

1.5 Plan de la th `ese . . . 19

1.5.1 Chapitre 2 : Etat de l’art . . . 19

1.5.2 Chapitre 3 : le mod `ele Continumm . . . 19

1.5.3 Chapitre 4 : Impl ´ementation et calcul des couches 1 et 2 . . . 20

1.5.4 Chapitre 5 : calcul de la couche 3 : les motifs g ´en ´eriques . . . 20

1.5.5 Chapitre 6 : calcul de la couche 4 et d ´ecouverte des connaissances 20 1.5.6 Chapitre 7 : Exp ´erimentation . . . 20

1.5.7 Chapitre 8 : Conclusion . . . 20

2 Etat de l’art 21 2.1 Mod ´elisation spatio-temporelle . . . 22

2.1.1 Notion de temps . . . 22

2.1.2 Notion d’espace . . . 26

2.1.3 Notions spatio-temporelles . . . 28

2.1.3.1 Primitives de mod ´elisation . . . 29 vii

(8)

2.1.3.2 Le changement . . . 29

2.1.3.3 Repr ´esentation d’une entit ´e . . . 29

2.1.3.4 Diff ´erents types d’entit ´es spatio-temporelles . . . 31

2.2 Etude des approches de mod ´elisation spatio-temporelle . . . 32´

2.2.1 Approches bas ´ees sur les ”snapshots” . . . 32

2.2.2 Approches bas ´ees sur les entit ´es . . . 33

2.2.3 Approches bas ´ees sur les ´ev `enements . . . 35

2.2.4 Approches bas ´ees sur les graphes . . . 36

2.2.5 Discussion . . . 37

2.3 Logiques de description et ontologies . . . 39

2.3.1 Base de connaissances . . . 39

2.3.1.1 TBox : terminologie . . . 39

2.3.1.2 ABox : description du monde . . . 40

2.3.2 D ´efinition et usage d’ontologie en informatique . . . 41

2.3.3 Le langage de repr ´esentation des ontologies : OWL . . . 42

2.4 L’approche Web S ´emantique et l’approche classique . . . 47

2.4.1 Comparatif des caract ´eristiques intrins `eques des syst `emes en monde ouvert et en monde ferm ´e . . . 47

2.4.1.1 Compl ´etude des informations . . . 47

2.4.1.2 Flexibilit ´e du sch ´ema . . . 48

2.4.1.3 Gestion de l’unicit ´e des entit ´es . . . 48

2.4.1.4 Interpr ´etation du monde repr ´esent ´e . . . 49

2.4.1.5 discussion . . . 49

2.4.2 Interpr ´etation des contraintes : de la contrainte d’int ´egrit ´e `a l’axiome logique . . . 50

2.4.2.1 Les contraintes d’int ´egrit ´e pour la d ´etection d’inconsistance 50 2.4.2.2 L’axiome logique comme support d’inf ´erence . . . 51

2.4.2.3 Discussion . . . 51

2.5 Mod ´elisation spatio-temporelle dans le Web S ´emantique . . . 53

2.5.1 Mod ´elisation spatiale dans le Web S ´emantique . . . 53

2.5.1.1 GML (Geography Markup Language) . . . 54

2.5.1.2 Basic RDF Geo Vocabulary . . . 54

2.5.1.3 GeoRSS et GeoOWL . . . 54

2.5.1.4 SPARQL-ST, st-RDF . . . 55

2.5.1.5 GeoSPARQL . . . 56

(9)

2.5.2 Mod ´elisation du temps dans le Web S ´emantique . . . 60

2.5.2.1 OWL-Time . . . 60

2.5.2.2 SWRL temporal ontology . . . 60

2.5.3 Ontologie de Fluent : Mod ´elisation de la dynamique d’un syst `eme . 61 2.5.3.1 Naissance des ontologies de fluent . . . 62

2.5.3.2 4D-fluents . . . 64

2.5.3.3 TOWL . . . 64

2.6 Discussion . . . 66

2.6.1 Apport pour le domaine de la mod ´elisation spatio-temporelle . . . . 67

2.6.2 Apport pour le domaine de la dynamique d’utilisation des terres et des couvertures terrestres . . . 69

II Contribution 73 3 Continuum : un mod `ele s ´emantique spatio-temporel 75 3.1 D ´efinition d’une couche spatio-temporelle . . . 75

3.1.1 Organisation hi ´erarchique des concepts . . . 76

3.1.2 Repr ´esentation du temps : intervalles et instants . . . 76

3.1.3 Les quatre composantes d’une entit ´e . . . 77

3.2 D ´efinition d’une transition spatio-temporelle . . . 78

3.2.1 Expression des contraintes d’int ´egrit ´e des relations de filiation . . . 80

3.2.1.1 Contraintes d’int ´egrit ´e de la premi `ere couche du mod `ele : la relation de filiation . . . 81

3.2.1.2 Contraintes d’int ´egrit ´e de la deuxi `eme couche du mod `ele : la couche d’identit ´e . . . 82

3.2.1.3 Contraintes d’int ´egrit ´e de la troisi `eme couche du mod `ele : les motifs g ´en ´eriques . . . 84

3.2.2 Contraintes d’int ´egrit ´e sur les primitives du mod `ele Continuum . . . 89

4 Impl ´ementation et calcul de la 1 `ere et 2 `eme couche 93 4.1 Le jeu de donn ´ees Corine Land Cover . . . 93

4.2 Calcul de la couche 1 et 2 . . . 96

4.2.1 La transition spatio-temporelle comme base d’ ´etude des relations de filiation . . . 96

4.2.2 Calcul de la couche 1 : g ´en ´ealogie . . . 98

4.2.3 Elimination des changements n ´egligeables . . . 98´

4.2.4 Calcul de la couche 2 : cycle de vie . . . 101

(10)

5 Calcul de la couche 3 : les motifs g ´en ´eriques spatiaux 105

5.1 Relations de continuation unaire . . . 106

5.2 Relations de d ´erivation unaire . . . 108

5.3 Motifs d’ ´evolution N-aire . . . 109

6 Couche 4 : d ´ecouverte de connaissance 115 6.1 Etude de la profondeur du changement . . . 115´

6.2 Les motifs de tendance : du ph ´enom `ene au processus . . . 123

6.3 Etude des ´evolutions connexes . . . 128´

7 Exp ´erimentation 131 7.1 Int ´egration du jeu de donn ´ees Corine Land Cover . . . 131

7.2 Cr ´eation des transitions spatio-temporelles . . . 133

7.3 Calcul des couches du mod `ele . . . 133

7.4 Architecture de l’application . . . 136

III Conclusion 141 8 Conclusion g ´en ´erale 143 8.1 Bilan . . . 143

8.2 Perspectives . . . 144

IV Annexes 159 A Liste des publications sur les travaux 161 B Introduction aux logiques de description 163 B.1 Les familles des logiques de description . . . 163

B.1.1 AL: la logique de description de base . . . 164

B.1.2 Le constructeur de hi ´erarchie de r ˆolesH . . . 165

B.1.3 Le constructeur de conjonction de r ˆolesR . . . 166

B.1.4 Le constructeur de r ˆoles transitifsR+ . . . 166

B.1.5 Le constructeur d’ ´enum ´eration d’individusO. . . 166

B.1.6 Le constructeur d’unionU. . . 166

B.1.7 Le constructeur de quantification existentielle compl `eteE . . . 167

B.1.8 Le constructeur de fonction F . . . 167

(11)

B.1.9 Le constructeur d’inverseI . . . 167

B.1.10 Les restrictions de cardinalit ´eN . . . 168

B.1.11 Les restrictions de cardinalit ´e qualifi ´eeQ . . . 169

B.1.12 La n ´egation sans restrictionC. . . 169

B.1.13 Discussion . . . 169

B.2 Les raisonnements en logiques de description . . . 172

B.2.1 Raisonnement sur la TBox . . . 172

B.2.2 Raisonnement sur la ABox . . . 173

B.2.3 Complexit ´e de l’inf ´erence . . . 174

C V ´erification de contraintes d’int ´egrit ´e 177 C.1 Les contraintes de subsomption . . . 177

C.2 Les contraintes domain-range . . . 178

C.3 Les contraintes de participation . . . 179

C.4 Les contraintes de cardinalit ´e . . . 181

C.5 Les contraintes de propri ´et ´es . . . 184

C.6 Les contraintes complexes . . . 185

D Raisonnements d’inf ´erences en OWL 189 D.1 Pr ´esentation de OWL 2 DL . . . 189

D.2 Les r `egles d’inf ´erence de OWL Horst . . . 191

D.2.1 R `egles RDFS . . . 191

D.2.2 R `egles OWL . . . 192

D.3 Raisonnements sur la TBOX . . . 192

D.3.1 Inf ´erence sur les classes . . . 194

D.3.1.1 H ´eritage de la disjonction avec le complement d’une super-classe . . . 194

D.3.1.2 H ´eritage de la contrainte de disjonction . . . 194

D.3.1.3 owl :equivalentClass . . . 194

D.3.2 Inf ´erence sur les propri ´et ´es . . . 195

D.3.2.1 Transivit ´e et relation inverse . . . 195

D.3.2.2 H ´eritage des propri ´et ´es subsum ´ees . . . 195

D.3.2.3 owl :equivalentProperty . . . 196

D.4 Raisonnements sur la ABOX . . . 196

D.4.1 Inf ´erence d’instance de classe . . . 197

D.4.1.1 L’h ´eritage via rdfs :subclassof . . . 197

(12)

D.4.1.2 Les contraintes rdfs :domain et rdfs :range . . . 197

D.4.1.3 L’axiome owl :oneOf . . . 198

D.4.1.4 La restriction owl :hasvalue . . . 198

D.4.1.5 La restriction owl :allvaluesfrom . . . 199

D.4.1.6 La restriction owl :someValuesFrom . . . 199

D.4.2 Inf ´erence d’instances de proprietes . . . 200

D.4.2.1 restriction owl :hasvalue . . . 200

D.4.2.2 La transitivit ´e a l’aide de owl :TransitiveProperty . . . 200

D.4.2.3 La sym ´etrie `a l’aide de owl :SymmetricProperty . . . 201

D.4.2.4 La propri ´et ´e inverse `a l’aide de owl :inverseOf . . . 201

D.4.2.5 owl :AllDifferent et owl :differentFrom . . . 201

D.4.2.6 Propri ´et ´es fonctionnelles . . . 202

D.4.2.7 Propri ´et ´es inversement fonctionnelles . . . 202

(13)

C ONTEXTE ET P ROBL EMATIQUES ´

1

(14)
(15)

I NTRODUCTION

Ce chapitre introduit le contexte des travaux, les limites, les verrous scientifiques ainsi que la contribution des travaux pr ´esent ´es. Enfin, une description des diff ´erents chapitres de ce rapport conclut cette introduction. Les syst `emes d’information g ´eographique offrent une vision simplifi ´ee du monde r ´eel. Par exemple, l’absence de la connaissance qu’un arbre ou un b ˆatiment existe sur une parcelle de terrain, dans l’absolu, ne permet pas de conclure qu’il n’y a pas d’arbre ou de b ˆatiment sur cette parcelle. Le manque de connais- sance sur l’environnement g ´eographique est une caract ´eristique r ´ecurrente du domaine spatio-temporel. D `es lors, il est n ´ecessaire, d’une part, de d ´efinir des outils permettant d’offrir une compr ´ehension partag ´ee de la r ´ealit ´e mod ´elis ´ee `a la fois par des humains et des machines. D’autre part, de fournir des capacit ´es d’analyse pour la d ´ecouverte de connaissances implicites susceptibles d’am ´eliorer la compr ´ehension de la dynamique des territoires et faciliter les d ´ecisions pour des experts ou charg ´es de territoire. Plu- sieurs mod `eles ont ´et ´e propos ´es dans la litt ´erature pour repr ´esenter la dynamique d’en- tit ´es spatio-temporelles mais ne permettent pas de repr ´esenter et prendre en compte le contexte de l’environnement g ´eospatial. Pour r ´epondre `a cette probl ´ematique majeure, ces travaux envisagent les technologies du Web S ´emantique comme support de l’infor- mation spatio-temporelle afin de proposer un mod `ele riche pour l’analyse qualitative de la dynamique des entit ´es.

Sommaire

1.1 Contexte . . . . 4

1.1.1 R ´ealit ´e physique et r ´ealit ´e observable . . . . 5

1.1.2 Une compr ´ehension partag ´ee pour la d ´efinition des jeu de donn ´ees 6 1.1.3 D ´efinition du mod `ele pour la d ´ecouverte de connaissance : de la donn ´ee `a la d ´ecision . . . . 7

1.2 Limites . . . . 12

1.3 Verrous . . . . 13

1.4 Contribution . . . . 14

1.4.1 L’ontologie : une mod ´elisation flexible, accessible et compr ´ehensible sans perte s ´emantique . . . . 14

1.4.2 L’ontologie comme support de l’information spatio-temporelle . . 15

1.4.3 Analyse qualitative et causalit ´e . . . . 16

1.4.4 Aide `a la d ´ecision . . . . 18

1.5 Plan de la th `ese . . . . 19

1.5.1 Chapitre 2 : Etat de l’art . . . . 19

1.5.2 Chapitre 3 : le mod `ele Continumm . . . . 19

1.5.3 Chapitre 4 : Impl ´ementation et calcul des couches 1 et 2 . . . . 20 3

(16)

1.5.4 Chapitre 5 : calcul de la couche 3 : les motifs g ´en ´eriques . . . . 20 1.5.5 Chapitre 6 : calcul de la couche 4 et d ´ecouverte des connaissances 20 1.5.6 Chapitre 7 : Exp ´erimentation . . . . 20 1.5.7 Chapitre 8 : Conclusion . . . . 20

1.1/ C

ONTEXTE

Les Syst `emes d’Informations G ´eographique ont ´et ´e conc¸us afin de rendre compte de l’ ´etat du monde r ´eel. La correspondance entre la r ´ealit ´e et la repr ´esentation qui en est faite au sein du SIG est un enjeu majeur dans la conception de ce syst `eme.

Cependant, la r ´ealit ´e physique, telle qu’elle existe dans la nature ne peut qu’ ˆetre observ ´ee et approxim ´ee par les outils de stockage existants. La repr ´esentation de cette r ´ealit ´e est alors, par nature, inexacte et incertaine `a cause de l’approximation impos ´ee par les syst `emes de repr ´esentation. Plusieurs diff ´erences d ´ecoulent de ce d ´ecalage entre r ´ealit ´e et repr ´esentation :

• Les propri ´et ´es physiques du monde r ´eel sont continues tandis que les syst `emes d’information sont uniquement capables de donner une approximation discr `ete de l’espace et du temps. D’autre part, le monde r ´eel ´evolue de mani `ere continue tandis que le syst `eme d’information tente de retracer et d’enregistrer les changements qui s’op `erent.

• La r ´ealit ´e est soumise `a la simplification et `a l’approximation aussi bien dans l’espace que dans le temps cr ´eant ainsi un d ´ecalage entre le monde r ´eel et sa repr ´esentation.

La mod ´elisation spatio-temporelle d’un environnement g ´eographique tente de donner une repr ´esentation du monde r ´eel de sorte que celle-ci soit compr ´ehensible et utilisable par un public expert ou non-expert. En somme, la mod ´elisation se doit de mettre en ´evidence les entit ´es essentielles composant l’environnement g ´eographique, prendre en compte les interactions et les relations entre ces diff ´erentes entit ´es, enfin la connaissance ´etablie `a partir de ces donn ´ees doit permettre d’inf ´erer de nouvelles connaissances et d’aider `a la prise de d ´ecision. Dans [Frank, 2003], l’auteur d ´efinit une hi ´erarchie ontologique en 5

´etapes pour d ´ecrire l’environnement g ´eographique.

• Etape 1 : La r ´ealit ´e physique. La premi `ere ´etape d ´ecrit la r ´ealit ´e physique. Par cons ´equent, il existe une infinit ´e de points d ´efinis dans le temps et l’espace.

Chacun de ces points poss `ede des propri ´et ´es d ´etermin ´ees. L’espace et le temps sont repr ´esent ´es comme des dimensions fondamentales de la r ´ealit ´e.

• Etape 2 : La r ´ealit ´e observable : La r ´ealit ´e observable est une perception de la r ´ealit ´e physique. Elle permet d’observer les propri ´et ´es d’un point dans l’espace `a un instant pr ´ecis. Du d ´ecalage entre la r ´ealit ´e et sa perception r ´esulte l’estimation.

Par cons ´equent, les observations sont toutes incompl `etes et impr ´ecises.

• Etape 3 : Les objets de l’environnement observ ´es : `a partir de la r ´ealit ´e observ ´ee, des objets sont d ´efinis selon des propri ´et ´es uniformes dans l’espace

(17)

et dans le temps. Par exemple, un ensemble d’arbres se r ´esume `a une figure polygonale qui ´evolue dans le temps en fonction de la taille de la for ˆet. En outre, des attributs descriptifs peuvent ˆetre associ ´es `a cette g ´eom ´etrie.

• Etape 4 : La r ´ealit ´e sociale : La plupart des informations contenues dans une base de donn ´ees spatio-temporelle ne sont pas des propri ´et ´es physiques du monde r ´eel. La r ´ealit ´e physique se compose d’un tr `es grand nombre de choses qui interagissent entre elles. Cependant, bien souvent, la r ´ealit ´e physique n’est pas repr ´esent ´ee comme telle au sein des syst `emes d’information g ´eographique, mais plut ˆot interpr ´et ´ee dans une r ´ealit ´e sociale. Bien que cette r ´ealit ´e sociale nous semble aussi r ´eelle que la r ´ealit ´e physique, elle est en fait totalement artificielle, car elle n’existe qu’au travers d’un contexte d ´efini par des interactions entre des entit ´es nomm ´ees ainsi que des faits et des r `egles sociales ´etablis.

• Etape 5 :Les agents cognitifs: Ces agents prennent en compte `a la fois le monde physique et la r ´ealit ´e sociale qui compose le monde dans lequel ils ´evoluent. L’ob- jectif de ces agents est alors d’inf ´erer de nouvelles connaissances `a partir de celles d ´ej `a existantes, et d’utiliser ces nouvelles connaissances dans un processus d’aide

`a la d ´ecision.

Les travaux propos ´es dans cette th `ese portent sur la mod ´elisation des objets de l’en- vironnement observ ´es et de la r ´ealit ´e sociale inscrits dans une dynamique. En ten- tant d’offrir un support riche de repr ´esentation des connaissances, le mod `ele propos ´e permet une repr ´esentation d ´etaill ´ee du contexte de l’environnement g ´eospatial et sera pr ´esent ´e au chapitre 3. En outre, le mod `ele a pour objectif de contribuer au d ´eveloppement d’agents cognitifs en utilisant les informations contextuelles d ´efinies aux

´etapes pr ´ec ´edentes. Un tel mod `ele n ´ecessite defournir des outils capables d’extraire des motifs g ´en ´eriques et d’offrir une interpr ´etation de ces motifs pour aboutir `a la d ´ecouverte de connaissanceau sein du jeu de donn ´ees. Cet aspect sera trait ´e au chapitre 6.

1.1.1/ R ´EALITE PHYSIQUE ET R´ EALIT´ E OBSERVABLE´

Le point de d ´epart de toute application SIG est le monde r ´eel dont la d ´efinition peut ˆetre associ ´ee `a celle de la r ´ealit ´e physique. La r ´ealit ´e physique ne peut ˆetre illustr ´ee en tant que telle, car toute illustration d ´ecoule d’une perception et alt `ere la nature de cette r ´ealit ´e. La perception du monde r ´eel par un capteur ou un humain donne lieu `a la r ´ealit ´e observable. La figure 1.1 illustre un exemple de cette r ´ealit ´e observable.

Bien que cette figure semble repr ´esenter le monde r ´eel, elle ne l’est pas. Cette figure est un clich ´e qui se r ´esume en un ensemble de pixel qui discr ´etise obligatoirement le monde r ´eel. D `es lors, cette image est une approximation de la r ´ealit ´e physique r ´ealis ´ee `a l’aide d’un capteur. Les perceptions humaines souffrent des m ˆemes contraintes du simple fait que chaque ˆetre humain est unique.

(18)

FIGURE1.1 – La r ´ealit ´e observable

1.1.2/ UNE COMPREHENSION PARTAG´ EE POUR LA D´ EFINITION DES JEU DE´

DONNEES´

Cependant, bien que les perceptions de tout `a chacun soit diff ´erentes, il est possible de partager et de s’accorder sur l’interpr ´etation de ces perceptions. Ainsi, bien qu’il existe un spectre infini de longueurs d’ondes pour constituer la lumi `ere visible au tra- vers de diff ´erentes couleurs, l’homme a depuis des si `ecles r ´eussi `a d ´efinir un vocabulaire commun afin de partager des informations sur les couleurs. Ainsi, chaque ˆetre humain poss ´edant la maitrise de ce vocabulaire est capable de se faire une repr ´esentation de ce qu’est le rouge, levert, lebleu, etc. Toutefois, il est int ´eressant de noter que plus le nombre de termes pour repr ´esenter les couleurs est ´elev ´e, plus il existe des risques de confusion d’une personne `a l’autre. Par exemple, les termes blanc cass ´e,blanc de zinc, blanc de lait poss `ede un fort potentiel de confusion.

Le m ˆeme principe s’applique pour la conception de jeu de donn ´ees de fac¸on plus

´elabor ´ee, car il est n ´ecessaire de s’accorder sur plusieurs caract ´eristiques de la r ´ealit ´e observable. Un jeu de donn ´ees est un groupement de donn ´ees par sujet, par th `eme ou par type. Ainsi, la conception d’un jeu de donn ´ees, requiert la s ´election des ca- ract ´eristiques pr ´epond ´erantes de la r ´ealit ´e observable pour un domaine d’ ´etude parti- culier. Les objets de la r ´ealit ´e observable sont alors approxim ´es et ramen ´es `a des figures g ´eom ´etriques accompagn ´ees ´eventuellement d’attributs descriptifs.

La figure 1.2 illustre les objets de l’environnement observ ´e `a partir de la r ´ealit ´e observable d ´ecrite par la figure 1.1. De nombreux objets non-pertinents de la r ´ealit ´e observable ne sont plus repr ´esent ´es, les routes deviennent des lignes, un ensemble d’arbre devient un polygone vert, un lac devient un polygone bleu ou encore un ensemble de b ˆatiment devient un polygone gris. Ainsi, les nombreuses nuances sont ramen ´ees `a un nombre minimal et explicite de couleur et les objets complexes sont r ´esum ´es par de simples g ´eom ´etries. Cette repr ´esentation permet de discriminer et mettre en avant chaque objet de mani `ere la plus compr ´ehensible pour l’homme. En parall `ele, ce travail de simplification du monde r ´eel permet d’ ´etablir des jeux de donn ´ees utilisables par la machine pour le stockage et l’analyse.

Dans cet exemple, seuls les objets existants physiquement dans le monde r ´eel sont

(19)

FIGURE1.2 – Les objets de l’environnement observ ´e ainsi que leur r ´ealit ´e sociale

repr ´esent ´es. Cependant, l’exploitation de ces donn ´ees spatiales d ´epourvue de donn ´ees contextuelles ne permet pas d’obtenir de r ´esultats pertinents. Par cons ´equent, il est n ´ecessaire d’ajouter des attributs ainsi que des g ´eom ´etries afin de mod ´eliser la r ´ealit ´e sociale de l’environnement g ´eographique. Sur la figure 1.2, cette r ´ealit ´e sociale est repr ´esent ´ee par : les noms de route, les noms de ville et la g ´eom ´etrie d ´efinissant les fronti `eres de la ville de Dijon. En somme, cette r ´ealit ´e sociale d ´efinie par l’auteur dans [Frank, 2003] correspond `a ce que nous qualifierons de ”contexte” de l’application.

Dans la litt ´erature de l’ing ´enierie des connaissances, les ontologies se sont impos ´ees comme un moyen efficace de d ´efinir un vocabulaire commun pour les chercheurs qui ont besoin de partager l’information dans un domaine. Une ontologie contient des d ´efinitions lisibles en machine des concepts de base de ce domaine et de leurs relations. Dans ces travaux, nous prenons le parti d’utiliser l’ontologie comme composante centrale du mod `ele de repr ´esentation d’entit ´e spatio-temporelles propos ´e dans le cadre de cette th `ese.

1.1.3/ D ´EFINITION DU MODELE POUR LA D` ECOUVERTE DE CONNAISSANCE´ :DE LA DONNEE´ A LA D` ECISION´

La d ´efinition des objets de l’environnement observ ´e ainsi que la r ´ealit ´e sociale sont guid ´es par une perception et une compr ´ehension partag ´ee de la r ´ealit ´e observ ´ee de sorte que chaque polygone, ligne ou couleur puisse ˆetre associ ´ee `a la s ´emantique d’un objet ou une entit ´e de cette r ´ealit ´e, et ce, quelque soit l’utilisateur du jeu de donn ´ees.

A ce stade, le jeu de donn ´ees n’est qu’une structure permettant d’accueillir les donn ´ees provenant des capteurs. Un enjeu majeur des syst `emes de gestion de donn ´ees consiste

`a rendre la donn ´ee utile pour des experts ou de simples consommateurs afin d’aider `a prendre une d ´ecision sur une action `a mener.

Cependant, la donn ´ee brute en tant que telle, n’est pas compr ´ehensible par l’humain et doit ˆetre contextualis ´ee. Pour cela, le mod `ele DIKW (Data-Information-Knowledge- Wisdom) [Rowley, 2007], [Cleveland, 1982], [Ackoff, 1989] a fait son apparition au sein

(20)

de la litt ´erature de l’information et de la connaissance. Le mod `ele DIKW consiste g ´en ´eralement en une hi ´erarchie visant `a donner une d ´efinition des donn ´ees, de l’informa- tion, de la connaissance et de la sagesse. Ainsi, il d ´ecrit l’articulation entre ces diff ´erentes strates, c’est- `a-dire d ´ecrire les processus de transformation pour passer de la donn ´ee `a l’information, de l’information `a la connaissance et de la connaissance `a la sagesse.

Cette pyramide est connue sous plusieurs noms parmi lesquels nous citerons ”hi ´erarchie de la connaissance”, ”hi ´erarchie de l’information”, ”hi ´erarchie de la compr ´ehension”,

”pyramide de la connaissance”. Bien que dans la litt ´erature Ackoff [Ackoff, 1989] soit g ´en ´eralement cit ´e comme ´etant `a l’origine de cette hi ´erarchie, d’autres travaux ant ´erieurs comme ceux de Cleveland en 1982 [Cleveland, 1982] d ´efinissaient d’ores et d ´ej `a les bases du domaine.

Par la suite, de nombreux travaux suivirent proposant chacun des ´evolutions au niveau de la hi ´erarchie, des d ´efinitions des termes ”donn ´ee”, ”information”, ”connaissance” et ”sa- gesse”, ou encore au niveau des processus de transformation. Si la majorit ´e des travaux s’accorde `a d ´efinir l’information en fonction des donn ´ees, la connaissance en fonction des informations, et la sagesse en fonction des connaissances, il n’existe, en revanche, aucun consensus r ´eel pour d ´ecrire les processus de transformations. D’autre part, bien que les couches ”donn ´ees-information-connaissance-sagesse” soient pr ´esentes dans les mod `eles propos ´es de mani `ere quasi constante, d’autres couches sont r ´eguli `erement d ´efinies en sus. Enfin, les d ´efinitions de chacune de ces couches varient fr ´equemment au sein des travaux propos ´es par la communaut ´e. En somme, le mod `ele DIKW fait l’objet d’une litt ´erature abondante, pour autant, il semble n’y avoir qu’un consensus faible quant

`a sa d ´efinition [Rowley, 2007].

Dans le cadre de cette th `ese, nous utiliserons le mod `ele DIKW pour mettre en ´evidence l’apport de l’ontologie par rapport aux bases de donn ´ees traditionnelles et pour expliciter le processus depuis la cr ´eation des donn ´ees jusqu’ `a leur exploitation dans l’aide `a la d ´ecision. Les syst `emes d’information traditionnels de la mod ´elisation spatio-temporelle que sont les bases de donn ´ees relationnelles sont limit ´es au stockage et au traitement de donn ´ees et d’informations. Les ontologies, quant `a elles, repousse cette limitation pour permettre d’atteindre le stade de la gestion des connaissances offrant ainsi un support int ´eressant pour l’aide `a la d ´ecision.

Face `a l’h ´et ´erog ´en ´eit ´e des propositions et des d ´efinitions du mod `ele DIKW de la litt ´erature, nous s ´electionnerons les diff ´erentes couches en s’appuyant sur les travaux classiques et fixerons nos propres d ´efinitions de chacune de ces couches afin de lever les ambigu¨ıt ´es tout en veillant `a refl ´eter les d ´efinitions habituelles de la litt ´erature :

Les donn ´ees :la donn ´ee est un ´el ´ement brut et ne poss `ede aucune signification.

Elle existe sous diff ´erentes formes utilisables ou non et peut ˆetre quantitative ou bien qualitative. Au stade de la donn ´ee, le contenu est dit ”non-structur ´e”.

L’information : A ce stade, la donn ´ee est mise en lien avec d’autres donn ´ees permettant de leur donner un sens et leur conf ´erer le statut d’”information”. L’infor- mation peut ˆetre utile, mais n’a pas vocation `a l’ ˆetre. Typiquement, les bases de donn ´ees relationnelles ´etablissent des informations `a partir des donn ´ees stock ´ees permettant de r ´epondre `a des questions telles que ”qui”, ”quoi”, ”o `u” et ”quand”. Au stade de l’information, le contenu est dit ”structur ´e”.

La connaissance : la connaissance est le r ´esultat de l’appropriation de l’infor-

(21)

mation. Contrairement `a l’information, la connaissance a pour vocation d’ ˆetre utile. Pour cela, la connaissance se base sur les donn ´ees et les informations pour tenter d’en extraire un motif, c’est- `a-dire r ´epondre `a la question : ”comment”.

Le contenu est alors dit ”s ´emantique”. La connaissance est en quelque sorte une m ´emorisation de l’information visant `a en extraire une r `egle. En ce sens, la connaissance poss `ede g ´en ´eralement des capacit ´es de pr ´ediction `a propos de ”ce qui est d ´ecrit” ou ”ce qu’il va se passer ensuite”.

La sagesse : Cette ´etape est parfois r ´epertori ´ee sous le terme ”savoir”. La sagesse prend en compte des codes sp ´ecifiques de l’humain tels que la morale, l’ ´etique, etc. La sagesse tente de comprendre ce qui n’a pu l’ ˆetre au travers des

´etapes pr ´ec ´edentes. D `es lors, elle se rapproche de la r ´eflexion faisant appel `a des processus tels que le discernement ou encore le jugement entre ce qui est vrai et ce qui est faux ou encore ce qui est bien, ce qui est mal. Par cons ´equent, contrairement aux ´etapes pr ´ec ´edentes, il ne peut y avoir de r ´eponses tranch ´ees aux questions. En d ´efinitive, la sagesse tente de mettre en œuvre l’action la plus appropri ´ee en tenant compte de ”ce qui est connue” (connaissance) ainsi que de

”ce qui est le mieux” en se basant sur des consid ´erations ´ethiques et sociales.

FIGURE 1.3 – Exemple d’ ´evolution spatio-temporelle d ´ecrite au travers des diff ´erentes couches de la hi ´erarchie de la compr ´ehension

Chacune des couches abord ´ees pr ´ec ´edemment est illustr ´ee par un exemple d’ ´evolution spatio-temporelle au sein de la figure 1.3

La couche ”donn ´ee” ´etablit la liste des ´el ´ements bruts appel ´ee univers de discours et permettant de repr ´esenter la situation `a partir de l’observation de celle-ci. L’univers de discours se d ´efinit comme un mod `ele tel quehD, .Iiavec D un ensemble non vide et .I une interpr ´etation. Dans l’exemple, les ´el ´ements bruts sont les g ´eom ´etriesG1,G2,G2’,G3

(22)

etG3’ les estampilles temporellesT1,T2 etT3, et les typesFor ˆet etUrbain.

Dans la couche ”information”, les donn ´ees sont structur ´ees. Les ´el ´ements sont mis en corr ´elation pour tenter de leurs donner un sens. Par exemple, la g ´eom ´etrieG1, l’estam- pille T1 et le type for ˆet sont mis en corr ´elation afin de d ´efinir l’ ´el ´ement P1. Le m ˆeme principe est appliqu ´e pour les autres parcelles. Enfin, plusieurs parcelles sont ´egalement connect ´ees par les relationsR ´eductionouCroissance.

La couche ”connaissance” permet de s ´emantiser l’information `a l’aide d’axiomes logiques et de r `egles de d ´eduction capable d’inf ´erer des faits `a partir de ceux d ´ej `a existants.

L’axiome logique donn ´e dans l’exemple d ´efinit la relation D ´eforestation comme transi- tive permettant d’inf ´erer que s’il existe une relation de d ´eforestation entre une parcelleP1 et une parcelleP2 et entre une parcelleP2 et une parcelleP3 alors il existe ´egalement une relation de d ´eforestation entre P1 et P3. Il existe ´egalement de nombreux autres axiomes logiques qui seront abord ´e `a la section 2.3.3 et pour lesquels plusieurs exemples d’inf ´erences sont disponibles en annexe D. La couche connaissance permet ´egalement d’ ´etablir des r `egles de d ´eduction. L’exemple donn ´e d ´efinit que toute relation der ´eduction intervenant sur des parcelles de typeFor ˆetpermet d’ ´etablir une relation de d ´eforestation entre ces deux parcelles. Pour cet exemple, la r `egle s’appuie sur un motif de r ´eduction, dans la suite de ces travaux, nous d ´efinissons et formalisons un ensemble de motifs g ´en ´eriques plus complexe dans le chapitre 3 `a la section 3.2. Ces motifs plus complexes permettent par exemple de mettre en corr ´elation la croissance du territoire urbain en parall `ele de la diminution des espaces forestiers. L’ ´etude des ph ´enom `enes et de leurs causalit ´es sur la base de ces motifs est abord ´ee au chapitre 6.

La couche ”sagesse” est un jugement humain qui utilise les connaissances pour analyser la situation, comprendre les causalit ´es et tirer des conclusions sur ce qui est bien ou mal et ce qu’il faut faire ensuite. Par exemple, il peut s’agir de reconnaitre que la d ´eforestation est un ph ´enom `ene n ´efaste et d’observer que celle-ci est fortement li ´ee `a l’urbanisation du territoire. D `es lors, il apparait n ´ecessaire de mettre en place des moyens afin de r ´eguler le ph ´enom `ene d’urbanisation et limiter, par extension, le ph ´enom `ene de d ´eforestation.

La figure 1.4 met en avant les outils classiques permettant de d ´efinir ou interroger des syst `emes d’informations. Les bases de donn ´ees traditionnelles sont limit ´ees `a la repr ´esentation d’information, c’est pourquoi il apparait pertinent d’ ´etablir un comparatif avec les technologies du Web S ´emantique r ´eput ´ees pour permettre la gestion et l’analyse de connaissance. Il est int ´eressant de noter que les technologies du Web S ´emantique sont agenc ´es en plusieurs couches de langages allant de la simple identification des objets `a la d ´efinition d ´etaill ´ee du contexte et de la s ´emantique de ces objets gr ˆace `a la s ´eparation du sch ´ema et des donn ´ees. Cette r ´epartition en couche est connue sous le nom de ”pile du Web S ´emantique” dont les couches seront explicit ´ees dans la section 2.3.3. Les bases de donn ´ees classiques, quant- `a-elles, ne poss `edent qu’une seule syn- taxe dont l’expressivit ´e est limit ´ee pour d ´efinir la structure. D’autres diff ´erences majeures distinguent les technologies du Web S ´emantique des approches classiques et seront abord ´ees `a la section 2.4.

Outre le stockage des donn ´ees, les syst `emes d’informations sont ´egalement ´evalu ´es en fonction de leurs capacit ´es de traitement et d’analyse. Dans la litt ´erature des bases de donn ´ees relationnelles, c’est le langage SQL qui fait autorit ´e. Plusieurs d ´eriv ´es ou extensions ont ´et ´e propos ´ees pour satisfaire aux besoins des mod `eles objets, objets- relationnel ou encore de domaine particulier tels que l’analyse spatiale. Dans le cas du Web S ´emantique, c’est le langage SPARQL qui domine. SQL et SPARQL ont tous deux

(23)

1: [Armstrong, 1988]

2: [Beller et al., 1991]

3: [Langran et al., 1988]

4: [Worboys, 1994]

5: [Hornsby et al., 2000]

6: [Egenhofer et al., 1992]

7: [Peuquet et al., 1995]

8: [Claramunt et al., 1996]

9: [Jiang et al., 2009]

10: [Harbelot et al., 2014b], [Harbelot et al., 2014a], [Harbelot et al., 2013c]

FIGURE1.4 – Comparatif des outils de d ´efinition et d’analyse des bases de donn ´ees (BD) classiques et du Web S ´emantique(WS)

vocations `a fournir des informations en mettant en corr ´elation les donn ´ees stock ´ees dans le syst `eme d’information. Toutefois, il est int ´eressant de noter que SPARQL est conc¸u pour interroger des donn ´ees RDF, c’est- `a-dire un mod `ele sous forme de graphe pour lequel les relations entre les donn ´ees sont explicitement d ´ecrites et accessibles direc- tement. En ce sens, SPARQL permet d’ ´etablir des requ ˆetes s’accordant plus facilement avec la repr ´esentation mentale de l’utilisateur `a propos du domaine d’ ´etude envisag ´e. En outre, le Web S ´emantique se distingue des bases de donn ´ees relationnelles gr ˆace aux outils de raisonnements et de d ´eduction permettant d’inf ´erer des connaissances expli- cites `a partir de connaissances implicites.

La grande majorit ´e des mod `eles spatio-temporels fournis pour la gestion d’entit ´es g ´eographiques spatio-temporelles sont impl ´ement ´es dans des bases de donn ´ees de type relationnel, relationnel ´etendu, objet, objet-relationnel et seront ´etudi ´es dans la sec- tion 2.2. Tous les mod `eles ´etudi ´es utilisent des supports de stockage dont l’expres- sivit ´e est limit ´ee. Toutefois, les mod `eles les plus r ´ecents et les plus aboutis ont opt ´e pour une mod ´elisation sous forme de graphe r ´ev ´elant la n ´ecessit ´e d’ ´etudier les relations qu’entretiennent les entit ´es au sein de l’environnement g ´eospatial dans le cadre de la mod ´elisation spatio-temporelle. Les limites de ces approches seront abord ´ees dans la section suivante.

(24)

1.2/ L

IMITES

La dynamique d’un environnement se caract ´erise par une succession de deux ´el ´ements : les ´etats et les transitions. Un ´etat fait r ´ef ´erence `a une repr ´esentation d’une entit ´e `a un instantT tandis qu’une transition d ´ecrit le processus induisant le passage d’un ´etat vers un autre ´etat. Dans la litt ´erature des ontologies, les ´etats peuvent ˆetre assimil ´es `a des ob- jets ditsendurants(aussi connus sous le nom decontinuants) et les transitions peuvent ˆetre assimil ´ees `a des objets ditsperdurants (aussi connus sous le nom deoccurrents).

Les endurants sont d ´efinis comme des entit ´es pouvant ˆetre perc¸ues comme des concepts complets quelque soit l’instant de temps. Par exemple, une zone urbaine, une voiture, un humain sont des endurants. Lesperdurants sont des entit ´es pour lesquelles seule une partie existe quelque soit l’instant de temps d’observation. Les perdurants sont souvent assimil ´es `a des processus tels que l’expansion urbaine, le fait de rouler ou courir. D `es lors, il est int ´eressant de noter que ce qui est d ´ecrit lors de la d ´efinition d’un objetperdu- rant est toujours d ´ecrit en r ´ef ´erence `a unendurant. Et, que chaque perdurant est similaire ou diff ´erent d’un autre en fonction ducontinuant concern ´e. Par exemple, l’expansion ur- baine et l’expansion foresti `ere sont desperdurantsdiff ´erents car, ils font r ´ef ´erences `a des continuantsdiff ´erents que sont les zones urbaines et les espaces forestiers.

Ainsi, un environnement g ´eospatial peut ˆetre vu comme un ensemble de continuants repr ´esent ´es `a plusieurs instants ou intervalles de temps et inscrits dans une dynamique par un ensemble deperdurants. Dans le cadre de l’ ´etude du changement des couvertures des sols, lescontinuantssont assimil ´es `a des parcelles tandis que lesperdurantssont as- simil ´es `a des processus ou des ph ´enom `enes. Ces derniers sont d’un int ´er ˆet capital pour permettre de comprendre la dynamique et les causalit ´es d’ ´evolution de parcelles. D `es lors, plusieurs mod `eles ont ´et ´e propos ´es dans la litt ´erature pour tenter de repr ´esenter des entit ´es spatio-temporelles. Les premiers mod `eles appar ˆut furent les mod `eles par ”snap- shots” permettant de repr ´esenter un territoire `a plusieurs instants de temps. Toutefois, ce type de mod `ele ne permet pas de capturer la temporalit ´e des attributs et les pro- pri ´et ´es des entit ´es. Pour pallier cette faiblesse, des mod `eles bas ´es sur les entit ´es ont vu le jour et permettent de repr ´esenter les entit ´es individuellement au sein de l’environ- nement g ´eospatial. Cependant, ce type de mod `elene permet pas de lier les diff ´erents

´etats au cours du temps ce qui limite fortement la capacit ´e du mod `ele `a mettre en avant les causalit ´es de l’ ´evolution. Les mod `eles bas ´es sur les ´ev `enements sont alors apparus. Ces mod `eles reposent sur le principe de stocker uniquement les changements.

Malgr ´e cela, il n’existe pas de relations explicites stock ´ees au sein du mod `ele et le suivi de l’ ´evolution reste une t ˆache difficile. D’autres approches ont ´et ´e propos ´ee pour ´etudier la dynamique d’environnement au travers des relations topologiques ou en- core au travers de l’identit ´e. Bien que ces mod `eles furent pr ´ecurseurs dans la prise en compte des relations au sein d’un mod `ele, l’ ´etude de la dynamique n’ ´etaient pas ex- plicitement repr ´esent ´ee. Les mod `eles bas ´es sur les graphes ont alors ´et ´e propos ´e pour permettre la d ´etection de motifs spatiaux d’ ´evolution et de processus.

Les approches graphes semblent s’ ˆetre impos ´ees comme des supports adapt ´es `a la mod ´elisation spatio-temporelle et permettent de repr ´esenter la dynamique d’entit ´es spatio-temporelles. Cependant, les motifs et processus permettant de d ´ecrire la dyna- mique ne s’int ´eressent qu’ `a la dynamique spatiale et ne peuvent repr ´esenter ex- plicitement des connaissances li ´ees aux entit ´es. C’est pourquoi, il est n ´ecessaire de fournir des outils de raisonnement afin de permettre de donner une interpr ´etation des motifs spatiaux plus proche d’un ph ´enom `ene du monde r ´eel en renforc¸ant les capacit ´es

(25)

s ´emantiques du mod `ele. Les SIG de nouvelle g ´en ´eration requi `erent une mod ´elisation et une analyse toujours plus proche de la r ´ealit ´e afin de rapprocher l’humain et la machine.

En effet, afin de permettre d’assister l’humain dans sa gestion de l’information, il est int ´eressant de permettre `a la machine d’acc ´eder `a la compr ´ehension de l’humain sur un domaine particulier. D `es lors, lemanque d’expressivit ´e des supports actuelsest une forte limitation aux futures d ´efis de la mod ´elisation spatio-temporelle. Dans ce contexte, il est fondamental d’envisager le d ´eveloppement de syst `emes capables de prendre en compte des structures s ´emantiques de plus haut niveau ainsi que de fournir des capa- cit ´es d’analyses qualitatives pour l’ ´etude de dynamiques g ´eospatiales.

Le Web S ´emantique et les technologies associ ´ees proposent des outils puissants per- mettant la repr ´esentation des connaissances ainsi que des m ´ecanismes de raison- nement. En outre, les technologies du Web S ´emantique dissocient le sch ´ema et les donn ´ees du syst `eme d’information offrant ainsi une structure plus flexible et plus facile

`a appr ´ehender pour un humain. Enfin, ces outils sont soumis `a l’hypoth `ese du monde ouvert. L’hypoth `ese du monde ouvert s’oppose `a l’hypoth `ese du monde ferm ´e, valable dans les bases de donn ´ees traditionnelles, en autorisant la repr ´esentation de connais- sances incompl `etes. Sous l’hypoth `ese du monde ferm ´e, toute connaissance non expli- citement d ´eduite est consid ´er ´ee comme fausse, alors que dans le monde ouvert ce qui est omis reste inconnu. Le manque de connaissance est une caract ´eristique r ´ecurrente du domaine spatio-temporel, c’est pourquoi l’hypoth `ese du monde ouvert semble la plus adapt ´ee. Toutefois, la repr ´esentation de donn ´ees incompl `etes peut ´egalement nuire `a l’exploitation des donn ´ees. En effet, l’hypoth `ese du monde ouvert n’impose pas que toutes les propri ´et ´es d’une instance d’un concept soient repr ´esent ´ees. Par exemple, dans une application spatio-temporelle, les parcelles d’un territoire poss `edent un attri- but ou une propri ´et ´e permettant de stocker et associer une g ´eom ´etrie. Dans le cadre du monde ouvert, il est possible de repr ´esenter des parcelles sans g ´eom ´etries. D `es lors, toute analyse spatiale r ´ealis ´ee sur les donn ´ees fournira des r ´esultats partiels difficile- ment exploitables. Ainsi, bien que le monde ouvert montre des aptitudes ´evidentes pour la d ´ecouverte de connaissances implicites, il est, en revanche, n ´ecessaired’ ´etablir des limites sur l’incompl ´etude des donn ´ees pour d ´efinir les n ´ecessit ´es techniques du mod `ele afin de garantir la consistance du syst `eme.

Les technologies du Web S ´emantique ne proposent pas de standards pour la mod ´elisation spatio-temporelle. Cependant, des mod `eles de repr ´esentation de donn ´ees spatiales, d’une part, et temporelles, d’autres part, ont ´et ´e propos ´es. Si des mod `eles tels que GeoSPARQL se sont impos ´es dans la repr ´esentation de donn ´ees spa- tiales, la litt ´erature des mod `eles temporelssouffrent de redondance et ne permettent pas de d ´ecrire les transitions entre les diff ´erents ´etats. D’autres approches de la com- munaut ´e ont propos ´e des mod `eles pour la gestion et l’interrogation de donn ´ees spatio- temporelles. Cependant, ces approches se basent sur l’introduction de nouvelles syn- taxes pour lesquelles ils n’existent pas de supports impl ´ement ´es.

Tous ces points seront discut ´es dans le chapitre 2 : Etat de l’art.

1.3/ V

ERROUS

La section pr ´ec ´edente pr ´esente les limites des supports actuels de mod ´elisation spatio- temporelle. La principale limite des mod `eles propos ´es dans la litt ´erature concerne le

(26)

manque de capacit ´e `a repr ´esenter explicitement la connaissance li ´ee `a l’environnement g ´eospatial ainsi que sa dynamique. Les technologies du Web S ´emantique, et plus parti- culi `erement leur application au sein des ontologies, comblent cette limitation. Toutefois, la litt ´erature du Web S ´emantique ne propose pas d’outils pour la mod ´elisation spatio- temporelle. D `es lors, le premier verrou consiste `a proposer un mod `ele de repr ´esentation de connaissances spatio-temporelles `a l’aide des technologies du Web S ´emantique.

Les technologies du Web S ´emantique sont d ´efinies en monde ouvert en assumant que les informations repr ´esent ´ees sont incompl `etes. Cependant, l’analyse de donn ´ees spatio- temporelles n ´ecessite d’identifier les propri ´et ´es utiles pour celle-ci. Afin d’obtenir des r ´esultats complets, il est n ´ecessaire que ces propri ´et ´es ou objets soient d ´efinis en monde ferm ´e. Le deuxi `eme verrou consiste `a d ´efinir un mod `ele et une m ´ethodologie hybride permettant la coexistence de donn ´ees ´etablies sous l’hypoth `ese du monde ferm ´e et du monde ouvert.

1.4/ C

ONTRIBUTION

Dans le cadre de la conception de bases de donn ´ees traditionnelles, le mod `ele concep- tuel est consid ´er ´e comme une ´etape interm ´ediaire r ´ev ´elant la vision d’un concepteur pour r ´epondre aux besoins d’un domaine particulier. D `es lors, le mod `ele conceptuel devient tr `es d ´ependant du concepteur et le passage au mod `ele logique induit g ´en ´eralement une structure tr `es difficile `a appr ´ehender pour les utilisateurs et nuit `a l’exploitation du syst `eme final.

1.4.1/ L’ONTOLOGIE : UNE MODELISATION´ FLEXIBLE, ACCESSIBLE ET COMPREHENSIBLE SANS PERTE S´ EMANTIQUE´

La mod ´elisation des donn ´ees est un outil puissant permettant l’analyse de la s ´emantique d’une organisation dans le respect de la structure et du flux d’information utilis ´es dans le cadre des activit ´es de cette organisation. Depuis 1975, l’ANSI (American National Stan- dards Institute) distingue les mod `eles selon trois couches :

• le mod `ele conceptuel : il d ´ecrit la s ´emantique du domaine au travers de classes d’entit ´es repr ´esentant diff ´erentes choses ayant une signification pour le domaine, et de relations `a propos du lien entre deux classes d’entit ´es. Un mod `ele conceptuel d ´efinit les diff ´erents faits ou propositions qui peuvent ˆetre exprim ´es en utilisant le mod `ele. En ce sens, il fournit les expressions autoris ´ees au sein d’un langage abstrait dont la port ´ee se limite `a celle du mod `ele. L’exemple de mod `ele conceptuel le plus connu est certainement UML.

• le mod `ele logique : il repr ´esente un sous-ensemble du mod `ele conceptuel qui peut ˆetre exprim ´e en utilisant une technologie particuli `ere. Il d ´ecrit, par exemple, des tables, des colonnes, des classes orient ´ees objet, des tags XML, etc.

• le mod `elephysique: il d ´ecrit le support physique utilis ´e pour stocker les donn ´ees.

Dans la m ´ethode Merise, le mod `ele physique consiste `a implanter une base de donn ´ees dans un syst `eme de gestion de bases de donn ´ees `a l’aide du langage SQL.

(27)

La grande majorit ´e des mod `eles spatio-temporels fournis pour la gestion d’entit ´es g ´eographiques spatio-temporelles sont impl ´ement ´es dans des bases de donn ´ees de type relationnel, relationnel ´etendu, objet, objet-relationnel. Chacun de ces mod `eles est d ´efinis au niveau logique n ´ecessitant g ´en ´eralement un mod `ele conceptuel avant d’ ˆetre impl ´ement ´e dans un support physique. Cette m ´ethode de transcription depuis le mod `ele conceptuel des donn ´ees vers le mod `ele physique souffre cependant d’une forte limitation. En effet, lorsque la mod ´elisation de l’information est faite pour cr ´eer une base de donn ´ees, le mod `ele conceptuel est obligatoirement diff ´erent du mod `ele logique, car il n’y a pas de place dans une structure de base de donn ´ees classique pour capturer, par exemple, les r `egles m ´etier, cr ´eer des relations de subsomption et d ´ecrire d’autres aspects cl ´es du mod `ele conceptuel. Ces informations s ´emantiques collect ´ees et document ´ees dans le cadre de la mod ´elisation initiale sont laiss ´ees de c ˆot ´e lors du passage `a la mod ´elisation logique des donn ´ees. Ces informations laiss ´ees de c ˆot ´e doivent alors ˆetre impl ´ement ´ees par des d ´eveloppeurs au sein de pro- grammes sp ´ecifiques. Ainsi, bien que ces mod `eles parviennent `a g ´erer les informations g ´eographiques spatio-temporelles, il est, en revanche, impossible de repr ´esenter expli- citement des connaissances g ´eographiques spatio-temporelles ni d’effectuer des raison- nements pouvant servir de base `a la prise de d ´ecision.

Depuis la d ´efinition des couches de mod ´elisation conceptuelle, logique et physique, il existe certaines technologies pour lesquelles cette architecture n’est plus valable. Les ontologies formelles en sont un bon exemple. En effet, ´etant admis qu’une ontologie constitue un mod `ele d’un domaine d ´ecrivant les objets ´evoluant au sein de celui-ci, les trois mod `eles de donn ´ees peuvent ˆetre chacun pens ´es comme une seule et m ˆeme onto- logie.

Contrairement aux bases de donn ´ees classiques, une ontologie peut ˆetre vue comme un mod `ele conceptuel pouvant ˆetre impl ´ement ´e directement sans subir une quelconque perte s ´emantique.

1.4.2/ L’ONTOLOGIE COMME SUPPORT DE LINFORMATION SPATIO-TEMPORELLE Les ontologies constituent un support riche pour la repr ´esentation des connaissances qui satisfait aux exigences de la mod ´elisation spatio-temporelle. D’autre part, elles donnent le moyen de raisonner sur les informations de contexte via des r `egles et des moteurs d’inf ´erences.

La figure 1.5 reprend le mod `ele DIKW afin d’illustrer l’apport de l’ontologie face aux bases de donn ´ees classiques. Les bases de donn ´ees classiques permettent de g ´erer efficace- ment l’information spatio-temporelle mais ne peuvent repr ´esenter ces informations dans une inf ´erence ou un raisonnement, condition n ´ecessaire pour acc ´eder `a l’appellation de connaissance. Les raisonnements impliquent le recours `a l’interpr ´etation et t ´emoignent d’outils capables de mod ´eliser certains raisonnements humains. La connaissance est donc une interpr ´etation de l’information bas ´ee sur l’exp ´erience, en somme, elle assimile des informations afin d’ ´etablir des r `egles permettant de d ´eduire de nouvelles donn ´ees, informations ou connaissances. La d ´efinition d’une r `egle t ´emoigne de la compr ´ehension du ”comment” fonctionne tel ou tel domaine gr ˆace `a la condition ”SI” et le cons ´equent

”ALORS”. Exemple : SI le nombre de centres commerciaux et d’habitants augmentent dans telle r ´egion ALORS il y a un ph ´enom `ene d’intensification urbaine.

(28)

FIGURE 1.5 – Repr ´esentation du contexte applicatif : Base de donn ´ees relationnelles versus ontologie

Afin de permettre la mise en oeuvre des connaissances, il est ´egalement n ´ecessaire que celles-ci puissent ˆetre assimil ´ees par des humains afin de d ´eterminer les causes (en r ´epondant `a la question ”pourquoi”) et d ´ecider des futures actions `a mettre en place. En ce sens, la connaissance est intrins ´equement destin ´ee `a servir l’action, c’est pourquoi les ontologies sont fr ´equemment employ ´ees au sein de syst `emes d’aide `a la d ´ecision permettant aux usagers de s’approprier plus rapidement et plus facilement les connais- sances d’un domaine. Dans ces travaux, nous explorons l’ontologie comme support de mod ´elisation spatio-temporelle afin de fournir :

un mod `ele g ´en ´erique de repr ´esentation et de gestion des connaissances g ´eographiques spatio-temporelles pour l’analyse de ph ´enom `enes dynamiques g ´eospatiaux.

1.4.3/ ANALYSE QUALITATIVE ET CAUSALITE´

Il existe deux approches pour permettre l’ ´etude de ph ´enom `enes dynamiques d’un terri- toire donn ´e : l’approche quantitative et l’approche qualitative. La premi `ere approche se base sur des donn ´ees num ´eriques pour offrir des statistiques `a propos des ´evolutions de la couverture terrestre. Toutefois, cette approche ne fournit des r ´esultats qu’ `a une ´echelle globale et ne peut ´etablir clairement les corr ´elations entre les ´evolutions observ ´ees. L’ap- proche qualitative, quant- `a-elle, se base sur la s ´emantique des donn ´ees repr ´esent ´ees sous la forme d’attributs ou relations. La mise en corr ´elation de ces donn ´ees au travers de r `egles permet de d ´efinir des connaissances explicites `a partir de donn ´ees implicites.

Dans ces travaux, le mod `ele propos ´e s’oriente principalement sur l’approche qualitative pour repr ´esenter les ph ´enom `enes dynamiques en se basant sur la relation de filiation.

La relation de filiation est au coeur du mod `ele et permet d’ ´etablir un lien spatio-temporel entre les diff ´erents ´etats d’une entit ´e au cours du temps. Dans ces travaux, la relation de

(29)

filiation est d ´eclin ´ee au travers de plusieurs couches d’expressivit ´e illustr ´ees sur la figure 1.6.

FIGURE1.6 – Liste des couches et motifs g ´en ´eriques d ´ecrits dans le mod `ele

La premi `ere couche du mod `ele poss `ede une expressivit ´e limit ´ee mais permet de d ´ecrire la g ´en ´ealogie des entit ´es d’un territoire donn ´e. La deuxi `eme couche se fonde sur la notion d’identit ´e pour permettre de s’int ´eresser au cycle de vie des entit ´es. La troisi `eme couche d ´ecrit des motifs spatiaux g ´en ´eriques et permet de d ´efinir la dyna- mique d’ ´evolution spatiale des entit ´es. Enfin, la quatri `eme couche s’appuie sur les motifs g ´en ´eriques de la troisi `eme couche et tente de leurs donner une interpr ´etation `a l’aide de la s ´emantique du contexte de l’environnement g ´eospatial d ´efinie dans l’ontologie. Le r ´esultat de cette interpr ´etation donne lieu `a des motifs sp ´ecifiques pouvant ˆetre assimil ´es

`a des ph ´enom `enes. Contrairement `a l’approche quantitative, les ph ´enom `enes dyna- miques sont explicitement d ´ecrits entre les entit ´es et peuvent ˆetre localis ´es pr ´ecis ´ement.

D’autre part, cette approche facilite la compr ´ehension des causalit ´es d’ ´evolution entre les entit ´es.

L’approche qualitative exploit ´ee au sein d’une ontologie par notre mod `ele constitue une contribution majeure et un outil performant pour permettre :

l’ ´etude de la profondeur du changement : la profondeur du changement uti- lise la s ´emantique pour r ´epondre `a la question : ” `a quel point le changement est-il significatif ?”. En effet, dans le cadre de l’ ´etude de la dynamique d’entit ´es spatio-temporelles, tous les changements ne sont pas ´equivalents. Par exemple, la transformation d’une for ˆet de conif `ere en une for ˆet de feuillus est g ´en ´eralement moins significative, pour l’utilisateur, qu’une zone urbaine transform ´ee en lac. Le mod `ele propos ´e s’appuie sur la hi ´erarchie de concept autoris ´ee par les ontologies pour permettre de distinguer diff ´erents degr ´es de changement.

(30)

l’ ´etude des motifs de tendance : les ph ´enom `enes d ´etect ´es sur la base de la relation de filiation ne peuvent ˆetre ´etablis qu’entre deux instants de temps cons ´ecutifs. Les motifs de tendance se d ´efinissent par l’ ´etude de dynamiques progressives se produisant sur plusieurs instants de temps cons ´ecutifs.

l’ ´etude des ´evolutions connexes : la relation de filiation telle qu’ ´etudi ´ee jus- qu’alors ne peut expliquer `a elle seule toutes les causalit ´es d’ ´evolution des en- tit ´es d’un territoire. Par exemple, la cr ´eation de centre commerciaux ou de r ´eseaux routiers `a proximit ´e de territoires agricoles est g ´en ´eralement le t ´emoin d’une dyna- mique d’intensification urbaine pouvant impliquer des r ´epercussions sur le paysage agricole environnant. D `es lors, il est n ´ecessaire de fournir des outils capable de mettre en relation les dynamiques d’entit ´es voisines.

Le mod `ele pr ´esent ´e dans ces travaux permet l’ ´etude de la profondeur du change- ment, l’ ´etude des motifs de tendance ainsi que l’ ´etude des ph ´enom `enes connexes.

1.4.4/ AIDEA LA D` ECISION´

Le mod `ele d ´ecrit dans ces travaux, appel ´eContinuum, est un outil d’analyse capable de mod ´eliser le contexte d’un environnement g ´eospatial dynamique dans l’optique d’assister les experts et aider les charg ´es des territoires dans leur politique de gestion. La figure 1.7 illustre le fonctionnement global de notre syst `eme en s’appuyant sur la d ´ecomposition ontologique d ´efinie par [Frank, 2003] ainsi que le mod `ele DIKW.

FIGURE 1.7 – Illustration du processus de traitement des donn ´ees au sein du mod `ele Continuum

Les connaissances inf ´er ´ees par le mod `ele offre une meilleure compr ´ehension de la dy- namique de l’environnement g ´eospatial. De fait, l’utilisateur peut ainsi mettre `a profit ces connaissances afin de prendre une d ´ecision sur l’am ´enagement du territoire, cette d ´ecision implique g ´en ´eralement la mise en place d’un plan d’action. Les modifications du

(31)

territoire r ´esultantes du plan d’action peuvent alors ˆetre inject ´ee dans le mod `ele afin de servir de support `a de nouveaux traitements et analyses permettant de juger l’efficacit ´e des moyens mis en œuvre.

1.5/ P

LAN DE LA THESE

`

Cette section pr ´esente une br `eve vue d’ensemble de chacun des chapitres composant cette th `ese.

1.5.1/ CHAPITRE 2 : ETAT DE LART

Ce chapitre a pour objectif d’introduire le domaine de la mod ´elisation spatio-temporelle ainsi que celui de l’ing ´enierie des connaissances. Il pr ´esente des approches et solu- tions existantes et met en avant les avantages et les limites dans l’optique de concevoir un syst `eme d’information g ´eographique de nouvelle g ´en ´eration en se basant sur une ontologie et les technologies aff ´erentes. Dans un premier temps, nous introduirons le domaine de la mod ´elisation spatio-temporelle ainsi que des propositions majeures du domaine. Puis nous introduirons la famille des langages ontologiques `a l’aide des lo- giques de description qui constitue un pilier majeur des travaux actuels du domaine des ontologies. Les logiques de description sont mise en œuvre au sein de syst `emes gr ˆace

`a des langages de repr ´esentation d’ontologie. Le langage OWL et plus particuli `erement OWL-DL (DL pour Description Logic), conc¸u pour le Web S ´emantique, est aujourd’hui le repr ´esentant par excellence des langages de repr ´esentation d’ontologie. Ce langage ainsi que les technologies du Web S ´emantique seront ´etudi ´es en troisi `eme partie de notre ´etat de l’art. La grande majorit ´e des mod `eles spatio-temporels fournis pour la gestion d’entit ´es g ´eographiques spatio-temporelles sont impl ´ement ´es dans des bases de donn ´ees de type relationnel, relationnel ´etendu, objet, objet-relationnel. Toutes ces m ´ethodes de conception de bases de donn ´ees poss `edent une limitation majeures : il existe en g ´en ´eral un ´ecart entre les mod `eles conceptuels et les mod `eles logiques qui s’accroit avec la divergence des formalismes. Les mod `eles logiques peuvent rapidement devenir incompr ´ehensible pour un utilisateur. Les ontologies permettent de lever cette difficult ´e en offrant une repr ´esentation du mod `ele conceptuel directement au sein de la base de donn ´ees pour qu’il puisse ˆetre accessible. La quatri `eme section de l’ ´etat de l’art ´etablit un comparatif entre l’approche relationnelle et l’approche s ´emantique pour justifier l’apport de l’ontologie comme support de la mod ´elisation spatio-temporelle. Ce premier chapitre se conclut par l’ ´etude des diff ´erents travaux de mod ´elisation s ´emantique de donn ´ees spatiales ou temporelles.

1.5.2/ CHAPITRE 3 :LE MODELE` CONTINUMM

Ce chapitre propose un mod `ele permettant de repr ´esenter des connaissances explicites

`a propos d’entit ´es g ´eographiques spatio-temporelles ainsi que de fournir des raisonne- ments pour comprendre la dynamique de ces entit ´es. Le mod `ele d ´ecrit les entit ´es au sein de couches spatio-temporelles et de transitions spatio-temporelles. Les couches permettent de repr ´esenter les diff ´erents ´etats du cycle de vie des entit ´es tandis que les transitions permettent de lier ces diff ´erents ´etats ainsi que de d ´ecrire la connaissance

(32)

li ´ee `a la dynamique de ces entit ´es. Les contraintes de chaque ´el ´ement composants les couches et les transitions sont explicit ´ees dans ce chapitre.

1.5.3/ CHAPITRE 4 : IMPLEMENTATION ET CALCUL DES COUCHES´ 1 ET 2

Ce chapitre pr ´esente l’impl ´ementation de notre mod `ele. L’un des objectifs majeurs de notre mod `ele consiste `a fournir un support pour l’ ´etude de la dynamique des ph ´enom `enes g ´eospatiaux. Pour cela, la relation de filiation est au coeur de notre mod `ele. Les jeux de donn ´ees de la litt ´erature ne fournissent pas de relation de filiation. Dans ce chapitre, nous proposons une m ´ethode pour permettre de d ´etecter et int ´egrer les relations de filiation au sein du mod `ele afin de servir de base d’ ´etude pour la d ´ecouverte de connaissance.

Dans un deuxi `eme temps, l’ajout de contrainte d’identit ´e permet de d ´ecrire la couche 2 du mod `ele pour l’ ´etude du cycle de vie des entit ´es.

1.5.4/ CHAPITRE 5 : CALCUL DE LA COUCHE 3 : LES MOTIFS GEN´ ERIQUES´ Ce chapitre d ´ecrit la couche 3 du mod `ele bas ´ee sur la d ´efinition de motifs g ´en ´eriques per- mettant de d ´ecrire la dynamique spatiale des entit ´es du mod `ele. Cette couche sp ´ecialise la couche 2 en int ´egrant des contraintes permettant d’accroitre son expressivit ´e. Les mo- tifs sont dits ”g ´en ´eriques” car ils sont ind ´ependants du domaine d’ ´etude au sens o `u ils n’int `egrent pas de connaissances li ´ees au contexte.

1.5.5/ CHAPITRE 6 :CALCUL DE LA COUCHE4 ET DECOUVERTE DES CONNAIS´ -

SANCES

Ce chapitre met en avant les capacit ´es d’analyse qualitative de notre mod `ele. Ce type d’analyse permet d’ ´etablir pr ´ecis ´ement les relations spatio-temporelles entre les diff ´erentes entit ´es mettant en ´evidence les liens de causalit ´e `a l’origine de ces ´evolutions.

Dans cet optique, ce chapitre pr ´esente une m ´ethodologie permettant d’ ´etudier la profon- deur du changement, des outils permettant de rechercher des motifs de tendance ainsi qu’ ´etudier les interactions entre des entit ´es dynamiques voisines au sein du graphe.

1.5.6/ CHAPITRE 7 : EXPERIMENTATION´

Ce chapitre pr ´esente un cas d’application du mod `ele Continuum sur le jeu de donn ´ees Corine Land Cover. Il montre un exemple d’ ´evolution au sein des quatre couches du mod `ele ainsi que des chiffres illustrant le nombre de motifs d ´etect ´es. L’architecture de l’application impl ´ement ´ee est ´egalement abord ´ee.

1.5.7/ CHAPITRE 8 : CONCLUSION

Ce chapitre conclut ce document. Il dresse un bilan des contributions apport ´ees par les travaux pr ´esent ´es dans cette th `ese et propose ´egalement de futurs travaux afin d’ ´etendre les capacit ´es du mod `ele.

Références

Documents relatifs

Ce travail de recherche va s’articuler largement autour du fonctionnement de Forum-Handicap Valais romand, de ses activités, de la particularité de sa position

Les élèves ne disposant pour l’instant que d’informations qualitatives sur l’énergie potentielle et l’énergie cinétique d’un système, le but de

[r]

De pr´ec´edents travaux ont montr´e qu’il ´etait possible de s’affranchir de la difficult´e li´ee ` a la d´ependance spatiale du syst`eme dynamique : ainsi nous avons

La présentation du dispositif ressemble un peu aux TPE, 2h par semaines dans l'emploi du temps par exemple, des thèmes imposés : - la nature et le corps humain ;

Elle est d’autant plus importante que la masse de la charge est grande et s’oppose à la mise en mouvement. Elle est caractérisée par le moment d’inertie J, qui s’exprime en

Ils sont ensuite émis sans vitesse par la source S, puis accélérés par un champ électrostatique uniforme qui règne entre S et P tel que.. U sp

Mettre les matrices suivantes sous forme ´echelon´ee, discuter de l’inversibilit´e, lorsque la matrice est inversible poursuivre le calcul et