• Aucun résultat trouvé

C Processus d'appariement de données géographiques basé sur la théorie des fonctions de croyance

C.2 Modélisation des critères d'appariement

C.2.1 Connaissances sur la géométrie

Les données géographiques ont une composante spatiale, la géométrie, et une composante attributaire, qui décrit l’objet géographique à travers des attributs tels que le nom, la nature, le nombre de voies, etc. Chaque objet géographique possède une géométrie qui peut être représentée généralement par une des trois primitives : point, ligne ou surface. La géométrie décrit donc la localisation, la forme dans le cas de la ligne et de la surface, ainsi que les relations spatiales implicites entre les objets géographiques.

La géométrie des objets géographiques est une information toujours présente dans les bases de données géographiques, et donc toujours exploitable. Comme nous avons pu le constater dans le chapitre A, la plupart des travaux d’appariement de données s’appuient sur la géométrie car elle est la plus discriminante.

Il existe de nombreuses mesures qui permettent d’exploiter et de comparer la géométrie des objets géographiques. Ainsi, pour comparer les localisations, on peut utiliser une mesure de distance telle que la distance euclidienne, la distance de Hausdorff ou la distance surfacique. La forme des objets peut être comparée à travers des mesures qui évaluent l’écart

de forme, comme par exemple la fonction à distance radiale, la fonction angulaire ou la sinuosité. Lorsque nous avons à comparer des lignes, nous pouvons analyser leur orientation.

C.2.1.1 Initialisation des masses de croyance pour le critère d'écart de position

Dans notre approche, le critère d’écart de position a fait ses preuves avec la distance euclidienne appliquée aux données isolées représentant les points remarquables du relief [Olteanu, 2007], et avec la distance de Hausdorff appliquée aux réseaux routiers [Olteanu-Raimond et Mustière, 2008]. Nous croyons que le critère reste exploitable pour d’autres mesures de distance.

La représentation explicite des connaissances pour le critère d’écart de position est illustrée dans le Tableau 2.

Hypothèse Critère d’écart de position

appCi

¬appCi

Θ

Tableau 2. Représentation des connaissances pour le critère d’écart de position

La courbe figurant dans la première ligne du Tableau 2 représente la masse de croyance attribuée à l’hypothèse appCi, c'est-à-dire « le candidat Ci est l’homologue de l’objet obj1 ». Elle signifie le fait que plus le candidat à l’appariement Ci est proche de l’objet obj1, plus il y a de chances que celui-ci soit l’objet homologue. Elle signifie aussi qu’à partir d’un seuil donné T2, nous considérons que cette hypothèse devient presque impossible, quelle que soit la distance. Afin d’éviter l’élimination définitive d’un candidat qui est relativement éloigné, la masse de croyance attribuée à cette hypothèse, m(appCi) n’est pas nulle mais égale à 0,1 dans notre exemple. Précisons qu’au delà d’une distance c’est effectivement improbable puisque nous ne sommes plus dans le cadre de discernement.

La courbe de la deuxième ligne représente la masse de croyance attribuée à l’hypothèse

¬appCi, signifiant « le candidat Ci n’est pas l’homologue de l’objet obj1 ». Afin de modéliser l’imprécision sur la localisation des objets géographiques, nous avons introduit un deuxième seuil T1 qui représente la résolution des données. Si la distance est inférieure au seuil T1, nous considérons cette proposition très improbable, par contre si la distance est comprise entre T1

et T2, la proposition devient de plus en plus crédible et enfin lorsque la distance est supérieure au seuil T2, la proposition devient très crédible. Plus la distance est élevée, plus nous croyons que la proposition est vraie.

Enfin, la courbe figurant dans la dernière ligne représente la masse de croyance attribuée à l’ignorance, m(Θ). Pour ce critère d’écart de position, l’ignorance est importante lorsque la distance est dans le voisinage de T1, c'est-à-dire lorsque le candidat n’est ni suffisamment éloigné pour conclure d’une manière sûre que ce n’est pas lui, ni suffisamment proche pour conclure que c’est lui le vrai homologue.

C.2.1.2 Initialisation des masses de croyance pour le critère écart d'orientation

Le critère d’orientation est représenté dans le Tableau 3. Il peut être utilisé pour les objets géographiques linéaires et il consiste dans cet exemple à évaluer le degré de co-linéarité local entre l’objet obj1 et le candidat Ci. Nous avons expliqué dans le chapitre A la manière d’étudier l’écart d’orientation entre les lignes. Nous rappelons brièvement le principe.

Le critère d’orientation mesure l'écart entre les orientations des tangentes à obj1 et au candidat Ci respectivement au point de obj1 le plus proche du candidat Ci, et au point du candidat Ci le plus proche de obj1. Si la valeur de l’angle entre les deux objets est proche de 0, alors les objets sont relativement parallèles et ils ont la même direction. Si la valeur de l’angle est proche de π, alors les objets sont parallèles et dans la direction opposée. Par contre, si la valeur de l’angle est proche de π/2, alors les objets sont perpendiculaires.

En raison notamment de la complexité des données géographiques linéaires, par exemple les réseaux routiers, il est possible que plusieurs candidats à l’appariement soient localement parallèles à l’objet obj1. Ainsi, le fait que deux objets linéaires aient la même orientation ne signifie pas qu’ils soient homologues.

D’autre part, en raison de niveaux de détail ou de segmentation différents, deux objets homologues peuvent ne pas avoir la même orientation. En conséquence, si l’écart d’orientation est dans le voisinage de π/2, nous croyons que les deux objets ne sont pas homologues mais nous n’avons aucune certitude.

De plus, cette mesure ne présente pas une grande fiabilité parce elle est calculée localement, c'est-à-dire que l’orientation entre deux arcs est déterminée au point le plus proche, ce qui est une forte approximation de la colinéarité. Cela veut dire que l’écart d’orientation entre deux objets linéaires peut être nul, sans toutefois que les deux objets soient vraiment semblables.

Les raisons que nous venons d’énumérer font que le critère d’orientation est peu fiable, et que l’ignorance a un rôle important. Ainsi, l’ignorance permet de gérer l’imprécision due à la mesure utilisée et aux caractéristiques des données.

Plus précisément, si les objets sont relativement parallèles, c'est-à-dire si l’angle θ est soit proche de 0 soit proche de π, nous croyons que l’objet obj1 et le candidat Ci peuvent être homologues et nous attribuons une masse de croyance de 0,5 à l’hypothèse « le candidat Ci

est l’homologue de l’objet obj1 », mais aussi à l’ignorance, afin d’exprimer le fait que le critère seul n’est pas suffisamment significatif. La masse de croyance attribuée à l’hypothèse « le candidat Ci n’est pas l’homologue de l’objet obj1 » est le complément de (m(appCi)+m(Θ)).

Plus l’écart d’orientation entre deux objets linéaires tend vers π/2, plus la masse de croyance attribuée à l’hypothèse appCi diminue et proportionnellement avec cette diminution, la masse de croyance attribuée à l’hypothèse ¬ appCi augmente.

Lorsque les objets sont perpendiculaires, c'est-à-dire que l’angle θ est égal à π/2, nous attribuons une masse de croyance importante à l’hypothèse « le candidat Ci n’est pas l’homologue de l’objet obj1 » et à l’ignorance, afin d’exprimer notre doute relatif à la mesure utilisée et aux caractéristiques des données.

Hypothèse Critère Orientation

appCi

¬appCi

Θ

Tableau 3. Représentation des connaissances pour le critère d’orientation