• Aucun résultat trouvé

Parmi les modèles vus au chapitre 3, seules des relations de subsomption, de

similarité et d’instanciation sont exprimées directement dans les ontologies. Nos

travaux se concentrent sur les tags, c’est pourquoi nous mettons de côté la relation

d’instanciation entre tags et objets géographiques exprimée dans l’ontologie LGD.

L’ontologie issue de l’approche GWAP hérite de la hiérarchie de l’ontologie

haut-niveau DUL, mais ne génère pas de relations de subsomption entre les tags. Le

réseau sémantique OSN hérite des relations de méronymie (le rapport du tout à

ses parties), antonymie (le rapport de symétrie sémantique) et troponymie (le degré

d’intensité) de WordNet, mais ne cherche pas à en créer de nouvelles entre les tags.

De plus, l’approche adoptée par OSN extrait des relations de similarité entre les tags

basée, entre autres, sur la structure de l’ontologie LGD. Cette dernière, à l’instar de

l’ontologie OSMonto, intègre des relations de subsomption entre les concepts extraits

des tags OSM.

Ce rapport hiérarchique n’intervenant qu’entre la clé et la valeur d’un tag, la

taxonomie générée, présentée en figure 4.1 est très simpliste : elle ne compte que

deux niveaux. Cette superficialité est un obstacle pour l’automatisation de certaines

tâches. Par exemple, au moment de l’acquisition, lorsqu’un contributeur ajoute un

tag à la base de données OSM, un système de suggestion de tags similaires pourrait

être mis à profit dans le but d’améliorer la précision du tag choisi. Il existe des

outils pour mesurer le degré de similarité entre des concepts d’une ontologie (comme

l’ontologie LGD, par exemple) : lesmatchers d’ontologies.

Afin de trouver des similitudes entre les classes, les matchers utilisent différentes

techniques (basées sur le nom des concepts, sur la structure de l’ontologie, sur des

ressources externes, etc.) et stratégies (chaînage de plusieurs matchers,

aggréga-tion des similarités, méthodes d’apprentissage, implicaaggréga-tion de l’utilisateur,etc.). J.

Euzenat et S. Pavel fournissent un état de l’art complet à ce sujet [Euzenat and

Shvaiko, 2013]. Chaque correspondance est établie entre deux concepts par un degré

de similarité. L’ensemble de ces correspondances est appelé un alignement.

Cer-taines techniques dematching consistent en l’exploitation de l’expressivité formelle

de lastructure de l’ontologie, c’est-à-dire les relations qui permettent d’agencer les

concepts entre eux. La relation de subsomption en est un exemple.

Ainsi, dans une ontologie structurée de manière hiérarchique, deux concepts

frères qui partagent le même parent via un lien de subsomption se verront

attri-buer un degré de similarité élevé par un matcher qui adopte une stratégie d’analyse

structurelle. Cette stratégie est d’autant plus efficace que la hiérarchie considérée est

profonde. Les ontologies LGD et OSMonto ne possédant que deux niveaux, cette

ap-proche demeure donc limitée. Par conséquent, lorsqu’un contributeur OSM souhaite

ajouter le tag amenity=school, le système de suggestion utilisant les

correspon-dances produites par une stratégie d’alignement basée sur la hiérarchie clé-valeur de

LGD ou OSMonto propose des tags frères, c’est-à-dire ayant la clé amenity. Ainsi,

les tags amenity=bar, amenity=parking ou encoreamenity=dentist partagent le

même degré de similarité avec le amenity=school, malgré une distance sémantique

dont l’importance apparaît comme évidente pour un jugement humain. Cette

su-perficialité de la taxonomie est donc un frein majeur au contrôle de la qualité des

données au moment de l’acquisition.

L’ontologie LGD propose la typologie de tags OSM la plus fine des modèles vus

en chapitre 3. En effet, les tags y sont organisés en trois catégories : les attributs

de classification, les attributs de description et les attributs de données.

Cepen-dant, la raison pour laquelle les attributs de classification font l’objet d’une classe

(owl:class) dans l’ontologie alors que les attributs de description et attributs de

données sont convertis en propriété (respectivement owl:ObjectProperty et

owl:-DataProperty) est discutable. En effet, de prime abord, des tags tels que

amenity-=restaurant semblent décrire la nature de l’objet auquel ils sont associés, tandis

que des tags tels quewheelchair=yes ne représente qu’une propriété de l’objet.

Toutefois, si l’on considère l’utilisation conjointe des tagsamenity=cafe et

in-ternet_access=yesdans le cas de la description d’un cybercafé, on voit mal lequel

des deux est le plus pertinent pour caractériser la nature intrinsèque de l’objet.

Pour-tant, seules les classes Amenity et Cafe sont générées dans LGD tandis qu’aucune

classeInternetAccessn’est créée. L’usage ambigu de certains autres tags témoigne

également de cette lacune : le tagbuilding=yes, très largement utilisé par la

com-munauté OSM

10

, est classifié comme un attribut de données par l’approche des

auteurs de [Auer et al., 2009] : aucun conceptBuilding n’est donc généré à partir

de ce tag. Pourtant, tous les autres tags partageant la clé building (

building-=church, building=stadium, building=kiosk, etc.), sont considérés comme des

attributs de description : cette fois le concept Building sera ajouté à l’ontologie.

L’exploitation d’un maximum de tags dans le but de construire une ontologie plus

étoffée permettrait, par exemple, de faciliter l’exploration des données.

10. Il est associé à plus de 4% de l’ensemble des objets en base de données OSM selon le service

Web TagInfo,http://taginfo.openstreetmap.org/tags/building=yes