Parmi les modèles vus au chapitre 3, seules des relations de subsomption, de
similarité et d’instanciation sont exprimées directement dans les ontologies. Nos
travaux se concentrent sur les tags, c’est pourquoi nous mettons de côté la relation
d’instanciation entre tags et objets géographiques exprimée dans l’ontologie LGD.
L’ontologie issue de l’approche GWAP hérite de la hiérarchie de l’ontologie
haut-niveau DUL, mais ne génère pas de relations de subsomption entre les tags. Le
réseau sémantique OSN hérite des relations de méronymie (le rapport du tout à
ses parties), antonymie (le rapport de symétrie sémantique) et troponymie (le degré
d’intensité) de WordNet, mais ne cherche pas à en créer de nouvelles entre les tags.
De plus, l’approche adoptée par OSN extrait des relations de similarité entre les tags
basée, entre autres, sur la structure de l’ontologie LGD. Cette dernière, à l’instar de
l’ontologie OSMonto, intègre des relations de subsomption entre les concepts extraits
des tags OSM.
Ce rapport hiérarchique n’intervenant qu’entre la clé et la valeur d’un tag, la
taxonomie générée, présentée en figure 4.1 est très simpliste : elle ne compte que
deux niveaux. Cette superficialité est un obstacle pour l’automatisation de certaines
tâches. Par exemple, au moment de l’acquisition, lorsqu’un contributeur ajoute un
tag à la base de données OSM, un système de suggestion de tags similaires pourrait
être mis à profit dans le but d’améliorer la précision du tag choisi. Il existe des
outils pour mesurer le degré de similarité entre des concepts d’une ontologie (comme
l’ontologie LGD, par exemple) : lesmatchers d’ontologies.
Afin de trouver des similitudes entre les classes, les matchers utilisent différentes
techniques (basées sur le nom des concepts, sur la structure de l’ontologie, sur des
ressources externes, etc.) et stratégies (chaînage de plusieurs matchers,
aggréga-tion des similarités, méthodes d’apprentissage, implicaaggréga-tion de l’utilisateur,etc.). J.
Euzenat et S. Pavel fournissent un état de l’art complet à ce sujet [Euzenat and
Shvaiko, 2013]. Chaque correspondance est établie entre deux concepts par un degré
de similarité. L’ensemble de ces correspondances est appelé un alignement.
Cer-taines techniques dematching consistent en l’exploitation de l’expressivité formelle
de lastructure de l’ontologie, c’est-à-dire les relations qui permettent d’agencer les
concepts entre eux. La relation de subsomption en est un exemple.
Ainsi, dans une ontologie structurée de manière hiérarchique, deux concepts
frères qui partagent le même parent via un lien de subsomption se verront
attri-buer un degré de similarité élevé par un matcher qui adopte une stratégie d’analyse
structurelle. Cette stratégie est d’autant plus efficace que la hiérarchie considérée est
profonde. Les ontologies LGD et OSMonto ne possédant que deux niveaux, cette
ap-proche demeure donc limitée. Par conséquent, lorsqu’un contributeur OSM souhaite
ajouter le tag amenity=school, le système de suggestion utilisant les
correspon-dances produites par une stratégie d’alignement basée sur la hiérarchie clé-valeur de
LGD ou OSMonto propose des tags frères, c’est-à-dire ayant la clé amenity. Ainsi,
les tags amenity=bar, amenity=parking ou encoreamenity=dentist partagent le
même degré de similarité avec le amenity=school, malgré une distance sémantique
dont l’importance apparaît comme évidente pour un jugement humain. Cette
su-perficialité de la taxonomie est donc un frein majeur au contrôle de la qualité des
données au moment de l’acquisition.
L’ontologie LGD propose la typologie de tags OSM la plus fine des modèles vus
en chapitre 3. En effet, les tags y sont organisés en trois catégories : les attributs
de classification, les attributs de description et les attributs de données.
Cepen-dant, la raison pour laquelle les attributs de classification font l’objet d’une classe
(owl:class) dans l’ontologie alors que les attributs de description et attributs de
données sont convertis en propriété (respectivement owl:ObjectProperty et
owl:-DataProperty) est discutable. En effet, de prime abord, des tags tels que
amenity-=restaurant semblent décrire la nature de l’objet auquel ils sont associés, tandis
que des tags tels quewheelchair=yes ne représente qu’une propriété de l’objet.
Toutefois, si l’on considère l’utilisation conjointe des tagsamenity=cafe et
in-ternet_access=yesdans le cas de la description d’un cybercafé, on voit mal lequel
des deux est le plus pertinent pour caractériser la nature intrinsèque de l’objet.
Pour-tant, seules les classes Amenity et Cafe sont générées dans LGD tandis qu’aucune
classeInternetAccessn’est créée. L’usage ambigu de certains autres tags témoigne
également de cette lacune : le tagbuilding=yes, très largement utilisé par la
com-munauté OSM
10, est classifié comme un attribut de données par l’approche des
auteurs de [Auer et al., 2009] : aucun conceptBuilding n’est donc généré à partir
de ce tag. Pourtant, tous les autres tags partageant la clé building (
building-=church, building=stadium, building=kiosk, etc.), sont considérés comme des
attributs de description : cette fois le concept Building sera ajouté à l’ontologie.
L’exploitation d’un maximum de tags dans le but de construire une ontologie plus
étoffée permettrait, par exemple, de faciliter l’exploration des données.
10. Il est associé à plus de 4% de l’ensemble des objets en base de données OSM selon le service
Web TagInfo,http://taginfo.openstreetmap.org/tags/building=yes
Dans le document
OF4OSM : un méta-modèle pour structurer la folksonomie d'OpenStreetMap en une nouvelle ontologie
(Page 72-75)