• Aucun résultat trouvé

lnteropérabi l ité François Chirié et Bénédicte Bucher

Dans le document La recherche à l'IGN : activité 1998 (Page 109-111)

C 3.4 Qual ité des bases de données géographiques

C.3.5 lnteropérabi l ité François Chirié et Bénédicte Bucher

Contexte - obj ectifs

L'interopérabilité dans le domaine de l'information géographique est une situation idéale où données et traitements seraient accessibles, sur un réseau comme Internet, et où il serait possible de les faire travailler ensemble, c'est-à-dire d'appliquer les traitements sur les données pertinentes, et de combiner éventuellement les traitements. Cela se situe dans un problème plus général : celui de l'échange d'informations, qu'il s'agisse de données ou de savoir-faire, cet échange pouvant être entre un producteur de données et un utilisateur, entre un traitement et un autre. L'interopérabilité renvoie au rôle joué dans cet échange par les méthodes et outils, conceptuels et informatiques, utilisés pour formaliser et gérer ces informations.

Les obstacles à l'interopérabilité peuvent ainsi être des incompatibilités à des niveaux divers des systèmes concernés : les formats, les modes de stockage, et les modes d'accès. Ce sont les obstacles les plus évidents et qui sont souvent à l'origine des démarches dans ce domaine.

Par ailleurs, derrière toute base de données, tout processus, et tout besoin, se trouvent des acteurs qui appartiennent à des communautés d'utilisateurs différentes. Or, à une communauté d'utilisateurs correspond un contexte précis de manipulation des données. Concrètement, dans le cas de fournisseurs de données, les schémas conceptuels de données, les nomenclatures, les sources et spécifications de saisie et de contenu peuvent être extrêmement variés. D'autre part, certaines informations qui nécessiteraient d'être considérées peuvent ne pas être exprimées explicitement. Tout cela conduit à la notion d'interopérabilité sémantique qui est cruciale lors de l'accès et l'exploitation de bases de données où il est important de prendre en compte les besoins et comportements des utilisateurs.

Notre action de recherche s'inscrit dans les démarches en interopérabilité sémantique, son objectif est d'étudier les modalités d'accès aux bases de données géographiques dans ce contexte.

Activités - résu ltats

L'année 1 998 a permis d'établir un état de l'art des différentes démarches en interopérabilité et de définir à partir de cet état de l'art le sujet de thèse de Bénédicte Schietecatte-Bucher. Cette question concerne différents acteurs : des producteurs et des utilisateurs de données géographiques, des concepteurs ou des vendeurs de logiciels, des institutions, des promoteurs de technologies, des universitaires .... Elle est traitée par différentes approches.

Le problème de l'interopérabilité entre des SIG et des bases de données a ainsi conduit à l'utilisation de standards de fait, les formats d'échange des principaux SIG, puis à la définition de normes institutionnelles (ISO/TC21 1 et CEN/TC287). L'OpenGIS Consortium tente d'apporter une solution à ce problème sous la forme de spécifications d'implémentation d'interfaces entre SIG.

Des infrastructures d'information sont par ailleurs mises en place, suite au développement de réseaux de communication comme Internet. Cela pose le problème de l'accès d'un utilisateur à cette information. Il ne peut évaluer chaque ressource, il lui faut un niveau plus gobai auquel il puisse prendre connaissance de l'information existante voire exprimer une requête. Cela est rendu possible par la méta-information, ou information sur l'information, qui comporte des informations utiles sur la ressource dispensant dans un premier temps de considérer celle-ci dans son intégralité. Ainsi on renseigne les données à l'aide de métadonnées portant par exemple sur leur propriétaire, leurs modalités d'acquisition, leur qualité et leur contenu. Des systèmes peuvent éventuellement gérer des requêtes de recherche d'information en consultant ces méta-informations. Pour cela, il faut que ces dernières aient une forme suffisamment homogène. Des travaux sont en cours pour élaborer des standards en la matière et pour enrichir les structures de métadonnées de façon à permettre l'expression de requêtes complexes.

Le problème de l'accès aux bases de données n'est pas uniquement celui de l'accès physique, mais plus généralement celui de la compréhension de l'information qu'il est possible d'extraire d'une base de donnée particulière, du choix éventuel d'une base de données, parmi plusieurs pour effectuer une tâche, de la sélection dans cette base de donnée de l'information utile dans le cadre de la tâche et de l'expression d'une requête.

Les principaux problèmes rencontrés sont liés à des différences de perceptions et de modélisations. Il n'existe pas de description naturelle de l'information géographique partagée par tous, et d'autre part, deux utilisateurs ayant une même vision du monde réel peuvent l'avoir modélisé différemment dans leurs applications respectives. L'hétérogénéité sémantique provient des disparités entre catégorisations géographiques. La correspondance entre le monde réel et les concepts cognitifs construits par l'homme varie en fonction de la culture, de la langue, et de la discipline. Par exemple, les définitions des catégories géographiques, les frontières entre différentes catégories ne sont pas les mêmes pour tous.

La thèse de Bénédicte Schietecatte-Bucher doit étudier l'amélioration de l"' accessibilité " des bases de données géographiques en contribuant à la conception d'un système d'interaction entre l'utilisateur et les bases de données.

Pour cela, nous cherchons a créer une description supplémentaire de nos données par l'utilisation qui en est faite. Cette description doit aider l'utilisateur à exprimer son besoin en termes de fonctionnalités et guider le choix des données et traitements appropriés. Formellement, nous cherchons à identifier et représenter des tâches génériques, c'est-à-dire communes à plusieurs domaines d'application, et à les exprimer en termes d'opérateurs plus élémentaires. Pour cela nous nous appuyons sur des utilisations typiques de l'information géographique dans des domaines différents. Une méthode d'analyse de scénarios cognitifs d'utilisation de cette information a été établie dans ce but, et des premières tâches et les opérateurs correspondants ont été déterminés.

S u i t e s

Deux pistes complémentaires vont être suivies :

d'une part, nous allons poursuivre la détermination des tâches genenques, celle de la décomposition en opérateurs, et l'organisation de ces derniers en ontologie. Cette démarche sera appuyée et validée par des contacts avec la direction commerciale de I'IGN et des utilisateurs des données de I'IGN. Un projet du PNSIG en collaboration avec le CERTU, la CEGN et le LALIC, laboratoire en acquisition de connaissances, doit concourir à ces études ; il existe un projet de détermination d'opérateurs élémentaires d'analyse spatiale dans les S 1 G : " Virtual G I S ", mené par Jochen Albrecht à l'Institut ISPA [ALBRECHT 95] . Nous chercherons à traduire nos opérateurs " utilisateurs " dans ces opérateurs SIG,

d'autre part, un test d'implémentation de résultats obtenus dans le domaine de l'interopérabilité sémantique par les thèses de Thomas Devogele [DEVOGELE 97] et Yaser Bishr [BISHR 97] sera effectué sur le thème routier des bases de données IGN. Ce test permettra d'aborder l'intégration et le partage de données entre bases de données distribuées hétérogènes.

R é f é r e n c e s

[ALBRECHT 95] Jochen Albrecht : Universal analytical GIS operations, Ph. D . dissertation, University of Vechta, Allemagne, 1 995.

[BISHR 97] Yaser Bishr : Semantic aspects of interoperable GIS, Ph. D. dissertation, ITC, Enschede (NL) , 1 997. [DEVOGELE 97] Thomas Devogele : Processus d'intégration et d'appariement de bases de données géographiques, application à une base de données routières mufti-échelles, thèse de méthodes informatiques, laboratoire COGIT, IGN­

SR 970025/S-THE, 1 997.

Généralisation

Dans le document La recherche à l'IGN : activité 1998 (Page 109-111)