La problématique de la qualité de l’information géographique

Chapitre 2 : L’approche système d’information géographique pour la gestion

2.3. Quelques questionnements actuels de la communauté des technologies

2.3.1. La problématique de la qualité de l’information géographique

Les données géographiques, comme toutes les autres, sont généralement constituées pour un usage précis, consécutif à leur production. Le plus souvent, les données rassemblées sont bien

13_{Cette partie n’a pas vocation à aborder toute la complexité du sujet. Pour plus d’information, voir notamment}

adaptées à ce premier usage. Le problème se pose lors de la réutilisation des données pour d’autres usages ou par d’autres personnes.

La qualité des données est généralement perçue comme leur degré de fiabilité. [CNIG, 2003] précise que la qualité d’une donnée ou d’un lot de données est généralement appréciée par les critères suivants :

- la généalogie qui permet d’indiquer les références complètes de la source des données ;

- l’actualité qui introduit l’aspect temporel des données ;

- la précision planimétrique qui définit l’écart moyen probable entre les mesures de contrôle et les valeurs de position planimétrique des données ;

- la précision altimétrique qui définit l’écart moyen probable entre les mesures de contrôle et les valeurs de position altimétrique des données ;

- l’exhaustivité qui permet d’apprécier le pourcentage d’éléments du terrain réel qui ont été pris en compte dans le lot de données par rapport à tous ceux qu’il aurait fallu inclure ;

- la précision sémantique qui définit le nombre des objets, des primitives, des relations ou des attributs qui ont été correctement codifiés conformément à la nomenclature ;

- la cohérence logique qui définit le nombre des objets, des primitives, des relations ou des attributs qui respectent une règle fixée par les spécifications du produit (le lot de données) ;

- la qualité spécifique : l’utilisateur peut définir une mesure propre de la qualité de ses données.

Les schémas ci-dessous illustrent l’intérêt que revêt l’utilisation de tels critères de mesure et de restitution de la qualité.

Fig 19. Exemple de la perte de détails lors d’une modélisation [Bédard Y., 1986]

Fig 21. Les possibilités de généralisation du concept maison [Martel J., 1999]

[Gervais M., 2003] met ainsi en évidence que, au moment de leur consommation, beaucoup de données géographiques ont vocation à être inexactes, incomplètes, périmées et subjectives autant dans les dimensions temporelle, géométrique que descriptive. Selon lui, l’incertitude résultante demeure difficile voire impossible à mesurer et sa nature dépend de la finalité ou des objectifs visés avant et pendant le processus de production. Afin de la réduire, les producteurs transmettent des indicateurs du type de ceux présentés précédemment, dont l’objectif est de permettre à l’usager d’évaluer ou d’apprécier la qualité de l’information fournie. Or, ces indicateurs ne sont pas nécessairement représentatifs de la qualité de l’information en fonction des besoins de l’utilisateur, sont influencés par le contexte propre au producteur et peuvent difficilement guider l’usager en regard d’une application particulière [Gervais M., 2003].

[Bédard Y. et Vallière D., 1995] en concluaient déjà qu’il n’existe pas et qu’il n’existera jamais de méthode générique suffisamment rigoureuse pour permettre de calculer de façon parfaitement objective la qualité de n’importe quelle donnée à référence spatiale.

Ces constats ont inspiré [Devillers R., 2004] qui rappelle que les producteurs utilisent en général le concept de qualité pour la seule qualité interne, c'est-à-dire le niveau de similarité entre la représentation de la réalité désirée et le jeu de données effectivement produit, notion évoquée jusque là. Par ailleurs, ils introduisent la notion de « fitness for use » pour décrire la qualité externe, c’est à dire l’adéquation entre les produits et services et les besoins des utilisateurs en fonction d’une ou plusieurs applications données :

Fig 22. Concepts de qualité interne et externe des données (traduit de [Morrisson J.-L., 1995] par [Devillers R., 2004] )

Selon [Gervais M., 2003], le modèle de commercialisation ou de transaction fondé sur la trilogie licence-données-métadonnées intègre encore mal ce concept de qualité divisé en deux approches différentes et complémentaires : la qualité interne, jusqu’à présent la cible des travaux scientifiques, et la qualité externe dont les développements restent encore timides.

Il démontre alors la pertinence de glisser de la transmission d’informations relatives à la qualité interne de l’information dans un contexte d’usages non contrôlés, vers la transmission d’informations relatives à la qualité externe de l’information dans un contexte d’usages contrôlés. [Bédard Y., 2007] va même plus loin en élargissant les méthodes de gestion des risques liés à une mauvaise utilisation de l’information géographique en préconisant la mise en place d’audit de qualité.

Ses travaux rejoignent le point de vue de [Goodchild M. F., 1995] qui décrit les SIG comme étant leur propre ennemi : en invitant les personnes à trouver de nouvelles utilisations pour les données, ces dernières sont invitées à être irresponsables dans leur utilisation.

[Devillers R., 2004] en conclue que des experts en qualité des données doivent pouvoir s’appuyer sur des outils pour identifier les problèmes potentiels ainsi que pour synthétiser les informations nécessaires pour un usage adéquat des données géographiques. Afin de supporter de tels experts dans l’évaluation de l’adéquation à l’utilisation il présente une approche visant à mieux gérer et communiquer l’information sur la qualité des données grâce à un ensemble de concepts relié aux bases de données décisionnelles et aux techniques de visualisation. Son approche repose techniquement sur une combinaison des fonctions d’un SIG avec des technologies d’intelligence décisionnelle (principalement le On-Line Analytical Processing ou OLAP), afin d’adapter l’approche de tableau de bord pour fournir des indicateurs interactifs et contextuels décrivant la qualité des données géospatiales. Il propose un prototype nommé MUM (Manuel à l’Usager Multidimensionnel) afin d’illustrer cette approche permettant de communiquer l’information sur la qualité des données à différents niveaux de détails.

Fig 23. Interface cartographique du MUM avec tableau de bord et indicateurs à gauche et représentation cartographique de la qualité à droite [Devillers R., 2004]

La présentation, incomplète, de la problématique de la gestion de la qualité des données géographiques et des solutions actuellement envisagées dans la littérature laisse penser que le

niveau d’expertise requis14 est susceptible d’être un frein dans le processus de diffusion des technologies de l’information géographique dans les organisations. Il s’avère que c’est un frein parmi tant d’autres… La section suivante aborde ces questions.

Dans le document Adoption des technologies de l'information géographique et gestion des connaissances dans les organisations. Application à l'industrie de l'assurance pour la gestion des risques naturels (Page 56-60)