• Aucun résultat trouvé

Chapitre 2 L’incertitude inhérente à l’information géographique et ses impacts

2.3 Certains impacts découlant de l’incertitude

2.3.3 Difficultés reliées aux superpositions de plusieurs jeux de données

Les systèmes d’information géographique permettent la superposition de plusieurs jeux de données géographiques numériques, opération difficilement réalisable à partir de cartes présentées sur support analogique. La superposition de plusieurs jeux de données constituerait d’ailleurs l’objectif premier des utilisateurs [Béguin et Pumain, 2000] afin de créer de la valeur [Loshin, 2001]. Pour être en mesure de profiter d’une superposition à des fins de visualisation ou d’analyse, la vue résultante doit être cohérente. Toutefois, les systèmes d’information géographique ne corrigent pas les incohérences résultant de telles superpositions ou intégrations.

Que ce soit des variations dans le géoréférencement (figure n°8), dans les définitions (entités ou attributs) [Hogan, 1993], dans le niveau d’exactitude et de détails (granularité) [Zhang et Goodchild, 2002], des données qui apparaissent comme étant exemptes d’erreurs prises individuellement, produisent ou démontrent des incohérences lorsqu’elles sont superposées avec d’autres (figure n°9) [Walford, 2002].

Figure n°8. Exemple d’incohérence provoquée par la superposition de cartes différentes dont le géoréférencement est différent

Notes : Sur cette image, on constate une différence en position, en orientation des murs du bâtiment, une différence de longueur des dits murs et une différence quant au niveau des détails montrés. Le bâtiment en rouge provient de la Base Nationale de Données topographiques (BNDT) à l’échelle de 1 : 50 0000 et le bâtiment détaillé provient d’une carte préparée par Gaz Métropolitain à l’échelle de 1 : 1000.

Chapitre 2 L’incertitude inhérente à la production et ses impacts 101

Figure n°9. Exemple d’incohérence résultant de l’intégration d’une photographie aérienne et d’une carte numérique

Note : Sur cette image, il est possible de constater des problèmes d’incomplétude (des routes et des bâtiments manquent), de localisation dans l’espace des bâtiments (ceux en bleu ou en caractère gras ne coïncident pas avec ceux montrés sur la photographie aérienne) et des routes (celles en rouge ou en caractère gras ne coïncident pas avec celles montrées sur la photographie aérienne). Les bâtiments et les routes proviennent d’une carte préparée à l’échelle de 1 : 1 000 par Gaz Métropolitain et la photographie aérienne est une orthophoto à l’échelle de 1 : 40 000 produite par le ministère des Ressources naturelles, de la faune et des parcs (MRNFP).

Confronté à une pareille situation, l’usager verra apparaître plusieurs ambiguïtés comme, non limitativement, des entités identiques qui ne coïncident pas, des entités différentes mais d’apparence identique [Zhang et Goodchild, 2002], la plupart des

ambiguïtés provenant de la présence de rigueurs conceptuelles différentes [Walford, 2002]. La localisation relative de deux objets voisins provenant de deux jeux de données différents (conçus par des procédés différents) peut même être très inexacte [Goodchild et Longley, 1999].

Les méthodes de combinaison de plusieurs jeux de données doivent prendre en considération l’identification des objets ou phénomènes d’intérêts209, leurs descriptions210 (différences sémantiques), leurs références spatiales211, leurs représentations212 et leurs références temporelles213 (figure n°10). Ces méthodes doivent résoudre les différences entre les diverses bases de données hétérogènes provenant de sources et de précisions distinctes [Zhang et Goodchild, 2002] ou captés à des moments distincts (figure n°11).

209 Il peut exister des différences sémantiques comme deux noms d’entités différents désignant exactement le même type d’objets.

210 Par exemple, les types d’un attribut, les longueurs d’attributs, les définitions d’une valeur, les domaines de valeurs ou les unités de mesure.

211 Par exemple, dans les systèmes de coordonnées, les projections cartographiques, les systèmes de référence géodésique, les systèmes de référence altimétrique, les ellipsoïdes de référence ou les formes géométriques des objets ou phénomènes représentés.

212 Par exemple, dans les échelles cartographiques, les résolutions spatiales, les structures de données cartographiques, les structures de données descriptives, les systèmes de découpage, les couvertures territoriales et les symbologies liées à l’échelle cartographique.

213 Par exemple, des dates de mises à jour différentes pour chaque classe d’objet, pour chaque objet à l’intérieur d’une même classe ou pour chaque primitive à l’intérieur d’un même objet.

Chapitre 2 L’incertitude inhérente à la production et ses impacts 103

Figure n°10. Exemple de conflits résultant d’une intégration sémantique, spatiale et temporelle. Note : Cette figure montre les limites de peuplements forestiers de la Forêt Montmorency de l’Université Laval (Québec) captés lors de trois inventaires réalisés à des moments différents.

Peuplements forestiers 1973 Peuplements forestiers 1984

Les méthodes d’intégration de données géographiques ne sont pas comparables avec les méthodes d’intégration des données non géographiques. Ces dernières reposent sur le simple concept de moyennes pondérées dont le traitement statistique est généralement fiable et bien documenté. Les données géographiques étant complexes et comportant des propriétés multidimensionnelles, elles doivent faire l’objet de manipulations et de traitements spécifiques. L’intégration de plusieurs couches ou de plusieurs jeux de données peut mener à des résultats souvent non significatifs et potentiellement dangereux [Zhang et Goodchild, 2002]. La précision d’une carte composée à partir d’une superposition de cartes serait généralement moins bonne que celle de la couche la moins précise [Faïz, 1999].

La combinaison d’informations géographiques provenant de plusieurs sources dans une même base de données ou dans une même vue donne un résultat d’une qualité difficile à évaluer. Les difficultés et les conséquences néfastes augmentent lorsque les usagers ne sont pas familiers avec les limitations intrinsèques des bases de données sources [Evans, 1997]. Finalement, en l’absence d’informations sur la qualité ou de connaissances antérieures utiles, les usagers ne possèderaient aucun moyen logique de résoudre les problèmes [Aalders et Morrison, 1997].

Figure n°11. Exemple d’une incohérence temporelle

Note : Dans cet exemple, les bâtiments sont mis à jour plus rapidement que les rues. On retrouve donc quatre bâtiments (image de droite) en apparence sans accès à une rue.

É Par

A

É É Par

A’

Chapitre 2 L’incertitude inhérente à la production et ses impacts 105