• Aucun résultat trouvé

Imperfection des données géographiques et prise de décision

1.2 Imperfection, prise de décision et qualité des données géographiques

1.2.1 Imperfection des données géographiques et prise de décision

Derrière la notion d'imperfection des données géographiques se cachent de nombreuses notions beaucoup plus spéciques, notamment celles d'incertitude et d'imprécision, qui ont été abordées par de nombreux auteurs traitant de la qualité des données géographiques. Malgré les nombreuses contributions dans le domaine, aucun consensus terminologique ne s'est véritablement dégagé quant à la dénition de ces notions. Ainsi cette section propose de poser dénitivement les termes utilisés dans le cadre de cette thèse, qui sont tous des sous-ensembles de la notion d'imperfection, comme proposée parBouchon-Meunier(1995). Ces dénitions seront mises en perspectives avec le processus de prise de décision.

1.2.1.1 Un manque de consensus terminologique

Comme souligné par Devillers et al. (2010), il n'existe pas véritablement de consensus au sein de la communauté scientique de l'information géographique, quant à la terminologie utilisée dans le domaine de la qualité des données géographiques. En eet, de nombreux concepts, comme ceux d'incertitude, d'erreur, de précision, ou d'exactitude sont utilisés, mais pas toujours de manière adéquate.

Tous les auteurs peuvent s'accorder sur le fait que les données géographiques présentent des imperfections (Goodchild,1995;Hunter,1998). Nous l'avons vu, au-delà du processus d'abstraction du monde réel, les diérents processus de production de la base de données sont également générateurs d'erreurs.

Dans le domaine de l'information géographique, de nombreuses taxonomies des imperfec-tions des données géographiques ont été proposées, et de nombreux termes ont été em-ployés. Les concepts d'incertitude (Fisher,2003; Fisher et al., 2005), d'imprécision ( Wor-boys,1998a,b), ou encore de vague (Schneider, 1999) ont été utilisés par les auteurs dans des sens diérents, en fonction de leur communauté d'appartenance, des domaines d'ap-plications ou de leurs points de vue (Olteanu,2008). Ainsi, aucune dénition standard n'a véritablement été adoptée, même siFrank(2007) a proposé une ontologie de la qualité des données géographiques.

Dans ce contexte, seules deux dénitions sont unanimement reconnues par les diérentes communautés, à savoir les concepts d'exactitude et de précision, que nous avons présenté

Notion d'incertitude Dans de nombreuses recherches dans le domaine de la qualité des données géographiques, la notion d'incertitude est utilisée comme un concept général (Zhang et Goodchild, 2002). Pour illustrer ce propos, parmi l'ensemble des terminologies proposées, celle proposée par Fisher(2003) et Fisher et al.(2005) est particulièrement re-connue au sein de la communauté de l'information géographique.

Fisher (2003) et Fisher et al. (2005)) proposent une taxonomie (cf. gure 1.19), qui se présente comme un sous-ensemble de la taxonomie de l'ignorance deSmithson(1989). Les auteurs considèrent ici l'incertitude comme un concept général englobant tous les autres. Comme nous le verrons dans la section suivante, cette vision du concept d'incertitude est en fait similaire au concept d'imperfection dans l'approche de Bouchon-Meunier (1995), que nous adopterons par la suite.

Figure 1.19  Taxonomie de l'incertitude de Fisher (2003) et Fisher et al.(2005) et des modélisations associées

Fisher (2003) etFisher et al. (2005) suggèrent ici que tout processus utilisant les données géographiques prend en compte cette notion d'incertitude des données géographiques, et que cette incertitude est principalement liée au processus d'abstraction du monde réel. Ainsi, les auteurs diérencient les objets à la géométrie bien dénie (par exemple un bâti-ment) des objets à la géométrie mal dénie (par exemple une vallée ou encore une forêt). De cette diérentiation, les auteurs distinguent trois formes d'incertitude (l'erreur, le vague et l'ambigu) qu'ils proposent de gérer à l'aide de théories mathématiques traitant du domaine de l'incertain.

Dans cette dénition, l'erreur concernant les objets bien dénis peut être modélisée par des approches statistiques (probabilités). Les objets mal dénis, quant à eux, peuvent avoir une géométrie aux limites vagues (comme par exemple les limites d'une forêt) et peuvent être modélisés à l'aide de la théorie des ensembles ous (Zadeh, 1965). Ces objets mal dénis peuvent également être de nature ambiguë, faisant intervenir d'autres théories

ma-1.2. Imperfection, prise de décision et qualité des données géographiques

L'intérêt de l'approche deFisher (2003) et Fisher et al. (2005) dans le cadre de ce travail de thèse, tient dans le principe d'associer le concept d'erreur à des objets bien dénis, ainsi que les probabilités comme méthode d'évaluation. En eet, nous nous focalisons dans le cadre de ce travail sur des données de référence, pour lesquelles la modélisation géomé-trique est bien dénie, comme des routes ou des bâtiments par exemple.

Cependant, comme évoqué précédemment, nous n'utiliserons pas la notion d'incertitude telle qu'elle est proposée dans cette approche, nous privilégierons les notions d'imperfection proposées par Bouchon-Meunier (1995).

1.2.1.2 Les notions d'imperfection

Les données géographiques constituent une abstraction du monde réel, donc une simpli-cation, mais qui sont en plus entachées d'erreurs d'origines diverses. En ce sens, les données géographiques sont par dénition imparfaites (Goodchild,1995).

La notion d'imperfection a fait l'objet de nombreux travaux dans le domaine de l'Intelli-gence Articielle (Zadeh, 1965;Bouchon-Meunier,1995). Cette notion d'imperfection fait en fait appel à trois concepts : l'imprécision, l'incertitude et l'incomplétude (Olteanu,2008) (cf. gure 1.20).

Figure 1.20  Les grands types d'imperfections, d'aprèsOlteanu (2008)

L'imprécision concerne la diculté d'exprimer précisément un état de la réalité par une proposition. Par exemple, "la distance entre ces deux villes est d'environ 150 km". La no-tion d'imprécision est ici formalisée par le terme "environ".

L'incertitude concerne elle un doute sur les connaissances. Elle formalise le doute ou la prudence de l'observateur quant à une connaissance. Par exemple, "je crois que la distance entre ces deux villes est de 148 km". La notion d'incertitude est ici formalisée par l'expres-sion "je crois".

Enn, l'incomplétude traite de l'absence de connaissances ou de connaissances partielles dans la donnée. Par exemple, si le champ "largeur" d'un objet route n'est pas rempli, ou encore si une route n'est pas présente dans la base de données.

Comme nous le voyons bien à travers ces dénitions, ce travail de thèse se focalise sur la notion d'imprécision, à travers sa quantication sur des mesures de longueur et de surface

Les Systèmes d'Information Géographiques (SIG) nous permettent aisément de calculer des longueurs ou des surfaces à partir de la géométrie des objets vectoriels, mais cependant aucune expression de l'imprécision de la mesure n'est proposée. Par exemple, à l'armation "la distance entre ces deux villes est d'environ 150 km", l'objectif de ce travail de thèse est de pouvoir estimer le terme "environ", en formalisant une expression du type "la distance entre ces deux villes est de 148 km, plus ou moins 2 km (à 99%)".

Les notions d'incertitude et d'incomplétude, si elles ne sont pas au c÷ur de ce travail de thèse, seront abordées par rapport aux prises de décision impliquées par des informations imprécises.

1.2.1.3 Incertitude et prise de décision

Les données géographiques sont utilisées comme support d'aide à la décision dans de nom-breux domaines (Longley et al., 2005). Comme l'indique Devillers (2004) ces données contiennent toujours un niveau d'incertitude, qui les rendent plus ou moins adaptées à l'utilisation qui en sera faite. Ainsi, il arrive qu'un utilisateur prenne des risques à utili-ser des données non-adéquates dans certains processus de décision, pour lesquels les SIG facilitent pourtant grandement la tâche. L'utilisateur peut donc se retrouver dans une si-tuation d'incertitude quant à la décision qu'il doit prendre en utilisant ses données. Ainsi, Goodchild (1995) suggère que les recherches en qualité des données géographiques ne se concentrent pas uniquement sur la description et la communication de la qualité des données géographiques à l'utilisateur nal, mais également sur l'impact qu'ont ces infor-mations sur les processus de décision. Cette idée rejoint le concept de "use error" proposé parBeard (1989) quant aux mauvaises utilisations pouvant être faites des données géogra-phiques pour certains usages.

Lorsqu'un utilisateur doit faire face à une situation d'incertitude lors d'un processus de prise de décision à l'aide de données géographiques, Bédard (1987) considère qu'il est en mesure de choisir entre : 1- ne rien faire, 2- essayer de diminuer le niveau d'incertitude, 3-prendre la décision en acceptant les conséquences possibles, en "absorbant" l'incertitude. Pour réduire l'incertitude,Epstein et al.(1998) proposent quant à eux : 1- d'acquérir plus d'information, 2- d'améliorer la qualité de l'information.

Egalement, Hunter(1998) propose une stratégie globale pour gérer l'incertitude dans les SIG en intégrant les concepts d'absorption et de réduction d'incertitude. Il propose notam-ment qu'une comparaison soit réalisée entre les besoins des utilisateurs et les caractéris-tiques de la base de données.

Enn, Agumya et Hunter (1996) proposent une approche permettant de déterminer le niveau d'acceptabilité de l'incertitude, en analysant les risques potentiels pouvant être as-sociés à une prise de décision basée sur ces données.

Si diérentes stratégies de gestion de l'incertitude associées à un processus de prise de décision ont été proposées dans ces contributions, les auteurs s'accordent à dire qu'il est nécessaire de communiquer préalablement un ensemble d'informations sur la qualité des données géographiques utilisées. Dans ce contexte, la section suivante a pour objectif de

1.2. Imperfection, prise de décision et qualité des données géographiques Synthèse Section Nous avons vu dans cette section qu'il n'existe pas véritable-ment de consensus terminologique autour du concept d'imperfection des données géographiques. Ainsi, dans le cadre de ce travail de thèse, la terminologie proposée parBouchon-Meunier (1995) sur les diérents types d'imperfections sera utilisée, la notion d'imprécision que l'auteur propose étant la plus appropriée dans le cadre de ce travail. Nous cherchons en eet dans le cadre de cette thèse à estimer l'im-précision des mesures géométriques de longueur et de surface, an d'aider un utilisateur à réduire l'incertitude d'un processus de prise de décision sollicitant ces mesures.