Incertitude descriptive - L’incertitude dans la production de l’information géographique

Chapitre 2 L’incertitude inhérente à l’information géographique et ses impacts

2.2 L’incertitude dans la production de l’information géographique

2.2.2 Incertitude descriptive

L’incertitude descriptive réfère au caractère vague des valeurs qualitatives et à l’imprécision des valeurs quantitatives utilisées dans la description des attributs de la réalité observée [Bédard, 1986b]. Plusieurs facteurs contribuent à augmenter l’incertitude descriptive. Toute donnée est le résultat d’une mesure ou d’une approximation. Il n’est pas toujours possible d’atteindre l’exactitude ou la précision désirée par les utilisateurs. Par exemple, lors de l’évaluation du nombre d’étages d’un bâtiment, l’analyste peut ne pas constater la présence d’une aire habitable au grenier. Lors de l’évaluation de la valeur marchande d’un immeuble, la méthode basée sur les comparables amène l’analyste à considérer d’autres immeubles qu’il juge similaires. Or, une comparaison n’est jamais définitive. L’incertitude peut aussi provenir d’une description défaillante ou imprécise des frontières d’un territoire, d’un objet ou d’un phénomène et devenir source de confusion111.

Ensuite, dans plusieurs situations, les attributs d’un objet sont fixés selon les résultats obtenus à partir d’un échantillonnage ou en observant qu’une portion de la population112. L’échantillonnage fait appel à des méthodes dites probabilistes ou non

probabilistes. Les méthodes non probabilistes sont généralement identifiées comme étant

inappropriées puisqu’elles ont vocation à insérer un niveau de biais et de subjectivité inacceptable dans la sélection des éléments observés. Elles sont donc généralement écartées ou dénigrées à l’égard d’investigations à caractère scientifique [Walford, 2002].

111_{Par exemple, dans l’élaboration des règlements d’urbanisme d’une municipalité, on pourrait omettre de} préciser la frontière exacte d’un bâtiment à partir de laquelle seraient calculées les marges latérales. Il existerait donc une incertitude à savoir si on doit considérer le parement extérieur ou les fondements du bâtiment, les deux étant régulièrement à des positions différentes.

112_{Une population est l’ensemble des occurrences d’une classe d’objets ou de phénomènes alors qu’un} échantillon constitue un sous-ensemble de la population totale.

Les méthodes probabilistes, quant à elle, sont fondées sur une sélection aléatoire des éléments de façon à pouvoir dégager des caractéristiques représentatives d’une population. Toutefois, on ne sait jamais avec précision ou certitude jusqu’à quel point un échantillon est représentatif d’une totalité [Gagnon et Hébert, 2000]. Un processus d’échantillonnage peut s’avérer inadéquat en de multiples circonstances en rapport avec des objets ou phénomènes géographiques. Par exemple, une base de données ayant vocation à montrer le réseau routier d’une municipalité pourra difficilement s’appuyer sur seulement un sous-ensemble des routes, rues ou chemins sur son territoire. L’exhaustivité, quoique difficile à atteindre, constitue souvent une caractéristique recherchée au sein des cartes ou bases de données géographiques.

De plus, le processus d’échantillonnage est valide à une échelle donnée mais peut, en certaines circonstances, s’avérer totalement inadéquat ou trompeur à une échelle différente. Par exemple, si les données sont collectées et présentées sur la base des territoires couverts par les Municipalités Régionales de Comté (MRC), les données perdent leur signification si elles sont réparties proportionnellement en fonction des territoires couverts par chacune des municipalités prises individuellement. La limitation est particulièrement importante à l’égard de l’information géographique numérique qui est sujette à des effets de zoom113. Les résultats issus d’un processus d’échantillonnage peuvent être valables à une résolution donnée mais risque de perdre toute signification et leurs éventuelles valeurs scientifiques lorsque le niveau de granularité est modifié114_.

113_{Un parallèle peut être effectué ici avec le concept de résolution ou de granularité exposé ci-dessus à la} section 2.2.1.

114_{Dans certaines bases de données plus sensibles, comme celles commercialisées par Statistique Canada,} des dispositifs techniques empêchent le lecteur de forer à un niveau de détails trop fin (ou granularité trop fine) de façon à ce que les données demeurent représentatives du phénomène étudié et aussi de façon à préserver la vie privée des citoyens [Worboys, 1998b]. Cet aspect de l’intrusion de la vie privée par l’utilisation de systèmes d’information géographique fait l’objet de plusieurs publications et soulèvent de fortes inquiétudes. Comme ces systèmes possèdent la capacité d’intégrer en même temps plusieurs jeux de données de sources différentes, de tels croisements peuvent mener à des investigations au-delà de ce qui est permis par la loi. À ce sujet, voir Onsrud [1993], Flaherty [1994], Perritt [1996], Barr [1997], Barr [1998], Gauthronet et Nathan [1998], Moreno [1999], Morgan [1999], Wiederhold [1999], Pitofsky et collab. [2000], Curry [2000], Blakley, Francoeur, Jenkins et Solomon [2003]. Le droit à l’image constitue une autre source d’inquiétude, voir à ce sujet Moreno [1999] et Tabaka [2003].

Chapitre 2 L’incertitude inhérente à la production et ses impacts 53

Lorsque la description d’un objet ou d’un phénomène est issue d’une méthode probabiliste, les caractéristiques ou attributs associés à cet objet ou ce phénomène peuvent ne pas être valides pour l’ensemble de population115. Par exemple, même si un peuplement forestier est identifié comme étant une sapinière, il demeure possible qu’on puisse retrouver à l’intérieur de ce même peuplement d’autres essences. Comme la quantité des autres essences présentes est minime ou sporadique, et comme la discrimination s’opère selon une granularité définie, le peuplement sera officiellement identifié et décrit comme étant une sapinière puisque cette dernière essence décrit le mieux la situation existante sur le terrain. Les classes mixtes, des classes pauvrement définies ou ambiguës, la présence de zones de transition (entre deux peuplements par exemple) constituent autant de facteurs générant de l’incertitude [Lunetta et collab., 1991]. Le caractère flou ou imprécis d’une discrimination (tel qu’exposé à la section précédente) s’applique donc aussi à la description des objets ou de phénomènes, autrement dit, dans la détermination de leurs attributs116.

Le même phénomène se retrouve au sein des représentations géographiques selon une structure matricielle. Il arrive, selon les dimensions des pixels, que plusieurs caractéristiques mutuellement exclusives existent à l’intérieur d’un même pixel. Nous sommes alors en présence de ce qu’il est convenu d’appeler des mixels [Longley, Goodchild, Maguire, Rhind, 2001], terme maintenant souvent utilisé pour identifier ce genre de situation ou l’analyste doit imposer la caractéristique dominante au détriment des autres, minoritaires. La classification des objets ou phénomènes est aussi sujette à une certaine fluidité dans l’appartenance à une classe117.

115_{Certains attributs sont déterminés à partir de questionnaires qui, en certaines circonstances, peuvent être} inadéquats, provoquer une résistance ou des incohérences provenant des répondants. La procédure d’échantillonnage peut être entachée d’erreur provoquant un biais systématique. L’instrument de mesure peut être sujet à des distorsions, des imprécisions ou des inexactitudes.

116_{Si les attributs d’un objet dans la base de données sont présentés sous la forme d’un domaine formé de} valeurs prédéfinies, l’observateur peut être confronté à un attribut ne correspondant à aucune de ces valeurs. Par exemple, pour l’attribut usage, si l’analyste a spécifié trois valeurs possibles telles que résidentiel, multifamilial et commercial, l’observateur aura de la difficulté à classer un immeuble faisant l’objet d’un usage mixte, c’est-à-dire un usage résidentiel et commercial.

117_{Pour reprendre notre exemple, il est possible à une date donnée que l’essence dominante d’un} peuplement soit de type sapinière mais que plusieurs années plus tard, le même peuplement soit reconnu comme étant majoritairement d’un autre type d’essence.

La collecte des données spatiales et descriptives n’est valide qu’à une date donnée et l’incertitude augmente au fur et à mesure que l’on s’éloigne de cette date, l’univers étant en continuel mouvement. Toutefois, même en présence des données les plus fraîches, l’incertitude perdure, ce qui nous conduit à discuter de l’incertitude dans la localisation des objets ou des phénomènes dans le temps et dans l’espace.

Dans le document Pertinence d'un manuel d'instructions au sein d'une stratégie de gestion du risque juridique découlant de la fourniture de données géographiques numériques (Page 64-67)