• Aucun résultat trouvé

Nouvelle méthode pour mieux informer les utilisateurs de portails Web sur les usages inappropriés de données géospatiales

N/A
N/A
Protected

Academic year: 2021

Partager "Nouvelle méthode pour mieux informer les utilisateurs de portails Web sur les usages inappropriés de données géospatiales"

Copied!
145
0
0

Texte intégral

(1)

Nouvelle méthode pour mieux informer les

utilisateurs de portails Web sur les usages

inappropriés de données géospatiales

Mémoire

Tania Roy

Maîtrise en sciences géomatiques

Maître ès sciences (M. Sc.)

(2)
(3)

Résumé

Dans le cas de portails Web donnant accès à de multiples jeux de données, il peut être difficile pour un utilisateur métier non expert en données géospatiales d‟évaluer si les données présentent des risques d‟utilisation, la seule information généralement disponible étant les métadonnées. Elles sont généralement présentées dans un langage technique, ce qui peut limiter la compréhension de leur portée sur les décisions de l‟utilisateur. L‟objectif principal de ce mémoire est de proposer une approche pour aider les utilisateurs et producteurs de données géospatiales à identifier et gérer les risques reliés à l‟utilisation envisagée de données acquises dans un portail Web a posteriori de la production des données. L‟approche utilisée pour répondre à nos objectifs consiste en une série de questions structurées adressées à l‟utilisateur dont les réponses permettent d‟identifier des risques. Dans le cas où celui-ci identifie des risques d‟utilisation, des actions spécifiques de gestion du risque sont suggérées.

(4)
(5)

Abstract

In the case of Web portals providing access to multiple data sets, it may be difficult for a non-expert user to assess if data may present risks; the only information generally available being metadata. These metadata are generally presented in a technical language, and it can be difficult for a non-expert user to understand the scope of the metadata on their decisions. The main objective of this thesis is to propose an approach for helping users and producers of geospatial data to identify and manage risks related to the planned use of data acquired through a Web portal, a posteriori of the production of data. The approach developed uses a series of structured questions to be answered by a user of geospatial data. Depending on the answers, the user can identify risks of use. When risks of data misuse are identified, specific risk management actions are suggested.

(6)
(7)

Table des matières

Résumé ... iii

Abstract ... v

Table des matières ... vii

Liste des tableaux ... ix

Liste des figures ... ix

Remerciements ... xiii

Chapitre 1 – Introduction ... 1

1.1 Mise en contexte ... 1

1.2 Problématique ... 4

1.3 Hypothèse générale de recherche... 6

1.4 Objectifs ... 8

1.5 Méthodologie ... 9

1.6 Conclusion ... 13

Chapitre 2 – Revue de littérature ... 15

2.1 Gestion des risques ... 15

2.1.1 Qu‟est-ce que le risque? ... 15

2.1.2 Méthodes existantes de gestion des risques ... 16

2.1.3 Applications de la gestion des risques dans le domaine géospatial ... 20

2.2 Utilisateurs de données géospatiales ... 22

2.3 Évaluation de la qualité des données géospatiales ... 25

2.3.1 Métadonnées ... 26

2.3.2 Approches d‟évaluation de la qualité ... 28

2.4 Communication de l‟information sur la qualité des données géospatiales ... 33

2.5 Conclusion ... 34

Chapitre 3 – Études de cas sur la diffusion et l‟évaluation de la qualité de données géospatiales ... 37

3.1 Études de cas de diffusion de données géospatiales ... 37

3.1.1 Service de la géomatique du Ministère des Transports du Québec ... 38

3.1.2 Centre d‟information topographique – Sherbrooke (CIT-S) ... 45

(8)

3.2.1 Consultation du contenu ... 52

3.2.2 Entrevue avec une des auteurs d‟un rapport ... 55

3.2.3 Apport de la démarche ... 56

3.3 Synthèse des études de cas ... 56

Chapitre 4 – Identification des risques d‟utilisation des données géospatiales ... 59

4.1 Approche d‟identification des risques ... 59

4.1.1 Contexte de diffusion ... 60

4.1.2 Principe utilisé ... 62

4.1.3 Création de l‟arbre de questions ... 64

4.1.4 Identification des risques ... 74

4.2 Suggestion d‟actions spécifiques pour gérer les risques ... 75

4.2.1 Questionnaire pan-canadien portant sur la qualité et la gestion du risque ... 75

4.2.2 Intégration des actions spécifiques à la solution... 78

4.3 Exemple d‟application de la solution ... 80

4.3.1 Mise en contexte... 80

4.3.2 Questions générales ... 80

4.3.3 Identification des risques en fonction des besoins formulés ... 83

4.3.4 Synthèse de l‟exemple d‟application de la solution... 86

4.4 Synthèse et évaluation de l‟approche ... 87

Chapitre 5 – Conclusion ... 91

5.1 Retour sur l‟hypothèse et les objectifs ... 91

5.2 Recommandations aux fournisseurs ... 94

5.3 Travaux futurs ... 95

BIBLIOGRAPHIE ... 97

ANNEXE I: Structure d‟un rapport de qualité des données géospatiales ... 107

ANNEXE II : Réalisation de l‟inventaire au Ministère des Transports du Québec ... 109

ANNEXE III : Détail des questions de l‟arbre d‟identification des risques... 113

(9)

Liste des tableaux

Tableau 1 : Matrice de hiérarchisation des risques proposée par Levesque, 2008 ... 21

Tableau 2: Comparaison entre le MTQ et le CIT-S ... 52

Tableau 3 : Résultat de l'analyse des critères de qualité pour le rapport du CRG (Gervais et al., 2007) en fonction de la provenance des informations ... 53

Tableau 4 : Résultat de l'analyse des critères de qualité pour le rapport d’intelli3 (intelli3,2010) en fonction de la provenance des informations ... 54

Tableau 5 : Stratégies de gestion du risque pouvant être mises en place par un utilisateur ... 77

Tableau 6 : Réponse à la question sur la connaissance du terrain ... 81

Tableau 7 : Réponse à la question sur les utilisateurs des données ... 82

Tableau 8 : Réponse à la question concernant l'analyse spatiale ... 83

Tableau 9 : Questions posées à l'utilisateur pour identifier des risques ... 84

Tableau 10 : Risques identifiés reliés aux besoins formulés par l'utilisateur ... 84

Tableau 11 : Risques identifiés par l'utilisateur reliés à l'aspect temporel des données ... 86

Liste des figures

Figure 1 : Démarche employée pour répondre aux objectifs ... 9

Figure 2 : Gestion des risques adaptée du Guide ISO/CEI 51 ... 17

Figure 3 : Méthode de gestion des risques dans le domaine de la gestion de projets ... 18

Figure 4 : Classification des utilisateurs de données géospatiales ... 24

Figure 5 : Diagramme de cas d'utilisation pour une diffusion ciblée de données géospatiales ... 40

Figure 6 : Diagramme d'activités du scénario de diffusion ciblée au Service de la géomatique du MTQ ... 41

Figure 7 : Cas d'utilisation pour une diffusion à travers un portail ... 48

Figure 8 : Diffusion de données géospatiales au travers d'un portail ... 49

Figure 9 : Diagramme de cas d'utilisation pour le contexte de diffusion de l'approche proposée ... 60

Figure 10 : Diagramme d'activités montrant le contexte de diffusion de l'approche proposée ... 61

Figure 11 : Organisation d’une question appartenant à la solution ... 63

Figure 12 : Organisation d’un risque identifiable par la solution ... 64

Figure 13 : Approche globale proposée pour identifier les risques ... 65

Figure 14 : Identification des besoins de l'utilisateur, puis des risques ... 66

Figure 15 : Exemple de question obligatoire portant sur les besoins de l’utilisateur ... 67

Figure 16 : « Est-ce que les données que vous consultez ont une composante altimétrique? » ... 68

Figure 17 : Arbre de décision partiel pour la composante altimétrique des données ... 69

Figure 18 : Arbre de décision relié à l'aspect temporel des données ... 72

Figure 19 : Identification partielle des risques reliés à la composante sémantique ... 74

(10)
(11)

It always seems impossible until it’s done - Nelson Mandela

(12)
(13)

Remerciements

J‟ai eu la chance d‟être accompagnée par un directeur et une codirectrice de choix au cours de mes études de 2e cycle. Merci pour vos conseils, votre patience, votre disponibilité, et de m‟avoir toujours encouragée à continuer malgré les difficultés. J‟aimerais tout d‟abord remercier mon directeur de maîtrise, M. Yvan Bédard. Ta capacité à toujours trouver les bons mots pour dire les choses m‟a souvent impressionnée, mais surtout aidée à bien exprimer ce que je voulais dire. Merci d‟avoir cru en moi malgré le temps que je prenais à rédiger, et de m‟avoir fait réaliser qu‟il était normal de douter de mes résultats. J‟aimerais aussi remercier ma codirectrice, Mme Jacynthe Pouliot pour sa contribution dans la réalisation de cette maîtrise. Ton œil extérieur a permis d‟enrichir de beaucoup le contenu de ce mémoire, et j‟en suis très reconnaissante.

La réalisation de ce mémoire aurait été difficile sans le soutien financier de plusieurs organismes. Merci tout d‟abord au CRSNG ainsi qu‟au FQRNT pour les bourses d‟études supérieures que j‟ai obtenues. Celles-ci m‟ont permis de me concentrer sur mes études sans avoir à me soucier de l‟aspect financier reliées à celles-ci. Merci aussi à GEOIDE pour le financement du projet IV-23 (Protection du public et diffusion éthique des données géospatiales – aspects sociaux et légaux), projet qui m‟a permis d‟élargir mes horizons, d‟enrichir mes travaux de maîtrise, et de rencontrer plusieurs spécialistes de la qualité des données géospatiales. J‟aimerais également remercier les employés du Service de la géomatique du Ministère des Transports qui ont collaboré à la réalisation de l‟inventaire des données du service. J‟aimerais aussi remercier les employés du Centre d‟information topographique de Sherbrooke avec qui j‟ai été en discussion concernant le processus de diffusion du centre.

Je me serais souvent sentie bien seule si ce n‟eût été des employés et étudiants du Département des sciences géomatiques. Je m‟en voudrais d‟oublier quelqu‟un, c‟est pourquoi je ne nommerai personne, mais il était toujours plaisant de pouvoir partager quelques moments de discussion, que ce soit relié à notre recherche ou pas! Merci à tous pour vos encouragements et vos conseils. Merci finalement à mes amis et ma famille pour votre support. Je vous suis très reconnaissante de ne pas avoir posé trop de questions lorsque je n‟avais pas envie de parler de l‟avancement de mon mémoire. C‟est à vous que j‟ai le plus hâte d‟annoncer que j‟ai enfin terminé! Je remercie finalement mon copain David, qui a dû composer avec mon stress et mes horaires de travail pas toujours

(14)
(15)

Chapitre 1 – Introduction

1.1 Mise en contexte

Les dernières années ont vu arriver l'émergence de nouveaux contextes d‟utilisation pour les données géospatiales. Alors qu'elles étaient au préalable utilisées en grande majorité par des experts en la matière (Hunter et al., 2009), leur usage s'est démocratisé et elles sont de plus en plus accessibles à quiconque le désire. En effet, il existe plusieurs services de cartographie sur le Web bien connus du grand public tels que Google Maps, Google Earth et OpenStreetMap. De plus, un nombre grandissant de ménages sont équipés d‟un appareil GPS (Global Positioning System) pour guider leurs déplacements routiers. De même, la démocratisation ne s‟est pas étendue uniquement au grand public, elle concerne aussi des spécialistes d‟application (foresterie, agriculture, géologie, etc.), qui connaissent très bien leur domaine mais qui n‟ont peu ou pas de connaissances en données géospatiales.

Parmi les moyens disponibles pour accéder à de l‟information géospatiale figurent les portails Web. Ces portails (ex : GéoGratis1, Polar Data Catalogue2, données ouvertes du Gouvernement du Québec3) servent d‟intermédiaire à différents producteurs pour distribuer leurs données, géospatiales ou non, à une grande variété d‟utilisateurs, experts ou non. Les fonctionnalités varient selon les portails, mais ceux-ci permettent généralement de faire une recherche en fonction d‟un thème ou d‟un territoire désiré et d‟avoir accès à des informations décrivant les produits disponibles, telles que des métadonnées. Certains portails donnent également accès à une infrastructure permettant de télécharger les données consultées, que celles-ci soient gratuites ou non. La distribution des données s‟est longuement effectuée directement du producteur à l‟utilisateur. Même si elle n‟est pas le seul facteur en cause, la présence de portails a diminué la communication directe qu‟il y avait entre les deux, étant donné que le producteur communique ses données au diffuseur, qui se charge ensuite de les rendre accessibles à un utilisateur. En effet, les portails, de par leur simplicité d‟accès via Internet, ont contribué à accroître l‟accessibilité aux données géospatiales. Cette accessibilité a conduit à des situations où des données sont utilisées pour un usage autre que celui qui avait été prévu initialement (Gervais, 2005). Cette situation semble avoir mené à un accroissement des

1

(16)

risques d’utilisations inappropriées des données, surtout au niveau des usagers non experts en référence spatiale (Lowell et al., 2000; Devillers, 2004; van Oort et al., 2005; Chandler et Levitt,

2011; Larrivée et al., 2011).

Pour un producteur de données géospatiales pouvant être considéré comme un professionnel au sens de la loi, il existe une obligation de renseigner sur le produit qui est diffusé, de même que d‟informer sur les usages reliés à ce produit (Gervais, 2004). Cette obligation entraîne la nécessité d‟informer sur la qualité du produit, ainsi que sur les risques reliés à son utilisation. L‟information sur la qualité des données peut être transmise de plusieurs façons. Il peut s‟agir de conseils verbaux donnés par un producteur, d‟un rapport informant sur la qualité ou d‟un manuel à l‟utilisateur avec des conseils bien précis. Dans d‟autres cas, l‟information sur la qualité peut être intégrée directement aux données, par exemple en visualisant la qualité. Cependant, le moyen le plus courant d‟intégrer l‟information sur la qualité des données aux données elles-mêmes est d‟utiliser un document contenant des métadonnées (Servigne et al., 2006 ; Zargar et Devillers, 2009 ; Goodchild et Li, 2012), c‟est-à-dire les données qui décrivent les données (par exemple : système de projection, source, date de mise à jour).

Il est possible de considérer la qualité des données sous deux angles, soit la qualité interne et la qualité externe (Devillers, 2004). La qualité interne des données concerne la conformité de celles-ci par rapport aux spécifications initiales, c‟est-à-dire la différence entre les données qui ont été produites et les données qui auraient dû être produites. La qualité interne fait l‟objet des normes ISO 19113:2002 : Information géographique - Principes qualité, ISO 19114:2002 : Information géographique – Procédures d‟évaluation de la qualité et ISO/TS 19138:2006 : Information géographique – Mesures de la qualité des données. La norme ISO/CD 19157 : Information géographique – Qualité des données, qui était toujours en développement lors de l‟écriture de ce mémoire, viendra regrouper les notions abordées par ces normes en une seule (Leibovici et al., 2011). Il est à noter que dans ces normes, on parle de la qualité en général, sans spécifier qu‟il s‟agit de qualité interne. La qualité interne peut être décrite en fonction de différents critères, qui se déclinent par la suite en éléments de qualité. La norme ISO 19113 :2002 propose cinq catégories d‟éléments pour décrire la qualité : la complétude, la cohérence logique, l‟exactitude spatiale, l‟exactitude sémantique et la qualité temporelle.

(17)

Les normes précédemment mentionnées désignent la qualité comme étant le degré de conformité d‟une série de caractéristiques intrinsèques aux données par rapport aux exigences. Bien que cette définition rappelle celle de la qualité externe, les moyens d‟informer sur la qualité se rapportent beaucoup plus à la qualité interne. Par exemple, ces normes suggèrent de présenter la qualité des données sous la forme d‟un rapport décrivant chacun des critères ainsi que les tests réalisés sur ceux-ci. Cependant, les rapports tels que proposés par les normes ne tiennent pas compte des usages possibles des données et se contentent plutôt de décrire les critères d‟un point de vue quantitatif par rapport à un seul besoin, soit les spécifications de production. Dans le cas des portails Web, les données sont rendues disponibles pour les « autres utilisateurs », qui n‟ont typiquement pas participé à la préparation des spécifications de construction. Les normes ISO n‟évaluent donc pas la qualité pour ces utilisateurs.

La qualité externe, de son côté, repose sur la notion d‟utilisation des données. Elle concerne la différence entre les données qui ont été produites et les données qui permettent de répondre aux besoins exprimés, ce qui est désigné sous le nom de fitness for use en anglais (Chrisman, 1984 ; Boin et al., 2007; Devillers et al., 2006). Ainsi, des données tout à fait conformes aux spécifications annoncées (et donc d‟excellente qualité interne) peuvent n‟être d‟aucune utilité et donc être de mauvaise qualité externe pour un usager et un usage particulier, c‟est-à-dire un usage autre que celui ayant contribué à élaborer les spécifications techniques. Par exemple, même si un jeu de données contenant la géométrie du réseau routier du Canada est précis au mètre près, tel que demandé par le client, celui-ci ne sera pas très utile pour réaliser des analyses de type réseau s‟il n‟est pas topologique, car il demandera des opérations supplémentaires de nettoyage et de validation.

Contrairement à la qualité interne, la qualité externe ne fait pas l‟objet de normes ISO dans le domaine de l‟information géographique. Le projet ISO/CD 19157 mentionné précédemment introduira la notion de «usability», qui permettra de «décrire une information spécifique sur la qualité à propos de l‟adéquation d‟un jeu de données à une application particulière » (traduction libre). Malgré que la notion de qualité externe (ou de fitness for use) ne soit pas explicitement mentionnée, cet élément de qualité illustre dans quelle mesure les données peuvent répondre à certains usages à partir d‟éléments quantitatifs. Cependant, cette façon de faire ne permettrait pas de remplir toutes les

(18)

données. Ainsi, malgré cet ajout, on ne peut affirmer que la communication de l‟information sur la qualité externe des données ne sera entièrement régularisée par des normes ISO, car elle se fera encore indépendamment de l‟utilisateur. Cependant, cela ne signifie pas qu‟aucune autre avenue n‟a été explorée en ce qui concerne les moyens de la communiquer et de l‟évaluer (Reinke et al., 2002; Boin et al., 2007; Sargent et al., 2007; Agumya et al., 1999b; De Bruin et al., 2001; Schuster et al., 2003; Vasseur et al., 2003 ; Sboui, 2011). Par exemple, afin d‟assister un expert dont le mandat est d‟évaluer la qualité externe d‟un jeu de données, un modèle de gestion de l‟information sur la qualité a été élaboré (Devillers, 2004; J. Levesque, 2007). D‟autres travaux ont été réalisés en ce qui concerne la visualisation de la qualité des données à l‟aide de méthodes graphiques (Paradis et Beard, 1994) ou à l‟aide d‟avertissements contextuels (Levesque et al., 2007; Levesque, 2008). L‟utilisation d‟un système permettant de quantifier la qualité perçue de modèles 3D dans des globes virtuels, à l‟aide d‟un système 5 étoiles, a également été envisagée (Jones, 2011). Le contenu de ces travaux sera abordé plus en détail dans le chapitre 2 du présent mémoire.

1.2 Problématique

La notion de qualité des données géospatiales présentée dans la section précédente est directement reliée aux risques d‟utilisation inappropriée des données. En effet, si des données sont utilisées pour un usage autre que celui qui avait été prévu sans que la qualité des données soit connue, de nouveaux risques peuvent apparaître. Étant donné que les données géospatiales servent à la prise de décision (Servigne et al., 2006; Rajabifard et al., 2012; Agumya et al., 1999b), il est important de connaître et de gérer les risques reliés à leur utilisation. De plus, la présence d‟incertitude dans les données utilisées pour la prise de décision peut entraîner des conséquences indésirables sur les résultats de ces décisions et donc faire apparaître des risques (Agumya et al., 2002). Dans un cas idéal, une méthode de gestion des risques est appliquée dès le début de la conception des bases de données spatiales (Levesque et al., 2007; Grira et al., 2012) ou de la production du jeu de données géospatiales. Une telle méthode implique d‟identifier les risques potentiels pouvant survenir lors de l‟utilisation du jeu de données, de les analyser, d‟évaluer la probabilité d‟occurrence et la gravité de ces risques, puis d‟appliquer des moyens permettant de les réduire. Des notions de gestion du risque plus détaillées seront présentées à la section 2.1 du présent mémoire. Lorsqu‟une méthode de gestion du risque est adoptée, il est plus aisé de prévoir les usages envisagés pour les données géospatiales et ainsi prévoir ceux qui seraient inappropriés. Cependant, lors de la diffusion du jeu

(19)

envisagés par les utilisateurs, étant donné qu’il ignore ce qu’ils seront. De même, le fait qu‟une

méthode de gestion du risque ait été entreprise lors de la production des données ne met pas les utilisateurs à l‟abri d‟une utilisation inappropriée des données. C‟est pourquoi ceux-ci doivent être en mesure d‟évaluer les risques reliés à l‟utilisation des données qu‟ils envisagent d‟acquérir, chose plus difficile pour un utilisateur non expert en données géospatiales.

Afin d‟évaluer les risques reliés à l‟utilisation de données géospatiales, il importe d‟avoir une idée de la qualité interne et externe des données mises à disposition. Une façon d‟informer un utilisateur sur la qualité des données géospatiales est de diffuser les données à l‟aide de métadonnées (moyen le plus courant, particulièrement dans le cas des portails). Par contre, celles-ci sont souvent difficiles de compréhension pour un utilisateur non expert. En effet, elles sont généralement présentées dans un langage très technique (Devillers et al., 2002), les informations peuvent porter à confusion pour les utilisateurs (Chapman et al., 2011), et l‟information saisie est rarement complète (Hunter et al., 2009). Finalement, les métadonnées tiennent peu compte des usages envisagés pour les données ainsi que de ceux qui seraient à proscrire (Gervais, 2004). Cette situation peut mener les utilisateurs non experts à simplement ignorer les métadonnées accompagnant le jeu de données (Boin et al., 2007; Ivánová et al., 2013), ceux-ci ne voyant pas à quoi elles peuvent bien servir (Agumya et al., 2002). Les métadonnées sont actuellement l‟outil le plus utilisé par les producteurs de données pour informer sur la qualité et s‟assurer d‟un usage approprié (Levesque et al., 2007). Malgré les critiques souvent rencontrées relativement aux métadonnées, celles-ci ne sont pas complètement inutiles pour un utilisateur expert. En effet, celui-ci est généralement à même de les comprendre et de pouvoir déduire des informations sur la qualité, d‟où la présence de travaux réalisés dans le but d‟aider un expert à évaluer la qualité externe. Cependant, pour un utilisateur non expert en référence spatiale, avec des ressources financières limitées, les métadonnées deviennent souvent le seul outil sur lequel il peut compter. De plus, il peut arriver qu‟il soit difficile pour un producteur lui-même d‟avoir à saisir l‟information sur les métadonnées, ce qui peut expliquer leur absence ou les difficultés qu‟ont les utilisateurs à les comprendre.

Compte tenu des risques que peuvent présenter l‟utilisation de données géospatiales, il importe, tel que déjà mentionné, de gérer ces risques. Néanmoins, pour un utilisateur ayant une compréhension limitée des métadonnées qui lui sont présentées, une approche de gestion du risque peut devenir

(20)

non expert en données géospatiales d‟identifier et de contrôler les risques qu‟il pourrait rencontrer lors de l‟acquisition de données au travers d‟un portail Web. Pour le moment, nous avons eu connaissance de l‟existence de méthodes permettant à un utilisateur non expert de consulter différents types de métadonnées pour aider sa compréhension du jeu de données (Gervais, 2004; Levesque et al., 2007; Grira et al., 2012; Jones et al., 2013). Cependant, les métadonnées utilisées par ces approches ne sont pas celles que l‟on retrouve traditionnellement dans les portails Web. Aucune méthode ne proposerait une approche qui par analogie serait symbiotique, c‟est-à-dire une approche simple à comprendre pour un utilisateur, facile d’implantation pour une organisation et permettant à un utilisateur métier de prendre une décision sur l’utilisabilité du jeu de données qu‟il compte acquérir dans un portail Web, et ce en utilisant les métadonnées traditionnellement utilisées par ces portails.

1.3 Hypothèse générale de recherche

La problématique précédemment présentée a permis de mettre en évidence le peu de moyens mis en œuvre pour prévenir les risques d‟utilisation inappropriée de données géospatiales lorsque celles-ci sont diffusées via un portail Web, souvent pour des utilisateurs inconnus. Notre hypothèse est que les informations normalement remises lors de la diffusion de données géospatiales (métadonnées, dictionnaire de données, etc.) ainsi que les connaissances du producteur peuvent être converties en arbre de décision portant sur les risques de manière à informer les utilisateurs de portails Web sur de tels risques et de leur suggérer des moyens de les gérer, ce qui pourrait contribuer à les prévenir. La question de recherche principale à laquelle nous répondons s‟énonce comme suit : « Peut-on

convertir les informations remises lors de la diffusion de données géospatiales en arbre de décision visant à mieux informer les utilisateurs de portails Web sur les risques d’usages inappropriés et suggérer des moyens de les gérer? » D‟autres questions de recherche sont

explorées dans le cadre de ce mémoire :

- Quels sont les moyens (directs ou indirects) actuellement utilisés pour informer quant aux risques associés à l‟utilisation des données géospatiales?

- Existe-t-il des métadonnées orientées vers la qualité externe qui seraient appropriées pour aider à la gestion des risques?

- Est-il possible de mettre à profit des méthodes de gestion du risque orientées pour des utilisateurs non experts en données géospatiales a posteriori de la production des données?

(21)

Afin de s‟assurer de bien comprendre la portée de l‟hypothèse, des questions de recherche ainsi que des objectifs, il importe de définir quelques termes. Le terme « utilisateur », désigne une catégorie bien précise d‟individus, soit ceux qui, dans le cadre de leurs fonctions professionnelles, sont appelés à utiliser des données géospatiales (l‟utilisateur grand public n‟est donc pas visé par la présente recherche). De plus, contrairement aux travaux de (Grira et al., 2009; Grira et al., 2012), la méthode suggérée ne devrait pas se situer a priori de la mise en œuvre du système, mais viserait à aider les utilisateurs d‟un système déjà en place (a posteriori). Même si nous ne le mentionnons pas explicitement, nous ciblons surtout une catégorie d‟utilisateurs non experts en données géospatiales mais experts dans leur métier (ex. : ingénieur forestier, agronome, urbaniste, etc.), et donc moins aptes à évaluer la propension des données à répondre à leurs besoins cartographiques et d‟analyse spatiale que leurs collègues connaissant bien les données géospatiales. Notre expérience nous porte à croire que ce sont ces utilisateurs qui utilisent principalement les portails Web. Ils sont désignés sous le terme d‟utilisateurs métier dans la présente recherche.

De plus, nous croyons qu‟il est possible de proposer une approche qui peut être implantée par un gestionnaire de portail et être utilisable pour tous ses jeux de données, contrairement au manuel à l‟utilisateur qui est propre à un seul jeu de données. Le terme « portail Web », désigne toute plateforme servant à la recherche et à la diffusion de plusieurs jeux de données géospatiales de sources différentes pour des utilisateurs très variés, souvent inconnus, et incluant des métadonnées permettant de décrire le jeu de données. Un « usage inapproprié » est un usage qui diffère de ce qui avait initialement été prévu et qui pourrait causer un résultat inadéquat par rapport au résultat attendu. La présente recherche ne couvre pas les dimensions éthiques et morales, c‟est-à-dire que l‟utilisation du terme « inapproprié » ne constitue pas un jugement moral sur l‟objectif d‟utilisation des données, mais réfère plutôt à la possibilité de répondre ou non à un besoin formulé.

Finalement, malgré que le terme « données géospatiales » englobe beaucoup de types de données, la recherche se concentre sur les données en deux dimensions, et principalement sur les données vectorielles. En effet, il appert que plusieurs métadonnées sont manquantes dans les normes actuelles pour décrire adéquatement des modèles de données géospatiales en 3 dimensions (Zamyadi, 2013). Cela ne signifie pas que les concepts abordés ne s‟appliquent pas aux données en trois dimensions, mais nous sommes conscients qu‟il existe des particularités reliées à ces données

(22)

1.4 Objectifs

Notre objectif principal consiste à proposer une approche pour aider les acteurs (utilisateurs et

producteurs) de données géospatiales à identifier et gérer les risques reliés à l’utilisation envisagée de données acquises dans un portail Web, et ce a posteriori de la production des données. Cette approche et les raisonnements qui nous y ont menés seront présentés dans le cadre

du quatrième chapitre de ce mémoire. L‟approche proposée s‟adresse à un utilisateur métier et lui donne des lignes directrices lui permettant d‟identifier les risques puis de les gérer. Cependant, cette approche aide aussi les producteurs de données géospatiales dans la mesure où les utilisateurs sont mieux protégés face à une utilisation inappropriée, ce qui diminue le risque pour le producteur d‟être tenu responsable de cette utilisation inappropriée. L‟approche proposée se doit d‟être symbiotique, c‟est-à-dire atteindre un juste milieu entre l‟utilisabilité par des non experts (dans notre cas des utilisateurs métier), la facilité d‟implantation dans un portail Web et son efficacité à identifier et gérer les risques d‟usages inappropriés des données. Il est important de mentionner que cette approche ne vise pas à identifier absolument tous les risques reliés à l‟utilisation de données géospatiales, mais plutôt à éduquer l‟utilisateur sur la présence de risques en l‟aidant à en identifier certains.

De l‟objectif principal découlent également les objectifs secondaires suivants :

1. Étudier l‟utilité d‟une méthode de gestion du risque adaptée au contexte des portails Web

adressée aux utilisateurs métier ayant peu de connaissances de la référence spatiale plutôt qu‟aux producteurs des données.

2. Fournir des recommandations aux fournisseurs de données relativement aux moyens de

communiquer l‟information sur la qualité externe des données géospatiales ainsi que sur les risques d‟utilisation aux utilisateurs métier non experts en référence spatiale.

Le premier objectif secondaire implique d‟étudier l‟utilité de proposer une approche basée sur une méthode de gestion du risque, ce qui sera présenté dans le cadre du quatrième chapitre. Le second objectif secondaire, de son côté, est de nature plus conclusive, et ses résultats sont présentés dans le cinquième et dernier chapitre. Cependant, on retrouve tout de même des ébauches de recommandations dans le chapitre 3, qui porte sur les analyses de cas réalisées. La présence de recommandations dans ce mémoire est une façon d‟évaluer si cet objectif a été rempli, mais il est aussi validé par la présentation de travaux aux partenaires du projet. La section suivante porte sur la méthodologie employée pour identifier et répondre à l‟objectif principal et aux objectifs secondaires.

(23)

1.5 Méthodologie

La méthodologie employée pour répondre aux objectifs est hypothético-déductive. Suite à l‟identification d‟une problématique, une hypothèse a été identifiée, et un cadre expérimental a été développé pour y répondre. L‟hypothèse de départ de même que la problématique ont alors dû être revus, et ont mené à une itération dans la démarche retenue en fonction de la nouvelle problématique. Afin de mettre en évidence l‟intégration de ces travaux à d‟autres activités de recherche, la figure 1, qui illustre les différentes étapes de la méthode de recherche, est séparée en deux corridors.

(24)

Le premier corridor présente les travaux réalisés uniquement par l‟auteure de ce mémoire, tandis que le deuxième est le résultat d‟une collaboration avec une équipe du projet GEOIDE IV-23 – Protection

du public et diffusion éthique des données géospatiales – Aspects sociaux légaux. L‟auteure de ce

mémoire faisant partie de cette équipe, il est apparu intéressant d‟enrichir les travaux à l‟aide d‟autres travaux se déroulant dans le même contexte.

Au départ, la problématique que nous avions identifiée concernait le fait que la rédaction de rapports de qualité tenant compte de l‟usage envisagé des données était complexe et qu‟il fallait trouver un moyen de la simplifier. Afin de mieux comprendre ce problème, une revue de littérature et des études de cas ont été réalisés en parallèle. La revue de littérature portait sur les différents sujets abordés au cours de cette maîtrise, mais une veille documentaire a constamment été effectuée sur les nouveaux documents parus. De plus, lors de l‟étape de précision du problème, de nouvelles recherches dans la littérature ont été effectuées afin de couvrir des sujets qui ne l‟avaient pas été au départ. Dans le cadre de la scolarité requise pour cette maîtrise, des lectures ont été effectuées sur les infrastructures de données géospatiales à travers le monde. Par la suite, des lectures portant sur la qualité externe et les moyens d‟informer les utilisateurs sur la qualité des données géospatiales ont été effectuées. Ces sujets ont ensuite mené à la gestion du risque d‟utilisation inappropriée, ce qui n‟avait pas été envisagé au départ. Finalement, des concepts reliés à l‟intelligence d‟affaires ont été étudiés, notamment l‟utilisation d‟indicateurs pour aider à la prise de décision.

Études de cas

Une partie importante de la méthode de recherche repose sur la technique de l‟étude de cas (ou analyse de cas). L‟étude de cas, une méthode qualitative, peut porter sur un petit nombre de cas, ou un seul, et permet d‟approfondir un sujet en particulier en utilisant son jugement critique (Paillé, 2008). Le choix de cette méthode de recherche réside dans le fait qu‟elle nous apparaissait le meilleur moyen, sinon le seul pour comprendre concrètement le contexte dans lequel se positionnaient nos travaux.

Les conclusions tirées des études de cas ont permis de dresser un portrait plus global de la diffusion de données géospatiales au sein des gouvernements provinciaux et fédéraux. Plus particulièrement, les travaux ont été l‟occasion d‟évaluer la situation du Service de la géomatique du MTQ (Ministère des Transports du Québec), dans le cadre de l‟élaboration d‟une politique de diffusion responsable

(25)

des données géospatiales qui tiendrait compte de la qualité externe des données pour chaque distribution de données. L‟activité principale a été d‟effectuer un inventaire des données géospatiales utilisées et diffusées par le Service de la géomatique. Au total, 275 produits et thèmes cartographiques ont été inventoriés, ainsi que leurs attributs et domaines de valeur (lorsque cela était applicable). Cet inventaire a permis d‟étudier les possibilités de diffusion responsable par ce Ministère. De plus, bien qu‟aucun travail n‟ait été effectué directement sur place, la situation du Centre d‟information topographique - Sherbrooke (CIT-S) a été étudiée en consultant le catalogue des données produites et diffusées par le centre, ainsi que par des échanges par écrit avec des employés du Centre.

Des travaux antérieurs réalisés par Gervais et al. (2007) au CRG (Centre de recherche en géomatique) et par l‟entreprise intelli3 (intelli3, 2010) ont également été consultés et étudiés. Il s‟agissait de rapports de qualité complets réalisés à partir de la structure de rapports d‟expertise utilisés dans d‟autres domaines (Gervais et Bédard, 2007a; Gervais et Bédard, 2007b). Ces rapports de qualité présentaient une description des besoins de l‟utilisateur, les caractéristiques des jeux de données à diffuser, et des recommandations sur l‟aptitude des données à répondre à ces besoins. Ils visaient à évaluer la qualité interne et la qualité externe de jeux de données géospatiales. L‟analyse faite de ces rapports avait pour but d‟identifier les métadonnées qui contribuent à l‟évaluation de la qualité externe des données géospatiales. Les éléments du rapport qui provenaient directement d‟informations contenues dans les métadonnées ont été notés, de même que ceux qui en étaient déduits indirectement. Une entrevue avec une des auteurs d‟un rapport a également été réalisée afin de mieux comprendre le raisonnement ayant mené à sa rédaction. Les deux études de cas réalisées par l‟auteure (MTQ et CIT-S), ainsi que les deux études de travaux antérieurs réalisés par le CRG et intelli3 seront présentées dans le troisième chapitre de ce mémoire.

Élaboration d’une solution

La revue de littérature a permis de constater que les métadonnées étaient, malgré leurs défauts, le moyen le plus utilisé pour communiquer les informations sur la qualité des données. Cependant, il a été constaté que dans la réalité, malgré la volonté des organisations, les métadonnées étaient généralement absentes ou déficientes. Comme l‟objectif était d‟appliquer la solution générale à des cas concrets, il devenait difficile de proposer une solution nécessitant l‟utilisation de métadonnées

(26)

semblable à un processus de sélection des meilleures sources de données dans un processus d‟intégration et s‟inspirait des travaux de Charron (1995). Une solution théorique qui permettait une automatisation partielle de la comparaison entre les besoins de l‟utilisateur avec les métadonnées a été élaborée, solution pour laquelle le développement d‟un prototype a été tenté. Les difficultés reliées à cette tentative de développement ont permis de confirmer que la première solution n‟était pas applicable et ne serait pas utile, ce qui a mené à son rejet et à la précision de la problématique telle que présentée à la section 1.2. Des efforts ont alors été entrepris pour trouver une deuxième solution qui permettrait à un utilisateur non expert de mieux comprendre l‟information accompagnant les jeux de données lors de leur acquisition. Le contexte des portails Web est apparu particulièrement intéressant lors de l‟étude de cas au CIT-S. Il est important de mentionner que malgré la précision de la problématique et des changements au niveau de l‟hypothèse de départ, la méthode de recherche est restée la même, et a été reprise telle quelle avec la nouvelle problématique.

On remarque dans le corridor de droite la présence de la rédaction d‟un questionnaire pancanadien portant sur les risques d‟utilisation des données géospatiales, travaux réalisés dans le cadre du projet GEOIDE IV-23. Les apports de la participation à ce projet de recherche sont nombreux. L‟auteure du mémoire faisait équipe avec deux professeurs et deux professionnelles de recherche du Département des sciences géomatiques de l‟Université Laval. Ces travaux, qui se déroulaient parallèlement aux travaux de maîtrise, ont finalement enrichi la solution proposée de par l‟expérience des collaborateurs en matière d‟utilisations inappropriées des données. La partie de ces travaux pertinente à l‟élaboration de la solution sera présentée dans le chapitre 4 du présent mémoire. Les contributions du questionnaire pancanadien, de la revue de littérature, des études de cas, de la proposition de solutions, et de développement d‟un prototype ont permis d‟élaborer l‟approche interactive finalement proposée dans ce mémoire. Afin de valider l‟approche, nous nous sommes interrogés à savoir si la solution permettait vraiment de répondre à la problématique énoncée. Aussi, même si aucun prototype n‟a été développé pour mettre en œuvre l‟approche finalement retenue, elle sera également évaluée afin de vérifier si elle est symbiotique, facile à utiliser par un utilisateur non expert en données géospatiales, et facile à implanter par un gestionnaire de portail Web.

(27)

1.6 Conclusion

Ce chapitre a permis de présenter le contexte dans lequel s‟inscrivent les travaux de ce mémoire, c‟est-à-dire la présence de risques d‟utilisations inappropriées de données géospatiales. Il a de plus permis de mettre en évidence la problématique que les travaux visent à résoudre, soit la nécessité d‟informer sur les risques et la difficulté que cela peut poser à un utilisateur métier non expert en données géospatiales. En effet, nous croyons qu‟il est possible de proposer une approche qui vise à aider les utilisateurs à identifier les risques reliés à l‟utilisation de données géospatiales acquises via un portail et à les gérer, ce qui sera présenté plus en détail dans les prochaines pages. Dans un premier temps, le chapitre 2 présentera une revue des concepts reliés à la recherche et retrouvés dans la littérature. Le chapitre 3, de son côté, présente différents concepts nécessaires à l‟approche à l‟aide d‟études de cas concrets et de travaux antérieurs. Ensuite, le chapitre 4 présentera la solution interactive qui a été développée afin de répondre aux objectifs précédemment mentionnés, ainsi que la mise en œuvre de cette solution. Finalement, le chapitre 5 permettra de revenir sur les travaux entrepris, de formuler des recommandations aux producteurs de données géospatiales, et présentera des pistes de travaux futurs.

(28)
(29)

Chapitre 2 – Revue de littérature

Ce chapitre présente les principaux concepts abordés dans la littérature qui sont nécessaires à la compréhension et la justification des travaux. Dans un premier temps, afin de bien comprendre le contexte dans lequel le projet se positionne, des notions reliées à la gestion des risques sont présentées en plus de présenter quelques exemples d‟utilisation en géomatique. Par la suite, étant donné que la relation des utilisateurs varie face au risque en fonction de leur niveau de connaissance et d‟expertise, des profils d‟utilisateurs ayant été établis seront présentés. Puis, nous aborderons quelques concepts d‟évaluation de la qualité des données géospatiales, particulièrement du point de vue de la qualité externe. Nous terminons en discutant de différentes façons utilisées pour communiquer l‟information sur la qualité des données, autant du point de vue interne que du point de vue externe.

2.1 Gestion des risques

2.1.1 Qu’est-ce que le risque?

L‟Office québécois de la langue française définit le risque comme un « événement éventuel, incertain, dont la réalisation ne dépend pas exclusivement de la volonté des parties et pouvant causer un dommage ». Le risque est une valeur qui peut être quantifiée par la probabilité d‟occurrence d‟un événement, multipliée par la gravité des conséquences reliées à cet événement (Agumya et al., 1999a; Guide ISO/CEI 51, 1999). Un exemple de risque dans le domaine géospatial peut s‟énoncer comme suit : « il est possible que les bâtiments du jeu de donnés ne soient pas bien identifiés dans le fichier que vous téléchargez ». Pour quantifier ce risque, il faudrait évaluer la probabilité que les objets utilisés dans l‟application ne soient pas bien identifiés, et vérifier la gravité de cette mauvaise identification pour l‟usage envisagé par un utilisateur.

Plusieurs domaines ont développé des méthodes permettant d‟identifier et gérer ces risques, par exemple la gestion des risques naturels, la sécurité ainsi que la gestion de projets. Le Guide ISO/CEI 51, « Aspects liés à la sécurité – Principes directeurs pour les inclure dans les normes » propose de réduire les risques reliés à l‟utilisation de produits, procédés ou services en tenant compte des utilisations prévues et des « mauvais usages raisonnablement prévisibles ». D‟autres normes et documents associés à l‟ISO existent, tels que la norme ISO 31000:2009 Management du risque –

(30)

31010:2009Gestion des risques – Techniques d’évaluation des risques. Par contre, étant donné que

les présents travaux se situent dans un contexte de diffusion de produits ou de services par un fournisseur de données géospatiales à un utilisateur métier, les principes proposés par le guide ISO/CEI 51 seront plutôt présentés. Dans un premier temps, la méthode proposée par ce guide sera présentée, et sera suivie d‟une approche semblable utilisée en gestion de projets. Il est à noter que peu importe le domaine d‟application de la méthode de gestion des risques, la démarche utilisée reste sensiblement la même.

2.1.2 Méthodes existantes de gestion des risques

La figure 2 présente la démarche de gestion des risques telle que décrite par le guide ISO, que nous avons adaptée sous forme de diagramme d‟activités UML. La première étape, la « définition de l‟utilisation prévue et du mauvais usage raisonnablement prévisible » inclut également la définition des groupes d‟utilisateurs probables, ce qui est mentionné dans la norme sans apparaître dans le diagramme. Les étapes suivantes concernent l‟identification des phénomènes qui pourraient mener à des risques, et cela en tenant compte de toutes les conditions d‟utilisation des produits, services ou procédés. Par la suite, ces risques peuvent être analysés et évalués, suite à quoi une décision doit être prise à savoir si un risque tolérable est obtenu. Si ce n‟est pas le cas, une étape de réduction du risque doit être entreprise et le processus doit recommencer au complet. Si un risque tolérable est obtenu, celui-ci est ensuite partagé entre les parties impliquées, soit les fournisseurs d‟un bien ou service et les utilisateurs, ce que (Bédard, 1986) désignait comme absorption du risque résiduel par les parties. Selon Bédard (1986), cette absorption sera répartie entre les parties en fonction des lois et règlements locaux, et peut mener à une absorption totale pour le fournisseur, une absorption totale par l‟utilisateur, ou une absorption partielle pour chacun.

(31)

Figure 2 : Gestion des risques adaptée du Guide ISO/CEI 51

Malgré que ce guide présente des principes de gestion des risques intéressants, il ne prévoit pas de mesure de documentation ni de suivi des risques après que ceux-ci aient été identifiés (Levesque, 2008). Par contre, les méthodes de gestion du risque proposées dans le domaine de la gestion de projets incluent généralement une telle étape, c‟est pourquoi une méthode provenant du Project

Management Institute est présentée à la Figure 3. Celle-ci illustre les étapes de documentation et de

suivi qui peuvent être primordiales suite à l‟identification d‟un risque. Les notions d‟évaluation et de réduction de risque, qui ont été présentées très brièvement jusqu‟à maintenant, seront aussi explicitées.

(32)

Figure 3 : Méthode de gestion des risques dans le domaine de la gestion de projets

Les premières étapes sont très semblables à celles qui ont été présentées dans le guide ISO/CEI, c‟est-à-dire une étape de planification, puis une étape d‟identification. On retrouve plusieurs rétroactions dans cette figure, particulièrement en ce qui concerne la réponse aux risques. En gestion de projets, une démarche de gestion des risques doit être flexible étant donné que de nouveaux risques peuvent survenir en cours de route, ou que la nature des risques peut évoluer. Les deux étapes sur lesquelles portent principalement les travaux de ce mémoire sont l‟identification des risques par l‟utilisateur d‟un portail ainsi que la réponse associée à ces risques.

L‟identification des risques est une étape très importante d‟un processus de gestion des risques. En effet, il est impossible de gérer un risque s‟il n‟est pas identifié, à moins de contracter une assurance. Même si les étapes de qualification ou de quantification des risques succèdent généralement à l‟étape d‟identification, il est possible d‟associer une réponse à un risque dès son identification. Dans une démarche de gestion de projets traditionnelle, cette activité est effectuée de façon itérative tout au long du projet lorsque de nouveaux risques apparaissent.

(33)

Certaines méthodes de gestion des risques dans le domaine de la gestion de projets ne distinguent pas les étapes de l‟analyse qualitative de l‟analyse quantitative des risques, par exemple Kerzner (2009), qui propose plutôt une seule étape d‟analyse du risque. Dans le domaine de la gestion de projets, l‟analyse qualitative implique d‟utiliser une échelle de risques avec une matrice d‟analyse afin de combiner la probabilité d‟occurrence et la gravité du risque. Cette matrice sera présentée dans la section suivante, qui montre des applications de la gestion des risques en géomatique. Les méthodes d‟analyse quantitative, de leur côté, reposent sur des matrices de coût, des arbres de décision ou une simulation de Monte-Carlo.

Afin de s‟assurer que l‟évaluation des risques est faite correctement et que la réponse planifiée est adéquate, il est important de documenter les risques, ce qui inclut les causes du risque, sa description ainsi que les conséquences possibles de ce risque, tel que le propose (Levesque, 2008). Cette étape de documentation est également importante pour le suivi historique des risques. En effet, lors d‟un nouveau projet, il peut être avisé de consulter la documentation de projets similaires afin de connaître les risques qui avaient été identifiés dans des projets antérieurs afin de faciliter l‟identification des risques. Cela peut également s‟apparenter à l‟acquisition d‟un jeu de données ; en effet, un utilisateur qui n‟en est pas à sa première acquisition peut se baser sur les risques qu‟il avait identifiés auparavant.

Dans le domaine de la gestion de projets, l‟objectif de l‟étape de réponse aux risques est de déterminer quelles sont les actions qui vont permettre au projet de bien se réaliser, tout en tenant compte des contraintes en place. Cela implique de déterminer quelles sont les ressources impliquées pour gérer le risque, le délai de réponse ainsi que les coûts qui y sont reliés. Il faut également s‟assurer que la stratégie de réponse retenue ne crée pas de nouveaux risques reliés au projet, risques qui devront également être gérés. Traditionnellement, dans cette étape, on retrouve quatre stratégies de gestion du risque.

Évitement : Comme son nom l‟indique, cette stratégie implique d‟éviter le risque, c‟est-à-dire de s‟assurer que ce risque n‟aura aucun effet sur le déroulement du projet. Cela peut aussi impliquer de laisser tomber le projet si les conséquences anticipées du risque sont trop grandes.

(34)

Transfert : Cette stratégie implique de faire reposer le risque sur les épaules d‟une tierce partie plus apte à en assumer les conséquences. Par exemple, l‟acquisition d‟une assurance est une stratégie de transfert de risque.

Contrôle : Le contrôle, ou « mitigation » en anglais, est la stratégie de gestion du risque la plus répandue. Il s‟agit d‟identifier les actions qui vont permettre de diminuer la probabilité d‟occurrence de ce risque ou d‟en minimiser les impacts. Plusieurs stratégies de contrôle des risques reliés à l‟utilisation de données géospatiales seront présentées dans le quatrième chapitre de ce mémoire. Indifférence : Lorsque les stratégies précédemment mentionnées ne sont pas applicables, il arrive que la solution retenue soit d‟ignorer le risque, c‟est-à-dire de n‟entreprendre aucune action visant à minimiser ses conséquences et d‟agir uniquement si le risque se présente vraiment. Cette stratégie est souvent utilisée par les utilisateurs de données géospatiales étant donné qu‟ils n‟ont pas vraiment le choix d‟utiliser les données qui se présentent à eux.

Parmi ces quatre stratégies, celles de transfert et de contrôle permettent plus de variété dans les actions spécifiques utilisées pour les mettre en œuvre. En effet, en ce qui concerne l‟utilisation d‟un jeu de données géospatiales, la stratégie d‟évitement consiste simplement à ne pas utiliser les données pour l‟usage envisagé, tandis que pour la stratégie d‟indifférence, les données sont utilisées peu importe les risques associés. La stratégie de contrôle est la seule pour laquelle il a été possible d‟identifier des actions spécifiques de gestion de projet qui sont propres au domaine géospatial et non pas seulement des actions générales de gestion de projet (Gervais et al., 2012).

2.1.3 Applications de la gestion des risques dans le domaine géospatial

On retrouve dans la littérature des exemples du domaine géospatial qui utilisent des méthodes de gestion des risques. Par exemple, une approche a été proposée permettant d‟identifier les risques pouvant survenir lors de l‟utilisation d‟un cube de données géospatiales (Levesque, 2008; Levesque

et al., 2007). La création d‟un cube de données géospatiales implique de combiner différentes

données ayant des provenances différentes et à préenregistrer toutes les requêtes possibles permettant de croiser ces données. Étant donné que les cubes spatiaux ont un aspect décisionnel important (les données à l‟intérieur y sont structurées de façon à faciliter la prise de décision), il importe de gérer les risques de mauvaise utilisation de ces cubes.

(35)

L‟approche proposée par M.-A. Levesque (2008) s‟inspire de la méthode présentée à la figure 2 et permet d‟identifier et de gérer les risques d‟utilisations inappropriées. Cette méthode se divise en deux phases, soit une phase de préparation et une phase d‟application. Il est à noter que cette méthode est mise en application par un producteur de cubes spatiaux et non pas par un utilisateur du cube. Ainsi, cela signifie que lorsque l‟utilisateur se sert du cube spatial, il n‟a pas à mettre lui-même en place des actions pour gérer les risques, mais plutôt profiter de ce que le producteur a développé. Lors de la phase de préparation, un « plan de management des risques » (PMR) est conçu pour documenter les risques, définir le rôle des intervenants lors de la conception du cube, etc. De plus, une définition de l‟utilisation prévue du cube est élaborée, de même qu‟une identification des utilisateurs éventuels de celui-ci. Cela implique de connaître les analyses et les décisions qui seront réalisées par les utilisateurs, mais également de réaliser un portrait des utilisateurs de la technologie en fonction de leur niveau de connaissance de la technologie, mais aussi de son domaine d‟application. Par la suite, une méthode inspirée de la gestion de projets est mise en application (dans la phase d‟application). Afin de permettre une meilleure identification des risques, une classification de ceux-ci a été proposée, en fonction de leur provenance.

Afin d‟évaluer les risques et de pouvoir les hiérarchiser, Levesque (2008) propose une matrice à deux axes inspirée de celle retrouvée dans les travaux de Kerzner (2007), mais utilisant trois niveaux, soit faible, moyen ou élevé, plutôt que les six proposés. Cette manière d‟évaluer les risques n‟est pas des plus exhaustives, mais cette façon de faire pourrait être suggérée à un utilisateur ayant peu de moyens à sa disposition et voulant avoir un ordre de grandeur des risques d‟utilisations inappropriées. Le Tableau 1 présente la matrice de hiérarchisation des risques proposée par Levesque (2008).

PROBABILITÉ D’OCCURRENCE

FAIBLE (F) MOYEN (M) ÉLEVÉ (E)

NIVEAU DE GRAVITÉ

ÉLEVÉ (E) M E E

MOYEN (M) F M E

FAIBLE (F) F F M

Tableau 1 : Matrice de hiérarchisation des risques proposée par Levesque, 2008

(36)

celui-ci doit trouver une façon de communiquer les risques d‟utilisation qu‟il a identifiés. La stratégie alors proposée par Levesque consiste à afficher des mises en garde lorsqu‟un utilisateur effectue une opération qui pourrait être dangereuse ou présenter des risques de mauvaise utilisation. Ces travaux sont présentement en train d‟être enrichis d‟une part pour identifier les risques potentiels en collaboration avec les utilisateurs ciblés (Grira et al., 2012) ainsi que pour ajouter une composante tenant compte du vague spatial inhérent aux données géospatiales (Edoh-Alove et al., 2013).

Il existe d‟autres exemples d‟utilisation de la gestion des risques en géomatique. L‟utilisation de techniques de gestion des risques afin de résoudre des problèmes de responsabilité juridique entourant l‟intégration d‟information géographique volontaire (ou VGI en anglais), a également été proposée (Rak, 2013). Quatre techniques sont proposées, dont l‟identification des risques, le contrôle continuel de la qualité de l‟information géographique, l‟utilisation de clauses de non-responsabilité (disclaimer), ainsi que la présence d‟avertissements sur la qualité des données. De plus, les travaux reliés au questionnaire pan-canadien portant sur la gestion des risques par les utilisateurs et les producteurs de données géospatiales ont également identifié plusieurs actions spécifiques (ou techniques) permettant de gérer des risques (Gervais et al., 2012).

2.2 Utilisateurs de données géospatiales

Plus d‟une classification ont été proposées pour distinguer les utilisateurs de donnés géospatiales entre eux, étant donné que ceux-ci ont des niveaux de connaissances variés et ne réagiront pas de la même façon si un risque d‟utilisation inappropriée se présente à eux. Typiquement, les utilisateurs étaient regroupés en deux catégories, soit les utilisateurs experts en données géospatiales (qui ont typiquement une formation dans ce domaine) et les utilisateurs non experts. Cependant, la démocratisation des données et technologies géospatiales a permis d‟accentuer la présence d‟une nouvelle catégorie d‟utilisateurs, soit les utilisateurs qui sont experts dans leur domaine d‟application (ex : foresterie, agriculture, géologie), mais qui ne sont pas experts dans le domaine de l‟information géographique (Devillers et al., 2002; Guimond, 2005). Ces utilisateurs sont désignés sous le nom d‟utilisateurs métier dans ce mémoire.

Dans certains cas, des auteurs ont désiré regrouper les utilisateurs en fonction de leur réponse face aux risques de mauvaise utilisation des données (Agumya et al., 1999b). Cette classification, qui a été reprise dans d‟autres travaux (van Oort et al., 2005), regroupe les utilisateurs en trois catégories :

(37)

1) Ceux qui établissent si les données peuvent répondre à leur besoin avant l‟utilisation; 2) Ceux qui décident de choisir le meilleur jeu de données parmi ceux disponibles;

3) Ceux qui utilisent les données peu importe si elles sont adaptées, parce qu‟ils n‟ont pas le choix ou parce qu‟ils décident d‟ignorer leur qualité.

Il est apparu que la plupart des utilisateurs de donnés géospatiales se retrouvaient à ce moment dans la troisième catégorie (van Oort et al., 2005), ce qui demeure probablement encore vrai aujourd‟hui. Même s‟il pourrait paraître que les utilisateurs de la troisième catégorie semblent indifférents à la qualité des données géospatiales ou même l‟ignorer, ce n‟est pas le cas (van Oort, 2005). En effet, ils seraient plutôt limités par des contraintes techniques ou un manque de ressources pour évaluer si les données peuvent répondre à leurs besoins.

Une classification a été proposée pour distinguer les utilisateurs de globes virtuels (Jones et al., 2013), en utilisant deux axes, soit la complexité de l‟application et le niveau d‟expertise de l‟utilisateur. Cela permet d‟identifier quatre types d‟utilisateurs :

1) Utilisateur néophyte (non-expert) utilisant les globes virtuels pour une application simple; 2) Expert utilisant les globes virtuels pour une application simple;

3) Utilisateur néophyte ou intermédiaire utilisant les globes dans un but scientifique ou professionnel;

4) Expert capable de comprendre et d‟analyser l‟information présente dans les globes virtuels dans un but scientifique ou professionnel.

Même si cette classification est plus spécifique aux globes virtuels et ne se veut pas un portrait de tous les utilisateurs de données géospatiales, on peut tout de même retrouver des similarités avec les classifications proposées antérieurement. La classification que l‟on retrouve à la Figure 4 se veut adaptation de la classification des utilisateurs proposée par Jones, 2013. Elle utilise également deux axes, soit l‟expertise métier des utilisateurs ainsi que leur expertise d‟un point de vue géospatial. Elle ne permet pas de couvrir toutes les caractéristiques qui pourraient être propres à un utilisateur métier, étant donné qu‟elle ne tient pas compte de la façon dont les utilisateurs réagissent aux risques. Cependant, elle permet de distinguer les utilisateurs n‟ayant pas d‟expertise géospatiale entre eux : utilisateurs de masse utilisant les données pour un usage personnel, et utilisateurs étant

(38)

spécialistes d‟un domaine d‟application. Cette distinction est importante étant donné que les moyens d‟acquérir les données varient pour ces utilisateurs, de même que les usages effectués.

Figure 4 : Classification des utilisateurs de données géospatiales

Cette classification permet donc à nouveau de présenter quatre catégories d‟utilisateurs, pour lesquelles nous présentons maintenant des exemples. Un agronome qui utilise des données géospatiales dans le cadre de son travail sans détenir de formation ni d‟expérience particulière en géomatique appartient à la catégorie des utilisateurs spécialiste métier. Par contre, un agronome pourrait aussi avoir une formation complémentaire en géomatique ainsi que suffisamment d‟expérience pour pouvoir prendre des décisions éclairées en matière d‟utilisation de données géospatiales, il appartiendrait donc à la catégorie des utilisateurs spécialistes métier et de la

référence spatiale. De l‟autre côté de l‟axe se retrouvent des utilisateurs spécialistes de la référence spatiale, parmi lesquels on retrouve les arpenteurs-géomètres, qui n‟ont pas

nécessairement d‟expertise reliée à un autre domaine. Finalement, les utilisateurs de masse non

experts contiennent entre autres les utilisateurs grands publics qui consultent des sites de

cartographie en ligne pour leurs déplacements. Cette catégorie d‟utilisateurs se distingue des autres étant donné qu‟elle correspond à des utilisateurs qui consultent des données pour leur usage personnel, alors que les trois autres catégories le font à titre professionnel.

(39)

Cette section a permis de présenter quelques classifications d‟utilisateurs de données géospatiales retrouvées dans la littérature, ainsi qu‟une adaptation d‟une classification pour tenir compte de l‟expertise métier des utilisateurs de données géospatiales. Cependant, il ne s‟agit pas d‟un portrait exhaustif de la littérature sur les utilisateurs de données géospatiales. En effet, des travaux se sont penché sur ce qui communique le mieux l‟information sur la qualité à un utilisateur de données géospatiales (Boin et al., 2006; Boin et al., 2007; Goodchild, 2007). De plus, des travaux visant à intégrer l‟utilisateur dans la conception du système d‟information géographique dont il fera l‟utilisation sont en cours d‟élaboration (Grira et al., 2012).

2.3 Évaluation de la qualité des données géospatiales

Comme cela a été mentionné dans le premier chapitre de ce mémoire, les notions de risque d‟utilisation inappropriée des données géospatiales et de qualité sont reliées. En effet, pour être en mesure d‟identifier des risques d‟utilisation inappropriée, il importe de connaître des façons d‟évaluer la qualité des données à disposition. Plusieurs travaux ont été réalisés afin d‟évaluer la qualité d‟un jeu de données géospatiales, mais la plupart de ces approches concernent la qualité interne des données et ne tiennent pas compte de l‟usage envisagé des données. Cette section présente les principales approches qui se retrouvent dans la littérature. Il a été établi qu‟une procédure visant à évaluer la qualité externe (fitness for use) devait avoir les cinq caractéristiques suivantes (Agumya et

al., 1999b) :

1) simple et abordable; 2) facile à comprendre;

3) elle doit utiliser les métadonnées disponibles et ne pas en demander de supplémentaires; 4) informative, c‟est-à-dire qu‟elle doit indiquer à quel point les données sont de bonne ou

mauvaise qualité;

5) sa fiabilité doit être mesurable.

Les sous-sections suivantes présenteront dans un premier temps les métadonnées d‟un point de vue d‟évaluation, mais aussi de communication de la qualité, puis des approches qui ont été proposées pour évaluer la qualité des données géospatiales.

Figure

Figure 2 : Gestion des risques adaptée du Guide ISO/CEI 51
Figure 3 : Méthode de gestion des risques dans le domaine de la gestion de projets
Tableau 1 : Matrice de hiérarchisation des risques proposée par Levesque, 2008
Figure 4 : Classification des utilisateurs de données géospatiales
+7

Références

Documents relatifs

Initialement développé par les laboratoires de recherche de l’IGN comme un outil de visualisation de données images et LiDAR issues de la cartographie mobile (c’est-à-dire

Biotechnology Information (NCBI), branche de la Bibliothèque nationale de médecine des États- Unis sous l'autorité de la National Institutes of Health (NCI). PubChem répertorie

Experimental results on measurements of the apparent thermal conductivity of pozzolana concrete are reported in this study, using an approach that considers

ConceptOrg représente les prépositions typiques précédant une Organisation (avec, par, etc). ConceptSpa se décline en trois sous-concepts pré- cédant, en général, une

G´en´erallement, la structure d’un objet g´eospatial flou doit d´efinir le type de l’objet, sa g´eom´etrie (forme et coordonn´ees) et la structure de l’ensemble de ses

- d’autre part , dans la construction nouvelle d’un indice d’implication entre classes a et b de variables, étendant l’évaluation de l’implication a ~ b à celle

Donnez des droits de consultation de toutes les tables de la BD biblio aux bibliothécaires ainsi que des droits de consultation, d’insertion sur les tables des emprunts,

Écrire une méthode qui reçoit en paramètre une chaîne de caractères et l'affiche sur deux lignes, en affichant sur la première ligne les caractères en majuscule de rang impair et