• Aucun résultat trouvé

Chapitre 4 – Identification des risques d‟utilisation des données géospatiales

4.1 Approche d‟identification des risques

4.1.3 Création de l‟arbre de questions

Afin de mettre en œuvre le principe de fonctionnement décrit précédemment (utilisation de questions pour identifier des risques), nous avons utilisé plusieurs informations que nous avions colligées en consultant les travaux antérieurs. Ainsi, une bonne partie des questions provenait de notre expérience personnelle en géomatique, mais aussi de la consultation des rapports de qualité, des normes ISO sur la qualité et les métadonnées ainsi que sur les problèmes reliés à la qualité des données que nous avions retrouvés dans la littérature. Dans un premier temps, nous n‟avons pas cherché à ordonner les questions que nous trouvions pertinentes, mais plutôt à identifier tous les éléments susceptibles de contribuer à l‟identification de risques. À ce stade, nous avons établi une distinction entre nos questions et les avons regroupées en deux catégories afin de faciliter l‟organisation de nos idées:

- les questions générales reliées à l‟utilisation des données (les besoins, les moyens à la disposition de l‟utilisateur);

Intitulé du risque

Risque #

• Indicateur d'importance : nombre de questions ayant mené à l'identification de ce risque • Première action spécifique de gestion de ce risque

• Stratégie associée à cette action spécifique

• Seconde action spécifique de gestion de ce risque • Stratégie associée à cette action spécifique

• ... • ...

Par la suite, nous avons identifié les différentes réponses qui pouvaient être données pour chacune des questions. Dans les cas où une question ne permettait pas de mener à l‟identification d‟un risque directement, des questions supplémentaires ont été ajoutées pour préciser la situation, ce qui a mené à l‟apparition de questions facultatives.

Figure 13 : Approche globale proposée pour identifier les risques

La figure 13 présente des questions qui ne changent pas selon les données que l‟utilisateur envisage d‟acquérir, questions que nous avons désignées précédemment comme étant des questions générales reliées à l‟utilisation des données. À chacune de ces questions sont associés des risques en fonction des réponses données. Elles sont présentes à titre préventif, c‟est-à-dire qu‟elles peuvent mener à l‟identification de risques, mais servent aussi à informer l‟utilisateur et à le sensibiliser à certaines problématiques qu‟il pourrait rencontrer dans son utilisation éventuelle. La question 1, « Quel est le portail via lequel vous envisagez acquérir vos données? » fait exception. Sa présence a pour but, dans le cas où l‟approche serait développée pour plusieurs portails, d‟orienter sur l‟endroit où

dans les métadonnées. Les exemples de questions présentées dans ce mémoire ne tiennent pas compte des différences possibles entre deux portails pour ne pas complexifier les travaux. Pour connaître le détail des questions et des justifications, il est possible de se référer à l‟annexe III en utilisant les numéros associés à chaque question. L‟avant-dernière action proposée par cette figure correspond en fait à plusieurs étapes qui forment une série de questions structurées, dont les grandes lignes sont présentées à la figure 14. La dernière question, qui demande au répondant d‟évaluer dans quelle mesure il est certain des réponses fournies aux questions, réfère à la notion de méta-incertitude (Bédard, 1988), qui permet d‟avoir une idée de la qualité des réponses données, et donc, dans ce cas, du processus d‟évaluation des risques.

Cette figure permet d‟illustrer qu‟il n‟est pas nécessaire d‟identifier les risques reliés à une composante altimétrique si celle-ci n‟est pas requise par l‟utilisateur. Si l‟utilisateur établit qu‟il a besoin de ces éléments, alors une étape d‟identification des risques reliés à cette étape commence. Les étapes que l‟on retrouve à droite, dont le nom débute par « Identification », sont elles-mêmes composées de plusieurs petites étapes. Pour avoir le détail de chacune de ces étapes, l‟annexe III présente toutes les questions qui ont été rédigées, en tenant compte des questions suivantes et des risques associés. La figure 15 présente les éléments de la question obligatoire « Est-ce que vous avez besoin de la composante altimétrique des données? », pour laquelle deux réponses sont possibles : oui ou non. Dans le cas où la réponse est non, aucune question supplémentaire n‟est requise, et on peut passer à la prochaine question obligatoire.

Figure 15 : Exemple de question obligatoire portant sur les besoins de l’utilisateur

Dans le cas où l‟utilisateur ne serait pas apte à répondre à cette question, ou aimerait être certain de la signification de la question, la partie Précision sur la question peut lui permettre de préciser son

Question 9 - Est-ce que vous avez besoin d'une composante

altimétrique pour les travaux que vous réalisez?

• Précision: Est-il nécessaire pour vous d'avoir une idée de l'altitude de vos données? Attention, ici on ne parle pas de 3e dimension (ou d'objets volumétriques), mais plutôt de la présence d'une position en Z. Il est à noter que si vous avez un modèle numérique de terrain ou de surface, il est possible que vous puissiez déduire cette information à partir de ces modèles. Il importe aussi de distinguer les altitudes orthométriques et les altitudes ellipsoïdales : les altitudes orthométriques sont la distance entre le point et le géoïde, alors que les altitudes ellipsoïdales sont la distance entre le point et l'ellipsoïde de référence.

Réponses possibles

• Oui

• Numéro de la question suivante • Risque associé: aucun

• Non

• Question suivante : prochaine question obligatoire • Risque associé : aucun

nécessaire de lui poser des questions supplémentaires sur cette composante altimétrique. Nous avons établi que cette question devrait être : « Est-ce que les données que vous consultez ont une composante altimétrique intégrée? ». On passe alors d‟une question portant sur les besoins de l‟utilisateur, à une question portant sur les données que l‟utilisateur envisage d‟acquérir. Une

Précision sur la question peut être apportée pour cette question également. Il ne s‟agit pas tout à

fait du même type de précision que lors d‟une question portant sur les besoins ; dans ce cas-ci, on vise à guider l‟utilisateur pour qu‟il puisse trouver cette information dans les métadonnées ou dans le reste de la documentation disponible. La figure 16 présente la question « Est-ce que les données que vous consultez ont une composante altimétrique intégrée? »

Figure 16 : « Est-ce que les données que vous consultez ont une composante altimétrique? »

La précision pour la question « Est-ce que les données que vous consultez ont une composante altimétrique?» guide l‟utilisateur de la solution au travers des métadonnées. Cet exemple pourrait être encore plus exhaustif et détailler tous les emplacements possibles pour chacun des portails, ainsi que toutes les formes de métadonnées possibles. On remarque dans cet exemple que plus d‟une question suivante est possible dans le cas où la réponse est « oui ». Cela signifie qu‟il y a plus d‟un élément à vérifier avant de parvenir à une décision. La figure 17 illustre une partie des différentes branches possibles pour l‟arbre de décision visant à identifier les risques reliés à la composante altimétrique. On remarque donc deux questions indépendantes dans le cas où la réponse est « oui », soit les questions

Question 13 - Est-ce que les données que vous consultez ont une

composante altimétrique? (facultative)

• Précision: Si vous n'arrivez pas à trouver l'information, il est fort probable que les données n'aient pas de composante altimétrique. Par exemple, dans le profil nord-américain ISO des métadonnées, les champs correspondant à un système de référence vertical vont apparaître uniquement si celui-ci est présent. Si la norme utilisée est le FGDC, c'est la même chose. Si vous êtes en mesure de consulter les données (téléchargement gratuit), vous pourriez aussi vérifier si l'information sur l'altitude des données se retrouve en attribut sans que ce soit indiqué dans les métadonnées.

Réponses possibles

• Oui

• Questions suivantes : 10,11 • Risque associé: aucun • Non

• Question suivante : 14 • Risque associé : aucun

14 et 17. Ainsi, même si l‟utilisateur se rend au bout de la branche de la question 14, il doit tout de même revenir à la question 17 pour compléter son identification, et non pas passer à l‟arbre suivant. Il existe deux fins possibles pour une branche, c‟est-à-dire l‟identification d‟un risque, ou aucun risque identifié. L‟annexe IV permet de connaître les énoncés des risques identifiés par chacune de ces branches.

Figure 17 : Arbre de décision partiel pour la composante altimétrique des données

Afin de mener à l‟identification d‟un risque relié à la composante altimétrique des données, il faut qu‟il existe quelques problèmes avec les données. L‟un de ces problèmes pourrait survenir si le système de coordonnées altimétriques n‟est pas connu, mais que l‟information sur l‟altitude se retrouve en attribut sans qu‟on ne sache à partir de quel point celle-ci est calculée. Cette distinction est expliquée

Question 13 - Est-ce que les données que vous consultez ont

une composante altimétrique?

Question 14 : Est-ce que le système de coordonnées

altimétrique est connu?

Question 15 : Est-ce que le système est disponible pour

toutes les données? (complétude de l'information)

Question 16 : Avez-vous besoin de la hauteur des objets ou de

l'altitude absolue?

Question 17 : Est-ce que l'information sur l'exactitude de

la composante verticale des donneés est disponible?

Question 18 : Est-ce que les données sont suffisamment exactes pour vos besoins?

RISQUE 20

Question 19- Serait-il possible de combiner un modèle numérique de terrain ou de surface à vos données pour en connaître l'altitude?

RISQUE 21

Il n'est pas conseillé d'utiliser ces données pour votre application. (RISQUE 4)

l‟utilisateur qui répond « non » à la question 15 que s‟il mesure une distance sur la carte, il s‟agira d‟une mesure plane différente de la mesure réelle sur le terrain, la distance ne tenant pas compte du relief. Après que l‟utilisateur ait jugé que l‟information sur l‟altimétrie pourrait lui convenir ou pas, celui- ci doit maintenant vérifier si l‟information sur l‟exactitude de la composante verticale des données est disponible. Si l‟information est disponible, il doit alors vérifier si celle-ci correspond à ses besoins. Il se peut que l‟information ne soit pas suffisamment précise ou exacte, auquel cas l‟utilisateur fait alors face à un risque d‟obtenir des résultats inexacts si ces données sont utilisées. Un principe semblable à celui de l‟identification des risques reliés à la composante altimétrique a été utilisé pour toutes les autres branches qui ont été présentées (analyse spatiale, exactitude temporelle, exactitude spatiale, exactitude sémantique). L‟annexe III présente toutes les questions qui ont été écrites, tandis que l‟annexe IV présente tous les risques qu‟il est possible d‟identifier par un utilisateur lorsqu‟il se sert de l‟arbre de questions.

L‟exemple qui vient d‟être présenté, c‟est-à-dire l‟identification de risques reliés à la composante altimétrique, n‟est pas nécessairement le plus typique qui aurait pu être présenté. Même s‟il est possible qu‟un utilisateur se soucie de cette information, cela ne sera probablement pas présent dans tous les usages envisagés. Le prochain exemple d‟arbre de décision partiel porte sur l‟aspect temporel des données, qui est central dans plusieurs usages envisagés des données. De plus, ce concept est généralement connu des utilisateurs non experts, car il fait partie des éléments qu‟il peut directement relever sur un produit cartographique. Par exemple, un utilisateur non expert peut très bien remarquer que la rue où sa nouvelle maison a été construite ne figure pas dans la base de données incluse avec son appareil GPS personnel. Il pourra donc déduire lui-même, par son expérience personnelle, que les données ne sont pas « à jour ». Cependant, cela implique qu‟il ait accès aux données afin de décider de les utiliser, ce qui n‟est pas toujours le cas. De plus, cela ne le met pas à l‟abri d‟éventuels risques et ne signifie pas qu‟il est capable d‟identifier tous les problèmes pouvant être reliés à la mise à jour des données.

Les champs de métadonnées reliés à l‟élément de qualité temporelle ne sont pas très difficiles de compréhension pour un utilisateur non expert. En effet, le vocabulaire utilisé (fréquence de mise à jour, date de dernière mise à jour) est simple à comprendre pour un utilisateur non expert. Cependant, cela ne signifie pas qu‟il n‟est pas nécessaire d‟éduquer l‟utilisateur à propos de cet aspect. Par exemple, la date indiquée dans le champ « Date de dernière mise à jour » peut n‟être distante que de

6 mois, ce qui ne veut pas nécessairement dire que toutes les données (tous les types de données, toutes les occurrences du territoire) ont été mises à jour à ce moment. Par exemple, on a pu corriger des erreurs dans les valeurs attributives sans avoir corrigé la géométrie des entités, mis à jour les données sur une petite partie du territoire uniquement, ou seulement sur certaines nouvelles entités. Ces derniers éléments désignent la complétude de la mise à jour. De plus, la date à laquelle les données ont été mises à jour dans le fichier ne correspond pas nécessairement à ce qu‟on retrouvait sur le terrain à ce moment ; il ne s‟agit pas de la date d‟acquisition mais de la date d‟insertion des données dans le système. Dans certains cas, par exemple les données disponibles sur Google Earth, la métadonnée annoncée peut même s‟avérer erronée : il est indiqué que les données ont un copyright 2013, alors que dans certains cas, les photographies remontent à plusieurs années. Il importe donc d‟éduquer les utilisateurs sur les limites de l‟information présente dans les métadonnées.

Figure 18 : Arbre de décision relié à l'aspect temporel des données

La figure 18 montre l‟arbre de décision partiel qui permet d‟identifier les risques reliés à l‟aspect temporel des données, à partir du moment où l‟utilisateur a affirmé que l‟exactitude temporelle était importante pour ses travaux. Cet arbre est beaucoup plus linéaire que celui qui a été présenté précédemment étant donné que plusieurs questions sont posées peu importe les réponses données antérieurement, et que des risques peuvent être identifiés à presque toutes les questions. Dans certains cas, l‟identification d‟un risque mène tout de suite à l‟arrêt du parcours de l‟arbre, ce qui est le cas du risque G. En effet, celui-ci s‟énonce ainsi : « Il semble difficile d'évaluer si les données sont réellement à jour, et si elles pourront répondre à vos besoins. Il est conseillé de ne pas utiliser le jeu

données plus à jour ». Cependant, dans le cas du risque H, on peut continuer à répondre aux questions, étant donné qu‟il vise plutôt à sensibiliser l‟utilisateur à une problématique éventuelle. Le risque H s‟énonce comme suit : « Il se pourrait que la mise à jour n‟ait pas été effectuée de façon uniforme sur tout le territoire, pour tous les types d‟objets du jeu de données ou pour tous leurs attributs et que certaines régions, certains types d‟objets ou certains attributs présentent des problèmes quant à l‟actualité des données représentées».

Les risques reliés à un manque d‟exactitude sémantique sont ceux pour lesquels il était le plus difficile d‟identifier d‟éventuelles questions. En effet, compte tenu du fait que les risques dépendent du thème sur lequel porte des données (données routières, forestières, agricoles, etc.), nous avons réalisé qu‟il était impossible de prévoir tous les cas et de rédiger des questions qui permettaient facilement d‟identifier ces risques. Cependant, nous avons tout de même été en mesure de proposer un arbre de décision utilisant des questions portant sur l‟aspect sémantique des données, mais il s‟agit de questions plus générales. Dans le cas où la solution proposée dans ce chapitre était mise en œuvre par un gestionnaire de portail ou par un producteur, ces derniers pourraient par contre ajouter des questions spécifiques à un jeu de données portant sur la sémantique de ceux-ci, et ainsi aider à réduire le risque d‟utilisation inappropriée de ce jeu de données en particulier. Nous proposons tout de même un extrait des questions visant à identifier les risques reliés à la composante sémantique des données.

Figure 19 : Identification partielle des risques reliés à la composante sémantique

Les questions reliées à l‟aspect sémantique se prêtent moins à la création d‟un arbre de décision, étant donné que les questions sont plutôt linéaires. En effet, plusieurs questions concernant la complétude et l‟uniformité du dictionnaire de données pourraient être posées et mener à l‟identification de nombreux risques sans que les réponses antérieures n‟affectent les questions suivantes.

Dans la figure 18, si l‟utilisateur n‟a pas accès à un dictionnaire de données, des questions reliées aux définitions sont posées. Cependant, le fait de ne pas avoir de dictionnaire de données mène directement à de nombreux risques reliés à la définition des objets et de leurs attributs. De plus, même si un dictionnaire de données est présent, il se pourrait que celui-ci soit incomplet, pas à jour ou même qu‟il ne soit pas uniforme pour tout le territoire ni toute la période couverte. Des questions portant sur le dictionnaire de données se retrouvent à l‟annexe III, par contre, nous réalisons qu‟il est difficile pour un utilisateur d‟évaluer la qualité d‟un dictionnaire de données.