• Aucun résultat trouvé

3.1 Études de cas de diffusion de données géospatiales

3.1.1 Service de la géomatique du Ministère des Transports du Québec

3.1.1.1 Portrait du service de la géomatique du Ministère des Transports du Québec Le service de la géomatique est responsable de la gestion des données géospatiales utilisées dans le ministère des Transports du Québec. Dans le cadre du projet GEOIDE IV-23 sur la qualité des données géospatiales, nous avons été appelés à collaborer à l‟élaboration d‟une politique de diffusion responsable des données géospatiales du Service de la géomatique du Ministère des Transports du Québec (MTQ). Le MTQ voulait élaborer cette politique étant donné qu‟il était de plus en plus appelé par d‟autres ministères et organismes à diffuser ses données géospatiales.

3.1.1.2 Travaux réalisés

Afin d‟en venir à une étude du processus de diffusion envisagé par le Ministère, les travaux réalisés par l‟auteure visaient à inventorier les données et les métadonnées sous la responsabilité du Service de la géomatique. Dans un premier temps, l‟outil servant à inventorier les données a dû être développé, et devait tenir compte des informations jugées les plus pertinentes pour diffuser les données de façon responsable. Cet outil a été inspiré de travaux antérieurs réalisés à l‟Université Laval qui visaient à inventorier les données à disposition d‟une organisation pour mettre en place un système d‟information à référence spatiale (SIRS) (Bédard et al., 1993, Prince et al., 1991). Nous avons adopté notre outil aux besoins du client suite à des rencontres avec celui-ci, notamment l‟ajout de champs permettant de voir à qui un objet ou un attribut pouvaient être diffusés.

Par la suite, l‟inventaire lui-même a dû être réalisé dans les bureaux du Service, en rencontrant les divers intervenants et en consultant la documentation disponible. En effet, le but était de recueillir le plus de métadonnées sur les données à diffuser, que celles-ci soient disponibles dans la documentation écrite ou qu‟elles proviennent de connaissances d‟un employé sans que ces

connaissances soient documentées. Nous avons inventorié des données vectorielles (nommées « thèmes » au MTQ, des photographies aériennes, des cartes de série (produits cartographiques représentant plusieurs thèmes de données en fonction d‟un même territoire), et d‟autres produits cartographiques. Au total, 275 produits ou thèmes ont été inventoriés. Dans le cas des données vectorielles, nous avons aussi inventorié les attributs et les domaines de valeur qui étaient présents. Le détail de la réalisation de cet inventaire se retrouve à l‟annexe II du présent mémoire.

3.1.1.3 Processus de diffusion

Plus d‟un scénario de diffusion avait été soulevé par le comité en charge de l‟élaboration de la politique de diffusion, mais celui de la diffusion ciblée semblait être préféré au sein du Service de la géomatique. Afin d‟illustrer le processus de diffusion ciblée et de pouvoir par la suite le mettre en évidence avec d‟autres scénarios de diffusion, nous avons créé un diagramme UML de cas d‟utilisation. Même si ce type de diagramme est principalement utilisé en génie logiciel pour décrire les interactions des utilisateurs avec un système (Schneider et al., 1998), nous avons décidé de considérer le processus de diffusion des données géospatiales comme un système. La figure 5 représente un exemple du scénario idéal qui avait été imaginé par le Service de la géomatique, afin d‟effectuer une diffusion ciblée des données. Le diagramme représente une interprétation que nous avons faite du processus idéal de diffusion ciblée, et qui, selon nous, s‟adaptait le mieux au contexte du Ministère des Transports tel qu‟il nous avait été présenté. Il est important de noter que ce diagramme n‟a pas été conçu à la demande du Service de la géomatique, mais pour les besoins de l‟étude de cas. Il ne s‟agit donc pas d‟un document officiel de ce service, mais vise à proposer une solution qui s‟appliquait au contexte.

Figure 5 : Diagramme de cas d'utilisation pour une diffusion ciblée de données géospatiales

Un diagramme de cas d‟utilisation implique de définir les acteurs concernés. Dans un premier temps, on retrouve l‟utilisateur, qui peut provenir du grand public, d‟un organisme externe, d‟une compagnie privée, ou être à l‟intérieur même du Ministère des Transports. Peu importe d‟où il provient, nous avons jugé que son interaction avec le système était la même. L‟autre acteur interagissant avec le système est le responsable de la diffusion, une personne à l‟interne au Service de la géomatique et qui est experte dans le domaine des données géospatiales. Il est à noter que nous n‟avons pas tenu compte de la façon dont les utilisateurs seraient informés des mises à jour disponibles.

Dans le langage UML, un diagramme d‟activités est généralement associé à un diagramme de cas d‟utilisation afin de mieux illustrer et d‟approfondir les cas d‟utilisation du diagramme. Un diagramme d‟activités permet de présenter les activités dans leur ordre prévu, mais permet aussi de présenter des activités en parallèle. La Figure 6 permet d‟exprimer les étapes de façon plus détaillée et de tenir

compte de certaines conditions particulières qui ne pouvaient être vues au premier abord avec le cas d‟utilisation. Il est à noter que dans cette figure, lorsqu‟on évalue si les données sont aptes à répondre au besoin, nous tenons compte de la région dans laquelle les données seront utilisées. Ainsi, nous tenons compte d‟une éventuelle hétérogénéité de la qualité des données géospatiales étant donné que la qualité des données peut varier dans un même jeu de données en fonction de l‟emplacement géographique.

Figure 6 : Diagramme d'activités du scénario de diffusion ciblée au Service de la géomatique du MTQ Les informations diffèrent peu en ce qui concerne l‟acteur « utilisateur de données géospatiales » par rapport à ce qu‟on retrouvait dans le diagramme de cas d‟utilisation. Cependant, on remarque

la diffusion. Afin de bien remplir son rôle, cet acteur (qui peut être plus d‟une personne) a besoin d‟outils : un répertoire des demandes d‟accès aux jeux de données, un répertoire des problèmes rencontrés, ainsi qu‟un inventaire des données géospatiales, qui contient la liste des thèmes et produits présents au Service de la géomatique. L‟étape qui peut s‟avérer la plus compliquée pour le responsable de la diffusion est d‟évaluer si les données sont aptes à répondre à un besoin et quels avertissements greffer aux données. Une expertise en gestion de données géospatiales serait alors souhaitable pour effectuer adéquatement ces tâches. Trois conclusions sont possibles lors de l‟évaluation de la propension des données à satisfaire le besoin formulé :

1) Les données ne sont pas aptes à répondre au besoin; 2) Les données sont aptes à répondre au besoin;

3) Les données sont partiellement aptes à répondre au besoin pour une région donnée. Si les deux premières options surviennent la décision à prendre par le diffuseur de données géospatiales est simple : il refuse l‟accès aux données, ou il fournit les données accompagnées de recommandations sur leur utilisation (ce qui peut aussi inclure des mises en garde, des informations sur la licence d‟utilisation, etc.). Par contre, dans le troisième cas, c‟est-à-dire si les données sont partiellement aptes à répondre au besoin pour une région donnée, le diffuseur de données se retrouve devant une décision plus difficile à prendre. La Figure 6 montre que les données sont alors diffusées accompagnées de recommandations particulières, mais en stipulant dans quelle mesure elles peuvent répondre aux besoins et en suggérant, s‟il y a lieu, des moyens qui permettraient à l‟utilisateur d‟éviter des problèmes. Cette diffusion devrait obligatoirement s‟accompagner de recommandations et de mises en garde pour que le producteur réponde à son devoir de conseil, et que l‟utilisateur soit conscient des risques reliés à l‟utilisation des données. Par exemple, le producteur pourrait indiquer à l‟utilisateur que l‟identification et la géométrie des routes sont bien adaptées au besoin, mais que l‟attribut de vitesse maximale n‟est pas toujours à jour. Dans un autre cas, le producteur pourrait informer l‟utilisateur que les données représentant les ponts et viaducs sont de qualité suffisante à l‟exception de la mise à jour des données, qui peut retarder jusqu‟à 6 mois. Il pourrait aussi arriver qu‟un producteur avertisse l‟utilisateur que les attributs d‟un objet sont de très bonne qualité mais que la géométrie de l‟objet ait fait l‟objet d‟une généralisation qui la déforme et la rend moins adaptée à son usage.

Suite à une diffusion, nous constatons à la Figure 6 l‟apparition de l‟étape : « mettre à jour le registre de diffusion ». Nous n‟avons pas proposé de structure exacte permettant de définir le contenu d‟un tel registre étant donné que cela ne faisait pas partie de notre mandat. Cependant, nous avions en tête qu‟un tel registre pourrait contenir des informations concernant les données qui ont été diffusées, c‟est-à-dire les besoins formulés par l‟utilisateur, l‟information à savoir si les données ont été diffusées entièrement, partiellement, ou pas du tout, ainsi que les recommandations et mises en gardes particulières qui accompagnaient la diffusion. Cela permettrait au responsable de la diffusion de conserver ses connaissances au sein de l‟organisation advenant un départ, mais lui faciliterait aussi la tâche pour prendre des décisions dans le cas où les demandes de diffusion se ressembleraient. De plus, afin d‟effectuer un contrôle qualité sur les diffusions antérieures, un répertoire de problèmes rencontrés peut être utilisé, répertoire qui permet de ne pas répéter les erreurs de diffusion. Dans le cas d‟un problème majeur, le responsable de la diffusion pourrait décider de ne plus diffuser les données pour l‟usage spécifié. Dans le cas d‟un problème mineur, le responsable peut diffuser les données, mais en fournissant des recommandations qui permettront à l‟utilisateur de ne plus rencontrer le problème.

Il est à noter que depuis la réalisation de ces travaux en collaboration avec le Ministère des Transports du Québec, le projet de diffusion ciblée tel qu‟envisagé par le Service de la géomatique a été abandonné. Les données sont maintenant diffusées dans un portail, accompagnées d‟autres données géographiques gouvernementales d‟autres ministères québécois. Cependant, l‟exemple que nous retiendrons tout au long de ce chapitre est celui de la diffusion ciblée enrichie de nos suggestions étant donné que c‟est dans l‟éventualité d‟une diffusion ciblée que nos travaux ont été réalisés.

3.1.1.4 Difficultés rencontrées et constats réalisés

La réalisation de l‟inventaire des données au Ministère des Transports du Québec a permis de révéler certains problèmes au niveau de la conservation de l‟information et de la mémoire de l‟organisation. En effet, peu de métadonnées étaient disponibles dans la documentation décrivant les jeux de données. À cette situation s‟ajoutait le fait que les jeux de données étaient souvent sous la responsabilité d‟une personne en particulier. Dans le cas des jeux de données qui étaient jusqu‟à tout récemment sous la responsabilité d‟un employé maintenant à la retraite, il était plus difficile d‟avoir des informations pour lesquelles nous étions absolument certains de la véracité.

Le ministère des Transports dispose de services sur lesquels il est possible de consulter des données. Ces données sont issues de la Base géographique routière (BGR). Les services de consultation mis à disposition, de même que les données qui ont été inventoriées, n‟étaient en fait que des vues de la base de données. Celle-ci est gérée par des consultants externes ; les données brutes ne sont pas disponibles pour les employés du Service de la géomatique, et nous n‟avons pas pu les utiliser non plus. Comme peu de métadonnées accompagnent les vues de la base de données en question, cela rend l‟identification de la provenance des données encore plus difficile. De plus, selon le service consulté (BGR, SIG), les attributs et métadonnées disponibles pour un même thème pouvaient varier, et il n‟était pas possible de savoir s‟il s‟agissait réellement du même thème ou de deux thèmes différents. Dans ces cas, il aurait été plus simple d‟avoir accès aux données brutes afin de valider l‟information saisie. Lorsqu‟une telle confusion était présente, et que personne n‟a pu nous éclairer sur les causes, nous avons saisi les thèmes en double dans ces données.

À certains moments, il y a eu un peu de confusion concernant le mandat entre la personne réalisant l‟inventaire et les employés du MTQ devant contribuer à la réalisation de cet inventaire. En effet, étant donné que l‟inventaire concernait la diffusion des données, certains employés omettaient de présenter des jeux de données sous prétexte qu‟ils n‟étaient pas diffusables à l‟externe. Cependant, les données devaient toutes être inventoriées, au cas où une diffusion à l‟interne soit possible. Afin de remédier à ce problème, nous avons convenu que l‟information à savoir si un produit cartographique ou un thème (ainsi que ses attributs) étaient diffusable ne serait pas saisie par nous, mais par les responsables du projet au Service de la géomatique.

3.1.1.5 Apport de la démarche

L‟inventaire des données et métadonnées du Service de la géomatique nous a permis de rencontrer un cas concret de diffusion de données géographiques gouvernementales avec pour objectif de diffuser ces données de façon responsable. L‟inventaire a été réalisé à temps partiel sur une période s‟étendant de juin 2010 à mai 2011. Les présents travaux peuvent sembler peu en lien avec les objectifs que nous avons présentés au début de ce mémoire ; on n‟y parle pas de risque ni de portails Web. Cependant, ces travaux se situent au début de la recherche et ont contribué à définir le problème que nous voulions étudier. Au moment où nous étions occupés à réaliser cet inventaire, notre objectif était de faciliter (grâce à une méthode semi-automatique) la rédaction de rapports de qualité tenant compte de l‟usage envisagé pour les données à partir des métadonnées associées au

de la géomatique. Cependant, au fur et à mesure de l‟avancement de l‟inventaire, nous avons constaté que les données présentaient trop peu de métadonnées pour évaluer si les données étaient aptes à répondre à un besoin et surtout à le faire de façon semi-automatique. Même si nous savions que l‟absence de métadonnées peut être très révélatrice au sujet de la qualité externe ou interne d‟un jeu de données, le fait que les métadonnées n‟étaient conformes à aucune norme ne facilitait pas l‟automatisation de la rédaction d‟un rapport, et cela n‟aurait pas été utilisable pour une autre organisation. Cela nous a permis de constater concrètement les limites de notre objectif initial, qui ne pourrait pas s‟appliquer à des organisations n‟ayant pas de méthode normalisée et systématique de cueillir les métadonnées.

Comme nous voulions tester le scénario de diffusion à l‟aide d‟une solution semi-automatisée qui puisait l‟information dans les métadonnées de l‟organisme diffuseur, nous nous sommes informés à savoir si nous pouvions avoir accès à d‟autres données provenant d‟un autre organisme, données idéalement accompagnées de métadonnées, ce qui nous a amené à une seconde étude de cas. Nous reviendrons sur l‟apport de la création d‟un scénario de diffusion dans la conclusion de ce chapitre.

Malheureusement, certains délais et modifications dans les priorités du ministère ont mis fin au projet et nous ont empêché de terminer complètement le travail d‟inventaire. Par exemple, nous n‟avons pas pu inventorier les données au format LIDAR, qui étaient pourtant mentionnées dans les types de données initialement présentés par le ministère. Par contre, l'expérience acquise fut très enrichissante pour les objectifs du présent projet de recherche, étant donné que cela nous a permis de mieux comprendre ce contexte de diffusion et qu‟il pouvait être difficile de mettre une solution théorique en application dans un contexte pratique.