• Aucun résultat trouvé

Chapitre 3 Méthode formelle d’identification et de gestion des risques

3.3 Description de la méthode

3.3.2 Phase 2 : l’application

3.3.2.1 Identification du risque

Tel que mentionné à la section 2.1.1, l’étape d’identification du risque est l’une des phases les plus importantes du processus de gestion du risque, puisqu’elle conditionne l’efficacité et la qualité de toutes les autres. Elle consiste donc à répertorier, de manière la plus exhaustive possible, les risques qui peuvent conduire à une analyse, à une interprétation, bref, à une utilisation inadéquate du cube spatial. Différentes techniques peuvent être employées afin de détecter les risques : explorer et analyser les risques identifiés lors de projets antérieurs, examiner la documentation existante des données sources devant être intégrées dans le cube (ex. : métadonnées, dictionnaire de données, avertissements incorporés dans des tableaux ou des rapports), étudier la qualité et les caractéristiques de ses modèles conceptuel et d’implantation, évaluer les impacts occasionnés par les opérations ETL utilisées pour agréger les données et peupler le cube, faire appel à des experts, etc.

L’identification des risques peut donc rapidement devenir une tâche laborieuse qui demande l’examen d’une multitude d’informations. Nous émettons deux recommandations à cet effet afin de faciliter l’exécution du travail :

ƒ Utiliser une classification des risques : La classification des risques constitue un aide-mémoire qui peut être fort utile pour faciliter la recherche et la découverte des risques. Or, aucune classification des risques pour un cube spatial n’avait jusqu’à

ce jour été définie ; nous avons donc dû en élaborer une première proposition. Puisque les risques peuvent être classifiés de différentes manières (cf. section 2.1.1), le défi consistait donc à trouver un ou des critères qui permettraient de former un nombre raisonnable de classes mutuellement exclusives. Pour ce faire, il a été décidé de répartir les risques pour un cube spatial selon la source à partir de laquelle ils sont issus ; (1) les données sources transactionnelles, (2) les opérations ETL utilisées pour peupler le cube spatial, (3) le cube lui-même ou (4) les fonctionnalités disponibles dans l’application SOLAP (cf. Figure 14).

Figure 14 Sources des risques pour un cube spatial

Chacune de ces quatre grandes familles de risque a ensuite été subdivisée en catégories. La Figure 15 présente ainsi, sous forme de diagramme de classes, la classification des risques résultante de cette subdivision. La première famille de risques, soit les risques liés aux données sources transactionnelles, regroupe les risques liés à la documentation des données sources (ex.: absence ou incomplétude des métadonnées), à leur qualité interne (exactitude spatiale, sémantique, temporelle, etc.) et à leur évolution (évolution spatiale, sémantique, etc.). Un risque associé à cette famille pourrait par exemple être le fait qu’un utilisateur puisse croire ou considérer, vu son manque de connaissance des données sources ou d’expertise en référence spatiale, que certains objets ou phénomènes (ex. : des incidents maritimes) sont positionnés très précisément sur le territoire, alors que ceux-ci pourraient être empreints d’une incertitude appréciable (ex. : exactitude spatiale qui varie entre 10 et 100 mètres). Étant directement liés aux données sources transactionnelles, ces risques seront majoritairement détectés lors de la phase du projet qui consiste à effectuer l’inventaire et l’analyse des données sources utilisées pour peupler le cube devant être produit.

RISQUELIÉAUX DONNÉESSOURCES TRANSACTIONNELLES

DOCUMENTATION ÉVOLUTION

QUALITÉINTERNE

RISQUELIÉAUX OPÉRATIONS ETL INTÉGRATIONDES DONNÉESSOURCES CALCULD'UNE MESUREPAR ANALYSESPATIALE GÉNÉRALISATION CARTOGRAPHIQUE RISQUEINTERNE AUCUBE QUALITÉINTERNE GRANULARITÉDES DIMENSIONS IRRÉGULARITÉDU MODÈLE

RISQUELIÉAUX FONCTIONNALITÉSSIG ETOLAP OPÉRATIONDE NAVIGATION CARTOGRAPHIQUE CRÉATIONDE NOUVELLESDONNÉES RISQUE

Figure 15 Classification des risques

La deuxième famille de risques, soit les risques liés aux opérations ETL, contient quant à elle les risques liés à l’intégration des données sources (ex. : conflit d’intégration spatial, sémantique ou temporel), aux opérations de généralisation cartographique (ex. : lissage, déformation, déplacement) et au calcul d’une mesure par analyse spatiale. Un risque associé à cette famille pourrait par exemple être le fait qu’un utilisateur puisse ne pas prendre en considération, étant donné sa méconnaissance des traitements appliqués sur les données lors du peuplement du cube, les incertitudes associées à une mesure calculée par analyse spatiale (ex.: application d’une interpolation spatiale pour déterminer la température en un certain lieu). Étant liés aux opérations ETL, ces risques seront donc généralement trouvés lors de la phase de réalisation (transformation des données, peuplement, etc.) du cube spatial.

La troisième famille de risques, soit les risques internes au cube, comporte les risques liés à des irrégularités (ex. : dimension débalancée, dimension mixte, relations N-N entre les faits et une dimension) dans le modèle du cube, à sa qualité

interne (ex. : cohérence logique entre dimensions) et à la granularité de ses dimensions. Par exemple, la présence d’une dimension spatiale mixte (c.-à-d. avec des membres cartographiés et non cartographiés) dans le cube pourrait constituer un risque lorsqu’un utilisateur effectue ses analyses dans la fenêtre cartographique, puisqu’il pourrait ne pas considérer dans son analyse les membres qui ne sont pas affichés. Puisque les risques de cette famille sont associés principalement à la structure même du cube, ceux-ci seront donc habituellement découverts lors de la phase de conception du projet.

La dernière famille de risques, soit les risques liés aux fonctionnalités SIG et OLAP, renferme quant à elle les risques liés aux opérations de navigation cartographique et aux fonctionnalités permettant de créer des nouvelles données (ex. : mesure de distances). Par exemple, le fait de rendre disponible à un utilisateur la fonctionnalité permettant de calculer des mesures à la volée (à partir de celles existantes dans le cube) pourrait constituer un risque, puisque celui-ci pourrait créer des résultats incohérents s’il ne connaît pas de façon approfondie les données sources, les opérations ETL effectuées sur celles-ci ainsi que la structure même du cube. Puisque les risques liés aux fonctionnalités SIG et OLAP sont dépendants du logiciel d’interrogation utilisé (ex. : JMap Spatial OLAP), ceux-ci seront donc généralement détectés lors des phases de réalisation et d’implantation du projet de développement.

Finalement, le lecteur est invité à consulter l’annexe A du PMR proposé à l’Annexe B de ce mémoire, qui présente de façon très détaillée la typologie des risques pour un cube spatial et ce, accompagnée d’exemples afin de faciliter la compréhension. Finalement, il est à noter que la typologie des risques que nous proposons ne doit pas être considérée comme exhaustive ou irréfutable, mais plutôt comme une première ébauche qui pourra, au fil du temps, être modifiée et enrichie.

ƒ Se doter des ressources humaines adéquates : Tel que présenté précédemment, il est possible de retrouver une diversité appréciable de risques; certains sont davantage reliés à l’aspect spatial des données (ex. : position des objets), d’autres à leur caractère sémantique (ex. : définition d’une classe d’objet) ou temporel, et d’autres à leur forme multidimensionnelle (ex. : hiérarchie non-stricte). Afin d’assurer l’identification d’un nombre maximal de risques, il serait ainsi préférable d’impliquer des individus possédant des expertises et des expériences qui, une fois réunies, permettraient de couvrir l’ensemble des sphères de connaissances

relatives aux types de risque. Une telle équipe pourrait par exemple être formée d’un spécialiste en référence spatiale, d’un second en OLAP et d’un dernier dans le domaine d’application du cube spatial, ou d’un spécialiste à la fois en référence spatiale et en OLAP (c.-à-d. en SOLAP) et d’un autre dans le domaine d’application.

Dans le contexte de l’exemple présenté en début de section, un spécialiste en géomatique dédié à l’étape d’identification des risques pourrait détecter, en utilisant la typologie des risques présentée à la Figure 15, un risque lié à une évolution spatiale et sémantique des données sources : un pays, soit l’Ex.-U.R.S.S. a été scindé en 15 nouveaux pays en 1991. Cette évolution peut en effet rendre certaines comparaisons temporelles difficiles à effectuer (ex. : comparer le nombre d’étudiants qui ont fréquenté l’Université entre les périodes de 1985-1990 et 1990-1995) et ainsi demander une attention particulière aux utilisateurs lors de la construction de leurs requêtes. De plus, pour certains croisements (ex. : le nombre total d’étudiants provenant de Biélorussie pour les 20 dernières années), ce fait historique pourrait rester caché et ainsi conduire à une analyse incorrecte des données. Devant ces constatations, le spécialiste en géomatique pourrait ainsi juger que ce risque présente une « menace » raisonnable face à une utilisation appropriée du cube spatial, et qu’il mériterait conséquemment d’être étudié plus attentivement lors de l’étape subséquente du processus de gestion du risque, soit l’évaluation du risque.