Consultation du contenu - Études de cas de diffusion de données géospatiales

3.1 Études de cas de diffusion de données géospatiales

3.2.1 Consultation du contenu

Comme nous voulions faciliter la rédaction des rapports, il importait de bien comprendre comment ceux-ci étaient construits et d‟où provenait l‟information qu‟on y trouvait. Au cours de la lecture du rapport, nous nous sommes intéressés aux éléments qui portaient sur la qualité externe des données, mais nous avons réalisé qu‟il fallait connaître la qualité interne des données afin d‟évaluer

MTQ CIT-S

● Données provinciales (Québec) ● Données provenant de différents

fournisseurs

● Aucune norme utilisée ● Très peu de métadonnées

● Projet de politique de diffusion des

données géospatiales

● Préoccupés par l‟usage prévu des

données

● Données fédérales (Canada) ● Données provenant de l‟interne

● Norme ISO-19115 PNA, Norme FGDC ● Beaucoup de métadonnées

● Sont intéressés à intégrer l‟information sur la

qualité d‟un point de vue producteur

● Préoccupés par l‟usage prévu des données

leur qualité externe. Le rapport listait une série de faits jugés pertinents par les auteurs, faits qui ont été examinés pour savoir s‟ils avaient été évalués avec des informations :

a) uniquement contenues dans les métadonnées et ne nécessitant pas d‟interprétation de la part du rédacteur du rapport;

b) partiellement contenues dans les métadonnées, ou entièrement contenues dans les métadonnées mais qui nécessitent une interprétation de la part du rédacteur du rapport; c) autres, c‟est-à-dire obtenues par tout autre moyen que via les métadonnées.

La raison pour laquelle nous avons effectué cette classification visait à évaluer la pertinence d‟automatiser la création des rapports de qualité à partir des métadonnées. En effet, nous étions conscients qu‟il était impossible d‟automatiser à 100% la génération de ces rapports, cependant, nous voulions voir dans quelle mesure nous étions capables d‟aider à la rédaction et dans quelle mesure les métadonnées contribuaient au rapport. Le tableau 3 montre la répartition des faits pertinents recensés dans le premier rapport étudié, soit celui du CRG. Les colonnes « a, b, c » réfèrent à la classification de la provenance des informations qui a été précédemment présentée. Il est à noter que ce rapport évaluait plusieurs besoins du client à l‟aide de plusieurs jeux de données différents, et visait à déterminer lequel des jeux de données étudiés permettait le mieux de répondre aux besoins du client. Dans les statistiques que nous présentons, les dictionnaires de données ont été considérés comme des métadonnées, étant donné que la solution que nous proposions visait à utiliser ces deux types de documentation. On remarque que la plupart des faits pertinents proviennent soit de la consultation des métadonnées ou de l‟affichage des géométries dans une interface cartographique.

Provenance des faits pertinents a b c Total

Consultation des métadonnées 3 22 0 25

Consultation de la structure des données 0 3 0 3

Consultation des données descriptives 0 1 2 3

Affichage des géométries 0 8 19 27

Représentation des données 0 3 6 9

Tests effectués sur les jeux de données 0 1 5 6

Information sur un objet en particulier5 ₀ ₀ ₁ ₁

Total 3 38 33 74

Tableau 3 : Résultat de l'analyse des critères de qualité pour le rapport du CRG (Gervais et al., 2007) en fonction de la provenance des informations

Les faits pertinents qui proviennent des métadonnées et qui auraient pu être lus automatiquement par un outil aidant à la rédaction de rapports qualité ne sont qu‟au nombre de 3 sur 74 (cf. colonne

a), ce qui représente un maigre pourcentage de 4% des faits pertinents, ce qui vient également

confirmer notre décision d‟abandonner cette solution. Cependant, si on considère le nombre total de faits pertinents identifiés par les auteurs du rapport, on se retrouve avec un nombre de 41 (3+38) sur 74, ce qui représente un pourcentage de 55%, ce qui devient beaucoup plus important. Comme nous n‟avons pas accordé de pondération à l‟importance de ces faits pertinents, nous ne pourrions affirmer que 55% des informations portant sur la qualité proviennent des métadonnées, mais il s‟agit sans doute d‟une proportion non négligeable. Il n‟a pas été possible de réaliser exactement la même classification pour les faits pertinents présentés dans le rapport réalisé par la compagnie intelli3_étant donné qu‟ils n‟étaient pas classés de la même façon, la demande du client étant différente et plus détaillée. Cependant, nous nous attendions à des proportions semblables d‟autant plus que les jeux de données évalués étaient les mêmes que pour le premier rapport, de même que le client. Le tableau 4 présente le classement des faits pertinents pour le rapport produit par la compagnie intelli3. Les méthodes d‟évaluation indirecte s‟utilisent en consultant la documentation, tandis que les méthodes directes nécessitent de manipuler les données.

Provenance des faits pertinents a b c Total

Documents et métadonnées consultés 6 14 0 20

Inventaire du contenu des jeux de données 0 3 0 3

Méthodes d‟évaluation indirecte – critères qualitatifs 0 12 0 12 Méthodes d‟évaluation indirecte – critères quantitatifs 1 15 0 16 Méthodes d‟évaluation directe (à partir des données) 0 11 49 60

Total 7 55 49 111

Tableau 4 : Résultat de l'analyse des critères de qualité pour le rapport d’intelli3_(intelli3_,_{2010) en} fonction de la provenance des informations

On retrouve encore une fois un nombre très faible de faits pertinents qui s‟interprètent automatiquement dans les métadonnées. Ces faits concernent des formats de fichier ou des valeurs quantitatives telles qu‟une date de mise à jour. Par contre, tout comme pour le rapport du Centre de recherche en géomatique, on se retrouve avec un pourcentage de faits pertinents nécessitant la consultation des métadonnées supérieur à 50%, soit 56% (55 + 7 / 111). Cela confirme donc l‟utilité des métadonnées pour l‟évaluation de la qualité dans les deux cas, et ce pour des besoins formulés différents.

Les faits jugés pertinents recensés par les auteurs du rapport ont servi à formuler des constats permettant d‟émettre une opinion sur la propension des données à satisfaire un besoin formulé, constats qui provenaient en partie de faits obtenus à partir des métadonnées. Nous n‟avons pas cherché à évaluer dans quelle mesure chacun des faits pertinents contribuaient aux constats, mais cela a permis de confirmer que plusieurs informations étaient nécessaires afin de se prononcer sur la qualité des données.

Dans le document Nouvelle méthode pour mieux informer les utilisateurs de portails Web sur les usages inappropriés de données géospatiales (Page 66-69)