L’application Web permettant l’accès aux métadonnées

Les choix d’implémentation effectués au chapitre 4 nous permettent de construire une base de métadonnées “documentaire” et une base de connaissances. Il nous faut à présent permettre l’accès et l’exploitation de ces bases.

Après avoir présenté l’architecture générale de notre application d’accès aux métadonnées section 5.1, nous en décrivons plus particulièrement les aspects “SI” et “SBC” sections 5.2 et 5.3. Nous montrons ensuite section 5.4 comment nous mettons en œuvre quelques-uns des exemples de raisonnement ER vus au chapitre 3. Section 5.4, nous tentons de cerner quelques-unes des limites de l’application construite.

5.1 Architecture de l’application

Nous d´eveloppons une application Web accessible depuis l’intranet de l’IGN. Nous adoptons une architecture Web classique “n-tiers” :

L’utilisateur dispose d’un ordinateur équipé d’un navigateur Web standard et connecté au réseau intranet de l’IGN. Via le protocole HTTP, l’utilisateur accède aux pages HTML de l’application, soumet de requêtes et transmet des données au serveur Web.

Le serveur Web re¸coit les requêtes de l’utilisateur. Il les reformule et les transmet au serveur d’application. Le serveur d’application renvoie la réponse au format XML. Le serveur Web effectue la mise en forme en transformant le XML en HTML qui est alors envoyé à l’utilisateur. Le rôle du serveur Web se limite à générer du HTML à partir des réponses XML fournies par le serveur d’application.

Le serveur d’application effectue toutes les opérations sur les métadonnées autres que leur mise en forme : exécution des requêtes, adaptation des modes d’emploi, vérification de la conformité de la base de métadonnées au modèle, pont entre les formalismes SI et SBC. Le serveur d’application peut être découplé en plusieurs serveurs d’application distincts, éventuellement répartis sur des machines distantes.

Les serveurs de données stockent les bases de métadonnées “SI” et “SBC”. Par choix de simplicité, nous n’avons en fait pas réellement mis en place de serveur, du moins pas qui utilise un protocole du Web. L’accès aux bases de métadonnées s’effectue en effet par simple chargement de fichiers. Cette solution préserve la philosophie de l’architecture souhaitée, à savoir que la base de données soit dissociée de l’application. Une nouvelle application doit-elle

accéder aux métadonnées ? Elle le peut, indépendamment des applications existantes.

La figure 5.1 illustre l’architecture que nous avons mise en place. Les flèches entre les parties du système signifient “interagit avec”. L’application Consul apparaˆıt en grisé car nous ne l’avons pas développée. Elle ne faisait pas partie de nos objectifs, mais nous devions prendre en compte son existence future. Il est en effet prévu que notre serveur de métadonnées des traitements soit intégré à une plateforme plus large dédiée également aux métadonnées sur les données géographiques et au calcul de tâches (projet de l’action de recherche Consul dans laquelle s’inscrit notre travail). Ceci, entre autres, explique pourquoi serveur d’application et serveur Web sont séparés : les métadonnées des traitements ne doivent pas seulement être fournies au format HTML mais aussi au format XML. Cette séparation rend ainsi aisée, par exemple, la construction d’un service Web SOAP dont les réponses encapsuleraient nos métadonnées au format XML.

Fig. 5.1 – Architecture de l’application d’accès aux métadonnées

Aucune partie de notre application n’est liée à un système d’exploitation particulier. Les parties “SI” et “SBC” du serveur d’application reposent sur différentes API Java ; la machine virtuelle Java JRE 1.5.0 (alias Java 2 version 5.0) est utilisée. Les servlets Java développés fonctionnent avec Tomcat 5.5. Les pages Web statiques de l’application sont fournies par un serveur de pages Web Apache 1.3.27.

5.2 L’application d’accès aux métadonnées – aspect “SI”

Après avoir succinctement indiqué nos principaux choix techniques concernant l’aspect SI de notre application, nous présentons cette dernière en suivant le point de vue de l’utilisateur.

5.2.1 Choix d’impl´ementation – aspect “SI”

Pour manipuler les différents formats de données nous faisons appel à diverses API Java. En particulier, pour manipuler les documents XML nous utilisons l’API standard Jaxp (Java API for XML Processing). Cette API nous permet d’utiliser XSLT et XPath.

XSLT (eXtensible Stylesheet Language Transformation) est le langage standard de transfor-mation de documents XML. XPath est le langage qui permet d’adresser les ´el´ements du

docu-ment XML à transformer. XSLT et XPath sont des recommandations W3C dont les premières versions ont été rendues publiques en 1999 [W3C99b][W3C99c].

Nous nous servons d’XPath comme d’un langage de requêtes, de la même fa¸con que nous pourrions utiliser SQL si nos métadonnées étaient stockées dans une base de données relation-nelle.

XSLT est un langage fonctionnel. Il est bien adapté à l’implémentation d’algorithmes récursifs. Nous en mettons en œuvre dans de nombreux endroits de l’application, pour générer des fichiers d’index inversés1, des fichiers retrouvant les types parents ou sous-types des ressources (cf. l’exemple des modes d’emplois code A.4 p. 234), des pages HTML représentant des arbres XML dont on ne connaˆıt pas à l’avance la profondeur (cf. fig. 5.6, 5.12 et 6.8 p. 186, 199 et 220). D’une fa¸con générale, les structures arborescentes se prêtent bien à la récursion. Pour développer nos servlets nous utilisons le package javax.servlet. De fa¸con annexe, nous nous assurons de la validité de notre base de métadonnées vis-à-vis du schéma XML avec XML Spy 2005, outil qui implémente toutes les spécifications W3C relatives aux éléments du langage que nous utilisons. Nous effectuons également des contrôles supplémentaires. Néanmoins, en théorie, la saisie via l’application ne permet pas d’enregistrer de description invalide.

5.2.2 Navigation et recherche dans la base de m´etadonn´ees

Notre application de consultation des métadonnées se présente à l’utilisateur sous la forme d’un site Web. L’utilisateur y accède avec un navigateur Web standard, via l’Intranet de l’IGN. La figure 5.2 est une copie d’écran de la page d’accueil. La barre de navigation, située à gauche, offre plusieurs fonctionnalités :

– Le lien “Navigation dans les index” mène au diagramme de la page d’accueil (dont les éléments sont cliquables).

– Le lien “Soumettre une requête” mène au formulaire montré fig. 5.9 p. 193. L’utilisateur ne fait que remplir ce dernier, il n’utilise aucun langage de requête (i.e. il ne saisit pas d’expression de langages comme SQL ou XPath).

– Le lien “Statistiques” mène à la page montrée fig. 5.4.

– Le lien “Index de toutes les ressources” mène à la liste alphabétique de toutes les ressources indexées dans la base de métadonnées.

– Le champ “Rechercher” permet d’effectuer une recherche plein-texte dans la base de m´etadonn´ees.

La partie “Acquisition” sera discut´ee au chapitre 6.

La figure 5.3 montre le résultat de la sélection de “Ensemble de traitements” puis de “Logi-ciel/SIG” : la liste de ces derniers est affichée. La liste peut être triée en prenant comme critère les propriétés affichées (les têtes de colonnes “nom”, “(domaine de) fonctionnalités”, etc. sont “cliquables”) ou celles proposées dans la liste déroulante en haut de l’écran. Remarquons que les flèches situées à gauche des noms de ressources permettent d’en visualiser une courte description. Les RessourcesTraitements mises à part, la plupart des ressources de notre base de métadonnées sont reliées entre elles par des relations de spécialisation. Lors de la navigation dans les index, il est possible de visualiser les taxinomies constituées sous forme arborescente. La figure 6.1 p. 214 montre un écran affichant la liste des fonctionnalités sous cette forme. Ce

1Le principe est simple : étant donné un ensemble d’index décrivant les relations entre ressources, on construit de nouveaux index décrivant les relations inverses. Typiquement, partant de pages Web contenant des listes de mots, on construit les index inverses qui décrivent pour chaque mot les pages Web qui les contiennent.

Fig. 5.2 –Page d’accueil de l’application

Fig. 5.4 – Affichage de statistiques – G´en´eration dynamique de camemberts JChart

type d’écran est généré dynamiquement avec des feuilles XSL dont les templates parcourent récursivement la hiérarchie des ressources (chaque ressource n’indiquant que son parent direct). L’utilisateur peut naviguer dans les index ; il peut aussi soumettre des requêtes. Celles qui s’effectuent via le formulaire proposé sont traitées par la partie SBC de l’application. Celles qui reposent sur la soumission de mots-clés sont plus simples, elles reposent sur la simple recherche plein-texte. Le résultat est la liste de toutes les ressources dont n’importe lequel des éléments de description contient la chaˆıne de caractère soumise par l’utilisateur. Un des obstacles de ce type de recherche réside dans les problèmes de synonymies ou de multilinguisme. Notre application permet de le surmonter en partie. Voici un procédé s’appliquant de fa¸con générique. L’utilisateur pensant avoir un problème de vocabulaire pour utiliser les bons termes de recherche peut consulter la description des concepts décrits dans la base de métadonnées. Par exemple, l’utilisateur recherche un programme de détection de talwegs. S’il soumet le mot-clé “talweg” le résultat de la recherche ne comportera aucun traitement, mais comportera en revanche le concept “relief”. L’utilisateur demande alors de visualiser la description de ce concept. La liste de toutes les ressources liées s’affiche. Parmi elles figure le programme “caractérisation des MNT”, qui répond au besoin de l’utilisateur.

Dans notre contexte, la question du tri des résultats en fonction de la popularité des res-sources est un aspect secondaire. Nous n’avons pas cherché à le traiter. Néanmoins, si les utili-sateurs le souhaitaient, il n’y aurait aucune difficulté à proposer un tri des résultats en fonction du nombre de ressources dont la description “pointe” vers les ressources recherchées (“popula-rité d’après les métadonnées”), ou un tri en fonction du nombre de “clics” effectués depuis une période donnée par les utilisateurs, indice éventuellement pondéré par l’ancienneté de l’accès ou le profil des utilisateurs2 (“popularité d’après les utilisateurs”).

2L’identité des utilisateurs est connue. Les servlets de notre application gardent une trace de leurs actions dans des fichiers log. Étant dans un contexte Intranet, nous avons stocké la table de correspondances entre les noms des

5.2.3 Visualisation des descriptions de traitements

A partir des listes de ressources obtenues par un des modes de recherche évoqués, l’utilisateur accède à la description d’une ressource particulière. La description du programme Accordéon v.2 telle qu’elle apparaˆıt à l’utilisateur est montrée figure 5.5.

Les pages de descriptions de RessourceTraitement sont organisées selon les cinq facettes qui structurent notre modèle conceptuel. Chaque facette est signalée par une barre horizontale bleue. Les descriptions comportent une sixième barre nommée “Ressources liées”, représentant la partie où sont listées toutes les ressources qui font référence à la ressource courante. Par exemple, à la fin d’une description d’une librairie se trouvent indiquées toutes les RessourceTraitement qui l’utilisent. Ce type d’information est simple mais précieux.

Pour plus de la moitié des éléments de description, les valeurs sont des références à des ressources. De fa¸con systématique, ces valeurs apparaissent sous forme de lien hyper-texte (en bleu, ou en violet pour les liens déjà visités)3. Les autres valeurs, de type simple (texte, nombres entiers et réels, date, booléens) apparaissent sous forme de texte simple (en noir). Les illustrations sont un cas particulier. Certaines ne sont que des images raster non indexées en tant que ressources. C’est le cas de l’image, figure 5.5, où les routes sont symbolisées en rouge. D’autres illustrations, au contraire, sont des ressources de type Echantillon. Certains échantillons sont de simples images raster (au format bitmap, GIF, Jpeg ou PNG). Les autres échantillons – il est important de le souligner – sont des jeux de données réels au format shape. C’est le cas des deux échantillons qui illustrent la description du programme Accordéon 5.5. Le jeu de données avant traitement est issu de la version d’octobre 2002 de la BD Carto et représente des routes de la région de Nice. Il a été généralisé avec le module AGENT du SIG Lamps2 en février 2006 ; Accordéon est un des programmes qui a été appliqué. Les jeux de données sont stockés dans la base de métadonnées. Ils sont visualisés dans les pages HTML de notre application grâce à des applets⁴ Java Geotools inclues dans des frames HTML.

utilisateurs et le nom ou l’IP fixe de leur machine, ces derniers étant récupérés par les servlets avec la méthode getRemoteHost() de l’objet HttpServletRequest créé à chaque accès à une page de l’application (pour les pages statiques comme la page d’accueil, l’utilisateur est au préalable redirigé automatiquement vers un servlet dédié au log grâce à une instruction Javascript location.replace(page )).

3Les propriétés des données sont des éléments de descriptions, mais ce sont aussi des ressources. Elles sont donc représentées par des liens hypertextes menant à leur description.

4appl ication widget, un widget étant un élément graphique d’interface (contraction de windows gadget, mais néanmoins utile ici).

Dans le document Conception et exploitation d'une base de métadonnées de traitements informatiques, représentation opérationnelle des connaissances d'expert -- Application au domaine géographique (Page 194-200)