• Aucun résultat trouvé

Chapitre 6 : Ressources pour l’acquisition de connaissances relatives à la localisation temporelle

6.2.2 TKA, un système d’assistance à la saisie de dates et horaires d’ouverture

6.2.2.3 Fonctionnalités et Interfaces Utilisateurs

L’interface Web d’édition (cf. fig. 55), disponible en français et en anglais est répartie en trois zones (widgets) : une zone pour la saisie en langage naturel des périodes d’accessibilité (cf. fig. 56), (2) une zone pour l’affichage des périodes d’accessibilité sur un agenda numérique (cf. fig. 57) et (3) une zone de contrôle pour lancer l’annotation et stocker les périodes d’accès dans la base de connaissances (cf. fig. 58).

166

Fig. 56 : la zone de saisie en langage naturel des périodes d’accès

Le calendrier où sont projetés les résultats de l’analyse est éditable : un utilisateur peut ainsi par exemple y modifier un horaire ou y ajouter un jour d’ouverture ou de fermeture. Le texte initialement saisi est alors automatiquement mis à jour. Un opérateur peut ainsi, à travers le calendrier, préciser que le samedi 1er mai est un jour de fermeture. La phrase suivante « Fermé samedi 1 mai 2010. » est alors automatiquement générée et ajoutée à l’énoncé initial.

L’utilisateur peut donc jongler entre deux manières de définir des périodes d’accessibilité, qui chacune renvoie à un modèle qui lui est propre : le texte et le calendrier. Les informations ajoutées directement sur le calendrier définissent toujours des périodes d’accès non itératives (fermé le 1er mai 2012, par exemple) : on ne peut pas, via le calendrier, préciser par exemple qu’un site est fermé le 1er mai chaque année ; pour cela, il faut modifier directement le texte (« Fermé le 1er mai »). Après la saisie, les données sont stockées au format RDF défini plus haut.

167

Fig. 57 : Visualisation correspondant à la période d’accès « Ouvert du mardi au samedi, de 10h à 19h et le dimanche, de 13h à 19h. Fermé les 1er et 8 mai. » pour la semaine du 30 avril au

6 mai 2012

Le panneau de contrôle (cf. fig. 58) contient trois onglets : l’un pour exécuter l’annotation du texte saisi, l’autre pour étendre sur une fenêtre de temps des horaires définis directement sur l’agenda et le troisième pour l’export et le stockage des informations.

Fig. 58 : panneau de contrôle

Il est possible également de définir les horaires d’accessibilité pour une semaine type, en utilisant l’agenda numérique, et d’étendre ensuite cette semaine sur une fenêtre de temps donnée. Un texte est alors généré qui reflète l’information saisie sur l’agenda. Ce mode de saisie est plus simple

168

lorsqu’il s’agit par exemple de définir les horaires de séances de cinéma. Voici un exemple de texte généré après une saisie sur l’agenda numérique, étendue ensuite sur une plage d’un mois du 30 avril 2012 au 30 mai 2012 :

du 30 avril 2012 au 30 mai 2012 : - lundi, de 10h à 11h30, de 13h à 14h30 - mercredi, de 12h à 13h30, de 15h à 16h30.

Ce prototype montre ainsi comment il est possible d’exploiter la sémantique des adverbiaux de localisation temporelle dans un cas d’application industriel. Le système permet de faciliter la saisie d’informations complexes, en évitant aux opérateurs de passer par de nombreux formulaires. Il permet aussi de stocker l’information dans un réseau sémantique réduit et d’exporter ensuite ces connaissances dans d’autres formats (iCalendar notamment) pour interagir avec des systèmes d’indexation et de recherche d’information.

Le système peut s’intégrer dans une chaîne de traitement semi-automatique, où seules les définitions de dates et horaires d’accessibilité dont l’analyse est incohérente feraient l’objet d’une intervention manuelle. La détection des incohérences dans l’analyse devient alors centrale, car elle permet d’isoler deux sous-ensembles, celui des énoncés définissant des périodes d’accessibilité bien transformés et ne nécessitant pas d’intervention manuelle et celui des énoncés mal transformés nécessitant une intervention manuelle. Il s’agit alors de privilégier la précision du système, afin qu’il délivre des informations sûres.

Les incohérences d’analyse peuvent être détectées à différents niveaux : durant la phase d’annotation, durant la phase d’instanciation d’un réseau sémantique ou encore durant la phase de transduction vers le format iCalendar. Nous avons ainsi mis en œuvre quelques règles simples pour détecter de telles incohérences : (1) repérage des portions de texte non annotées contenant des informations calendaires, (2) repérage de structures RDF non-conformes, (3) repérage des sorties iCalendar où des plages horaires se chevauchent.

L’industrialisation du prototype appelle ainsi des développements dans deux directions principales : l’amélioration de la détection des incohérences et l’interfaçage avec une base de connaissances, afin que le système puisse prendre en compte des informations faisant appel à des connaissances externes (pour résoudre les jours fériés variables, pour prendre en compte la notion de saisonnalité ou encore associer des dates précises aux périodes de vacances, par exemple).

6.3 Bilan du chapitre

Nous avons présenté dans ce chapitre une série de composants logiciels permettant d’effectuer des traitements sur les adverbiaux de localisation temporelle. Le composant d’annotation permet de repérer et d’annoter dans des textes en français et en anglais certains des adverbiaux de localisation temporelle (en premier lieu les adverbiaux calendaires et les adverbiaux déictiques). L’annotation s’effectue au moyen de grammaires Unitex. Nous avons également spécifié un langage d’annotation,

169

ChronolocationML (cf. annexe 2), reflétant le modèle formel qui représente les adverbiaux sous la forme d’une succession d’opérations sémantiques sur une base. A partir des annotations ou métadonnées posées dans les textes, il est possible d’instancier un modèle objet des adverbiaux de localisation temporelle et de les transposer sous la forme d’intervalles calendaires.

On a vu, sur un cas d’utilisation précis, en présentant un système facilitant la saisie de dates et horaires d’accessibilité d’un service, comment cet ensemble d’outils pouvait être utilisé dans une application dédiée à l’enrichissement d’une base de connaissances.

Le chapitre suivant décrit un moteur de recherche expérimental qui s’appuie également sur cet ensemble d’outils pour offrir des services de recherche d’information en mesure de traiter des requêtes combinant des mots-clés et des critères calendaires.

171