• Aucun résultat trouvé

Implémentation du système d’évolution de RTO

Durant ce travail de thèse nous avons réalisé trois versions de DYNAMO SMA et de

DYNAMO Corpus Analyser. Les agents de DYNAMO MAS ont été développés avec la

plateforme MAY : Make Agents Yourself2[Noel et al., 2010] présentée dans la section 3.2.2 du

chapitre 3 de l’état de l’art.

5.3.1 Les trois versions de DYNAMO

DYNAMO V1 comporte les fonctionnalités de base nécessaires au fonctionnement de

l’outil d’évolution de RTO. Nous n’avons implémenté que les comportements nominaux des agents termes et des agents concepts de DYNAMO MAS. Cette première version permet de vérifier que l’AMAS atteint son adéquation fonctionnelle et que la traduction des rela- tions lexicales en leur équivalent conceptuel se déroule convenablement. Dans cette version de DYNAMO MAS, nous avons implémenté des formules de pertinence moins élaborées que celles présentées dans le chapitre 4 de la thèse. Pour se proposer un agent terme doit avoir une relation lexicale dont la valeur de qualité Q dépasse la moyenne 5 et un agent concept doit avoir une relation conceptuelle dont la valeur de qualité Q dépasse la moyenne 5.

Dans DYNAMO Corpus Analyser nous avons intégré le module d’extraction de termes YaTeA ainsi que l’extraction de relations lexicales avec : (i) l’analyse de dépendances syn- taxiques entre candidats termes pour identifier des relations d’hyperonymie et (ii) le méca- nisme de calcul de similarité entre les termes et les candidats termes utilisant la distance de [Levenshtein, 1966]. Nous avons aussi implémenté une étape d’élimination des candidats termes grâce aux critères morphosyntaxiques et grâce au critère du contexte.

DYNAMO V2est la deuxième version contenant des améliorations du fonctionnement de DYNAMO MAS et du DYNAMO Corpus Analyser. Nous avons implémenté les méca- nismes d’auto-organisation permettant aux agents termes de changer de voisinage ainsi que la formule de calcul de pertinence d’un agent terme. Nous avons implémenté le mécanisme nommé "informer son voisinage de la qualité de sa position" et "déplacement d’un agent concept par relations transverses" et modifié la formule de calcul de pertinence d’un agent concept. Dans DYNAMO Corpus Analyser nous avons ajouté le mécanisme d’élimination des candidats termes lorsqu’ils comportent des termes associés à des concepts de catégories qui ne peuvent pas être associées. Nous avons également ajouté le mécanisme de radicali- sation [Porter, 1980] dans le calcul de similarité entre les termes et candidats termes. Enfin, nous avons défini d’autres critères morpohosyntaxiques pour détecter et éliminer des can- didats termes erronés.

DYNAMO V3est la troisième amélioration de DYNAMO. Nous avons implémenté les

règles de détection et d’élimination des agents inutiles pour simplifier la hiérarchie dans les agents termes et les agents concepts de DYNAMO MAS. Dans le module DYNAMO Cor-

pus Analysernous avons ajouté l’extraction de relations lexicales à l’aide des dictionnaires

sémantiques WordNet et Wolf.

5.3.2 Scénario d’utilisation de l’outil DYNAMO

L’outil DYNAMO complète l’outil d’annotation de fiches TextViz. L’ajout de nouveaux documents au corpus déclenche le fonctionnement de DYNAMO. Les nouveaux documents sont envoyés à DYNAMO Corpus Analyser pour être analysés. Dans un premier temps, l’ensemble du texte contenu dans les champs à annoter est extrait. Ensuite, ces textes sont scindés dans un seul fichier et transmis au module d’extraction de candidat termes YaTeA.

YaTeAextrait alors les candidats termes et réalise l’analyse de dépendances syntaxiques

entre candidats termes. Ensuite, la liste des candidats termes est filtrée. Les candidats termes erronés sont détectés grâce à des critères morphosyntaxiques et au mécanisme de suppres- sion des candidats termes contenant des termes associés à des concepts de catégories qui ne peuvent pas être associées. A partir de cette nouvelle liste, le module d’extraction de rela- tions lexicales de DYNAMO Corpus Analyser identifie d’autres relations lexicales. Toutes les relations lexicales ainsi que la liste des candidats termes sont utilisées par le module de filtrage. Une nouvelle liste de candidats termes filtrés ainsi que les relations lexicales impli- quant ces candidats termes sont envoyées au module DYNAMO MAS.

Lors du lancement d’un projet avec TextViz, le fichier OWL de la RTO est transmis à DY-

NAMO MAS. Les candidats termes sélectionnés par DYNAMO Corpus Analyser et trans-

mis à DYNAMO MAS sont alors agentifiés et les relations lexicales à traiter sont transmises aux agents termes concernés. A chaque fois qu’un agent terme ou un agent concept dépasse le seuil de proposition, il envoie une proposition au gestionnaire des propositions. Lorsque l’activité de DYNAMO MAS se stabilise, les propositions sont réorganisées par le gestion- naire des propositions. Une nouvelle RTO exprimée en OWL et enrichie par ces propositions est envoyée à l’interface graphique de l’outil TextViz. Le bouton AMAS au niveau de l’inter- face graphique de TextViz est alors activé (voir figure 5.15). Lorsque l’ontographe clique sur ce bouton (Ê), la nouvelle RTO enrichie s’affiche.

Figure 5.15 — Bouton AMAS active suite à l’envoie de propositions de DYNAMO MAS

à l’interface de TextViz.

Les nouveaux concepts apparaissent soulignés dans le panneau des concepts (Ë) et les nouveaux termes sont ceux soulignés dans le panneau des termes (Ì). Afin de visualiser ces propositions nous avons utilisé l’outil PROMPTDIFF [Noy et al., 2004] (permettant la visua- lisation des liens entre deux versions d’une ontologie) que nous avons modifié pour per- mettre d’afficher la différence entre deux versions d’une RTO. Un deuxième onglet rajouté à Protégé et nommé DYNAMO - Virtual Ontologist Propositions (Í) permet de visualiser dans un tableau les propositions de DYNAMO MAS. L’ontographe valide, supprime et/ou modifie les concepts (Î) et les termes (Ï) proposés par DYNAMO MAS grâce à l’interface graphique (figure 5.16).

Figure 5.16 — Interface graphique de l’outil TextViz avec le système DYNAMO.

L’ontographe a la possibilité de voir les fiches dans lesquelles les termes proposés par

DYNAMO MASont été trouvés. Pour cela, l’ontographe clique sur un terme souligné. Par

exemple, dans la figure 5.16, la fiche contenant le terme Code incoherence est sélectionnée et affichée permettant ainsi d’aider l’ontographe à prendre la décision de garder une propo- sition, de la modifier ou de la supprimer. En validant une proposition, cette dernière n’est plus soulignée et prend la même couleur que les éléments de la RTO.

Lorsque toutes les propositions ont été traitées par l’ontographe, ce dernier sauvegarde la RTO en cliquant sur le bouton de sauvegarde (Ê) (voir figure 5.17). Il relance ensuite l’indexation des nouveaux documents en cliquant sur le bouton d’indexation (Ë).

Figure 5.17 — Boutons de sauvegarde et d’indexation des fiches dans l’interface de l’outil

TextViz.

Afin de valider notre travail, nous avons réalisé deux types d’évaluation : (i) une éva-

luation de la qualité des propositions, pour juger de la pertinence des propositions d’évo-

lutions de la RTO ; et (ii) une évaluation des performances de l’AMAS pour démontrer les propriétés liées aux SMA en général et à l’approche par AMAS en particulier.

Nous présentons maintenant ces évaluations, les résultats obtenus ainsi que leurs ana- lyses.