La méthode MACAO-II - Td corrigé Publications

De nouvelles propositions, enrichissements et évaluations méthodologiques constituent la première facette des résultats établis avec MACAO-II, la deuxième, développée dans la partie suivante, portant sur la représentation des connaissances. Ainsi, la méthode MACAO-II fait des propositions sur la manière d’intégrer l’analyse de l’activité (§ 4.3.2.1). Elle précise comment le modèle peut guider l’acquisition avec la notion de schéma de modèle conceptuel (§ 4.3.2.2). La méthode a été mise en forme dans un document (§ 4.3.2.3). Elle permet de gérer de manière cohérente la construction du modèle et sa maintenance (§ 4.3.2.4). Enfin, elle s’ouvre à un nouveau type de sources de connaissances : la terminologie et les documents du domaine (§ 4.3.2.5).

1.12.2.1 Une approche ergonomique de l’activité

Les expériences menées avec MACAO, comme le projet SAMIE, ont permis de collaborer intensivement avec des ergonomes, de mettre en pratique un certain nombre de recommandations et pratiques liées à l’analyse de la tâche des spécialistes et des futurs utilisateurs et, par là même, de confirmer le caractère indispensable de ces études. En effet, le système à construire va s’intégrer dans l’activité de l’utilisateur et, à ce titre, le contexte d’usage doit être pris en compte dès la modélisation, soit pour faire un modèle spécifique (CommonKADS prévoit un modèle de l’organisation (Wielinga et al., 1992)) soit pour moduler le modèle conceptuel par les attentes de l’utilisateur et spécifier les interactions qu’il aura avec le système. La méthode MACAO-II recommande donc de mener très tôt l’analyse de la tâche des spécialistes et des utilisateurs à partir d’observations et de simulations, ainsi qu’une modélisation de l’organisation dans laquelle cette tâche se déroule. Elle donne également des indications en matière d’analyse de besoins.

Comme MACAO, la méthode MACAO-II insiste sur le fait que le modèle conceptuel produit soit compréhensible par les différents intervenants du projet. Pour cela, la représentation des connaissances proposée, MONA, cherche à faciliter la documentation précise du modèle ainsi que le suivi des différentes présentations des connaissances, leur trace, au cours de leur mise en forme, depuis leur formulation par l’expert jusqu’à leur opérationnalisation.

La partie conceptuelle des structures de représentation des connaissances favorise l’interprétation humaine et sert de support au dialogue entre expert, cogniticien et programmeur. La partie opérationnelle établit un lien entre le modèle et le code correspondant dans le système final, servant de référence commune au programmeur et au mainteneur.

Des principes d’ergonomie ont également été appliqués à la mise au point du guide méthodologique MACAO-II et du logiciel de modélisation lui-même. Le logiciel a fait l’objet d’une évaluation ergonomique qui a débouché sur l’ajout d’aides en ligne. Le guide présente les quatre grandes étapes de la méthode et leur réalisation sous forme d’une arborescence de tâches (IRIT-94-17-R, 94). La mise en forme de la méthode avait également bénéficié des efforts de présentation de ces caractéristiques dans le cadre de Sisyphus 2.

Dans le guide, chaque tâche est située dans son contexte de manière chronologique et par rapport à l’avancement de la modélisation. Toutes les tâches sont décrites de manière structurée selon un plan identique, incluant une phase de validation, et illustrées d’un exemple. Lorsqu’elles font appel au

101

logiciel associé, les fonctionnalités requises et leur mode d’utilisation sont présentés.

1.12.2.2 Évaluations expérimentales liées à MACAO-II

Ariane 4

Le premier retour d’expérience de MACAO-II sur des données réelles correspond à une application de diagnostic dans le domaine spatial, au sein du laboratoire ARAMIIHS. Un système d’aide au diagnostic a été développé en 1992 pour faciliter l’intégration et les tests de la case à équipements du lanceur Ariane 4. MACAO-II a été utilisé pour modéliser les connaissances de l’expert, expérience rapportée dans (Rapport-SOLER, 92]. La représentation des connaissances s’est faite à l’aide de schémas pour le raisonnement et d’un réseau conceptuel pour le domaine. La démarche adoptée suit le processus ascendant de MACAO-II. Un prototype du système a été développé puis validé opérationnellement. Ce projet a ensuite servi de terrain d’étude pour un projet sur l’apport des modèles conceptuels à la maintenance des systèmes à base de connaissances.

SADE

Les contrats liés à l’attribution de prêts immobiliers aux personnels des entreprises E.D.F. et G.D.F. et leur suivi sont gérés sous forme de dossiers. Si un contrat n’est plus honoré, le dossier est fermé. Il a été décidé de développer un système expert, SADE, pour capitaliser le savoir-faire des personnes chargées des dossiers fermés, leur permettre une meilleure analyse des dossiers en amortissement de prêts et mettre en oeuvre des procédures de recouvrement de créances mieux adaptées [Rapport-LÉPINE, 93]. Le traitement des dossiers ne nécessite pas seulement l'application de règles juridiques écrites (clauses du contrat de prêt et réglementation). Il s'appuie également sur l'expérience des experts. Il est aussi influencé par plusieurs aspects (social, politique et économique) du recouvrement des créances. L'expertise a été modélisée selon une démarche essentiellement basée sur MACAO-II mais reprenant aussi des résultats de KADS. L’analyse comparée des deux approches est développée dans [JAC, 94a] et reprise dans [Livre-AC, 96b]. Pour les besoins de ce projet, MACAO, jusque-là disponible sur station de travail SUN, a été porté sur PC.

Dans le projet SADE, la documentation juridique autant que les dossiers comportent une partie importante de la connaissance à modéliser et contiennent tout le vocabulaire du domaine. Ce projet était donc un terrain favorable pour expérimenter l’utilisation de logiciels de terminologie pour accélérer la modélisation du domaine et en définir la terminologie, tâche qui fait partie de la première étape de MACAO. Le projet ayant lieu dans le cadre d’une collaboration avec la DER d’EDF, un logiciel d’extraction de terminologie, LEXTER, basé sur des principes novateurs et tout à fait adapté au repérage des concepts d’un domaine, a aussi été utilisé. Le corpus analysé a été choisi en fonction de l’expertise à représenter. LEXTER s’est avéré un support très efficace pour réduire le temps consacré à l’inventaire, la structuration et à la définition des concepts du domaine nécessaires à la modélisation de l’expertise [JAC, 94b] repris dans [Livre-AC, 96b].

de connaissances

1.12.2.3 Expliciter une méthode de résolution de problème

La démarche préconisée par MACAO-II vise à produire des modèles conceptuels plus synthétiques que ceux qui sont obtenus avec MACAO.

L’accent est mis sur la caractérisation de la résolution de problème qui se traduit au final par la représentation explicite d’un modèle de tâches décrivant la ou les méthode(s) de résolution de problème adoptée(s). Pour parvenir à ce niveau de description plus abstrait, deux axes sont proposés, traduisant une influence des approches par réutilisation : d’une part, profiter des modèles existants quand leur réutilisation est possible ; et d’autre part, dégager les aspects génériques des modèles d’expertise via le schéma du modèle conceptuel. Le premier axe a consisté essentiellement en une confrontation de MACAO-II et CommonKADS, développée dans la partie suivante.

Clarifier la nature, le rôle et la manière d’obtenir le schéma de modèle conceptuel a été un moyen de préciser à la fois comment le modèle conceptuel peut guider le processus d’acquisition et en quoi consiste une caractérisation plus abstraite de la résolution de problème. Cette notion, introduite dans le cadre général de la modélisation conceptuelle dans [RIA, 92]

a été redéfinie au sein de MACAO-II [JAC, 94a]. Une étude plus complète sur sa construction et son utilisation dans MACAO-II est récapitulée dans la revue IJHCS [IJHCS, 94]. Elle s’appuie entre autres sur l’expérience ARIANE 4.

Modèle de

Figure 4.3.2 : Place du schéma du modèle conceptuel dans le processus de modélisation

Le Schéma du modèle conceptuel de MACAO-II est composé d’un Schéma du Modèle du Raisonnement et un Schéma du Modèle du Domaine (fig. 4.3.2).

Le Schéma du Modèle du Raisonnement est une représentation abstraite du raisonnement, non détaillée et plus ou moins indépendante du domaine de l’application, à rapprocher de la notion de méthode de résolution de problèmes utilisée dans KADS. Exprimé dans MACAO à l’aide de la structure de schémas, il est montré sous forme d'arbre. Le Schéma du Modèle du Domaine correspond à la partie abstraite du modèle du domaine, au réseau des concepts et relations sans leurs instances.

Cette notion a été reprise et clairement définie dans MACAO-II. Le modèle du raisonnement y est représenté sous forme d’un arbre de tâches et nouvelles connaissances dans la mesure où il permet d’identifier les lacunes et

103

de rechercher les éléments qui vont donner une cohérence et du sens au modèle.

1.12.2.4 Combiner approche ascendante et réutilisation

La complémentarité entre approche ascendante (MACAO-II) et réutilisation (KADS puis CommonKADS) a été analysée grâce aux trois projets Sisyphus 2, ARIANE 4 et SADE [EKAW, 94]. La démarche MACAO-II commence par la modélisation de résolutions de problèmes spécifiques. À partir de ces modèles, le cogniticien construit un modèle par catégorie de problème. Puis il doit parvenir à un modèle rendant compte de la démarche générale de résolution de problème. Ce processus d’abstraction en trois niveaux est représenté sur la figure 4.3.2.4. Selon MACAO-II, cette démarche ascendante peut être combinée à l’adaptation de modèles génériques proposés par KADS. Le processus d’abstraction impose de prendre le temps d’une analyse fine de l’activité experte, puis d’une étude précise des types de problème qu’il traite et de la manière dont il les résout. Ces tâches fournissent des éléments pour ensuite choisir et adapter avec plus de pertinence une méthode « générique » de résolution. La place accordée à ces recueils préalables centrés sur l’activité humaine et non sur des modèles a priori est une des originalités de MACAO-II.

La méthode se démarque des démarches descendantes qui caractérisent rapidement la tâche et ne recherchent des éléments d’expertise qu’en fonction des questions qui se posent au cours de l’adaptation d’une méthode

Figure 4.3.2.4 : Démarche ascendante et réutilisation dans MACAO-II. Les flèches sombres correspondent à un processus d’abstraction alors que les flèches

grisées matérialisent une adaptation pour la réutilisation.

1.12.2.5 Maintenance des modèles conceptuels et SBC

Le modèle de diagnostic pour les tests d’intégration de la case à équipement d’ARIANE 4 a été repris en 1993 en intégrant des résultats de KADS en vue d’étudier le problème de sa maintenance en lien avec celle du système opérationnel⁷. Un spécialiste des modèles de diagnostic de KADS a identifié au plus vite le type de diagnostic effectué dans cette application, puis

7 Ce travail a été réalisé en collaboration avec l’équipe fondatrice de KADS à l’Univ.

d’Amsterdam, dans le cadre d’un projet financé par un contrat avec la Région Midi-Pyrénées (MP-930, 94) et le programme « Sciences de la Cognition » (MEN-92-727, 94)

de connaissances

sélectionné un modèle de méthode de résolution de problème parmi les modèles disponibles dans la bibliothèque de CommonKADS [Rapport-BENJAMINS, 93]. Le modèle ainsi construit a été confronté à celui obtenu avec MACAO et présenté aux experts du domaine. Les deux modèles présentent des caractéristiques symétriques et complémentaires. Le modèle MACAO est très détaillé, concret, lié au domaine étudié et proche de la manière de raisonner des experts. Certaines étapes de raisonnement pourraient être regroupées ou généralisées. Le code est donc relativement morcelé. Le modèle obtenu avec KADS est très synthétique, plus abstrait mais les experts du domaine y reconnaissent difficilement leur approche. Il garantit une interprétation plus sûre par le cogniticien et permet d’organiser le code du système opérationnel.

Clairement, ce dernier modèle favorise mieux la maintenance que le premier.

Une étude bibliographique du processus de maintenance, jusque-là encore peu exploré, a été réalisée. L’objectif était surtout d’identifier les conditions dans lesquelles un modèle conceptuel facilite la maintenance du logiciel qu’il permet de réaliser, puis de préciser les propriétés qu’il doit vérifier. Il s’agissait de définir des outils, méthodologiques et logiciels, appropriés pour assurer un gain et non un coût supplémentaire au cours de la maintenance. Ce projet a comporté également une analyse psychologique de l’activité de mise à jour d’un modèle conceptuel. Cette étude a débouché sur un rapport de DEA [DEA-SILVIN, 94]. Surtout, elle a eu des conséquences sur la méthode MACAO-II autant que sur la plupart des choix faits dans MONA. Aux deux niveaux, les principes de représentation des connaissances et l'ajout de commentaires favorisent la traçabilité des connaissances ainsi que la caractérisation du raisonnement à un niveau plus abstrait.

Le modèle ARIANE 4 a finalement été repris avec le nouveau formalisme, MONA, de MACAO-II pour valider les capacités de représentation de la résolution sous forme de tâches.

1.12.2.6 Documents comme sources de connaissances

Le nouveau regard porté à partir de 1992 sur l’exploration de textes, considérés comme des sources de connaissances, à côté des coûteux entretiens avec les experts, a ouvert de nouvelles perspectives pour la mise au point d’applications à base de connaissances. Jusque-là, l’utilisation des textes comme sources de connaissances se faisait à l’aide de trois types de logiciel (Bourigault, 1994) : des outils de transfert, visant la production automatique de structures de connaissances à partir de textes, des outils hypertextuels de navigation dans les documents découpés en fragments, et enfin des outils de dépouillement permettant d’associer les textes aux modèles, à titre de documentation. Or aucun de ces choix n’est véritablement satisfaisant, et c’est la combinaison des trois types de fonctionnalité qui peut apporter une aide efficace à la modélisation à partir de textes. De plus, la focalisation sur la modélisation des connaissances du domaine concerné, et avec elle sur la maîtrise du vocabulaire associé, permet d’envisager l’utilisation d’outils linguistiques et d’approches terminologiques (Skuce et Meyer, 1991).

Ces logiciels facilitent une recherche focalisée des connaissances auxquelles la référence aux textes assure une plus grande validité.

Dans cet esprit, j’ai engagé deux types d’expériences autour de MACAO-II.

L’une, autour de l’identification du vocabulaire et des concepts du domaine, a consisté à évaluer l’apport du logiciel d’extraction de terminologie LEXTER. Pour l’autre, j’ai utilisé le logiciel COATIS qui permet de repérer des connaissances

105

causales à partir de textes afin de représenter des relations conceptuelles dans le modèle du domaine. L’ensemble de ces expériences a été possible grâce à plusieurs projets de collaboration avec la DER d’EDF (Clamart).

Ces deux initiatives ont fortement orienté la suite de mes recherches. Les perspectives ainsi ouvertes ont débouché sur les thèmes que j’ai développés à partir de 1995, et que je présente dans les chapitres suivants (5 et 6).

Extraction de terminologie et modélisation du domaine : LEXTER

LEXTER est un logiciel d’aide à l’acquisition et à l’interprétation de terminologie à partir de textes techniques. Ce logiciel réalise une analyse de corpus pour en dégager un ensemble de candidats termes, c’est-à-dire des groupes nominaux susceptibles de désigner des concepts du domaine (on se reportera à (Bourigault, 1994a ou 1994b) pour une présentation détaillée de son fonctionnement). Ces termes sont organisés au sein d’un réseau terminologique reflétant la manière dont ils entrent dans la composition les uns des autres. Une interface permet de naviguer dans ce réseau et de consulter la liste des termes produits selon différents critères numériques (fréquence ou productivité) ou syntaxiques (termes comportant un terme donné en tête ou comme complément). L’intérêt de ce logiciel est donc d’automatiser l’extraction des termes avec des résultats de qualité, mais aussi de faciliter l’exploitation des termes extraits grâce à l’interface de navigation.

Initialement conçu pour contribuer à la constitution et à la mise à jour de thesaurus, LEXTER a été utilisé à des fins d’acquisition de connaissances pour la première fois au sein du projet SADE, en conjonction avec la méthode MACAO. Le système Sade a pour vocation de fournir des connaissances pour guider la gestion de dossiers d’accession à la propriété en amortissement de prêts.

Cette expérience, récapitulée dans (Bourigault et Lépine, 1996), a montré comment LEXTER pouvait répondre à deux besoins liés à l’analyse de textes en acquisition des connaissances : (1) aide à la constitution de la terminologie du domaine ; (2) accès permanent et simple à la documentation du domaine. Elle a aussi permis de mettre en évidence différentes modalités d’utilisation des résultats de l’extraction terminologique. Lors de phases d’analyse ascendante des données identifiées, ce sont les fonctionnalités de dépouillement de LEXTER

qui sont utiles : les critères numériques permettent de lister les termes selon différents points de vue et d’opérer une sélection, de regrouper les termes synonymes ou encore des relations de généricité entre termes. Ces critères facilitent aussi le repérage de termes importants et pertinents pour le domaine. Lors des phases d’acquisition descendante, guidées par le modèle construit, LEXTER est utilisé comme outil de fouille. À partir de termes pertinents, le réseau terminologique permet de repérer des termes plus précis ou portant sur les mêmes éléments, ainsi que les termes co-occurrents (voisins en corpus), qui peuvent avoir des relations sémantiques avec les termes étudiés.

Ce projet a eu le mérite de poser les bases de démarches depuis développées au niveau national (au sein du groupe TIA en particulier) et international (Mikeev & Finch, 1995) (Ahmad & Holmes-Higgin, 1995) ou (Maedche & Staab, 2000). Ces différents modes d’utilisation ont été par la suite revus ou affinés, et peuvent nécessiter d’avoir recours à d’autres types d’outils ou d’analyses. En particulier, la phase de validation systématique de la liste des termes ne semble plus utile dans le cas de la construction de modèles.

Pour ce qui est de la fouille de texte, des logiciels comme les concordanciers ou

de connaissances

encore des systèmes de fouille automatique de textes sont tout à fait complémentaires.

Extraction de relations de causalité et modélisation du domaine : COATIS

COATIS est un outil d’aide au repérage d’expressions d’actions reliées par des relations causales dans les textes techniques en français (Garcia, 1996).

Les expressions d'actions ainsi trouvées constituent alors un index structuré du texte analysé. Pour cela, COATIS exploite le réseau de candidats à être des termes du domaine que produit l’extracteur de terminologie LEXTER à partir du texte. Mis au point par Daniela Garcia durant sa thèse, COATIS s'appuie d’une part sur un modèle en construction des relations causales telles qu’elles sont exprimées en français, et d’autre part sur la stratégie de l'exploration contextuelle. Deux expériences menées avec COATIS ont permis de montrer que ce système peut aider à l’acquisition des connaissances causales par exploration de textes, dans le cadre de la réalisation d'un modèle conceptuel.

Les résultats de COATIS facilitent d'abord la compréhension du domaine à partir d’une lecture focalisée des textes. De plus, COATIS fournit des éléments pour construire le modèle : il permet de relever des concepts saillants, d'identifier des actions associées à ces concepts, de trouver ou de vérifier des règles du domaine et, surtout, d'établir un réseau des causalités entre ces concepts [JAC, 96] et [Livre-IC, 00]. L'aide apportée par COATIS diffère selon la vocation du modèle construit. Dans le projet HYPERPLAN au cours duquel COATIS a été utilisé, le système visé aide à la consultation de documents textuels. Pour juger de l’intérêt dans le cadre de l’aide à la résolution de problème, ces résultats ont été confrontés à différents travaux utilisant des modèles causaux pour l’aide au diagnostic technique (Charlet et al., 1996).

1.12.3 Représentation des connaissances : du langage naturel au système

Dans le document Td corrigé Publications - TEL (thèses pdf (Page 103-109)