Book Chapter
Reference
Arbre BIC optimal et taux d'erreur
RITSCHARD, Gilbert
Abstract
Nous reconsidérons dans cet article le critère BIC pour arbres d'induction proposé dans Ritschard et Zighed (2003, 2004) et discutons deux aspects liés à sa portée. Le premier concerne les possibilités de le calculer. Nous montrons comment il s'obtient à partir des statistiques du rapport vraisemblance utilisées pour tester l'indépendance ligne-colonne de tables de contingence. Le second point porte sur son intérêt dans une optique de classification. Nous illustrons sur l'exemple du Titanic la relation entre le BIC et le taux d'erreur en généralisation lorsqu'on regarde leur évolution selon la complexité de l'arbre. Nous esquissons un plan d'expérimentation en vue de vérifier la conjecture selon laquelle le BIC minimum assurerait en moyenne le meilleur taux d'erreur en généralisation.
RITSCHARD, Gilbert. Arbre BIC optimal et taux d'erreur. In: Extraction des connaissances : Etat et perspectives . Toulouse : Cépaduès, 2006. p. 403-408
Available at:
http://archive-ouverte.unige.ch/unige:4526
Disclaimer: layout of this document may differ from the published version.
Revue des Nouvelles Technologies de l’Information
Sous la direction de Djamel A. Zighed et Gilles Venturini RNTI-E-5
Extraction des connaissances : Etat et perspectives
Rédacteurs invités : Florence Cloppet
(Laboratoire CRIP5-SIP, Université René Descartes, Paris) Jean-Marc Petit
(Laboratoire LIMOS, Université Blaise Pascal, Clermont-Fd) Nicole Vincent
(Laboratoire CRIP5-SIP, Université René Descartes, Paris)
CÉPADUÈS-ÉDITIONS 111, rue Vauquelin 31100 TOULOUSE – France Tél. : 05 61 40 57 36 – Fax : 05 61 41 79 89 (de l’étranger ) + 33 5 61 40 57 36 – Fax : + 33 5 61 41 79 89
www.cepadues.com
© CEPAD 2005 ISBN : 2.85428.707.X
Le code de la propriété intellectuelle du 1er juillet 1992 interdit expressément la photocopie à usage collectif sans autorisation des ayants droit. Or, cette pratique en se généralisant provoquerait une baisse brutale des achats de livres, au point que la possibilité même pour les auteurs de créer des œuvres nouvelles et de les faire éditer correctement serait alors menacée.
Nous rappelons donc que toute reproduction, partielle ou totale, du présent ouvrage est interdite sans autorisation de l'éditeur ou du Centre français d'exploitation du droit de copie (CFC – 3, rue d'Hautefeuille – 75006 Paris).
Chez le même éditeur
RNTI-Revue des Nouvelles Technologies de l'Information Sous la direction de Djamel A. Zighed et Gilles Venturini
n°1 : Entreposage fouille de données E1 : Mesures de qualité pour la fouille de données E2 : Extraction et gestion des connaissances EGC 2004
C1 : Classification et fouille de données
E3 : Extraction et gestion des connaissances EGC 2005 B1 : 1re Journée Francophone sur les Entrepôts de Données
et l’Analyse en ligne EDA 2005 E4 : Fouille de données complexes
LE MOT DES DIRECTEURS DE LA COLLECTION RNTI
Nous avons le plaisir de vous présenter ce nouveau numéro de la Revue des Nouvelles Technologies de l'Information qui va vous faire connaître le fruit des ateliers de la conférence EGC’2005. De nombreux travaux de grande qualité présentés lors de ces ateliers méritaient d’avoir leur place dans RNTI, et c’est maintenant chose faite grâce au travail des rédacteurs invités et au soutien de l’association EGC.
A l'image de ce numéro, nous vous rappelons que les thématiques générales couvertes par RNTI concernent tous les domaines liés à l'Extraction de connaissances à partir des Données (ECD), la Fouille de données (FD), la Gestion des connaissances (GC). Afin de mieux distinguer les différentes thématiques de RNTI, nous avons défini les appellations spécifiques suivantes :
§ RNTI - A : Apprentissage
§ RNTI - B : Bases de données
§ RNTI - C : Classification
§ RNTI - E : Extraction et Gestion des Connaissances
§ RNTI - S : Statistiques
§ RNTI - W : Web
RNTI a pour objectif d'être un outil de communication de très grande qualité et ouvert à tous. Nous vous rappelons également que deux types de numéros sont publiés dans RNTI :
§ des actes de conférences sélectives garantissant une haute qualité des articles (par exemple, nous demandons à ce que trois relecteurs émettent un avis sur les articles soumis),
§ des numéros à thème faisant l'objet d'un appel à communication. Chaque numéro à thème est édité par un ou plusieurs rédacteurs en chef invités. Un comité de programme spécifique d'une quinzaine de personnes est formé à cette occasion.
Nous sommes à votre écoute pour toute proposition de numéros spéciaux. Les thématiques abordées sont susceptibles également à moyen terme d'être élargies à d'autres domaines connexes.
Nous espérons vivement que ce numéro vous donnera à tous une entière satisfaction.
Pour tout renseignement, nous vous invitons à consulter notre site Web et à nous contacter.
Djamel A. Zighed et Gilles Venturini.
http://www.antsearch.univ-tours.fr/rnti
PREFACE
Les journées francophones EGC’2005 se sont tenues à Paris du 18 au 21 janvier et ont remporté un grand succès. La journée du 18 janvier était consacrée aux ateliers et aux cours. Une partie importante du succès de la conférence EGC a résidé dans la grande attractivité des ateliers qui ont réuni plus de 200 personnes sur des sujets très variés dont le point commun était l’extraction et la gestion des connaissances. En outre, ces rencontres ont permis des échanges fructueux, voire ont favorisé l’émergence de nouvelles problématiques.
Dans ce contexte, il a donc semblé tout à fait opportun à l’association EGC de valoriser le travail des organisateurs des douze ateliers et les articles des participants qui ont contribué au succès de ces ateliers. Le présent ouvrage est le fruit de ces réflexions. Il a été constitué à partir des actes informels qui ont été distribués le jour des ateliers.
L’intérêt de l’ouvrage réside en partie dans la réactivité que nous avons eue pour assurer sa publication. Chaque atelier est représenté par un chapitre dans l’ouvrage, les responsables d’ateliers rédigeant une introduction à chaque chapitre. De manière à assurer la meilleure qualité possible de l’ouvrage, un processus de relecture a été entrepris et une évaluation globale des différents papiers a été proposée par chaque responsable d’ateliers aux éditeurs de l’ouvrage. Il va de soi qu’il ne s’agissait pas d’accepter de nouveaux papiers, plutôt d’amener les auteurs à consolider leur article à la lumière des discussions qui ont pu intervenir pendant l’atelier.
Que soient ici remerciés chaleureusement pour leur travail et leur coopération les organisateurs des ateliers ainsi que les membres des comités de lecture impliqués dans l’ouvrage. Enfin, la réalisation de cet ouvrage n’aurait pas été possible sans le très fort soutien de l’association EGC. A titre d’exemple, cet ouvrage a été distribué gratuitement aux participants des ateliers, aux frais de l’association EGC.
Florence Cloppet (Université René Descartes, Paris) Jean-Marc Petit (Université Blaise Pascal, Clermont-Fd) Nicole Vincent (Université René Descartes, Paris)
TABLE DES MATIÈRES
Table des matières
Partie I : Modélisation ...1 Chapitre 1 : Modélisation des connaissances ...3 Une nouvelle méthode graphique pour interroger et vérifier des diagrammes de classes UML
Thomas Raimbault...7
Transformation des concepts du diagramme de classe UML en OWL full
Macaire Ahlonsou, Emmanuel Blanchard, Henri Briand, Fabrice Guillet ...13
Modéliser des connaissances ontologiques dans le cadre du modèle des Graphes Conceptuels
Frédéric Fürst ...19
Cartes cognitives de graphes conceptuels
David Genest, Stéphane Loiseau ...25
Modélisation des connaissances émotionnelles par les cartes cognitives floues Nathalie Ronarc’h, Gaële Rozec, Fabrice Guillet, Alexis Nédélec, Serge Baquedano, Vincent Philippé ...31
Logique Floue appliquée à l’inférence du « Risque Inhérent » en audit financier
Souhir Fendri-Kharrat, Hassouna Fedhila, Pierre-Yves Glorennec...37
Méthode sémantique pour la classification et l’interrogation de sources de données biologiques
Nizar Messai, Marie-Dominique Devignes, Amedeo Napoli, Malika Smaïl- Tabbone ...43
Chapitre 2 : Modèles graphiques probabilistes pour la modélisation des connaissances : inférence, apprentissage et applications ...49 Modèles de Markov cachés pour l’estimation de plusieurs fréquences fondamentales
Francis Bach, Michael I. Jordan...53
Inférence dans les HMM hiérarchiques et factorisés : changement de représentation vers le formalisme des Réseaux Bayésiens.
Sylvain Gelly, Nicolas Bredeche, Michèle Sebag ...57
Représentation et reconnaissance de caractères manuscrits par Réseaux Bayésiens Dynamiques
Laurence Likforman-Sulem, Marc Sigelle ...61
Les Réseaux Bayésiens versus d’autres modèles probabilistes pour le diagnostic multiple de gros systèmes
Véronique Delcroix, Mohamed-Amine Maalej, Sylvain Piechowiak...65
Réseaux bayésiens pour le filtrage d’alarmes dans les systèmes de détection d’intrusions
Ahmad Faour, Philippe Leray, Cédric Foll...69
Causal Inference in Multi-Agent Causal Models
Sam Maes, Stijn Meganck, Bernard Manderick ...73 Réseaux Bayésiens de Niveau Deux et D-Séparation
Linda Smail, Jean-Pierre Raoult ...77
Chapitre 3 : Modélisation d’utilisateurs et Personnalisation de l’Interaction Homme-Machine ...81 Représentation contextualisée des pratiques des utilisateurs
Patrick Brézillon, Charles Tijus ...83 Modélisation Sémantique de l’Utilisateur
Charles Tijus, Sébastien Poitrenaud, Jean-François Richard ...89 Une plate-forme de personnalisation basée sur une architecture multi-agents
Abdouroihamane Anli, Emmanuelle Grislin-Le Strugeon, Mourad Abed ...95
Réflexions sur l'apport de l'exploration des traces d'usage pour améliorer le tri des résultats des moteurs de recherche sur le Web
Rushed Kanawati...101
Services contextualisés pour utilisateurs et la modélisation des utilisateurs à base d’ontologies : défis et perspectives
Liana Razmerita ...107
De l’importance du pré-traitement des données pour l’utilisation de l’inférence grammaticale en Web Usage Mining
Thierry Murge ...113 Mesure d’audience sur Internet par populations de fourmis artificielles
Nicolas Labroche...119
Apprentissage d’une hiérarchie de concepts pou la conception de modèles de domaine d’hypermédias
Hermine Njike Fotzo, Thierry Artières, Patrick Gallinari, Julien Blanchard, Guillaume Letellier...125
Partie II : Extraction de connaissance et Web ...131 Chapitre 4 : Métadonnées et Adaptabilité pour les Systèmes d’Information sur le Web...133 Interface adaptable de requêtes pour un service de Métadonnées
Julien Barde, Jacques Divol, Thérèse Libourel, Pierre Maurel ...135
Gestion de connaissances et de données dans l'aide à la conception de Tissue Microarrays
Julie Bourbeillon, Catherine Garbay, Françoise Giroud...141 Un modèle d'adaptation pour les œuvres médiatiques
Anis Ouali, Brigitte Kerhervé, Odile Marcotte, Paul Landon ...147 Adaptabilité à l’utilisateur dans le contexte des services Web
Céline Lopez-Velasco, Marlène Villanova-Oliver, Jérôme Gensel, Hervé Martin...153
Génération de descripteurs : interrogation d’images satellitaires par les métadonnées
Florence Sèdes...159
Chapitre 5 : Extraction et Gestion de Connaissance dans les Environnements Informatiques pour l’Apprentissage Humain ...165 Extraction d'Information Pédagogique à l'aide de Fouilles de Données : une étude de cas
Agathe Merceron ...167 Un Web sémantique de formation par questionnement
Sylvain Dehors, Catherine Faron-Zucker, Alain Giboin, Jean-Paul Stromboni ...173
Extraction de pépites de connaissances dans des réponses d’élèves en langage naturel
Sylvie Normand-Assadi, Lalina Coulange, Elisabeth Delozanne, Brigitte Grugeon....179
Un cadre pour l’étude des comportements sur une plate-forme pédagogique : du parcours individuel à la conscience du groupe
Pierre Camps, Marie-Françoise Canut, André Péninou, Florence Sèdes...185
Chapitre 6 : De la construction d’entrepôts de données à l’extraction de connaissances sur grilles ...191 Entrepôts de données sur grilles de calcul
Pascal Wehrle, Maryvonne Miquel, Anne Tchounikine...195 Service de Cache pour les Grilles de Calcul
Yonny Cardenas, Jean-Marc Pierson, Lionel Brunie ...199 Sélection d’attributs en fouille de données sur grilles
Sébastien Cahon, Nouredine Melab et El-Ghazali Talbi...203
Chapitre 7 : Extraction de motifs temporels pour la détection en ligne de situations critiques...209 Apprentissage relationnel de motifs temporels
Marie-Odile Cordier, René Quiniou...211
Extraction non supervisée de motifs temporels, multidimensionnels et hétérogènes Application à la télésurveillance médicale à domicile
Florence Duchêne, Catherine Garbay, Vincent Rialle ...217
Améliorer la découverte de chroniques par une découpe intelligente d'un log d'alarmes
Françoise Fessant, Christophe Dousson, Fabrice Clérot ...223
Extraction de motifs temporels pour la détection dynamique de conflits ethno- politiques
Laure Mouillet, Bernadette Bouchon-Meunier, Emmanuel Collain ...229
Vers une analyse de la dynamique des paramètres physiologiques en Unité de Soins Intensifs
Samir Sharshar, Marie-Christine Chambrin ...235
Partie III : Données complexes ...243 Chapitre 8 : Fouille de données complexes...245 Extraction d’indices spatiaux et temporels dans des séquences vidéo couleur
Sébastien Lefèvre, Nicole Vincent ...249 Fusion de classifieurs pour la classification d’images sonar
Arnaud Martin ...259
Fouille de collections de documents en vue d’une caractérisation thématique de connaissances textuelles
Abdenour Mokrane, Gérard Dray, Pascal Poncelet ...269
Recherche d’information multimédia : Apport de la fouille de données et des ontologies
Marie-Aude Aufaure , Marinette Bouet ...279 Complexité de l’extraction des connaissances de données : une vision systémique Walid Ben Ahmed, Mounib Mekhilef, Michel Bigand, Yves Page ...289
Une représentation des arborescences pour la recherche de sous-structures fréquentes
Federico Del Razo Lopez, Anne Laurent, Maguelonne Teisseire...299 Classement d'objets incomplets dans un arbre de décision probabiliste
Lamis Hawarah, Ana Simonet , Michel Simonet ...309 Fouille de données du génome à l'aide de modèles de Markov cachés
Sébastien Hergalant, Bertrand Aigle, Pierre Leblond, Jean-François Mari...319 Exploration visuelle d'images IRMf basée sur des Gaz Neuronaux Croissants
Jerzy Korczak, Jean Hommet, Nicolas Lachiche, Christian Scheiber ...329 Mise en évidence d'invariants dans une population de cas chirurgicaux
Mélanie Raimbault, Ricco Rakotomalala, Xavier Morandi, Pierre Jannin...339
Chapitre 9 : Extraction de Connaissance à partir d’images ...349 Apprentissage Automatique de Catégories d'Objets Cartographiques par signature structurelle
Güray Erus, Nicolas Loménie...351 Application des courbes de Peano en recherche d'image par le contenu
Adel Hafiane, Bertrand Zavidovique ...355
Recherche d’image par le contenu : requête partielle ou globale, apprentissage en ligne
Sylvie Philipp-Foliguet ...359
Extraction de connaissances pour la description d’images satellitaires à très haute résolution spatiale
Erick Lopez-Ornelas, Florence Sèdes ...365
Chapitre 10 : Qualité des Données et des Connaissances...371 Data Freshness Evaluation in Different Application Scenarios
Veronika Peralta, Mokrane Bouzeghoub...373 Nettoyage des données XML : combien ça coûte ?
Laure Berti-Equille...379
Extraction de Règles en Incertain par la Méthode Implicative
Régis Gras, Raphaël Couturier, Fabrice Guillet, Filippo Spagnolo ...385
IPEE : Indice Probabiliste d'Ecart à l'Equilibre pour l'évaluation de la qualité des règles
Julien Blanchard, Fabrice Guillet, Henri Briand, Régis Gras ...391 Le rôle de l'utilisateur dans un processus d'extraction de règles d'association
Cyril Nortet, Ansaf Salleb, Teddy Turmeaux, Christel Vrain ...397 Arbre BIC optimal et taux d’erreur
Gilbert Ritschard ...403
Validation d’une expertise textuelle par une méthode de classification basée sur l’intensité d’implication
Jérôme David, Fabrice Guillet, Vincent Philippé, Henri Briand, Régis Gras ...409 ARQAT : plateforme exploratoire pour la qualité des règles d'association
Xuan-Hiep Huynh, Fabrice Guillet, Henri Briand ...415
Mesurer l’intérêt des règles d’association
Benoît Vaillant, Patrick Meyer, Elie Prudhomme, Stéphane Lallich, Philippe Lenca, Sébastien Bigaret ...421
Partie I _
Modélisation
Chapitre 1
Modélisation des connaissances
La conférence EGC rassemble depuis plusieurs années des chercheurs et industriels autour de la double thématique de l'extraction et de la gestion des connaissances. Tous les acteurs de cette communauté sont confrontés au problème de la modélisation des connaissances. Différentes méthodes, formalismes et outils ont été proposés et mis en oeuvre pour modéliser, stocker et utiliser les informations au sein des bases de données ou des bases de connaissances. L'atelier modélisation des connaissances qui a eu lieu en parallèle avec les journées EGC 2005 a réuni une quarantaine de personnes autour d'exposés sélectionnés avec édition d'actes. Les papiers ont été retravaillés pour l'édition que nous vous proposons dans cet ouvrage.
Actuellement, les recherches qui intéressent la communauté extraction et gestion des connaissances visent à exploiter les nombreuses données disponibles au sein des organisations, à en extraire des connaissances intéressantes et exploitables, à intégrer ces connaissances aux systèmes décisionnels, ou à les diffuser aux différents agents de l'organisation. La modélisation des connaissances est un sujet majeur pour ces différentes problématiques. Les articles présentés peuvent être regroupés en trois thèmes: transformation de modèles, apports fondamentaux, applications.
Tout d'abord un rapprochement s'effectue entre les travaux d'intelligence artificielle et les travaux des communautés de modélisation des données. Les problématiques de transformation de modèles sont ainsi de plus en plus prégnantes dans les diverses communautés. L'article de T.
Raimbault présente ainsi comment les diagrammes UML peuvent être utilisés comme support à de la représentation visuelle de connaissances dans le cadre du modèle des graphes conceptuels ; des vérifications inédites de construction de ces modèles sont proposées. L'article de M.
Responsables du chapitre : B. Duval, S. Loiseau, H. Briand
Ahlonsou et al. présente lui les transcriptions possibles entre un diagramme de classe UML et le langage OWL qui est utilisé dans les travaux de WEB sémantique.
Ensuite, les travaux fondamentaux qui proposent de nouveaux langages ou modèles de représentation sont illustrés par deux contributions. Le travail de F. Fürst propose un cadre formel et complet pour contraindre les ontologies ; celles-ci sont à la base de nombreux travaux de modélisation en fournissant de manière organisée le vocabulaire de base d'un domaine étudié.
L'article de D. Genest et al. propose quant à lui un modèle de connaissance qui fusionne les modèles d'influence traditionnels avec le modèle des graphes conceptuels qui contient lui-même une couche ontologique.
Enfin, les travaux de recherche appliqués à un domaine particulier sont évidemment présents.
Les applications ne sont pas simplement des illustrations ou validations des recherches menées en modélisation des connaissances, elles sont un point d'entrée pour comprendre et modéliser les connaissances mises en jeu dans les processus intelligents. Le travail de N. Ronarc'h et al. est issu des besoins applicatifs de modélisation du comportement psychologique. Il propose d'utiliser les modèles de cartes cognitives pour capturer et formaliser les connaissances émotionnelles des personnes. Les recherches de S. Fendri et al. sont consacrées à une tâche de modélisation et de capitalisation des connaissances humaines dans le domaine de l'audit financier. Afin de dépasser les limites des modèles couramment proposés, le processus d'estimation du risque d'audit est modélisé à l'aide d'arbres de décision flous permettant d'expliciter les facteurs pertinents mis en jeu. L'article de N. Messai s'intéresse à l'intégration de plusieurs sources de données biologiques lors d'une recherche. Le travail utilise des méta-données associées aux sources et le concept de treillis de Galois pour classer ces sources en fonction de leur intérêt pour les requêtes. Des ontologies sont associées aux treillis de Galois afin de permettre l'enrichissement de requêtes.
Plusieurs tendances peuvent être dégagées des travaux actuels. La modélisation des connaissances, en tant que processus intermédiaire entre l'analyse et l'exploitation, fait de plus en plus appel à des langages visuels de représentation. Les modèles de cartes cognitives, de graphes conceptuels, de diagrammes de classes sont ainsi à la base de nombreux travaux. La complexité des connaissances à modéliser nécessite des approches issues des travaux formalisant les informations "imparfaites" comme le fait la logique floue. Une des difficultés croissante, due en particulier au développement de l'internet, est l'hétérogénéité des sources de connaissances ; les problèmes de fusion et d'incohérence nécessitent des travaux nouveaux. Un point important que nous pouvons noter dans les différents articles proposés est que les travaux de recherche menés sont de plus en plus pluridisciplinaires : les travaux de génie logiciel (UML), de logique (logique floue), d'aide à la décision (cartes cognitives), de modèles de données (XML) côtoient les travaux de modélisation traditionnels (graphes conceptuels).
Comité de programme et d'organisation :
Béatrice Duval (LERIA, Université d'Angers ) Stéphane Loiseau (LERIA, Université d'Angers )
Henri Briand (LINA, Ecole Polytechnique de l'université de Nantes )
Salem Benferhat (CRIL, Université d'Artois) Giuseppe Berio (Université de Turin, Italie) Corine Cauvet (LSIS, Université de Marseille ) Nadine Cullot (LE2I, Université de Bourgogne) Jérôme Euzenat (INRIA Rhône Alpes)
David Genest (LERIA, Université d'Angers)
Fabrice Guillet (LINA, , Ecole Polytechnique de l'université de Nantes) Mohan Said Hacid (LIRID, Université Lyon1)
Rémi Lehn (LINA, Université de Nantes) Chantal Reynaud (LRI, Université de Paris Sud)
Une nouvelle m´ ethode graphique pour interroger et v´ erifier des diagrammes de classes UML
Thomas Raimbault
LERIA, Universit´e d’Angers, 2 boulevard Lavoisier 49045 ANGERS Cedex 01 [email protected]
R´esum´e. UML est le langage graphique de r´ef´erence dans l’industrie pour la mod´elisation objet. Cependant UML reste un langage, et ne four- nit aucun moyen de v´erification ou d’interrogation de ses sch´emas. Il existe aujourd’hui des outils de v´erification, mais ils se comportent comme des boˆıtes noires o`u l’utilisateur ne peut acc´eder. Nous proposons une m´ethode graphique de v´erification et d’interrogation de diagrammes de classes UML. L’aspect intuitif et dessinable de notre m´ethode offre `a l’utilisa- teur la possibilit´e d’interroger le contenu de diagrammes de classes, ainsi que de d´efinir et d’adapter ses propres crit`eres de v´erification. Le mod`ele calculatoire de notre approche est celui des graphes conceptuels.
1 Introduction
UML, Unified Modeling Language (Booch et al. 1998), est le langage graphique de r´ef´erence dans l’industrie pour la mod´elisation objet. Cependant UML reste un langage, et ne fournit aucun moyen de v´erification ou d’interrogation de ses sch´emas. Il existe des outils commerciaux de v´erification, tels que Rational Software Rose (IBM 2004) ou Borland Together (Borland 2004). Mais les v´erifications propos´ees sont uniquement standards, v´erifiant la coh´erence des diagrammes par rapport aux sp´ecifications objet.
De plus, la m´ethode de v´erification est dans une boˆıte noire : les traitements sont de bas niveau et non accessibles `a l’utilisateur. Enfin, l’interrogation de diagrammes n’est pas totalement libre mais limit´e `a un cadre pr´e-format´e de questions.
Pour r´epondre aux exigences de qualit´e et d’interaction en mod´elisation, nous propo- sons une m´ethode graphique d’interrogation et de v´erification de diagrammes de classes UML. L’aspect intuitif et dessinable de cette m´ethode offre `a l’utilisateur la possibilit´e de d´efinir et d’adapter ses propres crit`eres de v´erification, ainsi que d’interroger libre- ment le contenu de diagrammes de classes UML. Le travail pr´esent´e dans cet article est issu de (Raimbault 2004), et est trait´e pour l’atelier EGC 2005 “Mod´elisation des connaissances” de fa¸con intuitive au travers un exemple. Concr`etement, notre m´ethode utilise pour les calculs le mod`ele des graphes conceptuels (Sowa 1984).
Cet article est structur´e comme suit : la section 2 traite de notre m´ethode gra- phique d’interrogation et de v´erification de diagrammes de classes UML. En section 3, nous abordons l’aspect calculatoire de notre m´ethode qui utilise la mod`ele des graphes conceptuels. La section 4 discute des r´esultats et des perspectives de notre m´ethode.
2 Interroger et V´ erifier un diagramme de classes
Nous indiquons d’une part comment formuler unerequˆetepour interroger le contenu d’un diagramme de classes UML, d’autre part, comment d´efinir lescrit`eres de validit´e
Transformation des concepts du diagramme de classe UML en OWL full
Macaire Ahlonsou, Emmanuel Blanchard Henri Briand, Fabrice Guillet
2bis boulevard Léon Bureau BP96228 de l’Université de Nantes http://www.sciences.univ-nantes.fr/lina/fr/
LINA – Université de Nantes Ecole polytechnique de l’université de Nantes La Chantrerie, rue Christian Pauc 44306 Nantes CEDEX 3
{Prenom.Nom}@polytech.univ-nantes.fr
Résumé. Le web peut être considéré comme une grande base de connaissances. La recherche des informations pertinentes sur la toile est rendue de plus en plus difficile, voire impossible avec l’accroissement de la volumétrie des pages disponibles. Le problème réside dans le fait que les outils existants ne peuvent pas s’appuyer actuellement sur une description du contenu des documents. Le web sémantique utilise différents langages pour mieux exploiter et traiter les contenus des ressources web. Dans le but de passer de UML vers OWL, il est intéressant d’étudier la possibilité de transformer chacun des concepts du diagramme de classe UML en OWL.
1 Introduction
UML (Unified Modeling Language) (Gaertner et al. 2002) est un langage de modélisation orienté objet clairement adopté dans le monde industriel. Le web sémantique est une vision du futur web dans lequel l'information serait explicitée de manière à permettre son traitement automatique par des machines. Nombreuses sont les applications qui sont déjà modélisées en UML. Il n’existe pas de langage de modélisation spécifique pour modéliser une base de connaissance. On peut étendre l’utilisation de UML, notamment les diagrammes de classe à cette fin (Walter 1998).
L’objectif de cet article est d’étudier la possibilité de transformer les concepts du diagramme de classe UML (langage semi formel) en OWL (langage formel). Cette transformation est effectuée dans un seul sens (UML vers OWL) et reste dans un monde clos. Nous proposons de transformer trois concepts du diagramme de classe après avoir situé les divers langages du web sémantique les uns par rapport aux autres, en mettant en avant leurs limites.
2 Langages et définitions
2.1 UML
UML est un langage de modélisation plébiscité dans le domaine de la conception. Il permet de représenter les composants statiques et dynamiques des systèmes dépendant des logiciels à travers des modèles représentés par des vues. Ces vues sont manipulées à travers des diagrammes. Cet article ne traitera que le cas des diagrammes de classe.
Mod´ eliser des connaissances ontologiques dans le cadre du mod` ele des Graphes Conceptuels
Fr´ed´eric F¨urst LINA - FRE 2729
22 rue de la Houssini`ere, BP 92208, 44322 Nantes [email protected]
R´esum´e. Cet article pr´esente OCGL (Ontology Conceptual Graph Lan- guage), un langage de repr´esentation d’ontologie bas´e sur le mod`ele des Graphes Conceptuels. Il d´ecrit en d´etail la fa¸con dont une ontologie est mod´elis´ee en OCGL, et pr´esente l’impl´ementation de ce langage dans l’ate- lier d’ing´enierie ontologique TooCoM.
1 Introduction
L’ing´enierie des ontologies est n´ee de la volont´e de diversifier les applications des Syst`emes `a Base de Connaissances (SBC), et de permettre des repr´esentations de connaissances ind´ependantes de ces diverses applications (Gomez-Perez et al., 2003).
L’int´egration d’un tel composant dans un Syst`eme `a Base de Connaissances suppose alors d’adapter les repr´esentations qu’il int`egre `a l’objectif op´erationnel du syst`eme, adaptation qui est l’objet du processus d’op´erationalisation des ontologies (F¨urst et al., 2004). D’autre part, les ontologies ont vocation `a int´egrer toute la s´emantique des diff´erents domaines de connaissances, c’est-`a-dire des propri´et´es de base comme la sub- somption entre concepts, mais ´egalement toute propri´et´e permettant d’exprimer la s´emantique du domaine consid´er´e. Les ontologies ´evoluent ainsi des ontologies l´eg`eres (lightweight ontologies), n’int´egrant qu’un nombre restreint de propri´et´es, vers des onto- logies lourdes (heavyweight ontologies), visant la mod´elisation de toutes les propri´et´es n´ecessaires `a la repr´esentation de toute la s´emantique d’un domaine (Gomez-Perez et al., 2003).
Dans cet article, nous pr´esentons OCGL (Ontology Conceptual Graph Language), un langage de repr´esentation d’ontologies lourdes, bas´e sur le mod`ele des Graphes Conceptuels (GCs) (Sowa, 1984). OCGL est impl´ement´e dans l’outil TooCoM (a Tool to Operationalize an Ontology in the Conceptual Graph Model), d´edi´e `a la mod´elisation et l’op´erationalisation d’ontologies lourdes dans le cadre du mod`ele des Graphes Concep- tuels1. Nous d´etaillons ici le mod`ele de repr´esentation utilis´e dans TooCoM, mais ne pr´esentons pas le processus d’op´erationalisation qu’il impl´emente, renvoyant pour cela le lecteur `a (F¨urst et al., 2004).
1. Cet outil est disponible sous licence GPL sur le site http://sourceforge.net/projects/toocom/
Cartes cognitives de graphes conceptuels
David Genest, Stéphane Loiseau
LERIA – Université d’Angers, 2, Boulevard Lavoisier – 49045 Angers cedex 1 {genest,loiseau}@info.univ-angers.fr
Résumé. Le modèle des cartes cognitives offre une représentation graphique d’un réseau d’influences entre différentes notions. Nous proposons un nouveau modèle de cartes cognitives qui intègre la partie représentation des connaissances et l'opération de projection du modèle des graphes conceptuels.
1 Introduction
Une carte cognitive (Tolman 1948) contient deux types d'informations : des nœuds appelés états représentant des concepts et des arcs entre ces nœuds représentant des liens d'influence positifs ou négatifs. Un mécanisme d’inférence propage les influences.
Une première faiblesse des cartes cognitives est sa trop grande souplesse car un état peut être représenté par n'importe quelle étiquette linguistique. Une seconde faiblesse du modèle est l’absence de structuration des états, qui fait que des liens entre états, autres que ceux d’influence, ne peuvent pas être exprimés.
Le modèle des graphes conceptuels (Sowa 1984) est un modèle de représentation graphique de connaissances. Un graphe conceptuel est défini sur une structure appelée support permettant de spécifier en hiérarchie le vocabulaire. Une opération d'inférence, appelée projection, permet de rechercher des graphes qui sont sémantiquement liés entre eux.
L’idée du modèle des cartes cognitives de graphes conceptuels que nous proposons consiste à décrire chaque état par un graphe. D’abord, l’utilisation d'un graphe conceptuel, associé à chaque état, permet de définir chaque état en référence à une ontologie qui est le support. Ensuite, on peut calculer ou regrouper des classes d’états qui sont liés entre eux dans une collection. Enfin, cette classification peut se combiner avec le calcul d'influence.
Dans la partie 2, nous décrivons le modèle des cartes cognitives de graphes conceptuels.
La partie 3 décrit la notion de collection. Dans la partie 4, nous définissons les opérations permettant le raisonnement dans le modèle et décrivons les apports de ces opérations.
2 Modèle des cartes cognitives de graphes conceptuels
Le modèle des graphes conceptuels utilisé est celui défini dans (Chein et Mugnier 1992).
Tout graphe conceptuel est défini sur un support qui organise, à l’aide de relations « sorte de », un vocabulaire composé de types de concepts et de types de relations (figure 1). Un graphe conceptuel G est formé d’un ensemble de sommets concepts (CG), un ensemble de sommets relations (RG), un ensemble d’arêtes (EG) et une application qui associe à tout sommet et à toute arête une étiquette (étiqG). Le graphe conceptuel de la figure 2 représente un accident mortel (accident dans lequel une personne est morte)
Une carte cognitive de graphes conceptuels permet de représenter des relations d’influence entre différentes notions, appelées états, chacun de ces états étant défini par un graphe conceptuel.
Modélisation des connaissances émotionnelles par les cartes cognitives floues
Nathalie Ronarc’h 2, Gaële Rozec 1,
Fabrice Guillet 2, Alexis Nédélec 3, Serge Baquedano 1 , Vincent Philippé 1
1 Performanse SA Atlanpôle La Fleuriaye 44470 CARQUEFOU http://www.performanse.fr
2 LINA - Polytech' Nantes rue Christian Pauc BP50609 44306 Nantes CEDEX 3 {Prenom.Nom}@polytech.univ-nantes.fr
3 CERV/ ENIB de Brest Technopôle Brest Iroise ; CP 15 ; 29608 Brest Cedex {nom}@enib.fr
Résumé: Les recherches en psychologie ont permis d'établir une relation entre émotions et prise de décision. La prise en compte de caractéristiques humaines telles que les émotions et la personnalité dans les processus d’interaction entre agents est au centre de ce travail. Il s'inscrit dans le cadre du projet GRACE (Groupes Relationnels d'Agents Collaborateurs Emotionnels)/ RIAM (Réseau des Industries, de l’Audiovisuel et du Multimédia) .
1 Introduction
Aujourd’hui peu d'outils permettent de décrire facilement les comportements d’individus.
Les sciences humaines apportent leur expertise en proposant des modèles émotionnels décrivant le processus de décision et les comportements des humains dans un contexte donné. Les cartes cognitives émotionnelles basées sur le modèle Performanse SA nous servent d'outil de recueil d'informations sur l'évolution des émotions, suite à un événement donné. Douze émotions, influencées par les traits de personnalité de l'individu, sont ainsi représentées. La problématique est de traduire ces modèles en langage informatique. La combinaison de la socio-psychologie et du domaine multi-agent (Ferber 95) nous apporte les éléments nécessaires à la modélisation pertinente des comportements et des interactions d'agents humains pouvant évoluer dans un milieu virtuel.
Dans ce contexte les travaux du CERV/ LI2, associé au projet GRACE / RIAM, sur les SMA et la réalité virtuelle ont donné lieu à l'élaboration d'une simulation sur la plateforme AréVi (Harrouet) dans laquelle les entités considérées, c'est à dire des agents autonomes, sont capables de percevoir tout ou partie de leur environnement, de réagir aux évènements en fonction de leur état interne et de leurs connaissances. Nos agents possèdent des capacités de raisonnement, ils sont munis d'états mentaux, ce sont des agents cognitifs. De plus les agents ont une personnalité qui nous permet de les distinguer.
2 Représentation du processus de décision de l'agent
Le processus de prise de décision de l'agent repose sur la boucle Perception – Décision – Action du fonctionnement des agents cognitifs. Ainsi les cartes cognitives émotionnelles (CEF) sont intégrées à un dispositif plus complexe de prise de décision de l’agent, tenant compte de ses connaissances, de l’évaluation de l’événement perçu et de son estimation de l’environnement. Le processus de prise de décision des agents, représenté Figure 1 et
Logique Floue appliquée à l’inférence du « Risque Inhérent » en audit financier
Souhir Fendri-Kharrat*
Hassouna Fedhila**
Pierre-Yves Glorennec***
* Ecole Supérieure de Commerce, Rte de l’Aéroport-Km 4, BP 1081, Sfax 3018-Tunisie [[email protected]]
** Institut Supérieur de Comptabilité et d’Administration des Entreprises, Campus, Manouba 2001-Tunisie
*** Institut National des Sciences Appliquées de Rennes, 20, Av. des buttes de Coësmes-CS 14315-35043 RENNES Cedex-France
Résumé : Le Risque d’Audit est un indice d’existence d’erreurs dans les états financiers d’une entreprise. Trois modèles mathématiques sont associés à ce concept du RA : un modèle « Bayesien », un modèle « évidentialiste », et un modèle « flou ». Ces trois modèles accusent des incohérences mathématiques et des difficultés d’application pratique, surtout au niveau de la composante
« Risque Inhérent » du risque d’audit. Ils considèrent le processus cognitif d’estimation du RI en tant que « boîte noire ». Nous proposons un simple algorithme d’inférence flou interprétable pour capter le processus cognitif d’estimation du RI, algorithme basé sur l’induction d’arbre de décision flou.
Notre objectif est d’identifier les éléments de cette structure et de démontrer que l’utilisation d’une telle structure d’inférence floue est proche de la décision réelle d’estimation du RI. Il s’agit d’une recherche exploratoire et expérimentale.
1 Introduction
Aussi bien les normes internationales [ISA1] que les normes américaines [SAS1] d’audit s’accordent sur le fait que l’audit financier est un audit de conformité entre les réglementations en vigueur et les états financiers d’une entreprise. Les SAS n° 39, 47 & 55 et les ISA n° 400 à 408, stipulent que la non-conformité de la comptabilité d’une firme à des réglementations en vigueur, est l’essence même de l’erreur comptable (AICPA 2003 et IFAC 2003). Le concept de « Risque d’Audit » [RA] est un indice de l’occurrence d’erreurs dans les rapports financiers : ces normes conceptualisent le « Risque d’Audit » [RA] en tant qu’une intersection entre trois ensembles, à savoir : « Risque Inhérent » [RI], « Risque de Non Contrôle » [RNC] et « Risque de Non Détection » [RND]. La première composante RI, indique l’ensemble des erreurs pouvant s’infiltrer dans les états financiers et provenant de
1 SAS : ...Statements on Auditing Standards (normes d’audit de l’AICPA) ISA : ...International Standards of Auditing (normes d’audit de l’IFAC)
AICPA :...American Institute of Certified Public Accountants (Ordre des experts comptables-USA).
IFAC : ...International Federation of Accountants (Fédération internationale des experts comptables).
!"#$ % &'(") * + !,- #. /0 * 12
3 45 67
899:;;<<<6 67; ;
= 9 =98 / 7/ 9 9 /8 /8
/ 6 2 / 9 > / 9 9 ? > 9 @
=9 = /= A / 9/ 9 =9=
= 6 / / 9/ 9 9> 9 @ B9 9 9 9 9
== 9 C/ > 98 / 9 /9 /= 9 6 #
/ / = 99 . > A9 @ / 7 9
A9 9 / / 9 B9 9 ?
= 9 96 #@ 9 / / 9 = 9> 9 @
9 / / 9 / 9 9 6 = 9
=98 / 9 > /8 B9 > 9 @ 9 9
@ = 9 6 A @ /8 9 9 :
@ /8 9 = = 9 9@ /8 9 =/ 9 6
9 A . // /9 9 @ 0 =
= 9 // D 6 1 = 9 = 9 =
/ 77 9 9 7/ @ 9 9 7 7/ 9 @//. >
/ 9 6 # 9= / / 9 / = 9 9= = @
/ 9 9 99 9 A 9 9 @ 7 9 / .9 6 1 9
@ / @ /8= @ / 9 9= 7 9 = 9 @ / E
7 7= / F > G / 9 / 9 9 H / 8= /
= A B9 = 6 * / > 9 . 9 = = 9
@ / 7/ 9 / 7 9 = 9 99 9
G 9 / / > B9 6 1 99 / 7/ 9 9B9 7 9
@ / 9. / 9 9 / 9 9 9= / 9
= =9 = 6 I 9 8= /8 / 9 B9
/ @A9 / / 9 = A> 9 = 6 #
=98 @ 9 9 / 9 9 / 9 = 9
B9 @ 9 9 = = 99 /8 /8 6 .
. @ 9> @A 99 / / E =9 = F =/ 9 /
D 9 @ 97 / 9 9 9
= 9 @ 9 9> @ 0 = 9 B9 =7= 9> 9 9 77 / 99 B9 9 @ = = 6
Chapitre 2
Modèles graphiques probabilistes pour la modélisation des connaissances : inférence, apprentissage et applications
Les modèles graphiques probabilistes sont classiquement définis comme étant le mariage entre la théorie des probabilités et la théorie des graphes. Les probabilités permettent à ces modèles de prendre en compte l’aspect incertain présent dans les applications réelles. La partie graphique offre un outil intuitif inégalable et attractif dans de nombreux domaines d’applications où les utilisateurs ont besoin de "comprendre" ce que raconte le modèle qu’ils utilisent.
Réciproquement, cela permet aussi à un expert des modèles graphiques de construire plus facilement un modèle pour une application précise en s’appuyant sur les avis des spécialistes de ce domaine.
L’utilisation conjointe des probabilités et des graphes nous offre une famille de modèles de connaissance très riche, avec par exemple les réseaux bayésiens, les modèles de Markov cachés et leurs dérivés ou les filtres de Kalman.
L’apparition d’un formalisme commun pour représenter et manipuler ces modèles donne maintenant lieu à de fructueux échanges où un travail original sur l’un de ces modèles peut être adapté ou généralisé aux autres, et ouvrir de nouvelles pistes de recherche. Citons par exemple le cas des réseaux bayésiens dynamiques, qui utilisent à la fois des algorithmes développés originalement soit pour les réseaux bayésiens statiques, soit pour les modèles de Markov cachés, soit pour les filtres de Kalman, le tout en apportant un pouvoir expressif supplémentaire par rapport à ces premiers modèles.
Responsable du chapitre : P. Leray
Nous proposions dans cet atelier de dresser un panorama des activités de recherche dans le domaine des modèles graphiques probabilistes, tant au niveau théorique que pour les aspects applicatifs. Le but était donc de rassembler, dans le cadre de la conférence EGC 2005, et sous le parrainage de CAFE, Collège Apprentissage, Fouille et Extraction de l’AFIA, les chercheurs intéressés par le sujet et de fournir un lieu de discussion sur ses derniers développements.
Les présentations devaient aborder un des thèmes suivants :
• inférence : nouveaux algorithmes d’inférence exacte ou approchée
• stratégies et algorithmes d’apprentissage : élicitation de données, prise en compte de données incomplètes / variables manquantes, modélisation biomimétique
• modèles graphiques probabilistes : réseaux bayésiens temporels, réseaux bayésiens orientés objets, diagrammes d’influence, réseaux de neurones
• relations avec d’autres formalismes de représentation de l’incertain
• applications réelles
• outils logiciels
Afin de couvrir les nombreuses facettes du sujet tout en gardant du temps pour discuter, cet atelier s’est déroulé sur une journée entière, avec sept présentations couvrant un spectre assez large, de part les types de modèles graphiques utilisés (réseaux bayésiens « classiques », modèles causaux, modèles dynamiques, réseaux bayésiens de niveau deux), les algorithmes mis en oeuvre (inférence, apprentissage) et les domaines d’application concernés (diagnostic multiple de systèmes complexes, reconnaissance de caractères manuscrits, détection d’intrusion, systèmes multi-agents, traitement de la parole).
La première série d’articles traite des modèles graphiques dynamiques. F. Bach et M.I. Jordan utilisent des modèles de Markov cachés pour une application de traitement de signal, l’estimation de plusieurs fréquences fondamentales. Ce travail utilise de nombreuses avancées récentes des modèles graphiques probabilistes temporels.
Le second article de cette série est consacré à l’inférence dans les Modèles de Markov cachés hiérarchiques et factorisés. Ce travail, présenté par S. Gelly, N. Bredeche et M. Sebag, propose un changement de formalisme permettant de "simplifier" ces modèles pour être capable de leur appliquer des algorithmes d’inférence exacts.
L. Likforman-Sulem et M. Sigelle nous décrivent ensuite une application des réseaux bayésiens dynamiques pour la représentation et la reconnaissance de caractères manuscrits.
La dernière série d’articles est consacrée à d’autres modèles graphiques probabilistes. Les travaux de V. Delcroix, M.A. Maalej et S. Piechowiak passent en revue l’utilisation des réseaux bayésiens pour le diagnostic multiple de systèmes complexes.
A. Faour, Ph. Leray et C. Foll décrivent ensuite l’utilisation de réseaux bayésiens au sein d’une architecture de data-mining destinée à filtrer les alarmes dans les systèmes de détection d’intrusion informatique.
Nous passons ensuite des réseaux bayésiens "classiques" aux réseaux bayésiens causaux, et plus précisèment les modèles causaux multi-agents avec le travail de S. Maes, S. Meganck et B.
Manderick, qui décrit un algorithme d’inférence pour ces modèles spécifiques.
L’article de L. Smail et J.P. Raoult conclut cette série d’articles en développant un nouveau formalisme, les réseaux bayésiens de niveau deux et en illustrant le principe fondamental de d- séparation dans ces modèles.
Comité de programme et d'organisation :
P. Leray (Laboratoire PSI - FRE CNRS 2645, INSA Rouen - [email protected] M.R. Amini (LIP6, Université Paris 6),
T. Artières (LIP6, Université Paris 6),
M. Bouissou (EDF / LAMA, Université de Marne la Vallée), F. Druaux (GREAH, Université du Havre),
A. Faure (GREAH, Université du Havre), O. François (PSI, INSA Rouen), P. Gallinari (LIP6, Université Paris 6), Y. Kodratoff (LRI, Université Paris Sud), P. Naïm (Elseware),
O. Pourret (EDF),
J.P. Raoult (LAMA, Université de Marne la Vallée), L. Smail (LAMA, Université de Marne la Vallée), P.H. Wuillemin (LIP6, Université Paris 6).
Remerciements
Nous aimerions remercier F. Cloppet et les responsables de la conférence EGC 2005 pour avoir accueilli cet atelier, et M. Sebag pour son aide concernant la diffusion de l’appel d’offre.
Mod` eles de Markov cach´ es pour l’estimation de plusieurs fr´ equences fondamentales
Francis Bach∗, Michael I. Jordan∗∗
∗Centre de Morphologie Math´ematique Ecole des Mines de Paris
35, rue Saint Honor´e 77305 Fontainebleau, France
∗∗Computer Science Division and Department of Statistics
University of California Berkeley, CA 94720, USA [email protected]
1 Introduction
Le suivi de la fr´equence fondamentale est un probl`eme important du traitement de la parole et de la musique, et le d´eveloppement d’algorithmes robustes pour la d´etermination d’une ou plusieurs fr´equences fondamentales est un sujet actif de re- cherches en traitement du signal acoustique (Gold et Morgan, 1999). La plupart des algorithmes d’extraction de la fr´equence fondamentale commencent par construire un ensemble de caract´eristiques non lin´eaires (comme le corr´elogramme ou le “cepstrum”) qui ont un comportement sp´ecial lorsqu’une voyelle est prononc´ee. Ensuite, ces al- gorithmes mod´elisent ce comportement afin d’extraire la fr´equence fondamentale. En pr´esence de plusieurs signaux mix´es additivement, il est naturel de vouloir mod´eliser directement le signal ou une repr´esentation lin´eaire de ce signal (comme le spectro- gramme), afin de pr´eserver l’additivit´e et de rendre possible l’utilisation de mod`eles destin´es `a une seule fr´equence fondamentale pour en extraire plusieurs.
L’utilisation directe du spectrogramme n´ec´essite cependant un mod`ele probabili- tiste d´etaill´e afin de caract´eriser la fr´equence fondamentale. Dans cet article, nous consid´erons une variante de mod`ele de Markov cach´e et utilisons le cadre des mod`eles graphiques afin de construire le mod`ele, apprendre les param`etres `a partir de donn´ees et d´evelopper des algorithmes efficaces d’inf´erence. En particulier, nous utilisons des d´eveloppments r´ecents en apprentissage automatique (machine learning) pour caract´e- riser les propri´et´es ad´equates des signaux de parole et de musique ; nous utilisons des probabilit´esa priorinon-param´etriques afin de caract´eriser la r´egularit´e de l’enveloppe spectrale et nous am´eliorons la proc´edure d’apprentissage grˆace `a l’apprentissage dis- criminatif du mod`ele.
Inférence dans les HMM hiérarchiques et factorisés : changement de représentation vers le formalisme des
Réseaux Bayésiens.
Sylvain Gelly∗, Nicolas Bredeche∗, Michèle Sebag∗
∗Equipe Inference&Apprentissage - Projet TAO (INRIA futurs), LRI, Université Paris-Sud, 91504 Orsay Cedex
(gelly,bredeche,sebag)@lri.fr
1 Présentation du problème
Une limite essentielle des HMM, et plus généralement des modèles de Markov, concerne le passage à l’échelle, l’impossibilité de la prise en compte efficace de l’influence de phénomènes indépendants et la difficulté de généralisation.
Pour répondre à ces problèmes, plusieurs extensions existent. En particulier, nous nous intéresserons dans ce qui suit à lahiérarchisation (Theocharous et al. 2001, 2004) et à lafactorisation (Ghahramani 1996).
La hiérarchisation permet de réduire le nombre de liens entre états nécessaires dans un HMM et par là même de réduire la complexité algorithmique de l’apprentissage ainsi que l’imprécision. Quant à la factorisation, le principe est d’expliquer les observations par plusieurs causes plutôt qu’une seule. C’est à dire qu’on remplace le P(Y|X)des HMM parP(Y|X1, X2, ..., Xn). LesXisont des variables cachées pouvant être gérées indépendamment. LesP(Xt+1i |Xti)sont alors différents pour chaquei.
– L’existence de dépendances multiples dans les FHHMM entraîne à priori une explosion combinatoire du nombre de paramètres à apprendre, ce qui est d’autant plus problématique lorsque peu d’exemples sont à notre disposition (ceci est une propriété inhérente à la robotique) ;
– La présence de circuits dans les dépendances conditionnelles entre les variables d’un FHHMM empêchent la modélisation directe par un réseau bayesien. Il est à noter que ces dépendances ne concernent les variables qu’à un même pas de temps (synchrones).
Dans la suite de cet article, nous ne ferons pas de différence entre les dépendances synchrones et les transitions temporelles, les deux types étant desdépendances condi- tionnelles entre deux variables.
On ne peut ainsi pas adapter directement les algorithmes existants dans le cas des HMM factorisés, ou hiérarchiques.
Un aspect important du problème est que notre système apprend à partir de don- nées éparses car nous faisons l’hypothèse que nous ne disposons que d’un petit nombre d’exemples pour apprendre. Ceci se justifie par le domaine d’application (la robotique située), où le processus d’échantillonnage des données est contrôlé par un compor- tement dépendant entre autres de l’environnement et des capacités du robot qui ne permet pas d’obtenir beaucoup d’exemples. Par conséquent, nous souhaitons exprimer un compromis entre précision et vitesse de l’apprentissage.
Représentation et reconnaissance de caractères manuscrits par Réseaux Bayésiens Dynamiques
Laurence Likforman-Sulem, Marc Sigelle
GET-ENST/ Traitement du Signal et des Images et CNRS-LTCI (UMR 5141) 46, rue Barrault, 75013 Paris
{likforman|sigelle}@tsi.enst.fr
1 Introduction
Les approches stochastiques, tels que les modèles de Markov cachés (HMM), sont largement utilisées pour la reconnaissance de la parole et de l’écrit (Elms et al. 1998 ; Hallouli et al. 2002) pour leur capacité à s’adapter aux distorsions élastiques temporelles et spatiales. Cependant ces modèles sont mono-dimensionnels. Une adaptation doit donc être réalisée pour les images, par nature bi-dimensionnelles : celles ci sont converties en séquences 1D d’observations le long d’une direction. Une séquence admissible d’observations est par exemple la suite des colonnes de pixels en balayant l’image de gauche à droite. D’autres séquences sont possibles : vecteurs de caractéristiques sur des fenêtres glissantes, lignes de texte...
Les HMM font l’hypothèse que les observations sont indépendantes conditionnellement aux états cachés, ce qui n’est pas toujours réaliste pour les images. Des extensions des HMM permettant de mieux prendre en compte l’aspect bi-dimensionnel des images ont ainsi été proposées avec les modèles pseudo-2D (ou planar HMM) (Gilloux 1994). Plus récemment, des modèles 2D à base de champs de Markov ont été développés (Park et Lee 1998 ; Saon et Belaid 1999 ; Chevalier et al. 2003). En faisant apparaître les dépendances entre variables d’états ou observations, une modélisation plus fine de phénomènes peut être obtenue. Dans cette optique, des modèles probabilistes s’appuyant sur les réseaux bayésiens statiques sont apparus dans le domaine de la reconnaissance de l’écriture en-ligne (Cho et Kim 2003), l’analyse de documents (Souafi 2002) et l’authentification de signatures (Xiao et Leedham, 2002). Les réseaux bayésiens dynamiques sont une extension des réseaux statiques qui prennent en compte des séquences variables d’observations. On note ξt, l’ensemble des variables d’états et d’observations au temps t. Un réseau bayésien dynamique à deux pas de temps (2TBN) est défini par
– un réseau initial B1 qui spécifie la distribution initiale des états et les distributions conditionnelles des états et des observations à t=1
– un réseau de transition Btr qui spécifie les distributions P(ξt+1 | ξt ). Ces distributions sont supposées stationnaires, i.e. indépendantes de t.
Cette étude expérimente des modèles simples mono-flux de type HMM et des modèles couplés. Les structures couplées sont toutes construites par la mise en correspondance de deux réseaux simples mono-flux (ajouts de liens dans la structure graphique). Dans notre application, les états cachés sont des variables discrètes et les observations sont continues.
Les observations sont soit les lignes, soit les colonnes normalisées de pixels d’un caractère, obtenues par balayage séquentiel, soit les deux à la fois. L’évaluation de ces modèles a été réalisée sur la base de chiffres MNIST (LeCun 1998).
Les R´ eseaux Bay´ esiens versus d’autres mod` eles probabilistes pour le diagnostic multiple de gros
syst` emes
V´eronique Delcroix∗, Mohamed-Amine Maalej∗ Sylvain Piechowiak∗
∗LAMIH, Universit´e de Valenciennes et du Hainaut-Cambr´esis, Le Mont Houy, 59 313 Valenciennes cedex 9
Veronique.Delcroix,Mohamed-Amine.Maalej,[email protected] http ://www.univ-valenciennes.fr/LAMIH/
1 Introduction
Notre travail se situe dans le contexte du diagnostic multiple de syst`emes fiables et de grande taille. Les syst`emes que nous consid´erons sont constitu´es de composants, reli´es entre eux par leurs entr´ees ou sorties. Un composant C est soit en bon ´etat ok(C) soit d´efaillant ab(C). L’objectif du diagnostic est de trouver le ou les compo- sants d´efaillants qui expliquent le mieux des observations de panne. Plusieurs aspects rendent cette tˆache difficile : la grande taille des syst`emes consid´er´es implique qu’un grand nombre de composants peuvent ˆetre d´efaillants et que la liste des diagnostics cor- respondant `a des observations de panne peut ˆetre longue ; de plus, pour les syst`emes fiables, peu de sc´enarios de pannes sont connus et ils ne peuvent pas ˆetre utilis´es pour la recherche des diagnostics. En revanche, la probabilit´e de d´efaillance de chaque composant est connue. En fonction de ces contraintes pour la recherche des meilleurs diagnostics, les r´eseaux bay´esiens apparaissent comme un mod`ele tr`es bien adapt´e.
Apr`es avoir d´ecrit les r´eseaux bay´esiens que nous utilisons, nous pr´esentons notre al- gorithme de diagnostic. Nous comparons ensuite notre approche avec d’autres mod`eles probabilistes utilis´es pour le diagnostic et expliquons en quoi ils ne sont en g´en´eral pas adapt´es au diagnostic multiple de syst`emes fiables et de grande taille.
2 D´ efinitions et pr´ esentation du mod` ele utilis´ e
Unr´eseau bay´esien est un graphe orient´e sans circuit dont les nœuds repr´esentent les variables du syst`eme (Becker et Na¨ım, 1999). Dans notre mod`ele, lesvariables du syst`eme incluent les variables d’entr´ees/sorties des composants et les variables d’´etat (okouab) des composants. A chaque nœud est associ´ee une distribution de probabilit´es conditionnelles. On appelle observations de pannes un ensemble de variables dont la valeur est connue et incompatible avec l’´etat normal du dispositif : au moins un compo- sant est d´efaillant. Un´etat du syst`eme repr´esente une affectation d’un ´etat (okouab)
`a tous les composants du syst`eme. Undiagnosticest un ´etat du syst`eme coh´erent avec les observations de panne. Pour simplifier, nous d´esignons parfois un diagnostic comme l’ensemble des composants d´efaillants. Un diagnostic est simple ou multiple selon le nombre de composants d´efaillants. L’objectif est de calculer les “meilleurs” diagnostics
Réseaux bayésiens pour le filtrage d’alarmes dans les systèmes de détection d’intrusions
Ahmad Faour1,2 Philippe Leray1 Cédric Foll1,3 [email protected] [email protected] [email protected]
1 Laboratoire PSI - FRE CNRS 2645, INSA Rouen, France
2 Laboratoire LPM, Université Libanaise, Beyrouth, Liban
3 Rectorat de Rouen, France
1 Introduction
La détection des tentatives d’attaques sur un réseau est une problématique très importante dans le domaine de la sécurité informatique. Les NIDS (Network Intrusion Detection Systems), systèmes de détection d’intrusions, génèrent tellement d’alertes sur un réseau qu’il en devient très difficile de déterminer celles générées par une attaque réelle. L’utilisation d’outils de raisonnement probabiliste comme les réseaux bayésiens (RB) peut être efficace pour détecter les problèmes réels. Nous allons donc tout d’abord présenter les systèmes de détection d’intrusions et leurs limites puis passer brièvement en revue l’application de méthodes d’apprentissage à cette problématique. Nous décri- rons enfin notre architecture de filtrage d’alarmes issues de NIDS.
2 Systèmes de détection d’intrusions
Les firewalls utilisés sur les réseaux TCP/IP fonctionnent sur l’analyse des couches IP et TCP/UDP/ICMP, pour déterminer quelles sont les machines impliquées dans la connexion et à quel service la connexion s’adresse. Ce genre d’approche, bien que nécessaire, se révèle insuffisant dans bien des cas (Chambet, 2002). Il faut donc pousser plus loin l’analyse en examinant aussi les couches réseaux supérieures. Cette tâche, plus difficile, est dévolue aux NIDS. Ces logiciels fonctionnent le plus souvent par signatures, sur le même principe que les anti-virus (Zimmermann et al., 2002), en répertoriant les attaques connues. Une alarme est donc générée à chaque fois qu’une trame réseau res- semble à une des attaques répertoriées. Lorsqu’un nouvel exploit (tentative d’intrusion réussie) est répertorié, une signature adaptée sera ajoutée à la base de signatures. Cette approche est souvent utilisée conjointement avec une approche statistique dans laquelle le NIDS détermine d’abord un profil type du réseau (nombre de paquets échangés, vo- lume des flux, nombre de connections, etc.) et alarme ensuite l’administrateur lorsque le trafic courant dévie de ce profil. Malheureusement, les NIDS émettent généralement une quantité importante d’alarmes que l’administrateur n’est pas capable d’interpréter rapidement.
Depuis (Denning, 1987), les approches à base d’apprentissage statistique proposées pour la détection d’intrusion peuvent être classées en deux types : les méthodes essayant d’opérer avec les mêmes informations que les NIDS classiques (analyse de données réseaux), et celles opérant à partir de données comportementales de plus haut niveau (fichiers de logs de certaines applications ou du système).
Causal Inference in Multi-Agent Causal Models
Sam Maes, Stijn Meganck, Bernard Manderick Computational Modeling Lab,
Vrije Universiteit Brussel, Pleinlaan 2 - 1050 Brussel, sammaes, smeganck, [email protected],
http ://como.vub.ac.be
1 Introduction
This paper treats the calculation of the effect of an intervention (also called causal effect) on a variable from a combination of observational data and some theoretical assumptions. Observational data implies that the modeler has no way to do experiments to assess the effect of one variable on some others, instead he possesses data collected by observing variables in the domain he is investigating.
The theoretical assumptions are represented by a semi-Markovian causal model (SMCM), containing both arrows and bi-directed arcs. An arrow indicates a direct causal relationship between the corresponding variables from cause to effect, meaning that in the underlying domain there is a stochastic processP(effect|cause) specifying how the effect is determined by its cause. Furthermore this stochastic process must be autonomous, i.e., changes or interventions inP(effect|cause) may not influence the assignment of other stochastic processes in the domain. A bi-directed arc represents a spurious dependency between two variables due to an unmeasured common cause (Tian and Pearl, 2002), this is also called a confounding factor between the corresponding variables.
Deciding if a causal effect is identifiable (i.e. can be computed) in a SMCM amounts to assessing whether the assumptions of a diagram are sufficient to calculate the effect of the desired intervention from observational data. When all variables of a domain can be observed, all causal effects are identifiable. In the presence of unmeasured confounders, identifiability becomes an issue (e.g. the causal effect ofX onY is not identifiable in the causal diagram of Figure 1, since we can not distinguish causal influence fromX toY form the influence via the unobserved confounder (Pearl, 2000).
X Y
Fig.1 –The causal effect ofX onY is not identifiable in this SMCM.
In this paper we introduce an algorithm for the identification of causal effects in a context where no agent has complete access to the overall domain. Instead we consider a multi-agent approach where several agents each observe only a subset of the variables.
The main advantages of the multi-agent solution is that the identification of causal
R´ eseaux Bay´ esiens de Niveau Deux et D-S´ eparation
Linda Smail, Jean-Pierre Raoult
Laboratoire d’Analyse et de Math´ematiques Appliqu´ees (CNRS UMR 8050) Universit´e de Marne-la-Vall´ee
5 boulevard Descartes, Champs sur Marne 77454 Marne-la-Vall´ee Cedex 2 [email protected], [email protected]
R´esum´e. Etant donn´e une famille de variables al´eatoires (Xi)i∈I, mu- nie de la structure de r´eseau bay´esien et un sous-ensembleS deI, nous consid´erons le probl`eme de calcul de la loi de la sous-famille (Xa)a∈S
(resp. la loi de (Xb)b∈S¯, o`u ¯S =I−S, conditionnellement `a (Xa)a∈S).
Nous mettons en ´evidence la possibilit´e de d´ecomposer cette tˆache en plu- sieurs calculs parall`eles dont chacun est associ´e `a une partie deS (resp.
de ¯S) ; ces r´esultats partiels sont ensuite regroup´es dans un produit. Dans le cas du calcul de (Xa)a∈S, ceci revient `a la mise en place sur S d’une structure de r´eseau bay´esien de niveau deux.
1 Introduction
Etant donn´e un r´eseau bay´esien (Xi)i∈I, nous nous int´eressons, ´etant donn´e une partie non videSdeI, `a la loiPSde la sous-familleXS= (Xi)i∈Set `a la loiPS/S¯ , de la sous-familleXS¯= (Xj)j∈S¯conditionnellement `aXS.
Dans les r´eseaux bay´esiens poss´edant de nombreaux nœuds et fortement connect´es, le calcul de lois ou de lois conditionnelles peut faire intervenir des sommations relatives `a de tr`es gros sous-ensembles de l’ensemble des indicesI. Il y a donc int´erˆet `a s’efforcer, au pr´ealable, de d´ecomposer, s’il est possible, ces calculs en plusieurs calculs moins lourds et pouvant ˆetre men´es en parall`ele. Cette d´ecomposition est li´ee `a des propri´et´es du graphe d´efinissant le r´eseau.
Les formules donnantPSetPS/S¯ apparaissent alors comme des produits de facteurs d´ependant isol´ement des atomes pour des partitions appropri´ees.
La construction de ces partitions fait intervenir deux relations d’´equivalence dans S¯, toutes deux du type :xetysont ´equivalents si et seulement s’ils sont reli´es, dans un graphe non orient´e (GNO) convenablement d´eduit du graphe orient´e (GO) d´efinissant le r´eseau bay´esien, par une chaˆıne ne passant pas parS. Deux tels GNO sont consid´er´es ; l’un, classique, est le graphe moral, pour lequel les arˆetes relient les nœuds joints par un arc ou ceux ayant un enfant en commun ; l’autre, `a notre connaissance original, est le graphe hyper-moral, pour lequel les arˆetes relient les nœuds joints par un arc ou ceux dont les descendances proches (voir d´efinition dans (Smail 2004) et en 2 ci-dessous) ont une intersection non vide .
La formule de calcul dePSest li´ee `a une structure de r´eseau bay´esien dont les nœuds ne sont pas les ´el´ements deI mais les atomes d’une partition deI (notion introduite en (Smail 2003) sous le nom de r´eseau bay´esien de niveau 2).