Systèmes d’information logiques et leurs applications
Mireille Ducassé
[email protected] septembre 2010
Avec de larges emprunts à Sébastien Ferré, Peggy Cellier et Véronique Abily
de l’équipe LIS de l’IRISA
Introduction
• Données de plus en plus importantes
– mail, fichiers, photos, musique, …
• Le problème n’est plus le stockage des données mais :
– Comment les organiser ?
– Comment les retrouver facilement ?
Les solutions existantes 1/2
• La navigation hiérarchique
– Systèmes de fichiers
• Critères spécifiés dans un ordre fixé
• Emplacement et chemin unique pour un fichier
• L’interrogation par requêtes
– Bases de données
• Pas de guidage de l’utilisateur
• Rajout de descriptions difficile : Nécessite une modification du schéma
– Moteurs de recherche
• Pas besoin de connaître le schéma de la base
• Requête = ensemble de mots
– Systèmes à base de tags
• Pas de schéma, juste un ensemble d’étiquettes
• Mise à jour de la base par les utilisateurs : rajout de tags
• Langage de requête limité
Les solutions existantes 2/2
Critère Système de fichiers
Base de données
Systèmes à base de tags
Extensible x
Typage x
Relation d’ordre x
Requête THEN AND, OR, NOT AND/OR
Navigation x
LIS : Systèmes d’information logiques
• descriptions extensibles par l’utilisateur
• données typées
• relations d’ordre entre les valeurs
• requêtes expressives : patterns, AND, OR, NOT
• système de navigation guidant l’utilisateur
• requêtes et navigation intégrées
en s’appuyant sur l’analyse logique de concepts (LCA),
extension de l’analyse formelle de concepts (FCA)
FCA : Analyse Formelle de Concepts Données
• Contexte formel
– objets + attributs + relation binaire
petite moyenne grande Proche du soleil Loin du soleil Avec sat. Sans sat.
Mercure X X X
Vénus X X X
Terre X X X
Mars X X X
Jupiter X X X
Saturne X X X
Uranus X X X
Neptune X X X
Pluton X X X
Des objets aux attributs : intension
petite moyenne grande Proche du soleil Loin du soleil Avec sat. Sans sat
Mercure X X X
Vénus X X X
Terre X X X
Mars X X X
Jupiter X X X
Saturne X X X
Uranus X X X
Neptune X X X
Pluton X X X
Intent: ensemble maximal d’attributs partagés par l’ensemble d’objets O
intent (O) = {attr | obj O : ∀ ∈ (obj , attr ) I } ∈
ex : intent ({Terre, Pluton}) = {petite , avec sat.}
Des attributs aux objets : extension
petite moyenne grande Proche du soleil Loin du soleil Avec sat. Sans sat.
Mercure X X X
Vénus X X X
Terre X X X
Mars X X X
Jupiter X X X
Saturne X X X
Uranus X X X
Neptune X X X
Pluton X X X
Extent: ensemble maximal d’objets partageant un ensemble d’attributs A
extent (A) = {obj | attr A : ∀ ∈ (obj , attr ) I } ∈
ex : extent ({proche , avec sat.}) = {Terre, Mars}
FCA : Analyse Formelle de Concepts Concept formel
• Concept : paire (O, A) telle que
– O = extent (A) – A = intent (O)
• correspond à un rectangle maximal dans la
table
Treillis de concepts
petite moyenne grande Proche du soleil Loin du soleil Avec satellites Sans sat
Mercure X X X
Vénus X X X
Terre X X X
Mars X X X
Jupiter X X X
Saturne X X X
Uranus X X X
Neptune X X X
Pluton X X X
petite avec sat.
proche loin
sans sat. grande moyenne
Navigation dans le treillis
proche loin
petite avec sat.
sans sat. grande moyenne Mercure Terre Pluton Jupiter Uranus Vénus Mars Saturne Neptune
proche !
avec sat. !
Requête dans le treillis
proche loin
petite avec sat.
sans sat. grande moyenne Mercure Terre Pluton Jupiter Uranus Vénus Mars Saturne Neptune
proche AND avec sat. !
Mise à jour :
restructuration automatique 1/2
• Il y a de la vie sur terre
petite avec sat.
proche loin
sans sat. grande moyenne Mercure Mars Pluton Jupiter Uranus
Vénus Saturne Neptune vie
Terre
Mise à jour :
restructuration automatique 2/2
• Pluton n’est plus une planète !
avec sat.
proche loin
sans sat. grande moyenne Mercure Mars Jupiter Uranus Vénus Saturne Neptune
vie
Terre
petite
LCA : Analyse Logique de Concept [Ferré &
Ridoux, 2000]
L’analyse formelle de concept permet de combiner requêtes simples et navigation
mais il lui manque
• des types de données riches
• des requêtes complexes (OR, NOT, patterns)
• implication entre les attributs
Ces aspects sont fournis par la logique
Un ensemble d’attributs est remplacé par une
formule logique
Camelis [Ferré, 2007]
• Implémentation d’un système d’information logique (LIS)
– s’appuie sur LCA
– combine requêtes et navigation
• Construction de requêtes complexes à partir d’une simple navigation
• Seuls les liens de navigation pertinents pour la requête courante sont visualisés
– offre une navigation « locale »
• Les treillis deviennent très vite beaucoup trop gros pour
être investigués de manière globale
Camelis : Interface graphique
Fenêtre des objets
(extension) Requête courante
Fenêtre de navigation
(intension, incréments)
Naviguer dans le contexte
• Édition de la requête
– formules logiques
• Sélection d’attributs
– Downward : incréments + connecteurs logiques – Upward : relachement
– Sideward : downward + upward
• Sélection d’objets
– Interrogation par l’exemple
Les trois fenêtres sont toujours cohérentes entre elles
– quelle que soit celle par laquelle l’utilisateur a agi
Camelis : Conclusion
• Navigation et interrogation intégrées
– analyse de données manuelle possible même pour de grands jeux de données
• Nombreuses applications possibles
– Photos : collection personnelle de 6000 photos
• Récupération des photos, création de diaporamas
– Musique : environ 2000 fichiers
• Construction de listes pour lecteur multimédia
– Bibliographie : fichiers BibTex et résultats de recherche DBLP
– Hiérarchie de fichiers : droits d’accès, date de modification, propriétaire, … – Fichiers CSV : ligne = objet, colonne = attribut, cellule = valeur
– ...
• Transduceur et interface graphique génériques
– OK pour essais préliminaires
– demandent rapidement à être spécialisés
• Performances OK jusqu’à ~1 millions de « liens » objet/attribut
Serenelis
[Ducassé, Ferré 2008]
Application des LIS à l’aide à la décision
Travaux présentés à ICCS 2008, « International Conference on Conceptual Structures »,
version étendue publié en 2010 dans la revue francophone « Nouvelles Perspectives en
Sciences Sociales », Québec.
Motivation
• Beaucoup de décisions prises en commission
– recrutement, allocation de ressources…
• Souvent frustrant
– Souvent conflictuel
– Pas de meilleure solution évidente
– Critères de sélection difficiles à exprimer – Décision multicritère difficile à prendre
– Situation difficile à embrasser dans sa globalité
• « Cristalliser » l’information
Approche quantitative
• Scores selon des critères
• Poids à chaque critère
• Calcul combinant les deux aspects
– score global pour chaque possibilité
Avantage : les nombres sont naturellement totalement ordonnés
Inconvénient : pas facile de comprendre les
décisions (et donc de les endosser)
Notre approche : qualitative
Utiliser les LIS pour
• structurer l’information
• naviguer dans cette information
• formaliser les décisions
Etude de cas
• Reconstitution d’une commission de spécialistes qui devait choisir parmi 43 candidats
• Seul outil utilisé à la réunion : un tableur
• Les arguments ont été reconstitués a
posteriori
Contexte multivalué
Objets : noms des candidats 16 attributs/critères
Name CS backgroundteaching Exp. > 100hPratical exp. pedagog. ProjectDate end thesisThese location research team Integration irisa #journals #Int confs #nat. Confs other publi. Bonus Malus Reporter
AOG no 0 4 0 Brest Re
ARI yes yes yes juilllet 06 Saint-Etienne Alestx yes 1 4 3 Java spectre etroit Cp
BER yes yes 2006 ENSM Saint Etienne 2 6 1 3 Ba
BEJ yes yes yes yes 2006/2007 INT Evry ps ? yes 0 0 0 0 2ws date de soutenancePt
BED yes yes yes juil-04 Paris XI a2 ? yes 1 4 1 2 Me
BOL yes yes yes yes 2006 Telecom R&D+Irisatx yes 0 2 4 2 Cours A D + 265HTD Ba
BUN yes yes yes yes fin 2006 IRISA ps yes 0 5 1 2 2ws Ge
CAL yes yes yes yes dec-05 IRISA ic + tx yes 0 3 2 3 ATER R1 avec enseignement de Genie Logiciel (Design Paterns+ UML+ Ö). En recherche ouverture vers TexMEx et participation a l'encadrement de thesards- participation a une valorisation FT R&D. Lettre enseignement Noel Plouzeau et Yann Rg et Me-JoRelative faiblesse du dossier de publicationAi
CES no 61e yes(61e) yes 12/12/05 (Ecole Navale)BRESTimages yes 5 6 3 4 ens (61) : automatique+traitement du signal+ electronique+...Al
CHU yes no yes mars-06 Bordeaux no 0 2 1 1 dossier tres mal faitDe
COH yes yes ? ? Univ Versailles? yes 0 0 2 1 partiellt reseauxMe
CRO yes yes yes yes fin 2006 Montpellier II se yes 1 0 2 5 ens. PharmaciePo
DEA yes yes yes minimal sep-06 Toulouse tl? le ? no 0 3 0 2 enseignement volumineux + statsdossier recherche faibleSt
DES yes yes yes dec-06 Univ Picardie Amiensap ? ps ? yes 2 4 0 0 rech+/ens systeme Pt
DIT no no yes juil-05 Paris 6 lc yes 2 3 2 qualifie 61eme et 60emeFn
DOE yes yes yes juil-06 IRIT Toulouse vs ? no 0 4 2 1 Mo
DUT yes yes yes oct-05 Nimes le ? yes 3 6 4 1 comite de programme+ transferts industriels+coencadrement DEADe
DUN no no 4 4 3 1livre 33ans Re
FEI no no no 2007? Lille no 0 0 0 1poster totalement hors profilDe
FRD no yes sep-05 Inria Sophia lc yes 2 1 0 3 Rg
GUX yes yes yes no 12.2006 Univ. Rennes 1 LTSI - INSERMvs yes 0 3 1 0 Ly
HAI no yes ? no nov-05 Ecole centrale Lille? ? 4 9 2 3 Automatique Qd
HII no aou-07 Lille 0 0 1 Cp
KOA no 61e yes yes no 12.2006 Ecole centrale de Lille yes 1 3 0 0 formation EII Ly
LEC yes no yes yes nov-06 IRISA+USA le yes 0 1 1 2 Mobilite aux EU (these en co-tutelle)Peu de publis encoreQn
LET no yes yes no dec-05 Nantes ? ? 0 2 0 3 submitted Qd
MAL no 63e yes yes dec-06 Grenoble vs ? yes 1 5 0 1 Rg
MON yes yes dec-06 Fac de medecine Rennes 1tx ? vs ? no 2 8 1 7 Gros dossier de publication + lettre de recommandatiosIntegration IRISA problematique et experience en enseignement trop basique (bureautique essentiellement)Ai
MOC yes yes yes 08/07 ?11/06 IRISA a2 ? yes 0 4 1 1 RR+1conf etudiants Ae
NIT yes yes yes yes 2005 ENSSAT Lanion ? 4 7 0 4 2 Brevets + 4 revues Ba
ORU yes yes yes yes fin 2006 Rennes 1 Ia yes 0 2 2 Recommendations elogieusesFn
PAN no yes yes 2 dec 2004 Nice ts ? ss ? yes 2 9 0 6 bon dossier recherchetres 61e St
PID yes yes yes yes 15/12/05 Paris Sud ap ? yes 3 1 1 2 lettres recommandation+conf int tres selectiveAe
PRT yes yes yes yes 1/11/06 IRISA lc yes 1 5 3 2 soum. Ge
PRS yes yes yes 12-mai Le Havre (Cardon)se ? ps ? 0 0 5 0 Participation a un projet europeen TIM + projet web pedagogique + encadrement stagesCr
RAC yes no yes debut 2007 IRISA yes 2 6 0 2 recommandation JPBAucune experience d'enseignementMo
REK no 61e. yes 01/11/2006 ? Ecole Centrale Paris ? 2 4 0 3 Al
REI yes no no yes dec-06? Nimes ? ? 1 6 2 these 61 + tres peu d'enseignementQd
ROU yes yes yes yes nov-06 IRISA ic yes 0 2 2 Dossier equilibre enseignement/rechercheQn
SED yes yes yes aout 2006 Calais dm yes 0 4 3 2 Po
SIU yes yes yes yes hiver 2007? IRISA ls yes 1 1 1 5 pb de fin de these? Trop forte (?!) implication dans l'enseignement+ le developpement+ et autres activitesCr
SOZ yes yes yes nov-05 Amiens ps yes 1 3 1 5 Spectre enseign. Cp
TOL yes yes legere no 4.2007 Universite d'Evry yes 0 3 1 2 R.I. Ly