M ATHÉMATIQUES ET SCIENCES HUMAINES
E NGELBERT M EPHU N GUIFO
Une nouvelle approche basée sur le treillis de Galois, pour l’apprentissage de concepts
Mathématiques et sciences humaines, tome 124 (1993), p. 19-38
<http://www.numdam.org/item?id=MSH_1993__124__19_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1993, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE NOUVELLE APPROCHE
BASÉE
SUR LE TREILLIS DEGALOIS,
POUR L’APPRENTISSAGE DE CONCEPTS
Engelbert
MEPHUNGUIFO1
RÉSUMÉ 2014 L’apprentissage
automatique à partird’exemples
consistegénéralement
à caractériser unensemble
d’objets
dénotant un concept. Nous avonsdéveloppé
deux méthodesd’apprentissage symbolique,
LEGAL et LEGAL-E, qui
s’appuient
sur le même modèled’apprentissage,
et utilisent une technique degénéralisation
descendante, basée sur lalogique
des propositions et sur la structure de treillis de Galois, pourproduire
un ensemble dedescriptions
structurées et ordonnées. Ellesdiffèrent
dans leur approche deproduction
deconnaissances.
Pour des raisons de
complexité,
seules deux variantes de LEGAL-E sont évaluées sur leproblème
de laprédiction
de sites de jonctions introns-exons. Une comparaison à d’autres méthodes montrent que nos résultats sont
meilleurs que ceux obtenus avec des méthodes
symboliques,
et sont relativementcomparables
à ceux desmeilleures méthodes neuronales. Nous montrons enfin que LEGAL-E peut être vu comme un réseau de neurones multi-couches, simple et
dynamique.
SUMMARY 2014 A new approach based on Galois lattice for concept learning
The main
goal
of machinelearning
systems is to characterise a concept denotedby
a set of examples. We havedesigned
andimplemented
asymbolic-based
method, LEGAL, which uses atop-down generalisation
mecanismbased on
propositional logic
and Galois lattice structure, to build a setof ordered
and structureddescriptions.
Its major drawback relies on its time and spacecomplexity
whenbuilding
learnedknowledge.
Our
goal
in this paper is to present a new learning method LEGAL-E which uses adifferent
approachallowing
to reduce this drawback. Two variants of this method are tested onto the
problem
ofsplice
junction sitesprediction
on primate genetic sequences. A comparison to others machine learning systems shows that ourresults are far better than those obtained with
symbolic
representation, and are asgood
as the best neural networks-based ones. We finally show that LEGAL-E can be assimilated to a simple anddynamic multi-layer
neural network method.
1. INTRODUCTION
Les
techniques d’Intelligence Artificielle, parmi lesquelles
cellesd’apprentissage, permettent
de concevoir dessystèmes
dits"intelligents". L’apprentissage
est laproduction
et l’évaluation de modèles devant êtreexploités après
validation parl’expert
d’un domaine. Il existeplusieurs
types d’apprentissage [Michalski
&Kodratoff, 1990], [Mephu Nguifo, 1993].
Nous avonsfocalisé notre travail sur
l’apprentissage
inductif par détection de similarités àpartir d’exemples (SBL: Similarity
BasedLeaming), qui
dénotent unconcept.
1 Laboratoire
d’Informatique,
de Robotique et deMicroélectronique
deMontpellier,
UMR n°9928 CNRS-USTL 161 rue ada - 34392 Montpellier Cedex 5 ; e-mail: mephu@lknm,fr ; Fax: 67 41 85 00 ; Tel: 67 41 85 83.Dans le
paradigme SBL,
leproblème
de la formation desconcepts
estprincipalement
lié àcelui de la classification des
objets.
L’idéeprincipale
est de caractériserchaque
sous-classe desobjets
de l’ensembled’apprentissage.
On posel’hypothèse forte
selonlaquelle
lesobjets
sontclassifiables
dans des sous-classes exclusives. Cetype
de méthodes SBLengendre
une formulelogique qui représente
la connaissanceapprise.
Cette formule est unedisjonction
deconjonctions
d’attributs
binaires,
oùchaque conjonction
est en mêmetemps l’étiquette
d’une sous-classe et lapropriété qui exprime
la relationd’appartenance à
cette sous-classed’objets.
L’ensemble desobjets
est ainsi divisé en sous-classesdisjointes.
Dans ce cas,l’explication
de la décision estdonnée par une
étiquette
declasse,
et la validation de la méthode est effectuée par une estimationstatistique.
Une méthode bien connue de cetype
est la méthode ID3développée
parQuinlan [1986].
Dans notre
approche,
nous considéronsqu’un objet
doitpouvoir interagir
presque de la mêmefaçon
que sonvoisinage.
Il devient parconséquent
difficile d’exhiber une classificationhiérarchique significative
desobjets.
Notrehypothèse
est basée sur lefait qu’il
y adifférentes
manières d’être considéré comme
similaires,
etqu’un objet peut
être un élément deplusieurs
sous-ensembles
significatifs.
Lesobjets
sontregroupés
dansplusieurs
sous-ensembles. Les méthodesd’apprentissage
construisent dans ce cas un ensemble deconjonctions
d’attributs oùchaque conjonction
estl’étiquette
d’un sous-ensemble.Cependant,
iln’y
a pas de processus de décisionparticulière
dérivant de laphase d’apprentissage,
maisplutôt
une certaine latitude estlaissée pour élaborer
plusieurs
processus différents. LEGAL[Liquière
&Mephu, 1990]
estconçu à
partir
de cesidées,
et le treillis de Galois est une des meilleures manières deproduire
cesrecouvrements.
Le treillis de Galois ou treillis des
concepts
est une notion centrale dans un domaine de recherche relativement récentappelé Analyse
Formelle desConcepts [Wille, 1982],
basé sur unmodèle ensembliste de
concepts
et de hiérarchies deconcepts.
Dans le modèle deWille,
onrecherche des relations ou
dépendances
entreobjets
ouattributs, qui
sontprésentes
dans lecontexte initial. Alors que nous cherchons à caractériser un
concept
à travers le contexte initialqui
le dénote etqui peut
êtresimplement
une vuepartielle
duconcept,
les donnéespouvant
êtreincomplètes
et erronées.Le
principal avantage
du treillis de Galois réside dans son exhaustivité. De cetavantage,
découle un inconvénientmajeur:
tous lesalgorithmes
de construction du treillis ont unecomplexité exponentielle
en fonction du nombre d’attributs etd’objets.
Il est alors nécessaire d’introduire desheuristiques
pour réduire cettecomplexité.
Nous nous sommesappuyés
sur leprincipe
de lalogique majoritaire déjà
utilisée dans lesystème
CALM[Quinqueton
&Sallantin, 1986]
pour définir cesheuristiques
dans nos deux méthodes LEGAL et LEGAL-E. Les deux méthodesgénèrent
unsup-demi
treillis deconcepts,
mais leurprincipale
différence réside dans le fait que lors de lagénération,
LEGAL utilise tous lesobjets (exemples
+contre-exemples)
tandisque LEGAL-E se focalise seulement sur les
exemples.
Deux variantes de la méthode LEGAL-E ont été
implémentées
et testées sur uneapplication
de
biologie
moléculaire(la prédiction
de sites dejonctions d’épissage).
Les résultats obtenusdans les deux cas montrent un
comportement
relativementidentique
des deux variantes.Cependant,
unecomparaison
effectuée avec les résultats obtenus par d’autres méthodesd’apprentissage
sur le mêmejeu
dedonnées,
montre que LEGAL-E secomporte
relativement mieux que certaines méthodessymboliques,
et aussi bien que les méthodes neuronales.Après
un brefrappel
sur la notion de treillis deGalois,
nous allons introduire la méthode LEGAL au travers d’unpetit exemple (figure 1).
Nous définissons ensuite la méthode LEGAL- E et deux de ses variantes. Ces deux variantes de LEGAL-E sont évaluées sur unproblème
debiologie moléculaire,
etcomparées
à d’autres méthodesd’apprentissage.
Nous montrons enfinles relations existant entre LEGAL et réseau de neurones.
2. TREILLIS DE GALOIS
Nous introduisons la notion de treillis de Galois en définissant ses notions de base et en
l’illustrant sur un
exemple (figure
1 et2).
Lareprésentation
duale du treillis de Galoispossède
une utilité
potentielle.
Eneffet, après
Barbut etMonjardet [1970],
Wille[1992]
montre que ce modèle est une nouvelleapproche
pourl’analyse
dedonnées,
et pour les méthodes dereprésentation
formelle de connaissanceconceptuelle. Duquenne
&Guigues [ 198b]
s’intéressentégalement
à la recherche de familles non redondantesd’implications
contextuelles àpartir
de lastructure de treillis de Galois. Godin et ses
collègues [1986]
utilisent ce modèle pourreprésenter
une base d’informations dans
laquelle
onpeut
facilementnaviguer
pour rechercher des données.Figure 1 : Exemple de contexte.
Figure
2 : Treillis de Galois de la figure 1.Si l’objet o E 0 vérifie l’attribut a E A alors la case correspondante à la ligne o et à la colonne a est égale à 1.
Un rectangle matérialise un concept, et une arête entre 2 concepts représente la relation d’ordre entre les concepts.
Contexte :
Un contexte K est un
triplet (0, A, 1),
où 0(resp. A)
est un ensemble finid’objets (resp.
d’attributs),
et 1 x A est une relation binaire entre 0 etA,
définie comme suit :L’objet
o E 0 vérifie l’attribut a E A ssi lecouple (o, a)
E I. On a donc :(o, a)
E 1 -> o 1 a.L’expression
encompréhension
d’un sous-ensembled’objets
X c 0 est définie par :X’=IAEA
1 o I aexemple : X = { 1,2,7 }
~ X’ ={ a,c,f }
De
façon duale, l’expression
en extension d’un sous-ensemble d’attributs Y c A est :Y’={oe0 !
1 o I a’VaeY} exemple : Y = { d,e }
~Y’ _ { 1,2,3,5 } Correspondance
de Galois:Soient f et g, deux
applications
définiesrespectivement
deP(O)
dansP(A)
et deP(A)
dansP(0)
etqui respectivement
à X associe X’ et à Y associe Y’. A l’évidence f et g sont desapplications
monotones décroissantes satisfaisant lespropriétés
suivantes :L’application composée
h =f-g (resp.
h’ =g*f)
est une fermeture dans l’ensemble desparties P(O) (resp. P(A)) [Barbut & Monjardet, 1970].
Pardéfinition,
lecouple (f, g)
forme unecorrespondance
de Galois entre l’ensemble desparties P(O)
et l’ensemble desparties P(A).
Concept :
Un concept dans
(0, A, I)
est uncouple (X, Y),
X ç 0 et Y cA,
où X’=Y et Y’=X.Autrement
dit,
X est l’ensemble de tous lesobjets qui
vérifient tous les attributs de Y(extension),
et Y est l’ensemble des attributs communs à tous lesobjets
de X(compréhension).
La notion de
concept
est donc ici formée de deuxparties:
unecompréhension
constituée detous les attributs
qui
sont à la fois nécessaires et suffisants pourl’appartenance
auconcept2,
etune extension formée de tous les
objets
vérifiant ces attributs. Dans lafigure,
unconcept peut
être vu comme unrectangle
maximal de’l’ au sens de l’inclusion[Guénoche, 1990].
Relation d’ordre :
Tous les
concepts
d’un contexte K sont ordonnés par la relation desous-concept
1sur-concept.
Soient L l’ensemble de tous les
concepts
deK,
L ={ (X,Y)
EP(0)
xP(A)
1 X = Y’ ety = X’}
et _ une relation d’ordre sur L définies par :
(XI, YI)
S(X2, Y2)
ssiXI
cX2 (ou YI
?Y2)
On dit que:
(X1, YI)
est unsous-concept (spécialisation)
de(X2, Y2)- (X2, Y2)
est unsur-concept (généralisation)
de(X1, Y,).
Treillis de Galois d’une
correspondance binaire.;
L’ensemble L muni de la relation d’ordre ,
(L, ), possède
la structure d’un treilliscomplet,
etest
appelé
Treillis de concept du contexte K et notéL(K),
ou encore Treillis deGalois, T,
de la relation binaire 1 sur 0 x A(figure 2).
Il existe
plusieurs algorithmes
de construction des éléments dutreillis, parmi lesquels
onpeut
citer ceux deChein, Norris, Ganter,
et Bordat(voir [Guénoche, 1990]).
Tous cesalgorithmes génèrent
lesconcepts
dutreillis,
mais le dernierpermet
de construireplus
facilement le treillis[Bordât, 1986].
C’est celui que nous utilisons dans nos deux méthodes.L’algorithme
de Bordatconstruit les éléments du treillis et les arêtes de son
graphe
deHasse3.
Cette construction estbasée sur la relation de couverture de la relation d’ordre:9
[Bordat, 1986] [Liquière
&Mephu, 1990].
La construction d’un treillis de Galois est
exponentielle
en fonction du nombred’attributs,
car le nombre de sommets obtenus
peut
être de la forme 2n. Le nombre d’éléments du treillis construit est"exponentiel"
en fonction de la taille des données. Dans lapratique,
lesexemples
traités
gardent
souvent une taille raisonnable pour que l’ons’y
intéresse deprès.
En
fait,
lacomplexité
est aussi fonction du contenu du tableaubinaire,
parconséquent
leproblème,
dans lapratique, peut
être résoluplus rapidement
dans certains cas[Godin, 1989].
Deplus,
lacomplexité
entemps
et en mémoire est fortement réduite si le tableau initial est trié.Remarque :
Le Treillispeut
êtregénéré
enlargeur
ou enprofondeur.
Nous avonsimplémenté
lapremière : génération
enlargeur
ou par niveaux(en anglais:
"in breadth-flrstorder").
2 Elle se distingue avec la notion plus large de
"concept"
utilisé en Apprentissage pour se référer à un principeabstrait qui est en relation avec un sujet
particulier.
Une propriété d’un concept est qu’il est la généralisadon d’unensemble d’objets.
3 C’est le graphe dont l’ensemble des sommets est l’ensemble des concepts du treillis et les arêtes correspondent
à la relation de couverture de la relation d’ordre _.
3. TREILLIS DE GALOIS ET APPRENTISSAGE
Nous
présentons
ici les deux méthodesd’apprentissage
LEGAL etLEGAL-E,
et les illustronssur
l’exemple d’application
de lafigure
1.Le treillis de Galois est construit à
partir
d’un ensembled’objets
décrits par un ensemble d’attributs binaires. Le processus de construction du treillispart
duconcept
leplus général (décrivant
tous lesobjets),
et parspécialisations successives,
aboutit à un ensemble deconcepts.
C’est bien une méthode
descendante, qui
est facilementexploitable
enapprentissage.
Deplus,
letreillis de Galois offre une
représentation géométrique
intuitive et facilementreprésentable
enmachine,
surlaquelle
onpeut explorer
lesconjonctions
d’attributscaractéristiques possibles,
etapprendre
aisément. La structure du treillis de Galois offre leplus large
espaced’exploration
desrégularités.
Le treillis de Galois
permet également d’engendrer
facilement lesimplications
d’attributs[Duquenne
&al., 1986] - appelées règles -
liées au contexte étudié. Cesrègles
sontgénéralement
utilisées pour la construction de bases deconnaissances,
parexemple
lesrègles
deproduction
dans lessystèmes experts.
Dansl’exemple précédent,
on obtient àpartir
du treillis(figure 2) :
Autrement dit - et on le constate sur la
figure
1 - : -.. "tout
objet
vérifiant lapropriété
b vérifie aussi lapropriété a";
. "tout
objet
vérifiant lapropriété
f vérifie aussi lespropriétés
a et c".L’apprentissage
par l’intermédiaire du treillis limitera le nombred’implications
aux seulesrègles pertinentes
du contexte, dans la mesure où elles seront vérifiées parbeaucoup d’exemples.
La recherche d’unsystème
derègles (implications
entreattributs)
dans lesystème d’apprentissage
Charade[Ganascia, 1988]
est assimilable à la recherched’implications
contextuelles dans la structure du treillis de Galois
qu’effectuent Duquenne
& al.[1986].
Mais lastructure du cube de Hilbert
présente
ledésavantage
de contenir desdescriptions
nonmaximales,
et donc redondantes car elles
n’apportent
pas d’informations utiles pourl’exploitation
despropriétés engendrées.
Nous avons ainsi conçu et
implémenté
une méthode inductivesimple, conceptuelle,
etempirique, d’apprentissage
par détection desimilarités,
basée sur la notion de treillis de Galois pour construire un ensemble ordonné de faits(ou régularités)
àpartir
desdescriptions d’objets
caractérisant le
concept
àapprendre. L’avantage principal
de notre méthode est son exhaustivité bien que cela ait l’inconvénient de ralentir considérablement l’exécution dans le cas où il y a ungrand
nombre de données. Lesheuristiques
de choix desconcepts pertinents
du treillis réduisent considérablement cettecomplexité.
Cesheuristiques
sont basés sur les critères de validité et dequasi-cohérence.
3.1. Critères de validité et de
quasi-cohérence
Le but recherché ici est la réduction de la construction du treillis aux seuls
concepts
valides.Nous définissons
ci-après
les notions decomplétude,
decohérence,
devalidité,
dequasi-
cohérence et de
pertinence
liées à unconcept.
Mais avant, onpeut
remarquer que le treillis nesera pas
regénéré
en entier. On va obtenir un demi-treillisqui représente
notre espace deshypothèses (concepts).
Cette réduction diminuera considérablement letemps
de calcul.Novations
0+ :
ensemble desexemples ; 0» :
ensemble descontre-exemples ;
0 =0+ + 0’
U :
l’ensemble desconcepts valides ;
C :
l’ensemble desconcepts
valides etquasi-cohérents ;
P :
l’ensemble desdescriptions pertinentes ;
ct nombre minimum
d’exemples
liés à unconcept valide ;
P :
nombre maximum decontre-exemples
liés à unconcept
valide etquasi-cohérent ;
(Xo, Yo) :
leconcept
leplus général: Xo
= 0 etYo = 0.
Hypothèses
oc et
(i
sont les deuxparamètres
fixés parl’utilisateur,
etrespectivement appelés
seuil de validitéet de
quasi-cohérence,
avec les contraintes :( 1 )
0 S cc. S(2)
0 _(3
!g 10-1Complétude
et Cohérence d’unconcept :
- Un
concept (X, Y)
E L estcomplet
si sadescription
Y reconnaît tous lesexemples d’objets
du contexte ; autrement dit:0+
c X. On ditégalement
que ladescription
estcomplète.
- Un
concept (X, Y)
E L est cohérent si sadescription
Yrejette
tous les contre-exemples ;
autrement dit: 0- f 1 X =0.
On dit aussi que ladescription
est cohérente.Ces deux critères
peuvent parfois apparaître trop sévères,
etcontraignants.
Deplus, l’incomplétude
de ladescription
desobjets peut
induire une construction d’une connaissance erronée. Nous avons introduit deux nouveaux critères moinscontraignants.
Validité et
Quasi-cohérence
d’unconcept :
· Un
concept (X, Y)
E L est valide si sadescription
Y reconnaîtsuffisamment d’exemples d’objets
du contexte étudié. Sapremière composante
contient suffisammentd’objets qui
sont desexemples.
Ladescription
liée à ceconcept
estégalement
valide.U
={ (X, Y)
eL
1 ce et X ~ autrement dit unconcept (X, Y)
est valide siau moins oc
exemples d’objets appartiennent
à X.. Un
concept
valide(X, Y)
E L estquasi-cohérent
si sadescription
Y reconnaît très peu decontre-exemples.
Ladescription
liée à ceconcept
est aussi valide etquasi-cohérente.
autrement dit un
concept
valide(X, Y)
estquasi-cohérent
si auplus fi contre-exemples
sontdes éléments de X.
Par
définition, C
cU.
Concept minimal, concept
maximal :La minimalité ou maximalité au sens de
l’inclusion,
est liée aux notionsprécédentes.
Elle estdéfinie sur des
concepts
de mêmetype : complétude, cohérence, validité,
etquasi-cohérence.
Unconcept
valide(X, Y)
E L est minimal s’il ne couvre aucun autreconcept
valide(X~, Y,)
EL.
Un
concept
valide etquasi-cohérent (X, Y)
EL
est maximal s’il n’est couvert par aucun autreconcept
valide etquasi-cohérent Y,)
EL.
Figure 3 : Espace des concepts
explorés.
E l U E2 = espace exploré; E3 = espace non exploré;
El = Sup demi-treillis engendré.
Figure 4 :
Sup-demi
treillis de LEGAL.(voir légende ci-dessous)
Figure 5 : Sup-demi treillis de LEGAL-E-2. Figure 6 : Sup-demi treillis de LEGAL-E-1
Un rectangle représente un concept, et une arête entre 2 concepts matérialise la relation de sous-conceptlsur-concept.
Pertinence d’un concept :
Les
concepts pertinents
sont ceuxqui
sont sélectionnés dans le treillis pour laphase
de décision.Alors, quels concepts
choisir ? Autrementdit, quelles heuristiques implémentées
pour extraireles
concepts pertinents ?
Les différents critères mentionnésprécédemment
montrent bienl’existence d’une multitude de choix
possibles.
Desheuristiques peuvent également
être conçuesen combinant ces critères entre eux ou avec d’autres critères comme le rang d’un
concept,
ou lesconcepts
feuilles dudemi-treillis,
ou même encore sur lalongueur
desdescriptions
deconcepts (en
terme de nombre d’attributs de ladescription).
Une
description pertinente
est liée à unconcept pertinent.
Dans la suite nousdésignerons
souvent une
description
d’unconcept
par le termerégularité.
En construisant un demi-treillis
(voir figure 3),
nous cherchons à déterminer l’ensembleP
desdescriptions -
ourégularités - pertinentes.
Laphase
de décision est élaborée àpartir
deP.
Pour
étayer
notreillustration,
nous fixons les conventions suivantes :· l’ensemble 0 des
objets
estdécoupé
en un ensemble0+
dequatre exemples
et unensemble 0- de trois
contre-exemples :
- un
concept
valide contient au moins deuxexemples :
- un
concept
valide etquasi-cohérent
contient auplus
uncontre-exemple :
3.2. LEGAL - LEarning with GAlois Latdce
[Liquière
& Mephu Nguifo, 1990]Nous résumons la méthode
d’apprentissage LEGAL,
et l’illustrons surl’exemple précédent
de lafigure
1. LEGALs’appuie
sur le tableau binairecorrespondant
à tous lesobjets (exemples
etcontre-exemples)
pour construire leSup-demi
treillis.Le
principe
del’algorithme d’apprentissage
est celui de Bordat modifié tel que seuls lesconcepts
valides sontgénérés.
Bordat définit une structure de file des éléments dutreillis,
initialisée avec l’élémentsuprémum
0 x0,
et dont lesopérations
associées sont :Une
procédure
RECHERCHE renvoie la valeurvrai,
par la variable booléennetrouvé,
si le nouvel élément(successeur) généré
existedéjà
dans letreillis, et faux
sinon. Cetteprocédure
effectue réellement la double
opération
de recherche-insertion dans le treillis. Lesconcepts
valides etquasi-cohérents
non maximaux ne sont pas insérés dans le treillis.Nous introduisons une nouvelle fonction VALIDITE
qui,
pour unconcept,
retourne une des valeurs"valide",
"valide etquasi-cohérent",
ou "non valide"qui
luicorrespond.
Heuristique :
L’heuristique
de LEGALdépend
dutype
deproblème
que l’on essaie derésoudre,
à savoir assimilation(pas
decontre-exemples)
ou discrimination(exemples
etcontre-exemples) :
- En
Assimilation,
tous lesconcepts
valides sontpertinents.
Tous cesconcepts
sont aussiquasi-cohérents
car iln’y
a pas decontre-exemples. P
contient lesdescriptions
deU.
. En
Discrimination,
seuls lesconcepts valides, quasi-cohérents
et maximaux sontpertinents. P
contient lesdescriptions
maximales deC.
4 Est identique à: "couvert
par".
Remarque
1 :- La réduction du treillis aux seuls
concepts
validespeut
diminuer considérablement lacomplexité
de sa construction comme le montre lafigure
4. Parconséquent,
elle accroît l’intérêt de notresystème
pour des caspratiques.
· Avec
l’exemple d’application précédent,
LEGALexplore
9concepts
et construit un demi-treillis de 7concepts
dont 3 sontpertinents (figure 4).
On obtient l’ensemble :P
={acf, abd,abc}
- Cette démarche favorise certains attributs
qui
ont le mêmecomportement
sur lesexemples.
Parexemple,
l’attribut a parrapport
aux attributsb,
c, et de mêmeb,
c parrapport
à d.- De
plus,
ce que l’on recherche enapprentissage
c’est de caractériser un ensembled’exemples,
autrement dit deproduire
desdescriptions qui
caractérisent cetensemble,
en lediscriminant des
contre-exemples.
Le fait deproduire
des caractérisationsqui apparaissent
surdes
contre-exemples risque
malencontreusement de favoriser la reconnaissance de ceux-ci.~ En outre,
lorsque
le nombre decontre-exemples
est relativementélevé,
lacomplexité
del’algorithme
s’accroît considérablementAussi avons-nous choisi de réduire ces inconvénients en limitant la construction des
concepts
sur l’ensemble des
exemples,
d’où la méthodeLEGAL-E,
dont deux variantes sontprésentées
etdiscutées ci-dessous.
3.3. LEGAL-E : Une réduction de LEGAL sur l’ensemble des exemples
Lors de la
production
desconcepts,
seuls les contextes(tableau binaire)
diffèrent enprésence
decontre-exemples.
Alors que LEGAL utilise le contexte entier(0, A, 1) - exemples
et contre-exemples,
LEGAL-E se limite au contexte(0+, A, I)
contenant seulement lesexemples.
Le
principe
de LEGAL-E consiste à construire lesconcepts
valides sur l’ensemble desexemples
et ensuite tester leur cohérence sur lescontre-exemples (figures
5 et6).
Nous
présentons
ici deux variantes de la méthode LEGAL-E. Nous montrons sur unexemple d’application
engrandeur
réelle que les résultats obtenus sont relativementidentiques.
3.3.1. LEGAL-E-1 : La variante 1 de LEGAL-E
Algorithme
1 :C’est le même
algorithme
que celui de LEGAL.Remarque
2 :- Avec
l’exemple d’application précédent,
LEGAL-E-1explore
1concept
au lieu de 9(comme
le faitLEGAL)
et construit un demi-treillis contenant 1concept
valide etpertinent (figure 5).
On obtient l’ensemble suivant :P
={ abcd }
- S’il semble évident que la réduction du contexte de construction des
concepts
valides à celui desexemples
va considérablement réduire lacomplexité
del’apprentissage,
il est nécessaire de s’assurer que la connaissanceproduite
est meilleure. Laréponse
surl’exemple d’application
estpositive,
et deplus
semblepallier
les inconvénients cités dans la remarque 1. Eneffet,
parrapport
à l’ensemble desconjonctions générées
parLEGAL,
uneanalyse
visuelle du contexte(figure 1)
montre que laconjonction (a
et b et c etd)
caractérise mieux lesexemples (tous
sontreconnus)
et les discrimine bien descontre-exemples (tous
sontrejetés).
3.3.2. LEGAL-E-2 : La variante 2 de LEGAL-E
Dans cette deuxième variante de
LEGAL-E, l’heuristique
diffère en discrimination. La notion de maximalité estsupprimée,
et donc tous lesconcepts
valides etquasi-cohérents
sontpertinents.
La fonction RECHERCHE insère dans le treillis tous les
concepts
valides etquasi-cohérents.
Heuristique :
· En
Assimilation,
tous lesconcepts
valides sontpertinents.
Tous cesconcepts
sont aussiquasi-cohérents
car iln’y
a pas decontre-exemples. P
contient lesdescriptions
deU.
. En
Discrimination,
seuls lesconcepts valides, quasi-cohérents
sontpertinents. P
contient les
descriptions
deC.
Remarque
3 :· Avec
l’exemple d’application précédent,
LEGAL-E-2explore
9concepts
et construit undemi-treillis contenant 6
concepts
valides etpertinents (figure 6).
On obtient l’ensemble suivant :P
={ abcd, abcdf, abcde, abcdeg, abcdeh, abcdef }.
* Par
rapport
à lapremière variante,
celle-ciprésente
le défaut d’accroître lacomplexité
del’apprentissage. Cependant
ellegénère
un ensemble dedescriptions qui
fontapparaître
desattributs
pertinents
dupoint
de vue de l’utilisateur(par exemple,
l’attribut f est vérifié par troisobjets
et uncontre-exemple,
ceet P
sont fixés à 2 et1).
Ces attributspourront
servir àétayer
lesexplications.
Une
comparaison
de ces deux variantes est réalisée dans la section 5 sur uneapplication
réelle.
4. LE PROCESSUS DE
DÉCISION
Nous abordons la
phase
déductive de notresystème.
Celui-cidispose
d’un ensemble de connaissancesapprises.
Celles-ci sont lesdescriptions pertinentes
obtenues et ne sontgénéralement
pas réductibles à un seul énoncé(une
seulerégularité).
Laquestion
est"Comment utiliser cet ensemble de
régularités
pourprendre
des décisions ?"Les décisions sont très souvent réductibles à la classification ou reconnaissance d’un nouvel
objet.
Plusieurs considérations sont alorspossibles.
Nous savonsqu’Apprentissage
et Décisionsont étroitement
liés,
car lastratégie
de décision choisie ne doit en aucun cas remettre en cause le mécanismed’apprentissage
utilisé. Contrairement aux méthodes commeID3,
nous avons conçu notre fonctiond’apprentissage
de manière à favoriser ledéveloppement
deplusieurs
processus de décision. Ainsi la structure de demi-treillis obtenuepermet :
. d’utiliser l’ensemble des
régularités pertinentes
pourdévelopper
un raisonnementempirique.
Ce processus semble être leplus naturel,
et mieux encore une manièrelogique simple
de raisonner. Il est basé sur le
principe
de votemajoritaire déjà présent
dans lesystème
CALM[Quinqueton
&Sallantin, 1986].
- d’utiliser les
régularités
du treillis pourdévelopper
un raisonnementanalogique.
Leraisonnement est basé sur la notion de
proximité.
Laproximité peut
être liée àl’objet
leplus
"proche"
ou à l’ensemble desobjets
lesplus "proches" [Mephu Nguifo, 1992].
- de
pondérer
les attributs desrégularités pertinentes
en tenantcompte
de la structure du treillis(ordre
entre lesïégularités).
· etc...
Nous nous intéressons ici au raisonnement
empirique qui
estidentique
pour les deux méthodes LEGAL et LEGAL-E.4.1.
Principe
Ce
type
de raisonnement est leplus
naturel àutiliser,
au vu des critères de construction et de sélection desrégularités pertinentes.
Il est basé sur les notions dejustification,
réfutation et silence.(1)
Unobjet
est considéré comme unexemple
s’il vérifie suffisamment dedescriptions pertinentes. L’objet
est ditjustifié
car il est reconnu comme étant unexemple.
(2)
Unobjet
est considéré comme uncontre-exemple
s’il vérifie peu dedescriptions pertinentes. L’objet
est dit réfuté car il est reconnu comme n’étant pas unexemple.
(3)
Dans le cascontraire,
lesystème
est silencieux.L’objet
n’est ni unexemple
ni uncontre-exemple.
Le silence est définilorsque
lesystème
ne reconnaît pas unobjet.
Nous"introduisons
pour cefaire,
un seuil dejustification 9a
et un seuil deréfutation 9b.
Ces deux seuils sont
proposés
par lesystème (Cf.
section4.2), puis
confirmés ou infirmés parl’usager.
Dans le cas d’uneinfirmation, l’usager
attribue de nouvellesvaleurs,
ou révise la connaissanceapprise
en modifiant certainsparamètres d’apprentissage
tels que lelangage
dedescription,
lesparamètres d’induction,
l’ensemble desexemples,
etc...Les deux
paramètres
dejustification
et de réfutation sont despourcentages
satisfaisant les conditions suivantes :8a : Pourcentage
dejustification;
Pourcentage
de réfutation.Définitions :
Pour un
objet oi,
on définit :Ri
={ r
eP
1 r est vérifiée parl’objet oi 1
c’est-à-direRi
estl’ensemble de toutes les
régularités pertinentes
vérifiées parl’objet oi.
On définit
également
unpourcentage
devérification Oi
associé à unobjet oi’
de la manièresuivante :
où : - n =