A RNAUD D EVILLEZ P ATRICE B ILLAUDEL
G ÉRARD V ILLERMAIN L ECOLIER
Une méthode possibiliste de discrimination adaptée aux classes de forme complexe
Mathématiques et sciences humaines, tome 147 (1999), p. 71-85
<http://www.numdam.org/item?id=MSH_1999__147__71_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1999, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
UNE
MÉTHODE
POSSIBILISTE DE DISCRIMINATIONADAPTÉE
AUX CLASSES DE FORME COMPLEXEArnaud
DEVILLEZ1,
PatriceBILLAUDEL1,
Gérard VILLERMAINLECOLIER1
RÉSUMÉ - Notre équipe travaille sur la classification de données provenant des secteurs industriels et médicaux, dans le but de développer des systèmes de diagnostic et d’aide à la décision. Dans
cet article, nous proposons une modification de la méthode floue du «pattern matching», pour classer des données comportant des classes de forme complexe. Nous décrivons la méthode de base avant de montrer ses limites, lorsque les classes ne sont pas convexes. Ensuite, nous en proposons une amélioration par l’introduction d’une approche multiprototype. Nous présentons un exemple industriel, qui consiste à trier
automatiquement des bouteilles plastiques en vue de leur recyclage. Enfin, nous comparons les résultats obtenus par cette méthode avec ceux donnés par la méthode floue des k-plus proches voisins, sur trois
types de données : bouteilles plastiques, iris et formes d’ondes.
MOTS-CLÉS - Classification, Logique Floue, Théorie des possibilités, Fuzzy Pattern Matching,
Décision multicritère.
SUMMARY - A possibilistic discrimination method adapted to classes of complex shape
Our team works on the classification of data coming from industrial and medical sectors, in order to
develop decision making and diagnosis systems. In this paper we propose to modify the fuzzy method of
pattern matching, in order to classify data including classes of complex shape. We describe the basic
method before showing its limits when classes are not convex. Then, we propose to improve the method by introducing a multiprototype approach. We present an industrial example, which consists in sorting automatically plastic bottles in order to recycle them. Finally, we compare the results obtained by this
method with those given by the fuzzy k-nearest neighbours method, using three types of data : plastic bottles, iris and waveform data.
KEYWORDS - Classification, Fuzzy Logic, Possibility theory, Fuzzy Pattern Matching,
Multicriteria decision.
’ Laboratoire d’Automatique et de Micro-électronique, Faculté des Sciences - Moulin de la Housse, BP 1039, 51687 Reims Cedex 2, e-mail : [email protected],
12atrice.billaudel @uni v-rei-nis.fr,
gerard.villermain-lecolier}@univ-reims.frINTRODUCTION
Les
problèmes
dediagnostic
sont couramment rencontrés dans les domaines industriels et médicaux. Face à une situationdonnée, l’opérateur, l’ingénieur
et le médecin ont pour mission deprendre
une décision suivantplusieurs critères,
en faisantappel
à touteleur
expérience.
Pourcela,
ilspeuvent
soit avoir recours à unsystème
d’aide à la décision que l’on rencontre souvent dans le secteurmédical,
soit utiliser des méthodesautomatiques
de décision comme lessuperviseurs
de processus industriels.Les
objectifs
de notreéquipe
sont ledéveloppement
et la mise aupoint
dessystèmes
d’aide à la décision et desupervision
de processus industriels. Nous noussommes orientés vers les méthodes de classification
supervisée
ensupposant qu’une
décision est
prise
parrapport
à une situationdéjà vécue,
c’est à dire une situationclassée dans l’ensemble des événements connus, que l’on
appelle l’expérience.
Leprincipe
de ces méthodes est d’affecter un élément à uneclasse,
en se référant à des élémentsd’apprentissage,
dont la classe est connue[7].
Cesméthodes, présentées puis comparées dans [11], comportent
unephase d’apprentissage puis
unephase
declassement au cours de
laquelle
la décision d’affecter unobjet
à une classe estprise.
Considérant que cette décision
comporte
unepart d’imprécision
etd’incertitude,
tant au niveau des critères
qui permettent
de laprendre,
que desconséquences qu’elle engendre,
nous avons choisi d’utiliser lestechniques
floues etpossibilistes.
Lesméthodes retenues sont la méthode floue des
k-plus proches
voisins[17],
la méthodedes
règles
floues distribuées[15, 16]
et la méthode floue dupattern matching [12].
Uneétude
comparative [2]
nous apermis
de retenir la méthode floue dupattern matching
pour nos
applications.
Elle donne les meilleuresperformances
pour lestemps
de calcul lesplus
courts, tant que les classes sontparfaitement séparables,
que leur forme est convexe etqu’elles
sont orientéesparallèlement
aux axes dereprésentation.
Nous noussommes aperçus que, si les nuages
comportent
des classes de formes non convexes ouobliques,
c’est à dire des classes dont l’axeprincipal
n’est pasparallèle
à un des axes durepère,
les résultats sont nettement moins satisfaisants.L’objet
de cet article estl’adaptation
de la méthode floue dupattern matching
auxnuages
comportant
des classes de formequelconque. Après
uneprésentation
de laméthode de
base,
nous montrons les limites del’algorithme classique.
Puis nousproposons une amélioration basée sur une
approche multiprototype, permettant
de résoudre lesproblèmes
dus à la forme des classes.Enfin,
nous comparons les résultats que nous avons obtenus avec ceux d’autres méthodes en utilisant les donnéesprovenant
d’une étude sur le tri des bouteillesplastiques,
les données iris et les données de formes d’ondes.1. METHODE FLOUE DU PATTERN MATCHING 1.1.
PROBLEMATIQUE
ET NOTATIONSLes données sont décrites par a caractères et l’ensemble
d’apprentissage comporte n
points.
La méthode floue dupattern matching, présentée
dans[12, 18],
utilise la définition de cprofils (Pl,
...,F)
pour les c classes.Chaque profil
estreprésenté
surchaque
caractère par un sous-ensemble flouqui exprime
laplage
des valeurstypiques
de ce caractère. Dans notre cas, il
s’agit
des densités depossibilité
estimées et notées~‘k
pour la classe
à
et lekeme
caractère. Leproblème
consiste à affecter unpoint
x del’espace
dereprésentation Ra,
dont les valeurs pour les différents caractères sont(X xa),
à une des classes. -1.2. ESTIMATION DES DENSITES DE POSSIBILITES
Les
profils
sont les densités depossibilité
estimées pourchaque
caractère etchaque
classe
[23, 9].
Leur construction est basée sur la théorie despossibilités,
introduite par Zadeh en1978,
pourprendre
encompte
l’incertitude etl’imprécision
dans ladescription linguistique
descaractères,
des événements ou des situations[23].
Dans laméthode floue du
pattern matching, l’apprentissage
consiste à construire cesdensités,
pour
chaque
caractère et pourchaque classe,
àpartir
des échantillons de référence. Les distributions depossibilité peuvent
être calculées àpartir
des distributions deprobabilité, qui
sont elles mêmes estimées àpartir
deshistogrammes
des données.Figure
1.Exemple
de nuages depoints
à trois classesLes
histogrammes
des données sont établis àpartir
de l’ensembled’apprentissage.
Les bornes inférieures et
supérieures
del’histogramme
d’une classeC~
suivant uncaractère,
sontgénéralement
les valeurs minimales et maximales descomposantes
despoints d’apprentissage
de la classeC,
suivant ce caractère. Toutefois il arrive que cesbornes soient déterminées manuellement par l’utilisateur. L’intérêt est
d’élargir
la basedes
histogrammes
de manière àagrandir
lechamp
d’action du classifieur. Le nombre de barres h deshistogrammes
est unparamètre
de la méthode. Nous discuterons soninfluence sur les
performances
dans lapartie
1.4. Ilpermet
de calculer lalargeur
desintervalles et de déterminer les bornes intermédiaires des
histogrammes.
La hauteur dechaque
barre est l’effectif despoints d’apprentissage
de la classeCl,
situés dansl’intervalle considéré.
L’exemple, présenté figure 1,
est un nuage à trois classes dans unespace de dimension 2.
L’apprentissage requière
le calcul de sixhistogrammes.
A titred’illustration,
nous avonsreprésenté,
sur lafigure 2,
les troishistogrammes
calculéspour le caractère 1. Le passage des
histogrammes
aux distributions deprobabilité
nécessite deux transformations.
Chaque
barre est tout d’abordreprésentée
par le centrede l’intervalle noté yi.
Puis,
lerapport
entre la hauteur de la barre et le nombre total depoints d’apprentissage,
notép(yl),
détermine laprobabilité
associée au centre del’intervalle.
Figure
2.Histogrammes
des données pour le caractère 1 et pourchaque
classeLes valeurs de
probabilités
...,h }
des centres d’intervalles yi sont classées dans l’ordre décroissantp(yl)
2P(Y2) 2 P(Y4)
>_...>_ La distribution depossibilité
...,h }
est déduite de la distribution deprobabilité
par la transformation
bijective
introduite par Dubois et Prade[9] :
Cette
expression
vérifiel’hypothèse
de la théorie despossibilités
Larelation inverse s’écrit :
avec la convention = 0.
Le passage à la densité de
possibilité
est réalisé par uneinterpolation
linéaire de la distribution. Les densitéspossibilistes
pourchaque
classe etchaque caractère,
relativesà notre
exemple,
sontprésentées figure
3.Figure
3.Profils
des classes1,
2 et 3 suivant les 2 caractères 1.3. REGLE DE CLASSEMENTLe classement d’un nouveau
point
x, dont les valeurs des différents caractères sont(X 1 xa),
s’effectue en deuxétapes :
k
- détermination de la similitude entre
xk
et les différentsprofils P~.
Ledegré
desimilitude entre le
point
et lareprésentation
duprofil pi
sur lekeme
caractère est obtenu par lecture du
profil
pour la valeurxk.
-
fusion,
pourchaque profil,
de tous lesdegrés
de similitude(n (X 1tia(xa))
par un
opérateur
H :Le résultat
vl(x)
de cette fusionreprésente
ledegré
de ressemblance entre lepoint
x et le
profil P~.
Dans la méthode floue dupattern matching,
cette valeur est considéréecomme la
possibilité d’appartenance
dupoint x
à la classeC~. L’opérateur
de fusionpeut
être unproduit,
unminimum,
une moyenne, uneintégrale
floue[4, 12, 13],
ou encorel’opérateur
OWA[21, 22].
Lepoint
est affecté à la classe pourlaquelle
il a laplus
fortepossibilité d’appartenance.
1.4. INFLUENCE DU PARAMETRE h
Le
paramètre
hdésignant
le nombre de barres del’histogramme
a une forte influencesur les
performances
de la méthode. Il contrôle la taille de l’intervalle de discrétisation et il estindépendant
du nombre de classes.Toutefois,
sa valeur est liée aux effectifs des classesd’apprentissage.
Si elle esttrop élevée,
il estpossible
que le nombre depoints présents
dans certains intervalles soit nul. Un "trou"apparaît
alors dans les densités depossibilité, provoquant
une diminution des valeursd’appartenance,
même si cetintervalle est situé au centre d’une classe. Le classement d’un
point apparaissant
danscette zone sera par
conséquent
erroné. Si sa valeur esttrop faible,
larépartition
despoints
à l’intérieur les classes n’est pasrespectée puisque
les densités depossibilité
sontnivelées. La détermination du
paramètre
h est semblable à la détermination de ladimension de la fenêtre de
lissage
dans la méthode des noyaux[6].
L’étude de la méthode floue dupattern matching
a montréqu’une
valeurcomprise
entre 5 et15,
donnait souvent les
performances optimales, quelles
que soient les données à classer[2].
2. LIMITES DE LA METHODE
CLASSIQUE
Pour illustrer les limites de la
méthode,
nous nous sommes intéressés aux classes de formes non convexe etoblique,
telles que cellesprésentées
sur lesfigures
4a et 5a. Lesdensités de
possibilités
calculées pour ces nuages sontprésentées
sur lesfigures
4b et5b.
Figure
4. Classe non convexe et densités depossibilité
Figure
5. Classesobliques
et densités depossibilité
La
figure 6, représentant
les courbes de niveauxd’appartenance, permet
de visualiser lepouvoir
de discrimination de la méthode. Elle montre que la méthode floue dupattern matching,
associée à desopérateurs d’agrégation simples
comme leminimum,
nefonctionne pas pour ces deux
types
de classes trèscaractéristiques.
Eneffet,
les courbes de niveauxd’appartenance
nerespectent
pas la forme des classes. Cephénomène
provient
del’estimation,
caractère parcaractère,
des densités depossibilité.
Ilengendre
des
problèmes
de classementpuisqu’un point
situé dans la concavité de laparabole
estaffecté à la classe alors
qu’il
ne luiappartient
pas. Dans le cas des classesobliques présentées figure 6b,
nous assistons à un recouvrement des courbes de niveauxd’appartenance
des deuxclasses, qui
provoque des erreurs de classement. L’utilisation de la méthode floue dupattern matching
estimpossible
pour des classes de formes non convexes etobliques, lorsqu’elle s’appuie
unesimple représentation
des classes. C’est pour cette raison que nous proposons une amélioration basée sur uneapproche multiprototype.
Figure
6. Courbes de niveauxd’appartenance
obtenues en utilisantl’opérateur
minimum
3. ADAPTATION DE LA METHODE 3.1. APPROCHE MULTIPROTOTYPE
Chaque
classeà, comportant ni points d’apprentissage,
estpartagée
en si sous-classesC~
parl’algorithme
des c-moyennes floues[1].
Chacune de ces sous-classes estreprésentée
par unprototype :
son centroïdegJ .
Une classeC~
est parconséquent
représentée
par siprototypes.
En cela notre méthode estcomparable
à la méthode des k-plus proches
voisinscondensés, qui
sélectionne lesprototypes parmi
lespoints présents
dans les zones de forte densité de la classe
[10].
Pourchaque point
de la classeÙ,
l’algorithme
des c-moyennes floues délivre un coefficientd’appartenance
àchaque
sous-classe. Ces coefficients
composent
la matriced’appartenance U’
de dimension où l’élémentreprésente
le coefficientd’appartenance
dupoint xk
de la classeC,
à la sous-classeC§ .
Le lecteur trouvera lesexpressions
du coefficient et du centroïdeg~
dansl’ouvrage
deBezdek,
consacré aux méthodes floues de coalescence[1].
Pour
chaque point x
àclasser,
une fonctionexponentielle
pourchaque
sous-classeCi’-
est calculée selonl’expression
suivante[ 19] :
L’expression
de la fonctionexponentielle
est semblable à celle du noyaugaussien
utilisé dans la méthode des noyaux de Parzen
[7].
La notiond’appartenance graduée,
issue de la théorie des sous-ensembles
flous, apparaît
dansl’expression
de la distance."Aij
est une constante relative à la sous-classeC~
etd (x, g~ ) représente
la distance deMahalanobis floue entre le
point x
et le centroïde de la sous-classeC~
dansl’espace Ra.
Elle utilise la matrice de covariance floue et est définie par
l’expression
suivante[ 14J :
La connaissance des coefficients
d’appartenance
despoints d’apprentissage
permet
le calcul de la matrice de covariance floueE ~
dechaque
sous-classeC~ ,
dontl’expression
est :S’
est la matrice dedispersion
floue définie par :L’introduction de cette matrice dans le calcul de la distance
permet
derespecter
la formeelliptique
dessous-classes,
en tenantcompte
de larépartition
des niveauxd’appartenance.
Pourchaque
classecf,
nous déterminons une fonctiond’appartenance globale
par la fusion Fdes si
fonctionsexponentielles,
définies surles si
sous-classes(C~..~C;)[18]:
13.2. AGREGATION GLOBALE
Le
degré d’appartenance vr(x)
d’unpoint x
àchaque
classeci,
est obtenu paragrégation
de la valeur de la fonction
exponentielle globale
et des valeurs depossibilités
surchaque
caractère. Cetteagrégation,
dontl’expression
est donnéeci-dessous,
est réaliséepar
l’opérateur
minimum[8] :
Elle
permet
d’atténuer les zones de forteappartenance
données par la fonctionJ..1i(x)
autour dechaque prototype. L’opérateur
minimumappartient
à la classe t-normes, dont lacaractéristique
essentielle est l’intolérance[24].
Aucun effetcompensatoire n’apparaît
avec cetopérateur.
Si une seule des valeursagrégées
estfaible,
la valeurglobale d’appartenance après agrégation
s’en trouve aussitôt diminuée. Cettepropriété
est recherchée lors du classement
puisque
laprésence
d’une valeur trèsfaible, parmi
lespossibilités
et la fonctionJ.li(x), signifie
que lepoint x
n’est pas dans la classe. Il est tout à fait cohérent que sa valeurd’appartenance
à laclasse, après agrégation,
soit faible.Nous constatons sur la
figure
7 que les courbes de niveauxd’appartenance respectent
la forme des classes. Ces dernières ont étédécomposées
en 5 sous-classes.L’approche multiprototype
autorise l’utilisation de la méthode floue dupattern matching
pour les classes de forme non convexe ouoblique.
Figure
7. Courbes de niveauxd’appartenance
obtenues paragrégation
despossibilités
et de
la fonction exponentielle globale
3.3. INFLUENCE DU NOMBRE DE SOUS-CLASSES ET DES
PARAMETRES Â!i
Les
performances
del’algorithme dépendent
dunombre si
de sous-classes créées à l’intérieur dechaque
classeC‘.
Ce nombrepeut
être différent d’une classe à une autre.Les critères de validité des classes habituellement utilisés pour la recherche de la
partition optimale
dans un nuage depoints, permettent
de déterminer ceparamètre [3].
Parmi les critères les
plus utilisés,
nous pouvons citerl’hypervolume
flou[ 1 ],
lacompacité-séparabilité [20]
etl’entropie
de classification[1].
Le critère decompacité- séparabilité
donnegénéralement
de très bons résultats. Un nombre de sous-classestrop important
provoque uneaugmentation
destemps
de calculs sans accroissement desperformances.
Une valeurtrop
faible a pour effet dedégrader
les contoursd’appartenance,
cequi
provoque une diminution desperformances
en classement.Pour
chaque
sous-classeC~ ,
la fonctionpeut
être assimilée à une fonctiond’appartenance.
Les valeursÀij permettent
d’étaler les niveaux de cette fonction parrapport
aux centroïdes des sous-classes. Nous avons choisi d’utiliser la même valeur ~, pour toutes les sous-classes. Selon leshypothèses
définies dans[ 19],
elle est déterminéepour que la fonction
~~ (x)
prenne une valeurproche
de 0.5 pour la distance moyenne entre tous lespoints
de la sous-classe et son centroïde. La valeur que nous avons utilisée pourl’exemple
de lafigure
7.a est 0.01. Ceparamètre
a peu d’influence sur les résultats de classement. Toutefois il doit être déterminé defaçon
à ce que les courbes de niveauxd’appartenance enveloppent
lespoints d’apprentissage,
si uneprocédure
derejet
enappartenance [10]
doit être inclue dansl’algorithme.
3.4. APPRENTISSAGES INITIAL ET INCREMENTAL, REGLE DE CLASSEMENT
La
phase d’apprentissage comprend
le calcul des densités depossibilités,
des centroïdes et des matrices de covariance floues des sous-classes. Ellepeut
aussiintégrer
ladétermination des
paramètres
de la méthode : le nombre h de barres deshistogrammes,
le facteur d’étalement ~, de la fonction
~t’(x)
et le nombre desous-classes Si
créées danschaque
classe.Le classement d’un
point x
nécessite le calcul despossibilités d’appartenance
surchaque
densité ainsi que le calcul des fonctions~~ (x) . L’agrégation
de ces valeurs par lesexpressions (1)
et(2),
donne lapossibilité d’appartenance
dupoint
àchaque
classe.Ce dernier est affecté à celle pour
laquelle
il a laplus
fortepossibilité d’appartenance.
Il est
possible d’intégrer
uneprocédure d’apprentissage
incrémental.Lorsqu’un point
estclassé,
il estpris
encompte
dans leshistogrammes
dont la mise àjour
entraîneune modification des densités de
possibilité. L’adaptation
des sous-classes n’est effectuéequ’après
le classement deplusieurs points, puisque
leur calcul demande untemps important.
4. APPLICATIONS
4.1. NUAGE COMPORTANT DES CLASSES DE FORME NON CONVEXES
La méthode que nous avons
développée,
nous apermis
de résoudre leproblème
desclasses de forme non
elliptique exposé figure
8. La classeparabolique
que nous avonsprésentée figure 7,
a étédécomposée
en 5 sous-classes. La seconde classeparabolique
et la classe
elliptique
ont étérespectivement décomposées
en 4 et 3 sous-classes. Nous pouvons constater que la forme des courbes de niveauxd’appartenance respecte
celle des classes. En terme depouvoir
dediscrimination,
notre méthode donne des résultats similaires à la méthode desk-plus proches
voisins. A titred’exemple,
nousprésentons
figure
8b les frontières données par la méthode du1-plus proche
voisin.Figure
8. Courbes de niveauxd’appartenance
pour des classesde forme parabolique (a) et frontière de
discrimination obtenue par larègle
du1-ppv (b).
4.2. TRI DES BOUTEILLES PLASTIQUES 4.2.1. Présentation des données
Constituées soit de
polychlorure
devinyle (PVC),
soit depolyéthylène thérèphtalate (PET),
soit depolyéthylène
haute densité(PEHD),
les bouteillesplastiques
sontaujourd’hui
au centre d’unenjeu technique
et industrielimportant
pour lerecyclage.
L’analyse
duspectre infrarouge
dechaque matière, accompagnée
d’une étudestatistique,
nous apermis
de sélectionner deuxlongueurs
d’onde pourreprésenter
lesclasses. Nous
possédons
120 valeurs de transmission pour chacune deslongueurs
d’onde. Ces valeurs se
répartissent
en 3 classes de 40points correspondant
aux troispolymères,
comme le montre lafigure
9.Figure
9.Nuage
depoints
obtenu pour les matièresplastiques, 1 : Polychlorure
deVinyle,
2 :Polyéthylène Thérèphtalate,
3 :Polyéthylène
Haute Densité4.2.2. Courbes de niveaux
d’appartenance
et taux de bon classementL’application
de la méthode floue dupattern matching,
dans sa versionclassique,
avecle minimum comme
opérateur d’agrégation,
donne les courbes de niveauxd’appartenance présentées figure
10a. Nous constatons sur cettefigure,
que la formeoblique
de la classe 1 n’est pasrespectée.
Cecipeut engendrer
desproblèmes
declassement. En
effet,
certainspoints peuvent
être affectés à cette classe alorsqu’ils
nelui
appartiennent
pas. L’introduction del’approche multiprototype,
avec unedécomposition
dechaque
classe en 4sous-classes,
donne les courbes de niveauxd’appartenance présentées figure
1 Ob. Nous constatons que les courbesrespectent
la forme des classes. Pour cetteapplication,
nous avons obtenu un taux de bon classement de 100 % avec 20points d’apprentissage
par classe. Lesparamètres
h et ~, ont étérespectivement
fixés à 5 et 0.2.Figure
10. Courbes de niveauxd’appartenance
obtenues avecl’opérateur
minimum(a)
et avec
adjonction des fonctions exponentielles (b)
4.3. CLASSEMENT DES DONNEES IRIS
Les données Iris sont
largement
utilisées pour lacomparaison
des classifieurs. Elles secomposent
de 3 classes de fleurs : IrisSétosa, Versicolor,
etVirginia.
Chacune de cesclasses est constituée de 50 échantillons caractérisés par 4 caractères :
longueur
etlargeur
desépales, longueur
etlargeur
depétales.
Le taux de bon classement donné parl’algorithme
flou dupattern matching classique
est de 94 % avec 25points, d’apprentissage
par classe et leparamètre
h fixé à 5.L’adjonction
desprototypes
avecla
paramètre
~,égal
à 0.2 et unedécomposition
dechaque
classe en 3 sous-classes nous apermis
d’obtenir un taux de 97 %. Ce taux estidentique
au taux donné par la méthode des10-plus proches
voisins.4.4. DONNEES DE FORMES D’ONDES
Ces données sont issues de l’étude des méthodes de classement réalisée par Breiman
[5].
Le nuage,composé
de 5000points, comporte
3 classesreprésentées
par 21 caractères. Conformément aux études réalisées sur ces données par d’autres auteurs[6],
nous avons utilisé 300
points d’apprentissage,
soit 100 parclasse,
et nous avons calculéle taux de bon classement sur les 5000
points.
Lesparamètres
h et 1 ont étérespectivement
fixés à 5 et 0.01. Les classesd’apprentissage
ont étédécomposées
chacune en 3 sous-classes. Le taux de bon classement que nous obtenons est de 81 %.
Nous avons testé
plusieurs
combinaisons pour lesparamètres
h et 1 et il s’avère que les valeurs données ci-dessuspeuvent
être considérées comme les valeursoptimales,
donnant le taux de bon classement le
plus
élevé.L’apprentissage intègre
l’estimation des densités depossibilité,
ladécomposition
des classes ainsi que le calcul des matrices de covariance floue. Le taux que nous obtenonspeut
êtrecomparé
au taux de 81.7 %donné par la méthode des
30-plus proches
voisins[11].
La méthode floue dupattern matching
modifiéepeut
être considérée comme trèsperformante
pour discriminer cesdonnées.
5. COMPARAISON AVEC LA METHODE FLOUE DES k-PLUS PROCHES VOISINS
Les critères que nous avons retenus pour comparer la méthode floue des
5-plus proches
voisins
[ 17]
à la notre, sont le taux de bon classement et letemps
de classement pour unpoint.
Les résultats sontprésentés
dans le tableau 1. Lestemps
de calcul sont donnéspour un micro-ordinateur de
type pentium
cadencé à 120 Mhz.Nous avons effectué 100 essais avec
tirage
aléatoire despoints d’apprentissage, puis
classement de la totalité despoints.
Le taux de bon classement donné dans le tableau 1 est la moyenne des taux de bon classement obtenus pour les 100 essais. Cetteprocédure permet
d’atténuer l’influence de l’ensembled’apprentissage
sur lesperformances
del’algorithme.
Nous constatons que la méthode floue du
pattern matching
modifiée estplus rapide
que la méthode floue des5-plus proches
voisins dans tous les cas. Deplus
elleutilise un nombre de
points d’apprentissage
moinsimportant.
En cequi
concerne lesdonnées de formes
d’ondes,
notrealgorithme
donne un taux de bon classementsupérieur
à celui obtenu par la méthode floue des5-plus proches
voisins.Tableau 1. Résultats
comparatifs
CONCLUSION
L’amélioration de la méthode floue du
pattern matching,
que nous proposons,permet
son
application
à des nuagescomportant
des classes de formequelconque.
Ellerequière
la détermination de trois
paramètres :
le nombre de barres h deshistogrammes,
lenombre ni
de sous-classes crées à l’intérieur dechaque
classeC~
et leparamètre
caractérisant l’étalement des fonctions
exponentielles. L’expérience
a montréqu’une
valeur de h
comprise
entre 5 et 15garantit
de bonnesperformances. Quelques
critèrespermettent
la détermination du nombre de sous-classes et duparamètre
~,.Nous avons
comparé
la méthode floue dupattern matching,
ainsimodifiée,
avecla méthode floue des
5-plus proches voisins,
sur troisjeux
de données. Les deux méthodes donnent des taux de bon classement similaires.Cependant
notre méthodedonne les
temps
de calcul lesplus
courts.L’utilisation de cette méthode pour des
problèmes
tels que le tri des bouteillesplastiques
est tout à faitenvisageable
même s’il estpossible
d’utiliser des méthodesplus simples
telles quel’analyse
discriminante linéaire.L’intégration
desprocédures
derejets
enappartenance
et enambiguïté [10]
étant aisée dans cetalgorithme,
nousenvisageons
son utilisation pour résoudre desproblèmes
dediagnostics,
tant dans ledomaine médical
qu’industriel.
BIBLIOGRAPHIE
[1]
BEZDEKJ.C.,
Patternrecognition with fuzzy objective function algorithms,
New-York,
PlenumPress, 1981.
[2]
BILLAUDELP.,
DEVILLEZA.,
VILLERMAIN LECOLIERG.,
"Performance evaluation offuzzy
classification methodsdesigned
for real timeapplication", International journal of approximate reasoning 20, (1999), 1-20.
[3]
BILLAUDELP.,
DEVILLEZA.,
VILLERMAIN LECOLIERG.,
"Anunsupervised fuzzy
classificationalgorithm
for the nonelliptic classes", EURISCON’98, (1998), Athens,
Greece.[4]
BOUCHON MEUNIERB.,
Lalogique floue
et sesapplications, Paris,
CollectionVie
Artificielle, Addison-Wesley,
1995.[5]
BREIMANL.,
FRIEDMAN J.H.,
OLSHEN R.A.,
STONE C.J.,
"Classification andregression
trees",
Wadsworth international group :Belmont,
California(1984),
43-49.
[6]
CARAUXG.,
LECHEVALLIERY., "Règles
de décision deBayes
et méthodesstatistiques
dediscrimination",
Revued’intelligence artificielle
10(2,3), (1996)
219-283.
[7]
CELEUXG.,
DIDAYE.,
GOVAERTG.,
LECHEVALLIERY.,
RALAMBONDRAINY
H., Classification automatique
desdonnées, Paris, Dunod,
1989.
[8]
DEVILLEZA.,
BILLAUDELP.,
VILLERMAIN LECOLIERG.,
"Use of theFuzzy
Pattern
Matching
in adiagnosis
module based on thepattern recognition",
CESA’98IEEE
Systems,
man andcybernetics 4, (1998),
902-907.[9]
DUBOIS D. et PRADE H., Théorie despossibilités Application
à lareprésentation
des connaissances en
informatique, Paris, Masson, 1987.
[10]
DUBUISSONB., Diagnostic
et reconnaissance desformes,
Traité des NouvellesTechnologies,
sérieDiagnostic
etMaintenance, Paris, Hermès, 1990.
[11]
GASCUEL O. etal.,
"Twelvenumerical, symbolic
andhybrid supervised
classification
methods",
Internationaljournal of
patternrecognition
andartificial intelligence
12(5), (1998)
517-571.[12]
GRABISCH M. et SUGENOM.,
"Multi-attribute classificationusing fuzzy integral ",
Proc.of fuzzy IEEE ,(1992), 47-54.
[13]
GRABISCHM.,
"Theapplication
offuzzy integral
in multicriteria decisionmaking", European journal of operational
research89, (1996),
445-456.[14]
GUSTAFSOND.E.,
KESSELW.C., "Fuzzy clustering
with afuzzy
covariancematrix
", Proceedings of IEEE Conference
on decision andcontrol, (1979),
761-766.[15]
ISHIBUCHIH.,
NOZAKIK.,
TANAKAH.,
"Distributedrepresentation
offuzzy
rules and its
application
topattern
classification"Fuzzy
sets andsystems 52, (1992),
21-32.
[16]
ISHIBUCHIH.,
NOZAKIK.,
TANAKAH., "Selecting Fuzzy
If-Then Rules for Classification ProblemsUsing
GeneticAlgorithms",
IEEE Transactions onfuzzy
systems 3, (1995).
[17]
KELLERJ.M.,.
GRAYM.R,
GIVENS J.A.JR,
"Afuzzy
k-nearestneighbor algorithm",
IEEE Transactions onsystems,
man andcybernetics,
15(4), (1985),
580-585.
[18]
Lalogique floue,
ObservatoireFrançais
destechniques Avancées,
série ARAGOn°14, Masson, 1994.
[19]
MASSON M.H.,
DUBUISSONB.,
FRELICOTC., "Conception
d’un module de reconnaissance de formes floues pour lediagnostic",
RAIRO-APII-JESA 30(2, 3), (1996), 319-341.
[20]
XIE X.L.,
BENIG.,
"Avalidity
measure forfuzzy clustering",
IEEE Transactionson pattern
analysis
and machineintelligence
13(8), (1991)
841-847.[21]
YAGER R.R.,
"On orderedweighted averaging aggregation operators
in multicriteria decisionmaking",
IEEE Transactions onsystems,
man andcybernetics
18(1), (1988),183-190.
[22]
YAGER R.R., "Aggregation operators
andfuzzy systems modeling", Fuzzy
setsand