Pour le rejet d’ambiguïté

4.2 Résultats sur la base artificielle

Classe 1 Classe 2 Classe 3

_i^{F umera}

^{F umera}_i

_i^{F umera}

4.2 Résultats sur la base artificielle

4.2.1 Pour le rejet d’ambiguïté

Le rejet d’ambiguïté cherche à limiter les erreurs de classification. Dans cette section

nous étudions le comportement des différentes options de rejet face à ce problème. Nous

commençons par étudier la forme en deux dimensions des zones de rejet produites par

ces options puis leur efficacité globale pour résoudre ce problème.

4.2.1.1 La forme des zones de rejet

La figure 4.2 présente les zones de rejet d’ambiguïté apprises à partir de la base

artificielle pour les architectures RC (avec une classe de rejet, figure 4.2(a)), SC (

avec un classifieur spécialisé, figure 4.2(b)), TRF (avec des seuils sur les fonctions de

confiance, figure 4.2(c)) et SCRF (avec un classifieur spécialisé sur les fonctions de

confiance, figure 4.2(d)). Pour ces quatre exemples nous avons choisi comme classifieur

principal un RBFN avec un prototype par classe car il s’agit d’un classifieur facile à

observer en deux dimensions. Le type de classifieur de rejet pour les architectures SC

et SCRF ayant peu d’importance pour la visualisation des zones de rejet (il s’agit d’un

SVM). Les architectures TRF et SCRF sont basées sur les fonctions de confianceψ

de l’équation (3.7). Les taux de rejet de ces options de rejet sont approximativement

identiques (entre 3% et 5%) . Le chiffre dans les zones d’acceptation (zones blanches)

correspond au numéro de la classe reconnue. Les pointillés correspondent aux frontières

de décision du classifieur principal sans rejet. Les zones grisées sont les zones rejetées.

Il est intéressant de remarquer que les formes des zones de rejet des quatre options de

rejet sont assez différentes les unes des autres. Les deux premières utilisant directement

l’espace des caractéristiques (RC et SC) ont les zones de rejet placées là où il y a le plus

de confusions entre les trois classes. Pour l’architecture RC les frontières de décision

ont changé par rapport au classifieur sans rejet (les pointillés ne se superposant pas

aux nouvelles frontières) alors que ce n’est pas le cas pour les autres architectures

puisqu’elles conservent le classifieur principal d’origine. Dans l’architecture SC les zones

de rejet sont très spécialisées et la petite zone où les trois classes se rejoignent n’est

pas rejetée car il doit y avoir moins de données d’apprentissage ici. Les deux autres

architectures (TRF et SCRF) utilisent les fonctions de confiance pour décider du rejet

et c’est pourquoi les formes de leur zones de rejet se ressemblent un peu. Ce qu’il faut

(a) RC sur RBFN

(b) SC sur RBFN avec SVM

(c) TRF sur RBFN avecψ

(d) SCRF sur RBFN avec SVM etψ

(e) TRF sur MLP avecψ

(f) TRF sur SVM avecψ

(g) Données deD

Fig. 4.2 – Les zones de rejet des différentes options de rejet d’ambiguïté. Les zones de

rejet sont en gris et les zones acceptées sont en blanc. Les frontières de décision sans

rejet sont en pointillés, les numéros correspondent à la décision.

Résultats sur la base artificielle 81

remarquer en premier c’est que les zones de rejet suivent toutes les frontières de décision

et ne se focalisent pas sur des petites zones. Par conséquent ces architectures ont une

bonne généralisation de la zone de rejet même là où il y a très peu d’erreurs puisque les

fonctions de confiance apportent une information comme quoi ce qu’il faut rejeter est

plutôt proche des frontières. Nous pouvons observer dans le coin Nord-Est des figures

que la zone sans données d’apprentissage est rejetée. Cette zone de rejet est présente car

les scores des classes 1 et 2 sont proches (et faible) dans cette zone éloignée des données

d’apprentissage. Mais la présence de cette frontière est due à la nature du classifieur.

La forme des zones de rejet d’ambiguïté dépend de la nature du classifieur

prin-cipal utilisé pour les architectures TRF et SCRF (et évidement aussi pour RC). Les

figures 4.2(e) et 4.2(f) montrent les zones de rejet d’une option avec l’architecture TRF

basée sur un MLP et un SVM avec noyaux Gaussiens. Cette architecture permet de

bien voir les différences dans les formes des fonctions de confiance par rapport à

l’archi-tecture SCRF qui ajoute l’étape du classifieur de rejet. On peut voir que avec un SVM

il y a le même effet dans le coin Nord-Est comme avec le RBFN. Par contre il n’y a pas

de rejet avec le MLP dans cette zone. Cette zone de rejet est donc due aux informations

intrinsèques apportées par la modélisation des connaissances dans les RBFN et ce type

de SVM qui ne se retrouve pas dans les MLP. D’un autre point de vue, on ne peut pas

dire que la présence de cette zone de rejet isolée soit bénéfique puisqu’il n’y a pas de

données dans cette zone qui correspond en vérité plus à une notion de rejet de distance.

Par contre on peut voir que la zone de rejet du SVM est beaucoup plus découpée que

celle du MLP ou du RBFN. Cette différence vient de la modélisation des connaissances

dans le SVM qui utilise les vecteurs support issus des données d’origine, il n’y a peu de

lissage des connaissances comme avec les RBFN et les MLP.

4.2.1.2 Comportement global

Considérons maintenant l’option de rejet dans sa globalité. Nous allons donc utiliser

les courbes Erreur/Rejet (ER) ainsi que l’aire sous cette courbe (AUERC) comme

expli-qué dans la section 2.6.1. La table 4.2 présente l’AUERC, le taux d’erreur à 5% de rejet

(ERR5) et le nombre de points de fonctionnement (NOP) calculés par l’apprentissage

de l’option pour les quatre architectures sur un RBFN (l’algorithme d’apprentissage

utilisé, l’éventuelle fonction de confiance et le classifieur de rejet utilisé sont indiqués

entre parenthèses). Les résultats complets pour chaque classifieur et chaque

architec-ture sont présentés en Annexe A.1. Rappelons que plus l’AUERC et l’ERR5 sont petits,

meilleure est l’option de rejet.

D’après les résultats en annexe, la première observation est que, pour ce problème

simple, le choix de la fonction de confiance ou de l’algorithme utilisés n’a pas toujours

d’influence. C’est pourquoi nous avons sélectionné ces huit résultats représentatifs. Les

Option de rejet 100AUERC 100ERR5(%) NOP

Option de rejet 100AUERC 100ERR5(%) NOP