Pour le rejet de distance

4.2 Résultats sur la base artificielle

^AmbSym_{_i,j_}

i − 1 1 3 2 3

Contre−exemples A Contre−exemples B

^AmbSym_{_i,j_}

_i^{F umera}

_i^{F umera}

4.2 Résultats sur la base artificielle

4.2.2 Pour le rejet de distance

Le rejet de distance a pour but de rejeter les formes qui ne correspondent pas aux

classes apprises. Nous avons vu que ce type de rejet peut être confronté à trois types de

problèmes suivant les contre-exemples disponibles pendant l’apprentissage de l’option

de rejet. L’objectif de ces tests est de comprendre le comportement des différentes

options de rejet face à ces problèmes pour choisir les plus adaptées. Nous commençons

par présenter les résultats (vu en deux dimensions puis comportement global), ensuite

nous commenterons ces résultats d’abords pour les architectures utilisant les fonctions

de confiance puis pour celles utilisant directement les caractéristiques.

4.2.2.1 La forme des zones de rejet et comportement global

La figure 4.4 compare les formes des zones de rejet de distance pour différentes

options de rejet apprises sur la base artificielle D

. Les taux de rejet des options de

rejet présentées sont à peu près identiques. Nous pouvons constater que les zones de rejet

sont très différentes d’une architecture à l’autre. La table 4.4 présente pour les mêmes

options de rejet (et quelques autres) les aires sous la courbe ROC (AUROCC) pour les

trois problèmesA→A,A→BetA→ABet le nombre de points de fonctionnement appris

(NOP). Rappelons que plus l’AUROCC est grand, meilleure est l’option de rejet. Les

résultats complets de cette expérience sont donnés en annexe A.2. Quelques remarques

générales à propos de l’utilisation de l’aire sous la courbe sont les mêmes que pour le

rejet d’ambiguïté, par exemple le fait que l’égalité des AUROCC n’implique pas l’égalité

des courbes ROC.

Tab. 4.4 – AUROCC et NOP pour le rejet de distance sur les données artificielles

(extraits des tables A.7 à A.12.

Option de rejet A→A A→B A→AB NOP

1 TRF (RBFN, AMTL1,ψ

) 91.0±0.48 91.8±0.53 91.1±0.15 103

2 TRF (RBFN, AMTL2,ψ

) 89.5±0.79 94.9±0.2 92.2±0.27 103

3 TRF (RBFN, AMTL1,ψ

) 89.3±0.77 95.1±0.21 92.2±0.28 103

4 TRF (MLP, PSO,ψ

) 84.9±0.46 57 ± 1 68.7±0.58 43

5 TRF (SVM, TGD,ψ

) 81.5±1.2 63.5±2.8 70.6±1.4 103

6 TRF (RBFN, AMTL1,ψ

) 93.4±0.52 81.1±0.66 87.1±0.48 103

7 SCRF(RBFN avecψ

, SVM) 96.1±0.18 82.1±1.3 88.4±0.62 53

8 SC (RBFN avec SVM) 97.1±0.23 55.1±5.1 73.7±3.5 103

Résultats sur la base artificielle 85

(a) TRF (AMTL1) sur RBFN avecψ

(b) TRF (AMTL2) sur RBFN avecψ

(c) TRF (AMTL1) sur MLP avecψ

(d) TRF (AMTL1) sur SVM avecψ

(e) SCRF (avec un MLP) sur RBFN avecψ

(f) RC sur SVM

(g) SC (avec un SVM) sur RBFN

(h) Bases de contre-exemplesD

etD

Fig. 4.4 – Les zones de rejet des différentes options de rejet de distance. Les zones de

rejet sont en gris et les zones acceptées sont en blanc. Les frontières de décision sans

rejet sont en pointillés. Les chiffres correspondent aux décisions de classification.

4.2.2.2 Architectures TRF et SCRF

Les figures 4.4(a) et 4.4(b) permettent de comprendre la différence entre les deux

variantes AMTL1 et AMTL2 de notre algorithme d’apprentissage des seuils de

l’archi-tecture TRF. AMTL1 prend en compte les contre-exemples et donc les zones

d’accep-tation 1 et 3 sont plus petites que celles apprises par AMTL2 car elles sont proches

des contre-exemples de type A. D’un autre coté la zone de la classe 2 est plus large

avec AMTL1 qu’avec AMTL2 car les contre-exemples en sont éloignés. AMTL2 en

ne prenant en compte que la densité des exemples généralise mieux les zones de rejet

de façon homogène alors que AMTL1 se spécialise dans le rejet d’un type de

contre-exemples. Cette différence se retrouve dans la table 4.4 (lignes 1 et 2) : l’AUROCC du

problème A→Aest le même pour AMTL1 et AMTL2 mais pour les problèmesA→Bet

A→ABles AUROCC sont bien meilleures pour AMTL2. La ligne 3 du tableau montre

les résultats en utilisant une seule fonction de confianceψ

et on peut constater que

ce problème simple ne permet pas de montrer l’intérêt du multi seuillage. En effet le

fait de n’avoir qu’un seul seuil à fixer permet facilement de généraliser, ce qui dans ce

problème est un handicap pour leproblème A→Amais un avantage pour les problèmes

A→Bet A→AB.

Les bons résultats de l’architecture TRF dépendent en grande partie du classifieur

principal utilisé comme le montrent les figures 4.4(c) et 4.4(d) qui utilisent

respective-ment un MLP et un SVM. On peut voir que le MLP n’est pas du tout adapté à ce type

de rejet puisqu’il essaye de rejeter seulement dans les zones proches des frontières. La

ligne 4 du tableau confirme ces résultats. Les résultats du SVM (ligne 5 du tableau)

sont faibles malgré l’information intrinsèque contenue dans les vecteurs supports. La

figure 4.4(d) montre que l’utilisation de la normalisation soft-max n’est pas adaptée au