Notre formalisation des quatre architectures

2.3 Les principales architectures pour les options de rejet

RC Classe ou rejet Classifieur Principal / de Rejet Caractéristiques −

Classe ou rejet _SC Caractéristiques

Classifieur Principal Classifieur de Rejet Décision Classe Rejet ₋

Classifieur Principal Décision SCRF Classe ou rejet Classifieur de Rejet Caractéristiques Classe Rejet −

Décision TRF

Classifieur Principal Seuils de Rejet

Caractéristiques

Classe ou rejet

Classe Rejet −

Notre formalisation des quatre architectures

2.3 Les principales architectures pour les options de rejet

2.3.4 Notre formalisation des quatre architectures

Comme nous l’avons vu, quatre architectures principales pour systèmes de

recon-naissance avec les options de rejet peuvent être distinguées. Elles sont illustrées par la

figure 2.3. Elles ont toutes le même fonctionnement et objectif final : le système prend

en entrée les caractéristiques de la forme à reconnaître et rend en sortie soit la décision

de rejet, soit la classe reconnue. Cette section a pour but de formaliser et comparer ces

architectures de manière à bien en voir les différences.

2.3.4.1 Classe de rejet

Dans cette architecture notée RC (décrite par la figure 2.3(a)) une classe de rejet est

ajoutée au problème de reconnaissance. Cette classe de rejet est considérée de la même

manière que les autres classes. Il y a donc rejet si le score obtenu par la classe de rejet

est supérieur aux scores obtenus par les autres classes. Dans certaines applications, le

classifieur principal existe déjà, il faudra donc le réapprendre pour intégrer la classe de

rejet, ce qui peut-être un inconvénient de cette architecture.

Pour le rejet de distance, les contre-exemples forment une classe comme les autres.

Donc les bases d’apprentissage D

et D

sont fusionnées en D

. Cette base sert

ensuite pour l’apprentissage du nouveau classifieur avec classe de rejet. Cette solution

a besoin d’avoir des contre-exemples pour l’apprentissage de la classe de rejet. Donc si

D

est vide dans le problème A→B (problème ∅ →B), cette architecture RC n’est pas

possible.

Pour le rejet d’ambiguïté, la difficulté est de créer une base d’apprentissage des

erreurs que va commettre le futur classifieur. Pour cela il faut d’abord apprendre un

classifieur normal sur D

s’il n’existe pas déjà. Ensuite il faut ré-étiqueter les erreurs

comme des contre-exemples de type A pour constituer une base d’apprentissageD

Les principales architectures pour les options de rejet 37

(a)

(b)

{ψ

}

(c)

{ψ

}

(d)

Fig.2.3 – Les quatre architectures de systèmes avec option de rejet : utilisant (a) une

classe de rejet dans le classifieur principal (RC) ; (b) un classifieur spécialisé dans

l’es-pace des caractéristiques (SC) ; (c) un classifieur spécialisé dans l’esl’es-pace des fonctions

de confiance {ψ

} (SCRF) ; (d) des seuils sur les fonctions de confiance{ψ

} (TRF).

pour apprendre le classifieur avec la classe de rejet. Le problème est que même si les

erreurs commises par le premier classifieur sont bien rejetées, de nouvelles erreurs vont

apparaître à cause des confusions entre les classes principales et la classe de rejet. De

plus, les erreurs de classification sont éparpillées dans tout l’espace des caractéristiques

le long des frontières de décision, ce qui rend la définition d’une classe de rejet difficile.

Dans cette architecture, les classifieurs avec de bonnes capacités de discrimination

seront préférés. En effet l’efficacité du rejet repose entièrement sur les capacités du

classifieur à distinguer les classes entre elles, surtout que l’insertion de la classe de rejet

rend le problème de classification plus compliqué. De plus les performances du système

peuvent diminuer notablement par rapport à celles du classifieur sans rejet, puisque

les formes bien reconnues par le système sans rejet peuvent être mal reconnues par le

système avec rejet.

2.3.4.2 Classifieur spécialisé

Dans cette architecture appelée architecture avec un classifieur spécialisé (SC), un

classifieur indépendant à deux classes est chargé de la décision de rejet (Figure 2.3(b)).

Ce classifieur utilise le même espace de caractéristiques que le classifieur principal. Il

y a rejet si le classifieur de rejet classe la forme dans la classe rejet. Si la forme est

acceptée, alors c’est le classifieur principal qui décide de la classe d’appartenance.

Séparer la décision de rejet du classifieur principal en utilisant un classifieur de rejet

présente quelques avantages. D’abord, le classifieur principal n’est pas modifié s’il existe

déjà et la complexité du problème de reconnaissance n’est pas augmentée par l’ajout

d’une nouvelle classe. De plus les deux classifieurs peuvent tirer avantage de familles

de classifieurs différentes. Par exemple dans [115], un MLP est utilisé comme

classi-fieur principal pour ses capacités discriminantes et un OGMM (Orthogonnal Gaussian

Mixture Model) est utilisé comme classifieur de rejet de distance pour ses capacités de

description intrinsèque.

Pour le rejet de distance, cette architecture a les mêmes inconvénients que

l’archi-tecture RC. En effet, siD

est vide, le classifieur de rejet ne pourra pas être appris. La

seule solution dans ce cas est d’utiliser un classifieur qui n’a pas besoin des deux classes

pour être appris (comme les OGMM dans [115]). De plus pour le problème A→B, le

classifieur de rejet doit avoir une bonne capacité de généralisation pour pouvoir rejeter

efficacement des formes non rencontrées pendant l’apprentissage. Il donc faudra

préfé-rer un classifieur très discriminant comme classifieur principal et un classifieur avec une