Les algorithmes de l’état de l’art

3.2 Apprentissage des seuils de l’architecture TRF

^{DistRbf W}

₀_≤_k_≤_k_{M AX}

3.2 Apprentissage des seuils de l’architecture TRF

3.2.1 Les algorithmes de l’état de l’art





µ

si i=argmax

(µ

),

0 sinon. (3.13)

Il est aussi possible de réduire le nombre de fonctions de confiance à 1 en n’utilisant

que la meilleure activation des fonctions à base radiale :

ψ

= max

(µ

). (3.14)

Ces listes de fonctions de confiance pour le rejet de d’ambiguïté et pour le rejet de

distance ne sont pas exhaustives. En effet d’autres sont possibles comme celles utilisées

dans [86, 87]. De plus il est possible de combiner entre elles les fonctions de confiance

pour prendre en compte plusieurs sources d’information, mais cette approche n’est pas

développée dans cette étude.

3.2 Apprentissage des seuils de l’architecture TRF

L’architecture TRF est utilisée avec un classifieur principal déjà appris et avec un

ensemble de fonctions de confiance{ψ

}adaptées à ce classifieur et à la nature de rejet

désirée. L’utilisation de plusieurs seuils exige une étape d’apprentissage pour l’option

de rejet. En effet si un seul seuil est utilisé, il suffit de le faire varier pour tracer

une courbe ROC ou ER suivant le cas et ainsi choisir le compromis intéressant. Avec

plusieurs seuils, soit il faut tracer la courbe en N dimensions (une pour chaque seuil)

ce qui est ensuite difficilement utilisable, soit utiliser un algorithme qui cherche quelle

est la meilleure combinaison de seuils pour chaque compromis. L’apprentissage de cette

option de rejet consiste donc à fixer une valeur pour chaque seuil associé aux fonctions

de confiance.

Dans cette section nous présentons deux algorithmes originaux. Le premier appelé

AMTL est basé sur des heuristiques définissables par un expert, le second appelé TGD

est l’application de la méthode de la descente du gradient de l’erreur à notre problème

d’apprentissage des seuils. A titre de comparaison nous présentons d’abord deux

algo-rithmes de l’état de l’art que nous avons transposé à notre formalisme.

3.2.1 Les algorithmes de l’état de l’art

Les deux algorithmes auxquels nous nous comparons ensuite sont l’optimisation par

nuée de particules(proposé par Oliveiraet al.[81]) et leproblème de maximisation sous

contraintes (proposé par Fumera et al. [40]). La transposition à notre formalisme de

Apprentissage des seuils de l’architecture TRF 61

3.2.1.1 Optimisation par nuée de particules

Le problème de trouver l’ensemble optimal de seuils peut être vu comme un

pro-blème d’optimisation multi-objectifs. Dans [81] les auteurs ont choisi d’utiliser un

algo-rithme d’optimisation appelé optimisation par nuée de particules (PSO pour Particle

Swarm Optimization). Nous comparerons dans les résultats nos algorithmes AMLT et

TGD, présentés dans les sections suivantes, à PSO.

Comme expliqué dans [56, 85], PSO est une technique d’optimisation stochastique

multi-objectifs. Elle simule le comportement d’un groupe d’oiseaux en vol ou d’un banc

de poissons cherchant de la nourriture. En effet PSO utilise un ensemble de particules

dont le déplacement dépend du mouvement du groupe. La direction du déplacement

d’une particule dépend de sa meilleure position trouvée jusqu’alors et de la meilleure

position trouvée par le groupe.

Dans notre problème, l’espace de recherche est l’espace des valeurs possibles pour

les N seuils {t

}, c’est-à-dire <

. La position de chaque particule correspond à une

option de rejet i.e.une valeur pour chaque seuil. La mesure de performance

(fitness

function) F utilisée pour évaluer les positions des particules dépendra de la nature du

rejet désirée. Dans [81], les auteurs utilisent comme fonctionF pour le rejet d’ambiguïté

la fiabilité avec la contrainte que l’erreur reste inférieure à un seuil (presque comme

dans l’approche de Fumera

, présentée dans la section suivante). Nous avons choisi de

modifier cette fonctionF pour qu’elle représente mieux la notion de compromis entre

ce qu’il faut rejeter et ce qu’il faut accepter. De plus nous en proposons une fonction

F adaptée au rejet de distance.

Si un rejet d’ambiguïté est appris, nous proposons d’utiliser cette fonction utilisant

la base d’apprentissage D

:

F({t

}, D

) = 1 +α(1−Err

(D

))−Rej

(D

). (3.15)

Le paramètreα permet d’ajuster le coût d’une erreur par rapport à celui d’un rejet.

0 sinon. ^(3.13)

^. (3.17)