Automatic Multiple-Thresholds Learning algorithm (AMTL)

3.2 Apprentissage des seuils de l’architecture TRF

^card^{^Ei}ti

Automatic Multiple-Thresholds Learning algorithm (AMTL)

3.2 Apprentissage des seuils de l’architecture TRF

3.2.2 Automatic Multiple-Thresholds Learning algorithm (AMTL)

CMP n’est pas adapté à toutes les fonctions possibles de notre approche, PSO est

difficilement interprétable car il est stochastique. De plus aucun de ces deux algorithmes

ne peut apprendre le rejet de distance sans contre-exemples. Toutes ces raisons nous

ont poussé à développer un algorithme générique, efficace et interprétable.

L’algorithme que nous présentons dans cette section se nomme AMTL pour

ap-prentissage automatique de seuils multiples (Automatic Multiple-Thresholds Learning

Algorithm). Cette approche est un cadre générique pour l’apprentissage des seuils des

différentes natures de rejet. AMTL est un algorithme glouton basé sur des heuristiques

définissables par l’utilisateur. Différentes variantes de cet algorithme donc sont possibles

et nous présentons les deux plus intéressantes AMTL1 et AMTL2.

AMTL utilise un classifieur principal déjà appris et un ensemble de fonctions de

confiance déjà choisies. De plus il a besoin de deux bases d’apprentissage : une base

d’exemples notéeD

et une base de contre-exemples notéeD

. Le contenu de ces deux

bases dépend de la nature du rejet appris comme expliqué dans les sections précédentes :

pour le rejet de distance,D

contient les formes à accepter etD

contient les formes à

rejeter disponibles ; pour le rejet d’ambiguïtéD

contient les formes bien reconnues et

D

contient les formes mal reconnues par le classifieur principal. Le choix des fonctions

de confiance et des heuristiques utilisées dépendant du problème considéré, le seul

paramètre de AMTL estθ le taux de faux rejet maximal permis.

Comme on peut le voir dans l’Algorithme 2, AMTL est composé de cinq étapes :

1. A l’initialisation les valeurs des fonctions de confiance sont calculées pour tous les

exemples et contre-exemples puis les seuils sont fixés de manière à rejeter tous les

contre-exemples et tous les exemples,E etC contiennent la liste des exemples et

contre-exemples rejetés ;

2. Les étapes suivantes sont répétées tant que le critère d’arrêt n’est pas vérifié par

la fonctioncas_d_arrêt;

3. Le seuil qu’il va falloir modifier est choisi suivant la politique de choix des seuils

par la fonction choisir_le_seuil;

4. Le seuil choisi est ensuite diminué suivant la politique de descente des seuils grâce

à la fonction diminuer_le_seuil pour accepter de plus en plus d’exemples (et

de contre-exemples) ;

5. Mise à jour des exemples et contre-exemples encore rejetés, on retire de E et C

ceux qui sont acceptés par un des seuils.

En considérant l’espace<

des valeurs possibles des seuils, AMTL est basé sur le fait

qu’il y a deux points remarquables : le point de rejet nulP

où tous les seuils sont à zéro,

et le point de rejet totalP

où tous les seuils sont suffisamment hauts pour tout rejeter.

Cet algorithme cherche un chemin pour aller de P

à P

en suivant itérativement une

dimension (un seuil) à chaque étape. Ce chemin ressemble à un escalier enN dimensions.

La dimension parcourue à chaque étape est choisie par la fonction choisir_le_seuil

en essayant de minimiser le FRR et maximiser le TRR plus ou moins localement suivant

cette fonction. Ensuite la fonction diminuer_le_seuil diminue le seuil choisi. Il faut

Apprentissage des seuils de l’architecture TRF 65

Algorithme 2 : Algorithme AMTL d’apprentissage des seuils.

Entrées : Le classifieur

Entrées :Ψensemble des N fonctions de confiance ψ

Entrées :D

base d’exemples

Entrées :D

base de contre-exemples

Entrées :θparamètre du cas d’arrêt

Résultat:T ensemble desN seuils de rejett

début

//Initialisation

pour chaque ψ

∈Ψfaire

E

← {ψ

(e

),∀e

∈D

, ψ

(e

)>0}

E ←E∪ {E

}

C