Protocoles de tests

Classe 1 Classe 2 Classe 3

Contre−exemples A Contre−exemples B

Les tests consistent à comparer les quatre architectures apprises avec les différents

algorithmes pour les mêmes problèmes de rejet (rejet d’ambiguïté et les trois problèmes

du rejet de distance). Pour comparer les options de rejet obtenues, nous utilisons les

mesures présentées dans la section 2.6. Nous présentons maintenant les bases que nous

avons utilisées pour ces tests puis la façon d’obtenir les différents points opérationnels.

4.1.1 Les bases utilisées

Comme expliqué dans la sections 2.6, il nous faut définir quatre types de bases pour

réaliser nos tests. Une base d’exemples D

pour le rejet d’ambiguïté. Pour le rejet de

distance, il faut en plus les bases de contre-exemples connusD

, inconnus D

et mal

connusD

correspondant à chacun des trois problèmes. Nous avons définis ces bases

autour de deux contextes très différents destinés à tester et expliquer nos approches :

un contexte artificiel pédagogique et un contexte réel d’utilisation.

La première base utilisée est générée artificiellement dans le but d’illustrer cette

étude. Elle se place dans un espace à deux dimensions ce qui permettra de

visuali-ser les données et les zones de rejet. La base d’exemples D

est composée de trois

classes (notées 1, 2 et 3) chacune générées à partir d’une distribution gaussienne. Il y

a volontairement un léger recouvrement entre ces trois classes. Chacune des bases de

contre-exemplesD

etD

est aussi générée à partir d’une gaussienne. Les gaussiennes

sont toutes différentes les unes des autres. Il y a aussi un recouvrement partiel avec les

trois classes principales. La figure 4.1 présente la localisation des trois classes deD

et

les deux distributions de D

etD

. La base D

sera constituée de l’union des deux

bases de contre-exemples.

(a)

(b)

Fig.4.1 – Les données artificielles en deux dimensions D

(a), D

etD

(b).

La seconde base utilisée correspond à des problèmes réels de rejet rencontrés dans

notre contexte applicatif : la reconnaissance de chiffres pour le rejet d’ambiguïté et la

reconnaissance de chiffres avec rejet des lettres minuscules pour le rejet de distance.

Les classes de D

sont les chiffres isolés manuscrits en-ligne de la base UNIPEN [46]

Protocoles de tests 77

D

sont les lettres minuscules isolées manuscrites en-ligne de UNIPEN (soit 61017

lettres). La base de contre-exemples D

est composée d’un sous-ensemble des lettres

majuscules isolées de UNIPEN choisies pour être très différentes des chiffres et des

lettres minuscules. Les lettres pour D

choisis sont B, H, K, P, Q, R, X, Y et Z (soit

1789 lettres tirées au hasard parmi toutes les majuscules correspondantes de UNIPEN).

Ce choix s’est fait en considérant la nature des caractéristiques utilisées par la suite.

Enfin la base D

est composée de toutes les lettres majuscules de UNIPEN donc

certaines ressembleront aux chiffres, d’autres aux lettres minuscules et d’autres à aucun

des deux (soit 6000 lettres tirées au hasard parmi toutes les majuscules de UNIPEN).

Les caractéristiques utilisées pour cette bases sont celles décrites dans la section 1.1.1.2.

Ce problème beaucoup plus compliqué que celui avec les données artificielles permet

de tester les options de rejet dans un contexte réel avec plus de classes (les 10 chiffres),

plus de dimensions (21 caractéristiques) et plus de variabilité (caractères manuscrits).

Comme nous l’avons vu dans la section 2.6 nous utilisons pour nos tests une

vali-dation croisée. Nous avons donc séparéD

etD

en quatre parties : un quart sert au

test de l’option de rejet, la moitié sert de base d’apprentissage avec le dernier quart

utilisé comme base de validation (pour les apprentissage nécessitant une base de

valida-tion, comme l’apprentissage des classifieurs ). Les expérimentations sont donc répétées

quatre fois en faisant une rotation des quatre bases. La séparation entre base

d’appren-tissage, base de validation et base de test a été fait de manière aléatoire sans considérer

les scripteurs, c’est donc un test multi-scripteurs c’est à dire que les scripteurs présents

dans la base d’apprentissage peuvent être dans la base de test.

La table 4.1 résume le contenu de chaque base et présente la taille de chacune d’elles

pour le test, pour l’apprentissage et pour la validation.

Tab. 4.1 – Taille et nature des bases de données utilisées.

Bases Taille Classes

Apprentissage Validation Test

Données D