Décodage MAP

5.2 Réordonnancement des N meilleures hypothèses

22 21.9 21.8 21.7 21.6 6 8 10_{12 14 16} 18 20 α 0 2 4 6 8 10 12 β 21.4 21.6 21.8 22 22.2 22.4 22.6 22.8 WER(%)

t1∈T1...ti∈Ti

i, suivant le

0 500 1000 1500 2000 2500 3000 3500 −8 −6 −4 −2 0 2 4 6 nb de groupes de souffle Z_i

12 12.5 13 13.5 14 14.5 8 10 12 14 16 18 W E R (% ) α β=0 (sans POS) β>0 (avec POS)

5.2 Réordonnancement des N meilleures hypothèses

5.2.1 Décodage MAP

Le critère MAP consiste à rechercher parmi lesN hypothèses proposéesW

pour

un groupe de soue donné celleWˆ qui vérie

:

ˆ

W = arg max

score

(W) . (5.3)

Pour tester la validité de ce critère et de notre score incluant les POS, nous avons mené

plusieurs expérimentations, en confrontant nos résultats avec les méthodes usuelles.

5.2.1.1 Premiers résultats

Nous comparons dans un premier temps le WER obtenu avec notre système de RAP

selon que l'on inclut on non le score morpho-syntaxiqueβlogP(t

). En optimisant les

Siscore

est déni de telle manière à ce que sa valeur est d'autant plus grande que l'hypothèse

est correcte.

Fig. 5.2: Évolution du WER en fonction des paramètres αet β avec le jeu d'étiquettesext2 et

sur le corpus de développement

étiquettes Sub Del Ins WER α β γ

sans POS 13,5 4,5 2,0 19,9 12 0 0

norm 13,0 4,1 2,2 19,3 12 4 5

red1 13,1 4,2 2,2 19,5 13 3 5

red2 13,0 4,1 2,2 19,2 12 4 5

ext1 12,9 4,1 2,2 19,2 11 4 5

ext2 12,9 3,9 2,3 19,1 10 4 5

Tab. 5.2: Résultats obtenus sur le corpus de test pour diérents jeux d'étiquettes et avec un ordre

N = 7. Sub, Del et Ins représentent respectivement les taux d'erreur de substitution, de suppression

et d'insertion

coecientsα,β etγ pour chacun des jeux d'étiquettes sur le corpus de développement,

nous constatons une baisse du WER sur le corpus de test pour tous nos jeux d'étiquettes

(Tab. 5.2). Cette évolution du taux d'erreur se révèle néanmoins assez sensible aux

étiquettes utilisées. Pour le meilleur ensemble, i.e., ext2, nous observons une baisse

absolue du WER de 0,8 % ; c'est dorénavant ce jeu d'étiquettes que nous utilisons dans

toutes les expériences qui suivent sur le réordonnancement d'hypothèses.

5.2.1.2 Comparaison avec les ML N-classes

An de montrer l'ecacité du score que nous proposons, nous comparons les

ré-sultats que nous avons obtenus avec ceux donnés par la méthode qui est généralement

employée pour prendre en compte les POS, i.e., les MLN-classes. Ces ML sont

système de RAP initial s(w

) ML N-classes

19,9 19,1 19,5

Tab. 5.3:WER(%) mesurés sur les données de test

lement introduits au cours du processus de transcription au moyen d'une interpolation

linéaire avec un ML de mots [Maltese et Mancini, 1992]. La recherche de la meilleure

hypothèse se fait à l'aide de la formulation classique de la RAP (cf. équation (1.11)

page 16) en calculant la probabilité de la séquence de mots de la manière suivante :

P(w

) =

Y

[λP

(w

|w

) + (1−λ)P

(w

|w

)] (5.4)

avec :

P

(w

|w

) = X

[P(w

|t

)P(t

|t

)] . (5.5)

λ est un coecient déterminant le poids du ML M-grammes par rapport au ML N

-classes et T

représente l'ensemble des étiquettes possibles pour le mot w

dictionnaire de notre étiqueteur. Nous utilisons au cours de nos expériences un ML de

mots d'ordreM = 4 et un ML de classes d'ordre N = 7.

La variation des paramètres α, γ et λsur le corpus de développement montre une

baisse du WER quand on prend en compte le modèleN-classes. En xantλà 0,7, nous

obtenons sur le corpus de test une baisse absolue du WER de 0.4 % (Tab. 5.3, dernière

colonne), ce qui reste une diminution deux fois inférieure à celle observée précédemment

(Tab. 5.3, deuxième colonne) avec le scores(w

un groupe de soue donné celleW^ˆ qui vérie

) = ^X