• Aucun résultat trouvé

1.6 Prinipe de fontionnement d'un moteur de reonnaissane

1.6.3 Résultats de la reonnaissane

Généralement, lesystème de reonnaissane ne fournit qu'une seule etunique solutionà un

problème de reonnaissane dela parole :laphrase la plusprobable. Cependant, dansbien des

as, ette information n'est pas susante. En eet, s'il doit y avoir des post-traitements à la

reonnaissane,des informations omplémentairessur lerésultat sont néessaires. Par exemple,

déterminerlavaleurdeonanedehaquemotreonnuestimpossibleaveuniquementlaphrase

résultat.Nousprésentonsiidiérentesreprésentationsdesrésultatsdumoteurdereonnaissane

autres que la seule solution maximale. Ces représentations inluent les

n

-meilleures phrases, le graphede mots etleréseau de onfusion.

1.6.3.1 N-meilleures phrases

Les

n

-meilleures phrases sont un sous-ensemble de toutes les phrases qu'il est possible de générer suivant le lexique et les modèles linguistiques. Ce sous-ensemble est déterminé par le

moteur de reonnaissane suivant le ritère du sore de vraisemblane de haune des phrases

hypothèses.L'algorithmequipermetd'extrairelalistedes

n

-meilleuresphrasesesttrèssemblable à l'algorithmede Viterbi[Shwartz90℄.

Généralement,lemoteurdereonnaissaneeetueplusieurspassespourdéterminerle

résul-tatnal.Unepremièrepasserapideavedesmodèlesmoinspréispermetderestreindrel'espae

de reherhe de solution.Les autres passes suessives introduisent des modèles plus préis ou

desinformations supplémentaires, parexemple, de naturesémantique. Unexemple d'utilisation

de la struture des

n

-meilleures phrases onsiste à extraire de la première passe l'ensemble des

n

-meilleuresphrasespuis,àpartirdeetensemblerestreintd'hypothèses,eetuerunedeuxième passe deré-estimation dessoresave desmodèles plus préis.

Un élémentdelastruturedes

n

-meilleuresphrasesseprésentesouslaforme d'uneséquene demots.Généralement,l'informationimportanteonernelapositiondesmotsdanslaséquene.

Cependant,ilestpossibledeonserverd'autrestypesd'information:l'instantdedébutetden

desmots, lesprobabilités aoustiquesetlinguistiques, et.

Un point négatif des

n

-meilleures phrases réside dans la distribution des phrases dans et ensemble. Dans l'exemple table 1.1, nous pouvons remarquer que la plupart des phrases ne

dièrent entre elles que d'un mot.En eet, des phrasesayant des vraisemblanesprohes sont

en généraletlogiquement trèssemblables. Lesystèmeauradon tendane àfournir desphrases

très similaires. Ainsi, pour une phrase longue, il faut onsidérer un nombre

n

de plus en plus

important de séquenespourobtenirune variété susantedephrases.

Tab. 1.1 Exemplede listedes5 meilleuresphrasesissues d'unsystèmede reonnaissane.

phrase 1: elles approheront vingt-quatre vingt-inq degrés sur le massif entral

phrase 2: elles se approheront vingt-quatre vingt-inq degrés sur le massif entral

phrase 3: et ils approheront vingt-quatre vingt-inq degrés sur le massif entral

phrase 4: -elles approheront vingt-quatre vingt-inq degrés sur le massif entral

phrase 5: elles le approheront vingt-quatre vingt-inq degrés sur le massif entral

1.6.3.2 Graphe de mots

Lastruturedegraphedemotspermetdereprésenterdemanièrepluspréiseetplusomplète

lesinformations issues généralement dela première passe[Ney94, Ortmanns97℄.Le moteur de

reonnaissane,dufaitdel'algorithmedeViterbi,génèreeninterneungraphedemotsontenant

les mots hypothèses onservés par le moteur de reonnaissane. Un graphe de mots inlut les

multiples hemins possibles qui vont du début à la n de la phrase. Les informations stokées

sont,entre autres, lesore aoustique desmots etleursinstants de début etde n.De parson

proessusde onstrution,haquemotdugrapheestl'extrémitéd'ununique hemin partant du

débutde laphrase. Cetteuniité provient de la propriété d'optimalitéde Bellman. Aussi, pour

haque motdugraphe, l'informationdumot prédéesseurausens deViterbi estonservée ainsi

quelavraisemblane umulée depuisle débutdelaphrase de etunique hemin.

La gure1.7 présenteunexemple de graphe de mots assoié à laphrase je mange ii vers

midi.Lesèhesillustrentlesliaisonsdepréédeneentrelesmots dugraphe. L'axehorizontal

orrespondà l'axetemporel.

t

je mange vers midi

range

je vers

vert riz

je mange

mange ici vers midi

range

verse ici

vert

mardi

Fig. 1.7 Exemple d'ungraphede mots

Le graphe de mots est bien plus eae dans la représentation des informations que la

struturedes

n

-meilleuresphrases.Par exemple,pourune phrasede10mots ayantpourhaque mot un hoix possible entre 2 hypothèses alternatives, il faudrait

2 10 = 1024

phrases dans la

struture des

n

-meilleures phrases pour représenter toutes les alternatives possibles. Or, ave une struture de graphe de mots, garder en mémoire seulement 20 mots sut. Le graphe de

mots est également plus eae du point de vuealulatoire. En eet,ave lastruture des

n

-meilleuresphrases,letraitementdephrasesalternativestrèssimilairesvontnéessiterd'eetuer

plusieurs fois des aluls identiques. Par ontre, ave un graphe de mots, les aluls pour les

parties ommunes desalternatives ne seront réalisés qu'une seule fois. Ainsi, les données et les

aluls peuvent être mieux partagés, et don l'utilisation d'un graphe de mots est nalement

moinsoûteuseenplae eten tempsdealul.

1.6.3.3 Réseau de onfusion

Le réseaudeonfusionestunesimpliationdugraphedemots.Lesmots n'ysontplus

loa-lisés suivant leurinstant de débutetde n,maissuivant leurpositiondanslaphrase/séquene.

Le résultatestungraphed'alignementsmultiplesavediérenteshypothèses(parfoisnulles)

à haque position possible d'unmot.La gure1.8 présenteun graphede mots standard assoié

à la phrase je mange vers midi alors que la gure 1.9 présente son équivalent sous forme

de réseau de onfusion. On peut noter les éléments <s> et </s> qui orrespondent

respetivementauxmarqueursdedébutetde ndephrase.L'introdutiond'unélément spéial

-, représentant une position optionnelle dans la phrase, permet d'indiquer la possibilité de

passerdiretement au motsuivantpourformerune phrasesans ajouterune nouvelle hypothèse

de mot.

Fig. 1.8 Seondexemple d'ungraphede mots

Je mange ici vers midi

_ range _ vert riz

_ mardi verse

Fig.1.9 Exemple d'unréseau deonfusion

La réation d'unréseau de onfusion est un point déliat et diile. En eet, sepose alors

des problèmes de séletions, éliminations, regroupements d'hypothèses qui peuvent onduire à

l'apparition de trous dans le ontinuum temporel qu'est ensé représenté le graphe de mots.

Cependant un algorithme a été proposé an de réaliser es opérations tout en onservant un

ordretotal etlaonsistanedu grapheobtenu [Mangu00℄.