1.6 Prinipe de fontionnement d'un moteur de reonnaissane
1.6.3 Résultats de la reonnaissane
Généralement, lesystème de reonnaissane ne fournit qu'une seule etunique solutionà un
problème de reonnaissane dela parole :laphrase la plusprobable. Cependant, dansbien des
as, ette information n'est pas susante. En eet, s'il doit y avoir des post-traitements à la
reonnaissane,des informations omplémentairessur lerésultat sont néessaires. Par exemple,
déterminerlavaleurdeonanedehaquemotreonnuestimpossibleaveuniquementlaphrase
résultat.Nousprésentonsiidiérentesreprésentationsdesrésultatsdumoteurdereonnaissane
autres que la seule solution maximale. Ces représentations inluent les
n
-meilleures phrases, le graphede mots etleréseau de onfusion.1.6.3.1 N-meilleures phrases
Les
n
-meilleures phrases sont un sous-ensemble de toutes les phrases qu'il est possible de générer suivant le lexique et les modèles linguistiques. Ce sous-ensemble est déterminé par lemoteur de reonnaissane suivant le ritère du sore de vraisemblane de haune des phrases
hypothèses.L'algorithmequipermetd'extrairelalistedes
n
-meilleuresphrasesesttrèssemblable à l'algorithmede Viterbi[Shwartz90℄.Généralement,lemoteurdereonnaissaneeetueplusieurspassespourdéterminerle
résul-tatnal.Unepremièrepasserapideavedesmodèlesmoinspréispermetderestreindrel'espae
de reherhe de solution.Les autres passes suessives introduisent des modèles plus préis ou
desinformations supplémentaires, parexemple, de naturesémantique. Unexemple d'utilisation
de la struture des
n
-meilleures phrases onsiste à extraire de la première passe l'ensemble desn
-meilleuresphrasespuis,àpartirdeetensemblerestreintd'hypothèses,eetuerunedeuxième passe deré-estimation dessoresave desmodèles plus préis.Un élémentdelastruturedes
n
-meilleuresphrasesseprésentesouslaforme d'uneséquene demots.Généralement,l'informationimportanteonernelapositiondesmotsdanslaséquene.Cependant,ilestpossibledeonserverd'autrestypesd'information:l'instantdedébutetden
desmots, lesprobabilités aoustiquesetlinguistiques, et.
Un point négatif des
n
-meilleures phrases réside dans la distribution des phrases dans et ensemble. Dans l'exemple table 1.1, nous pouvons remarquer que la plupart des phrases nedièrent entre elles que d'un mot.En eet, des phrasesayant des vraisemblanesprohes sont
en généraletlogiquement trèssemblables. Lesystèmeauradon tendane àfournir desphrases
très similaires. Ainsi, pour une phrase longue, il faut onsidérer un nombre
n
de plus en plusimportant de séquenespourobtenirune variété susantedephrases.
Tab. 1.1 Exemplede listedes5 meilleuresphrasesissues d'unsystèmede reonnaissane.
phrase 1: elles approheront vingt-quatre vingt-inq degrés sur le massif entral
phrase 2: elles se approheront vingt-quatre vingt-inq degrés sur le massif entral
phrase 3: et ils approheront vingt-quatre vingt-inq degrés sur le massif entral
phrase 4: -elles approheront vingt-quatre vingt-inq degrés sur le massif entral
phrase 5: elles le approheront vingt-quatre vingt-inq degrés sur le massif entral
1.6.3.2 Graphe de mots
Lastruturedegraphedemotspermetdereprésenterdemanièrepluspréiseetplusomplète
lesinformations issues généralement dela première passe[Ney94, Ortmanns97℄.Le moteur de
reonnaissane,dufaitdel'algorithmedeViterbi,génèreeninterneungraphedemotsontenant
les mots hypothèses onservés par le moteur de reonnaissane. Un graphe de mots inlut les
multiples hemins possibles qui vont du début à la n de la phrase. Les informations stokées
sont,entre autres, lesore aoustique desmots etleursinstants de début etde n.De parson
proessusde onstrution,haquemotdugrapheestl'extrémitéd'ununique hemin partant du
débutde laphrase. Cetteuniité provient de la propriété d'optimalitéde Bellman. Aussi, pour
haque motdugraphe, l'informationdumot prédéesseurausens deViterbi estonservée ainsi
quelavraisemblane umulée depuisle débutdelaphrase de etunique hemin.
La gure1.7 présenteunexemple de graphe de mots assoié à laphrase je mange ii vers
midi.Lesèhesillustrentlesliaisonsdepréédeneentrelesmots dugraphe. L'axehorizontal
orrespondà l'axetemporel.
t
je mange vers midi
range
je vers
vert riz
je mange
mange ici vers midi
range
verse ici
vert
mardi
Fig. 1.7 Exemple d'ungraphede mots
Le graphe de mots est bien plus eae dans la représentation des informations que la
struturedes
n
-meilleuresphrases.Par exemple,pourune phrasede10mots ayantpourhaque mot un hoix possible entre 2 hypothèses alternatives, il faudrait2 10 = 1024
phrases dans lastruture des
n
-meilleures phrases pour représenter toutes les alternatives possibles. Or, ave une struture de graphe de mots, garder en mémoire seulement 20 mots sut. Le graphe demots est également plus eae du point de vuealulatoire. En eet,ave lastruture des
n
-meilleuresphrases,letraitementdephrasesalternativestrèssimilairesvontnéessiterd'eetuer
plusieurs fois des aluls identiques. Par ontre, ave un graphe de mots, les aluls pour les
parties ommunes desalternatives ne seront réalisés qu'une seule fois. Ainsi, les données et les
aluls peuvent être mieux partagés, et don l'utilisation d'un graphe de mots est nalement
moinsoûteuseenplae eten tempsdealul.
1.6.3.3 Réseau de onfusion
Le réseaudeonfusionestunesimpliationdugraphedemots.Lesmots n'ysontplus
loa-lisés suivant leurinstant de débutetde n,maissuivant leurpositiondanslaphrase/séquene.
Le résultatestungraphed'alignementsmultiplesavediérenteshypothèses(parfoisnulles)
à haque position possible d'unmot.La gure1.8 présenteun graphede mots standard assoié
à la phrase je mange vers midi alors que la gure 1.9 présente son équivalent sous forme
de réseau de onfusion. On peut noter les éléments <s> et </s> qui orrespondent
respetivementauxmarqueursdedébutetde ndephrase.L'introdutiond'unélément spéial
-, représentant une position optionnelle dans la phrase, permet d'indiquer la possibilité de
passerdiretement au motsuivantpourformerune phrasesans ajouterune nouvelle hypothèse
de mot.
Fig. 1.8 Seondexemple d'ungraphede mots
Je mange ici vers midi
_ range _ vert riz
_ mardi verse
Fig.1.9 Exemple d'unréseau deonfusion
La réation d'unréseau de onfusion est un point déliat et diile. En eet, sepose alors
des problèmes de séletions, éliminations, regroupements d'hypothèses qui peuvent onduire à
l'apparition de trous dans le ontinuum temporel qu'est ensé représenté le graphe de mots.
Cependant un algorithme a été proposé an de réaliser es opérations tout en onservant un
ordretotal etlaonsistanedu grapheobtenu [Mangu00℄.