L'algorithme de Viterbi - Prinipe de fontionnement d'un moteur de reonnaissane

1.6 Prinipe de fontionnement d'un moteur de reonnaissane

1.6.1 L'algorithme de Viterbi

1.6.1.1 Le prinipe de Viterbi

Nous herhons ii à déterminer la séquene d'états maximisant

P(O|M)

. Le système à résoudrepeutsereprésentersous laformed'ungrapheàdeux dimensions:laséquene d'obser-vationsen absisse,lemodèle

M

en ordonnée.

LaFigure1.5représenteuntelgraphepourunexempled'uneséquenede10observationset unmodèledeMarkovahéàtroisétatsàtopologiedetransitiongauhe-droite.Dansegraphe, unn÷udreprésenteunétat

i

dumodèlepouruneertaineobservation

o

_taveunevaleurassoiée égaleà

b

(o

)

. Lesars orrespondent auxtransitions d'unétat

i

à un état

j

(

i

peutêtre égal à

j

) etontomme valeur assoiéelaprobabilité detransition

a

_ij (.f.setion 1.4.1).

O1 O2 O3 O4 O5 O6 O7 O8 O9 O10

Fig. 1.5 Graphe de Viterbi pour un HMM à 3 états gauhe-droite et une séquene de 10 observations

La solution se présente ainsi sous la forme d'un hemin ayant omme origine un état du modèledeMarkovautemps

t= 1

etommeextrémitéunétatdumodèleautemps

t=T

.Dans l'exemple de lagure 1.5, latopologie du modèle de Markovest gauhe-droite, e qui implique

des ontraintes supplémentaires sur les hemins possibles. En eet, le hemin doit forément débuter danslepremier état du modèleet terminerdansledernier étatde elui-i. A partirde ette représentation graphique du problème,l'emploi d'un algorithme de reherhe du meilleur hemin dansungraphe semblenaturel.

L'algorithme de Viterbi permet d'eetuer ette reherhe en s'appuyant sur le prinipe d'optimalitéde Bellman.

1.6.1.2 Le prinipe d'optimalitéde Bellman

Le prinipe d'optimalité de Bellman utilisé en programmation dynamique peut s'appliquer dansleadrede lareherhede hemindansun grapheets'exprime ainsi:imaginonsquenous onnaissions lehemin optimal pourarriveren

A

2 et

A

3 (Figure 1.6).

A1

A2

A3

B

Fig.1.6 Exemple d'unextrait degraphe and'illustrer leprinipe d'optimalitéde Bellman.

Alors, leheminoptimal pouraller en

B

,donnépar

dcumul(B)

,est :

dcumul(B) = min











dcumul(A

₁

) +d(A

₁

, B)

dcumul(A

₂

) +d(A

₂

, B)

dcumul(A

₃

) +d(A

₃

, B)

dcumul(A

)

étant la distane umulée pour arriver au point

A

i, et

d(A

, B)

la distane loale pouraller de

A

_i à

B

∀i∈ {1,3}

1.6.1.3 L'algorithme de Viterbi

En se reportant à la Figure 1.5 et en utilisant le prinipe d'optimalité de Bellman, nous onstatonsqueles soresumuléspourhaqueétatdu modèledeMarkovautemps

t

dépendent seulement :

dessoresumulés pourhaque étatau tempspréédent

t−1

desprobabilités detransitionentre lesétats du temps

t−1

eteux dutemps

t

, desprobabilités d'émissionde l'observation

o

_t parles états duHMM.

Soit

δ

(j)

laprobabilitédumeilleurheminquis'arrêteàlatrame

t

àl'état

j

duHMM,nous obtenons alorslarelation suivante:

δ

(j) = max

δ

_t₋₁

(i)×a

_ij

×b

(o

)

(1.5)

L'algorithmedeViterbiestfondésuretterelationderéurrenequipermetàhaqueinstant

t

de onnaîtrelaprobabilitédumeilleur hemin menantà l'état

j

dumodèle.Deette manière,

tousles hemins possibles sont parouruset lesore du meilleur hemin est onnu.Nousavons deplus larelationsuivantequilie l'équation 1.5auproblème initial:

P(O|M) = max

δ

(i)

(1.6)

l'algorithmede Viterbi sedéompose ainsi:

Initialisation :

δ

₀

(i) = π

_i, la probabilité initiale d'être dans un des états du modèle de Markov.

Réurrene :autemps

t

pourhaqueétat

i

dumodèlenousalulons

δ

(i)

parl'équation 1.5qui ne dépendque des

δ

_t₋₁.

Terminaison :pourhaque état

i

du modèle,nousherhons

δ

(i)

maximal.Nous obte-nonsainsi

P(O|M)

(voirEq. 1.6).

L'algorithmene dépendantainsi quedunombred'étatsdu modèleet, pourun temps

t

,que dessores umulés du temps

t−1

,la omplexité devient linéaire parrapport à la longueur de la séquene d'observations. Un deuxième point important de et algorithme est qu'il est non seulement possible d'estimer

max

P(O|M, Q)

,maissurtout deonnaître lameilleure séquene

Q

. En eet, il sut de onserverpourhaque meilleur hemin les états par lesquels e hemin estpassé.

1.6.1.4 Algorithme de Viterbi dans le as d'une phrase

Dans la setion préédente, nousavons expliqué l'algorithme de Viterbi dans leas général d'unmodèledeMarkovahé

M

pouraluler

P(O|M)

.Grâeàetalgorithme,pourunmodèle donné, nouspouvons déterminerla séquene d'alignement des états du modèle sur la séquene d'observations.

Le prinipe pour eetuer la reonnaissane d'une phrase est le même. Nous allons en fait onstruire un méta-modèle de Markov ahé dans lequel haque méta-état représente un mot dulexique. Le méta-modèle estergodique, toutes les transitions entre méta-états sont possibles et dépendent du modèle de langage. Ainsi, la meilleure séquene de méta-états alulée par l'algorithmede Viterbiorrespond à unephrase,la solutiondu systèmede reonnaissane.

Trouver la séquene de mot

W

^∗ maximisant l'équation 1.3 revient herher la séquene de motsqui maximiselaquantité suivante:

max

W∈Ξ

π

Y

wi∈W

P(O|w

)P(w

|w

i−1

. . . w

)

(1.7)

Ξ

représente l'ensemble des séquenes de mots appartenant au lexique qu'il est possible de onstruire,

π

_w0 est la probabilité initiale du premier mot de la séquene,

P(O|w

)

, la pro-babilité aoustique du mot

w

_i de la séquene

W

, l'équivalent de la probabilité d'émission, et

P(w

|w

_i₋₁

. . . w

₀

)

représentelaprobabilitélinguistiquen-gramme,jouantlerledesprobabilités detransitiondans lemodèlede Markov.

De par son proessus de onstrution, haque mot du graphe est l'extrémité d'un unique hemin partant du début de la phrase. Cette uniité provient de la propriété d'optimalité de Bellman. Aussi, pour haque mot du graphe, le mot le préédant sur e hemin est déterminé defaçonunique.Nousnousréféreronsàe motsousletermedeprédéesseurau sensde Viterbi danslasuitedee doument.

Dans le document Mesure de confiance trame-synchrones et locales en reconnaissance automatique de la parole (Page 34-37)