Soit
w
lemotdontnousvoulonsévaluerlaonaneetquenousappelleronsmotanalysé.Ce motommene à l'instantτ
etnit à l'instantt
.Nous lereprésentons sous laforme ondensée[w, τ, t]
.Lesmesuresde onanetrame-synhronesne sont fondéesquesurdesindiesdisponiblesà
l'instantdetraitementdumoteurdereonnaissane.Le motanalysé
[w, τ, t]
limitelealulauxdonnéesprésentesdansle systèmededéodageantérieuresau temps
t
.Les mesures trame-synhrones que nousavonsdénies sont fondées sur un rapport de
vrai-semblane entre l'hypothèse nulle et l'hypothèse alternative. L'hypothèse nulle représente la
suppositionqu'une séquened'observations
O
aitétéengendréeparunmotw
onsidéréommeorret.L'hypothèsealternative représentequant àelle lasupposition quelaséquene
O
aitétéengendréeparn'importequelmotdulexique.Orgénéralementtoutlelexiquen'estpasonsidéré
dansl'hypothèse alternative maisuniquement un sous-ensemblede elui-i.
Les mesures de onane que nous proposons sont dénies à partir de l'équation générique
suivante:
C([w, τ, t]) = P (O|w)P (w) P
w ′ ∈E
P (O|w ′ )P (w ′ )
(3.1)P (O|w)
est la probabilité que la séqueneO
ait été engendrée par le motw
etP (w)
estlaprobabilité linguistique du mot
w
.Nous avons déni l'ensembleE
ommeun sous-ensemble de tous les mots présents dans le graphe vériant des ontraintes que nous présentons dans leparagraphesuivant.Lesmots appartenant à l'ensemble
E
sont dits onurrentsdu motw
.L'équation3.1représenteainsilerapportentrelavraisemblanedumotanalysé
[w, τ, t]
etlavraisemblanedetouslesmotsquipeuventêtresesonurrentslorsdelaphasedereonnaissane.
Cette mesure est fondée sur un prinipe similaire au rapport de vraisemblane ave modèles
ompétitifs (f. setion 2.3.5.5). Comme nous l'avons présenté paragraphe 2.3.5, e rapport a
été essentiellement utilisé pour la reonnaissane de mots isolés, en parole ontinue ave un
voabulaire réduit ou à partir de la liste des
n
-meilleures phrases. Nous le dénissons dans un ontextegrandvoabulaire.3.2.1 Dénition des mots onurrents de l'ensemble
E
L'idée est de séletionner parmi tous les mots possibles du graphe uniquement eux qui
peuventsesubstituerà
[w, τ, t]
parrapportauproessusdedéisiondumoteurdereonnaissane.Ceritèrereposesurlapositiondansletempsdumotonurrent ainsiquesursalongueur.Une
première possibilité serait de onsidérerles mots diretement éhangeables ave le mot
[w, τ, t]
analysé, i.e. les mots du graphe ayant exatement les mêmes temps de début et de n que
w
.Toutefois, ette restrition auxmots ayantexatementlamême position temporelle etlamême
longueur est trop forte. En eet, supposons que le mot
w
ne soit pas orret, il est possibleque le vrai mot orret soit dans le graphe de mots à une position prohe mais diérente, ne
serait-equed'unetrame. Lavaleur deonanede
w
aluléeparunrapportdevraisemblane strit pourrait être prohe de 1, alors qu'en onsidérant une tramede plus ou de moins, lavaleurpourraitêtre prohe de 0.
Pourteniromptedeesvariations,nousavonsintroduitunfateurderelâhement
ε
,assoiéà lalongueur du mot
[w, τ, t]
,qui permetd'intégrerdesmots onurrents dont la positiontem-porelleoulalongueurnesontpasexatementidentiquesàellesde
w
.Leparamètreε
représenteen faitun pourentagede lalongueur dumot
w
.Soit
d
lalongueur en tramesdumot[w, τ, t]
etε
lefateur de relâhement :d = t − τ + 1
(3.2)Un mot
[w ′ , τ ′ , t ′ ]
du graphe de mots du système de reonnaissane, de longueurd ′
, est unmotonurrentde
w
s'ilrespeteles ontraintes suivantes :τ − ε d ≤ τ ′ ≤ τ + ε d
(3.3)t − ε d ≤ t ′ ≤ t
(3.4)(1 − ε) d ≤ d ′ ≤ (1 + ε) d
(3.5)L'asymétriede laontraintesurl'instant dendesmotsonurrentsprovientdenotrehoix
d'élaborerune mesurede onane trame-synhrone.
L'ensemble
E
introduit dans l'équation 3.1 est ainsi déni omme l'ensemble des mots dugraphequivalidentlesontraintesdonnéesparleséquations3.3à3.5.Cesontraintesdépendant
du mot
[w, τ, t]
analysé,l'ensembleE
estégalement dénirelativement à[τ, t]
Par ailleurs, notons quelemot
[w, τ, t]
lui-même respeteles ontraintesdes troiséquationspréédentes. Parmi les mesures de onane fondées sur un rapport de vraisemblane, elles
présentées paragraphe 2.3.5.5 utilisent une méthode de alul de rapport similaire. Cependant,
le rapport exluait le mot
w
analysé, ou la phrase analysée, de l'hypothèse alternative. Nous avonshoisid'inlure dansl'ensembleE
lemotanalysélui-mêmeommeétantundesespropresonurrents. Ainsilerapportobtenuest normaliséetpeutêtre assimilé àune probabilité.
3.2.2 Gestion des ourrenes multiples
Nousavonsrelâhélesontraintestemporellesdeséletiondesmotsonurrentsde
w
quiap-partiennentàl'ensemble
E
and'obtenirunplusgrandnombredemotsreprésentantl'hypothèse alternative.Toutefois e relâhement des ontraintes entraîne l'apparition d'ourrenes multiples des
mots onurrents
w ′
.Eneet,lemoteurde reonnaissanepeutavoirdéodélemêmemotave desinstantsde débutetn légèrementdéalés.Par ailleurs, si les ontraintes ont été relâhéespourles mots de l'ensemble
E
,elles doiventl'être également pour le mot analysé
w
an que la ohérene du rapport de vraisemblane de l'équation 3.1 soit onservée. Des ourrenes multiples peuvent don apparaître pourw
. Quefairede esourrenes multiplesdumot analyséetde sesonurrents?
Nousavonshoisiles deuxméthodessuivantesande gérerlesourrenesmultiplesdansle
aluldurapportde vraisemblane :
faire lasommedesvraisemblanesdesourrenes d'unmêmemot,
onsidérerun seulreprésentant parmilesourrenesd'un mêmemot.
Conernant lehoix d'unseul représentantde touteslesourrenesdumotanalysé
[w, τ, t]
,lasolution que nousproposons onsiste, à hoisir parmitoutes les ourrenes de
w
respetantles onditions 3.3 à 3.5, l'ourrene dont le sore aoustiqueest maximal. Ce représentant est
noté
[ w, b τ , ˆ ˆ t]
.Lesreprésentants[ w b ′ , τ ˆ ′ , t ˆ ′ ]
desmots[w ′ , τ ′ , t ′ ]
deE
sonthoisisde lamêmefaçon.Nousappelons alors
E b
l'ensemble desreprésentants[ w b ′ , ˆ τ ′ , ˆ t ′ ]
.Une stratégieidentiqueest ainsiadoptée,quee soit pourlemot analyséou pourles mots onurrentsde l'ensemble
E b
.Dans lasuite de e doument, nousappellerons méthode par sommationla méthode
onsis-tant à sommer les vraisemblanes des ourrenes multiples d'un même mot, et, méthode par
maximisation elle fondée sur la séletion d'un représentant de sore aoustique maximal. Par
extension, nous appellerons mots onurrents de l'ensemble
E
les ourrenes des motsw ′
dugrapherespetant leséquations 3.3à 3.5.
Aprèsesonsidérationsintrodutivesetlesquelquesnotationsmentionnées,nousdérivons
dans les paragraphes suivants les mesures trame-synhrones que nous avons dénies. Elles
dif-fèrent lesunesdesautres parleniveaudu modèlede langage utilisé:unigramme, bigrammeou
trigramme.
3.2.3 Mesure fondée sur la probabilité unigramme
Dans ette première mesure, l'aspet loal de la mesure est très marqué. Il n'est en eet
tenu ompte que de la probabilité aoustique des mots et de leur probabilité unigramme. Les
deux méthodes de gestion des ourrenes onduisent à deux équations pourette mesure dite
unigramme.
Méthode par sommation
Siuneméthodedegestionparsommationdesourrenesmultiplesaétéhoisie,ettemesure
deonane estdénie parl'équationsuivante:
C([w, τ, t]) =
P
[ w,˜ e τ , ˜ t]∈E, w=w e
p(o ˜ t τ ˜ | w)p( e w) e P
[w ′ ,τ ′ ,t ′ ]∈E
p(o t τ ′ ′ |w ′ )p(w ′ )
(3.6)lemot
[ w, e τ , ˜ ˜ t]
estune ourrenedu motanalyséw
,ontenuedansE
;lemot
[w ′ , τ ′ , t ′ ]
estune ourrene d'unmotw ′
ontenue dansE
;
p(o ˜ t ˜ τ | w) e
représente la probabilité aoustiquedu mot[ w, e τ , ˜ ˜ t]
,respetivementp(o t τ ′ ′ |w ′ )
re-présentelaprobabilitéaoustique dumot
[w ′ , τ ′ , t ′ ]
;
p( w) e
représente la probabilité linguistique unigramme du motw e
, respetivementp(w ′ )
représentelaprobabilitélinguistique unigrammedumot
w ′
.Comme nous l'avons préisé dans le paragraphe préédent, le mot
w
lui-même et toutes sesourrenesappartiennent àl'ensemble
E
.Méthode par maximisation
Silaméthodedegestiondesourrenesmultiplesestlaséletiond'unreprésentantdesore
aoustiquemaximal,lamesurede onane estalorsdénie ainsi:
C([w, τ, t]) = p(o ˆ t τ ˆ | w)p( b w) b P
[w ′ ,τ ′ ,t ′ ]∈ E b
p(o t τ ′ ′ |w ′ )p(w ′ )
(3.7)Notons bienquelesélémentsdel'ensemble
E b
dansl'équationsontdesreprésentantsdesore aoustiquemaximaldesmots onurrentsde[w, τ, t]
.[ w, b τ , ˆ ˆ t]
est lereprésentant desore aous-tiquemaximal dumotanalysé[w, τ, t]
etsetrouve àlafois aunumérateur etaudénominateur.3.2.4 Introdution de fateurs d'éhelle
Les mesures de onane que nous venons de dérire ombinent probabilité aoustique et
probabilitélinguistique. Or,les valeursde esprobabilitésontdesordres degrandeur diérents.
An d'équilibrer les ontributions de es deux probabilités, nous introduisons deux fateurs
d'éhelle:
α
pourlaprobabilitéaoustiqueetβ
pourlaprobabilité linguistique.Les équations préédentes3.7et3.6s'ériventdorénavant ainsi:
Méthode par sommation
C([w, τ, t]) =
P
[ w,˜ e τ , ˜ t]∈E, w=w e
p(o ˜ t ˜ τ | w) e α p( w) e β P
[w ′ ,τ ′ ,t ′ ]∈E
p(o t τ ′ ′ |w ′ ) α p(w ′ ) β
(3.8)Méthode par maximisation
C([w, τ, t]) = p(o t τ ˆ ˆ | w) b α p( w) b β P
[w ′ ,τ ′ ,t ′ ]∈ E b
p(o t τ ′ ′ |w ′ ) α p(w ′ ) β
(3.9)3.2.5 Mesure fondée sur la probabilité bigramme
Les mesuresde onanepréédentes,fondéesuniquement surlaprobabilitéunigrammedes
mots, n'ont qu'une vision très loale. Or, le ontexte d'apparition d'un mot est important ar
lesmots sontdépendantslesunsdesautresdansune phrase.C'est pourquoinousavonsmodié
lespréédentesmesuresan deteniromptedesmots présentsdanslevoisinagedumotanalysé
[w, τ, t]
.Ande onserverlearatèretrame-synhronedenosmesures,nousneonsidéronsquelevoisinage passé de
[w, τ, t]
.Comme pour lamesure diteunigramme, nous avons onsidéré lesdeuxtypesde priseenomptedesourrenes multiples.
Méthode par sommation
Danseas,notremesureditebigramme,pourhaunedesourrenes
w e
dumotanalyséw
etpourhaunedesourrenes desmots onurrents
w ′
deE
,prendenomptelesprobabilités bigrammesaveunensembledemotspouvantlesprééder.Parexemple,pourunedesourrenes[ w, e ˜ τ , ˜ t]
dumotw
analysé,nousonsidéronsles probabilitésbigrammes entre[ w, e ˜ τ , ˜ t]
ettous lesmots
[ w e p , τ ˜ p , ˜ t p ]
du graphe préédant diretement[ w, e τ , ˜ ˜ t]
. Nous faisons de même pour touteslesourrenes
[w ′ , τ ′ , t ′ ]
desmots del'ensembleE
ave pourhaune,les motsw p ′
lapréédantdiretement.
Nousobtenons lamesurede onaneainsi dénie:
C([w, τ, t]) =
Nous proédons de la même manière mais en ne prenant en ompte que les probabilités
bigrammesentrelereprésentant
w b
ettouslesmotsw b p
pouvant leprééderdiretement. Respe-tivement, sont prises en ompte les probabilités bigrammes entre haun des motsw ′
deE b
ettousles mots
w p ′
pouvantle prééderdiretement.L'équationsuivantedénitette mesure:C([w, τ, t]) =
Nousavonsonsidéré deuxfaçonsde dénir l'ensembledesmots préédents:
soit l'ensemble de tous les prédéesseurs exats dans le graphe de mots, 'est-à-dire par
exemple pour une ourrene
[ w, e τ , ˜ ˜ t]
l'ensemble des mots[ w e p , τ ˜ p , ˜ t p ]
du graphe tel quet ˜ p = ˜ τ − 1
;soit l'unique motprédéesseur ausens de Viterbi.
3.2.6 Mesure fondée sur la probabilité trigramme
Pourettemesure, nousavonsétendudavantagelaportéeduvoisinage passéprisenompte
dans la mesure en intégrant un modèle de langage trigramme. La mesure onserve son
ara-tèretrame-synhronearlemodèlede langage trigrammen'estonsidéré qu'avedes motsdéjà
déodés par le moteur de reonnaissane et antérieurs au mot analysé. Le modèle de langage
trigramme est généralement porteur d'une information plus pertinente que le modèle de
lan-gage bigramme. De même que pour les mesures de onane unigrammes et bigrammes, nous
allonsexprimer ettenouvelle mesuredansleadre d'unegestiondesourrenes multiplespar
sommation, puis,nousladénironspourlagestionparmaximisation.
Méthode par sommation
L'équation dénissant ette mesureestlasuivante:
C([w, τ, t]) =
Nous dénissons lamesure de onane suivant le mêmeprinipe ave ette fois-i les mots
[ w b p , τ ˆ p , t ˆ p ]
préédant l'ourrene[ w, b τ , ˆ ˆ t]
de sore aoustiquemaximal du mot analyséw
.Pourhaun de es mots
[ w b p , τ ˆ p , ˆ t p ]
, nous onsidérons un ensemble de mots[ w b pp , ˆ τ pp , ˆ t pp ]
du graphepouvant les prééder. Nous proédons de même pour les mots
[w ′ , τ ′ , t ′ ]
de l'ensembleE b
enalulant les probabilitéstrigrammesave un ensemblede mots
[w ′ p , τ p ′ , t ′ p ]
et[w ′ pp , τ pp ′ , t ′ pp ]
.La mesures'exprime alorssous laformesuivante:
C([w, τ, t]) =
De même que pour la mesure dite bigramme, nous avons plusieurshoix possibles pourles
motspréédentsetlesmotspréédantesmotspréédents.Nousavonsdénilesmêmesensembles
quepourlamesurebigramme:
soit l'ensemblede tous les prédéesseurs exatsdans legraphe de mots de tousles
prédé-esseursexats. Par exemplepouruneourrene
[ w, e τ , ˜ ˜ t]
l'ensembledesprédéesseursest onstituédesmots[ w e p , τ ˜ p , ˜ t p ]
dugraphetelsque˜ t p = ˜ τ − 1
etl'ensembledesprédéesseurs d'unmot[ w e p , τ ˜ p , ˜ t p ]
estonstitué desmots[ w e pp , τ ˜ pp , ˜ t pp ]
tels quet ˜ pp = ˜ τ p − 1
;soit l'unique prédéesseurduprédéesseurd'unmot,le toutausens de Viterbi.
3.2.7 Implantation
3.2.7.1 Constrution de l'ensemble
E b
Nous dérivonsdans ette setionle prinipe de onstrution de l'ensemble
E b
desreprésen-tants de sore aoustique maximal des ourrenes des mots onurrents d'un mot analysé
w
,dansleasd'unegestiondesourrenesmultiplesparmaximisation.Dansleasdelaméthode
parsommation,l'ensemble
E
estsimplementdéniparl'ensembledesmotsdugrapherespetantlesontraintestemporelles deséquations 3.3, 3.4et3.5.
Pourunmot
[w, τ, t]
analysé,l'ensembleE b
desreprésentantsdesmotsonurrentsestonstruit parl'algorithme 3.1dont leprinipe estlesuivant:paroursdu graphede mots,
séletion des mots selon les ontraintes temporelles données par les équations 3.3, 3.4 et
3.5,
reherhe parmiles mots séletionnésdesreprésentantsayant lessoresaoustiques
maxi-maux.
L'espae de reherhe dépend de la longueur du mot à analyser ainsique du paramètre de
relâhement
ε
.L'ajout etlareherhe dumaximumsefont enmêmetemps.Chaun desmots onurrents
w ′
apparaît dansE b
une seule fois, etette unique ourrenereprésentele motonurrent
w ′
de probabilitéaoustique maximale.L'ensembleE b
déni, nouspouvonsaluler lavaleurde onane dumot
[w, τ, t]
.3.2.7.2 Calul des mesures fondées sur les probabilités unigramme, bigramme et
trigramme
Pouraluler lesmesures de onanefondéessurles probabilitésunigramme, bigrammeou
trigrammedesmots,donnéesparleséquations 3.9à3.13, nousdevonsalulerlenumérateuret
ledénominateurdurapportdevraisemblane.Or,ommelemot
w
dontnousvoulonsévaluerlaonane fait également partie de l'ensemble
E
, le alul du numérateur sera eetué pendantunedesitérations dualuldu dénominateur.
Andealulerledénominateur,pourhaquemotdel'ensemble
E
,nousumulonsleproduitdelaprobabilitéaoustiqueparlaprobabilitésoit unigramme,bigrammeoutrigramme selonla
mesurealulée.
Quandle mot
w
estrenontrédansl'algorithme de alul,lavaleur duproduit de la proba-bilité aoustiquepar laprobabilité linguistique est onservée pourle numérateur deséquationsavantd'êtreumuléepourledénominateur.Lavaleurdeonanepourlemot
[w, τ, t]
estdonnéeparle rapportentrelenumérateuretle dénominateur.
Par ailleurs, le hoix de l'ensemble desmots prédéesseurs a une inidene sur l'algorithme
de alul de la mesure de onane. En eet, si nousne prenons en ompte que les préédents
au sens de Viterbi, un seul mot est onerné et il n'est don pas néessaire de sommer les
probabilités bigrammes ou trigrammes. Par ontre, si nous hoisissons de onsidérer tous les
motstemporellement préédents,nousdevonsparourirlegraphede mots.Parexemple pourla
mesurebigramme,soitl'ourrene
[w ′ , τ ′ , t ′ ]
,nousalulonslesprobabilitésbigrammesentrew ′
ethaundesmots
[w p ′ , τ p ′ , t ′ p ]
du graphedont l'instant den vautτ ′ − 1
.Commelemontrel'algorithme3.2,pourlamesuredeonane fondéesurlaprobabilité
tri-gramme,uneprofondeurd'itérationsupplémentaireestajoutéeparrapportàlamesureutilisant
laprobabilitébigramme.Eneet,pourhaqueourrene
[w ′ , τ ′ , t ′ ]
demotsdel'ensembleE
,ouE b
,nousdevonsparourir touslesmots[w p ′ , τ p ′ , t ′ p ]
préédantw ′
dontl'instant denvautτ ′ − 1
.Algorithme 3.1 : Algorithme dérivant la onstrution de l'ensemble
E b
assoié au mothypothèse
[w, τ, t]
dont nousvoulons estimerlaonane.longueur
lg = t − τ + 1
déalage
dec = lg ∗ ε
pour (t' = (
t − dec
); t'< (t + 1)
; t'++)faire
/* parours de tous les mots se terminant à l'instant t' */
pour (i = 0; i
<
nombre de motsse terminant à l'instantt ′
; i++)faire
soit
[w ′ , τ ′ , t ′ ]
lei
e mot/* test sur les ontraintes temporelles */
si (
τ ′ ≥ (τ − dec)
)et (τ ′ ≤ (τ + dec)
)alors
/* test sur la longueur du mot */
si(lg'
≥
(lg - de))et (lg'≤
(lg + de))alors
/* test si le mot est déjà dans l'ensemble
E
*/si la graphie de
w ′
estdéjà dansE
alors
sile sore aoustiquede
w ′
estmeilleur queelui déjà dansE
alors
on onserve
w ′
dansE
àlaplae del'anien représentant sinonon gardel'anien représentant
n
sinon
On ajoute
w ′
àl'ensembleE
n
n
n
n
n
Deplus, nous devons également parourir pour haque
w p ′
, tous les motsw pp ′
dont l'instant denvaut
τ p ′ − 1
puisaluler laprobabilitétrigrammep(w ′ |w ′ p w ′ pp )
.Algorithme3.2:Algorithmedealuldunumérateuretdudénominateurdelamesurede
onane fondéesurlaprobabilitétrigrammeave gestionparmaximisation etpréédents
temporels(Eq.3.13)
numérateur=0
dénominateur=0
/* parours des toutes les ourrenes des mots de l'ensemble
E
*/pour haque
[w ′ , τ ′ , t ′ ] ∈ E
faire
SommeTrigramme=0
/* parours de tous les mots du graphe préédant
w ′
*/t ′ p
=τ ′ − 1
pour (i= 0; i
<
nombre de motsnissant à l'instantt ′ p
; i++)faire
[w p ′ , τ p ′ , τ ′ − 1]
lei
e mot/* parours de tous les mots du graphe préédant
w ′ p
*/t ′ pp = τ p ′ − 1
pour (j= 0; j
<
nombre de motsnissant à l'instantt ′ pp
; j++)faire
[w pp ′ , τ pp ′ , τ p ′ − 1]
lej
e mot/* alul du sore linguistique onnaissant
w ′ p
etw pp ′
et umul deette valeur */
SommeTrigramme+=
(P (w ′ |w ′ p w ′ pp )P(w ′ p |w ′ pp )P (w ′ pp )) β
n
n
/* umul dans le dénominateur de la somme des trigrammes de
w ′
*/dénominateur+=
P (x t τ ′ ′ |w ′ ) α
.SommeTrigramme siw ′ = w
alorsnumérateur=
P (x ˆ t ˆ τ | w) b α
.SommeTrigrammen
n