• Aucun résultat trouvé

Soit

w

lemotdontnousvoulonsévaluerlaonaneetquenousappelleronsmotanalysé.Ce motommene à l'instant

τ

etnit à l'instant

t

.Nous lereprésentons sous laforme ondensée

[w, τ, t]

.

Lesmesuresde onanetrame-synhronesne sont fondéesquesurdesindiesdisponiblesà

l'instantdetraitementdumoteurdereonnaissane.Le motanalysé

[w, τ, t]

limitelealulaux

donnéesprésentesdansle systèmededéodageantérieuresau temps

t

.

Les mesures trame-synhrones que nousavonsdénies sont fondées sur un rapport de

vrai-semblane entre l'hypothèse nulle et l'hypothèse alternative. L'hypothèse nulle représente la

suppositionqu'une séquened'observations

O

aitétéengendréeparunmot

w

onsidéréomme

orret.L'hypothèsealternative représentequant àelle lasupposition quelaséquene

O

aitété

engendréeparn'importequelmotdulexique.Orgénéralementtoutlelexiquen'estpasonsidéré

dansl'hypothèse alternative maisuniquement un sous-ensemblede elui-i.

Les mesures de onane que nous proposons sont dénies à partir de l'équation générique

suivante:

C([w, τ, t]) = P (O|w)P (w) P

w ∈E

P (O|w )P (w )

(3.1)

P (O|w)

est la probabilité que la séquene

O

ait été engendrée par le mot

w

et

P (w)

est

laprobabilité linguistique du mot

w

.Nous avons déni l'ensemble

E

ommeun sous-ensemble de tous les mots présents dans le graphe vériant des ontraintes que nous présentons dans le

paragraphesuivant.Lesmots appartenant à l'ensemble

E

sont dits onurrentsdu mot

w

.

L'équation3.1représenteainsilerapportentrelavraisemblanedumotanalysé

[w, τ, t]

etla

vraisemblanedetouslesmotsquipeuventêtresesonurrentslorsdelaphasedereonnaissane.

Cette mesure est fondée sur un prinipe similaire au rapport de vraisemblane ave modèles

ompétitifs (f. setion 2.3.5.5). Comme nous l'avons présenté paragraphe 2.3.5, e rapport a

été essentiellement utilisé pour la reonnaissane de mots isolés, en parole ontinue ave un

voabulaire réduit ou à partir de la liste des

n

-meilleures phrases. Nous le dénissons dans un ontextegrandvoabulaire.

3.2.1 Dénition des mots onurrents de l'ensemble

E

L'idée est de séletionner parmi tous les mots possibles du graphe uniquement eux qui

peuventsesubstituerà

[w, τ, t]

parrapportauproessusdedéisiondumoteurdereonnaissane.

Ceritèrereposesurlapositiondansletempsdumotonurrent ainsiquesursalongueur.Une

première possibilité serait de onsidérerles mots diretement éhangeables ave le mot

[w, τ, t]

analysé, i.e. les mots du graphe ayant exatement les mêmes temps de début et de n que

w

.

Toutefois, ette restrition auxmots ayantexatementlamême position temporelle etlamême

longueur est trop forte. En eet, supposons que le mot

w

ne soit pas orret, il est possible

que le vrai mot orret soit dans le graphe de mots à une position prohe mais diérente, ne

serait-equed'unetrame. Lavaleur deonanede

w

aluléeparunrapportdevraisemblane strit pourrait être prohe de 1, alors qu'en onsidérant une tramede plus ou de moins, la

valeurpourraitêtre prohe de 0.

Pourteniromptedeesvariations,nousavonsintroduitunfateurderelâhement

ε

,assoié

à lalongueur du mot

[w, τ, t]

,qui permetd'intégrerdesmots onurrents dont la position

tem-porelleoulalongueurnesontpasexatementidentiquesàellesde

w

.Leparamètre

ε

représente

en faitun pourentagede lalongueur dumot

w

.

Soit

d

lalongueur en tramesdumot

[w, τ, t]

et

ε

lefateur de relâhement :

d = t − τ + 1

(3.2)

Un mot

[w , τ , t ]

du graphe de mots du système de reonnaissane, de longueur

d

, est un

motonurrentde

w

s'ilrespeteles ontraintes suivantes :

τ − ε d ≤ τ ≤ τ + ε d

(3.3)

t − ε d ≤ t ≤ t

(3.4)

(1 − ε) d ≤ d ≤ (1 + ε) d

(3.5)

L'asymétriede laontraintesurl'instant dendesmotsonurrentsprovientdenotrehoix

d'élaborerune mesurede onane trame-synhrone.

L'ensemble

E

introduit dans l'équation 3.1 est ainsi déni omme l'ensemble des mots du

graphequivalidentlesontraintesdonnéesparleséquations3.3à3.5.Cesontraintesdépendant

du mot

[w, τ, t]

analysé,l'ensemble

E

estégalement dénirelativement à

[τ, t]

Par ailleurs, notons quelemot

[w, τ, t]

lui-même respeteles ontraintesdes troiséquations

préédentes. Parmi les mesures de onane fondées sur un rapport de vraisemblane, elles

présentées paragraphe 2.3.5.5 utilisent une méthode de alul de rapport similaire. Cependant,

le rapport exluait le mot

w

analysé, ou la phrase analysée, de l'hypothèse alternative. Nous avonshoisid'inlure dansl'ensemble

E

lemotanalysélui-mêmeommeétantundesespropres

onurrents. Ainsilerapportobtenuest normaliséetpeutêtre assimilé àune probabilité.

3.2.2 Gestion des ourrenes multiples

Nousavonsrelâhélesontraintestemporellesdeséletiondesmotsonurrentsde

w

qui

ap-partiennentàl'ensemble

E

and'obtenirunplusgrandnombredemotsreprésentantl'hypothèse alternative.

Toutefois e relâhement des ontraintes entraîne l'apparition d'ourrenes multiples des

mots onurrents

w

.Eneet,lemoteurde reonnaissanepeutavoirdéodélemêmemotave desinstantsde débutetn légèrementdéalés.

Par ailleurs, si les ontraintes ont été relâhéespourles mots de l'ensemble

E

,elles doivent

l'être également pour le mot analysé

w

an que la ohérene du rapport de vraisemblane de l'équation 3.1 soit onservée. Des ourrenes multiples peuvent don apparaître pour

w

. Que

fairede esourrenes multiplesdumot analyséetde sesonurrents?

Nousavonshoisiles deuxméthodessuivantesande gérerlesourrenesmultiplesdansle

aluldurapportde vraisemblane :

faire lasommedesvraisemblanesdesourrenes d'unmêmemot,

onsidérerun seulreprésentant parmilesourrenesd'un mêmemot.

Conernant lehoix d'unseul représentantde touteslesourrenesdumotanalysé

[w, τ, t]

,

lasolution que nousproposons onsiste, à hoisir parmitoutes les ourrenes de

w

respetant

les onditions 3.3 à 3.5, l'ourrene dont le sore aoustiqueest maximal. Ce représentant est

noté

[ w, b τ , ˆ ˆ t]

.Lesreprésentants

[ w b , τ ˆ , t ˆ ]

desmots

[w , τ , t ]

de

E

sonthoisisde lamêmefaçon.

Nousappelons alors

E b

l'ensemble desreprésentants

[ w b , ˆ τ , ˆ t ]

.Une stratégieidentiqueest ainsi

adoptée,quee soit pourlemot analyséou pourles mots onurrentsde l'ensemble

E b

.

Dans lasuite de e doument, nousappellerons méthode par sommationla méthode

onsis-tant à sommer les vraisemblanes des ourrenes multiples d'un même mot, et, méthode par

maximisation elle fondée sur la séletion d'un représentant de sore aoustique maximal. Par

extension, nous appellerons mots onurrents de l'ensemble

E

les ourrenes des mots

w

du

grapherespetant leséquations 3.3à 3.5.

Aprèsesonsidérationsintrodutivesetlesquelquesnotationsmentionnées,nousdérivons

dans les paragraphes suivants les mesures trame-synhrones que nous avons dénies. Elles

dif-fèrent lesunesdesautres parleniveaudu modèlede langage utilisé:unigramme, bigrammeou

trigramme.

3.2.3 Mesure fondée sur la probabilité unigramme

Dans ette première mesure, l'aspet loal de la mesure est très marqué. Il n'est en eet

tenu ompte que de la probabilité aoustique des mots et de leur probabilité unigramme. Les

deux méthodes de gestion des ourrenes onduisent à deux équations pourette mesure dite

unigramme.

Méthode par sommation

Siuneméthodedegestionparsommationdesourrenesmultiplesaétéhoisie,ettemesure

deonane estdénie parl'équationsuivante:

C([w, τ, t]) =

P

[ w,˜ e τ , ˜ t]∈E, w=w e

p(o ˜ t τ ˜ | w)p( e w) e P

[w ,t ]∈E

p(o t τ ′ |w )p(w )

(3.6)

lemot

[ w, e τ , ˜ ˜ t]

estune ourrenedu motanalysé

w

,ontenuedans

E

;

lemot

[w , τ , t ]

estune ourrene d'unmot

w

ontenue dans

E

;

p(o ˜ t ˜ τ | w) e

représente la probabilité aoustiquedu mot

[ w, e τ , ˜ ˜ t]

,respetivement

p(o t τ ′ |w )

re-présentelaprobabilitéaoustique dumot

[w , τ , t ]

;

p( w) e

représente la probabilité linguistique unigramme du mot

w e

, respetivement

p(w )

représentelaprobabilitélinguistique unigrammedumot

w

.

Comme nous l'avons préisé dans le paragraphe préédent, le mot

w

lui-même et toutes ses

ourrenesappartiennent àl'ensemble

E

.

Méthode par maximisation

Silaméthodedegestiondesourrenesmultiplesestlaséletiond'unreprésentantdesore

aoustiquemaximal,lamesurede onane estalorsdénie ainsi:

C([w, τ, t]) = p(o ˆ t τ ˆ | w)p( b w) b P

[w ,t ]∈ E b

p(o t τ ′ |w )p(w )

(3.7)

Notons bienquelesélémentsdel'ensemble

E b

dansl'équationsontdesreprésentantsdesore aoustiquemaximaldesmots onurrentsde

[w, τ, t]

.

[ w, b τ , ˆ ˆ t]

est lereprésentant desore aous-tiquemaximal dumotanalysé

[w, τ, t]

etsetrouve àlafois aunumérateur etaudénominateur.

3.2.4 Introdution de fateurs d'éhelle

Les mesures de onane que nous venons de dérire ombinent probabilité aoustique et

probabilitélinguistique. Or,les valeursde esprobabilitésontdesordres degrandeur diérents.

An d'équilibrer les ontributions de es deux probabilités, nous introduisons deux fateurs

d'éhelle:

α

pourlaprobabilitéaoustiqueet

β

pourlaprobabilité linguistique.

Les équations préédentes3.7et3.6s'ériventdorénavant ainsi:

Méthode par sommation

C([w, τ, t]) =

P

[ w,˜ e τ , ˜ t]∈E, w=w e

p(o ˜ t ˜ τ | w) e α p( w) e β P

[w ,t ]∈E

p(o t τ ′ |w ) α p(w ) β

(3.8)

Méthode par maximisation

C([w, τ, t]) = p(o t τ ˆ ˆ | w) b α p( w) b β P

[w ,t ]∈ E b

p(o t τ ′ |w ) α p(w ) β

(3.9)

3.2.5 Mesure fondée sur la probabilité bigramme

Les mesuresde onanepréédentes,fondéesuniquement surlaprobabilitéunigrammedes

mots, n'ont qu'une vision très loale. Or, le ontexte d'apparition d'un mot est important ar

lesmots sontdépendantslesunsdesautresdansune phrase.C'est pourquoinousavonsmodié

lespréédentesmesuresan deteniromptedesmots présentsdanslevoisinagedumotanalysé

[w, τ, t]

.Ande onserverlearatèretrame-synhronedenosmesures,nousneonsidéronsque

levoisinage passé de

[w, τ, t]

.Comme pour lamesure diteunigramme, nous avons onsidéré les

deuxtypesde priseenomptedesourrenes multiples.

Méthode par sommation

Danseas,notremesureditebigramme,pourhaunedesourrenes

w e

dumotanalysé

w

etpourhaunedesourrenes desmots onurrents

w

de

E

,prendenomptelesprobabilités bigrammesaveunensembledemotspouvantlesprééder.Parexemple,pourunedesourrenes

[ w, e ˜ τ , ˜ t]

dumot

w

analysé,nousonsidéronsles probabilitésbigrammes entre

[ w, e ˜ τ , ˜ t]

ettous les

mots

[ w e p , τ ˜ p , ˜ t p ]

du graphe préédant diretement

[ w, e τ , ˜ ˜ t]

. Nous faisons de même pour toutes

lesourrenes

[w , τ , t ]

desmots del'ensemble

E

ave pourhaune,les mots

w p

lapréédant

diretement.

Nousobtenons lamesurede onaneainsi dénie:

C([w, τ, t]) =

Nous proédons de la même manière mais en ne prenant en ompte que les probabilités

bigrammesentrelereprésentant

w b

ettouslesmots

w b p

pouvant leprééderdiretement. Respe-tivement, sont prises en ompte les probabilités bigrammes entre haun des mots

w

de

E b

et

tousles mots

w p

pouvantle prééderdiretement.L'équationsuivantedénitette mesure:

C([w, τ, t]) =

Nousavonsonsidéré deuxfaçonsde dénir l'ensembledesmots préédents:

soit l'ensemble de tous les prédéesseurs exats dans le graphe de mots, 'est-à-dire par

exemple pour une ourrene

[ w, e τ , ˜ ˜ t]

l'ensemble des mots

[ w e p , τ ˜ p , ˜ t p ]

du graphe tel que

t ˜ p = ˜ τ − 1

;

soit l'unique motprédéesseur ausens de Viterbi.

3.2.6 Mesure fondée sur la probabilité trigramme

Pourettemesure, nousavonsétendudavantagelaportéeduvoisinage passéprisenompte

dans la mesure en intégrant un modèle de langage trigramme. La mesure onserve son

ara-tèretrame-synhronearlemodèlede langage trigrammen'estonsidéré qu'avedes motsdéjà

déodés par le moteur de reonnaissane et antérieurs au mot analysé. Le modèle de langage

trigramme est généralement porteur d'une information plus pertinente que le modèle de

lan-gage bigramme. De même que pour les mesures de onane unigrammes et bigrammes, nous

allonsexprimer ettenouvelle mesuredansleadre d'unegestiondesourrenes multiplespar

sommation, puis,nousladénironspourlagestionparmaximisation.

Méthode par sommation

L'équation dénissant ette mesureestlasuivante:

C([w, τ, t]) =

Nous dénissons lamesure de onane suivant le mêmeprinipe ave ette fois-i les mots

[ w b p , τ ˆ p , t ˆ p ]

préédant l'ourrene

[ w, b τ , ˆ ˆ t]

de sore aoustiquemaximal du mot analysé

w

.Pour

haun de es mots

[ w b p , τ ˆ p , ˆ t p ]

, nous onsidérons un ensemble de mots

[ w b pp , ˆ τ pp , ˆ t pp ]

du graphe

pouvant les prééder. Nous proédons de même pour les mots

[w , τ , t ]

de l'ensemble

E b

en

alulant les probabilitéstrigrammesave un ensemblede mots

[w p , τ p , t p ]

et

[w pp , τ pp , t pp ]

.

La mesures'exprime alorssous laformesuivante:

C([w, τ, t]) =

De même que pour la mesure dite bigramme, nous avons plusieurshoix possibles pourles

motspréédentsetlesmotspréédantesmotspréédents.Nousavonsdénilesmêmesensembles

quepourlamesurebigramme:

soit l'ensemblede tous les prédéesseurs exatsdans legraphe de mots de tousles

prédé-esseursexats. Par exemplepouruneourrene

[ w, e τ , ˜ ˜ t]

l'ensembledesprédéesseursest onstituédesmots

[ w e p , τ ˜ p , ˜ t p ]

dugraphetelsque

˜ t p = ˜ τ − 1

etl'ensembledesprédéesseurs d'unmot

[ w e p , τ ˜ p , ˜ t p ]

estonstitué desmots

[ w e pp , τ ˜ pp , ˜ t pp ]

tels que

t ˜ pp = ˜ τ p − 1

;

soit l'unique prédéesseurduprédéesseurd'unmot,le toutausens de Viterbi.

3.2.7 Implantation

3.2.7.1 Constrution de l'ensemble

E b

Nous dérivonsdans ette setionle prinipe de onstrution de l'ensemble

E b

des

représen-tants de sore aoustique maximal des ourrenes des mots onurrents d'un mot analysé

w

,

dansleasd'unegestiondesourrenesmultiplesparmaximisation.Dansleasdelaméthode

parsommation,l'ensemble

E

estsimplementdéniparl'ensembledesmotsdugrapherespetant

lesontraintestemporelles deséquations 3.3, 3.4et3.5.

Pourunmot

[w, τ, t]

analysé,l'ensemble

E b

desreprésentantsdesmotsonurrentsestonstruit parl'algorithme 3.1dont leprinipe estlesuivant:

paroursdu graphede mots,

séletion des mots selon les ontraintes temporelles données par les équations 3.3, 3.4 et

3.5,

reherhe parmiles mots séletionnésdesreprésentantsayant lessoresaoustiques

maxi-maux.

L'espae de reherhe dépend de la longueur du mot à analyser ainsique du paramètre de

relâhement

ε

.L'ajout etlareherhe dumaximumsefont enmêmetemps.

Chaun desmots onurrents

w

apparaît dans

E b

une seule fois, etette unique ourrene

représentele motonurrent

w

de probabilitéaoustique maximale.L'ensemble

E b

déni, nous

pouvonsaluler lavaleurde onane dumot

[w, τ, t]

.

3.2.7.2 Calul des mesures fondées sur les probabilités unigramme, bigramme et

trigramme

Pouraluler lesmesures de onanefondéessurles probabilitésunigramme, bigrammeou

trigrammedesmots,donnéesparleséquations 3.9à3.13, nousdevonsalulerlenumérateuret

ledénominateurdurapportdevraisemblane.Or,ommelemot

w

dontnousvoulonsévaluerla

onane fait également partie de l'ensemble

E

, le alul du numérateur sera eetué pendant

unedesitérations dualuldu dénominateur.

Andealulerledénominateur,pourhaquemotdel'ensemble

E

,nousumulonsleproduit

delaprobabilitéaoustiqueparlaprobabilitésoit unigramme,bigrammeoutrigramme selonla

mesurealulée.

Quandle mot

w

estrenontrédansl'algorithme de alul,lavaleur duproduit de la proba-bilité aoustiquepar laprobabilité linguistique est onservée pourle numérateur deséquations

avantd'êtreumuléepourledénominateur.Lavaleurdeonanepourlemot

[w, τ, t]

estdonnée

parle rapportentrelenumérateuretle dénominateur.

Par ailleurs, le hoix de l'ensemble desmots prédéesseurs a une inidene sur l'algorithme

de alul de la mesure de onane. En eet, si nousne prenons en ompte que les préédents

au sens de Viterbi, un seul mot est onerné et il n'est don pas néessaire de sommer les

probabilités bigrammes ou trigrammes. Par ontre, si nous hoisissons de onsidérer tous les

motstemporellement préédents,nousdevonsparourirlegraphede mots.Parexemple pourla

mesurebigramme,soitl'ourrene

[w , τ , t ]

,nousalulonslesprobabilitésbigrammesentre

w

ethaundesmots

[w p , τ p , t p ]

du graphedont l'instant den vaut

τ − 1

.

Commelemontrel'algorithme3.2,pourlamesuredeonane fondéesurlaprobabilité

tri-gramme,uneprofondeurd'itérationsupplémentaireestajoutéeparrapportàlamesureutilisant

laprobabilitébigramme.Eneet,pourhaqueourrene

[w , τ , t ]

demotsdel'ensemble

E

,ou

E b

,nousdevonsparourir touslesmots

[w p , τ p , t p ]

préédant

w

dontl'instant denvaut

τ − 1

.

Algorithme 3.1 : Algorithme dérivant la onstrution de l'ensemble

E b

assoié au mot

hypothèse

[w, τ, t]

dont nousvoulons estimerlaonane.

longueur

lg = t − τ + 1

déalage

dec = lg ∗ ε

pour (t' = (

t − dec

); t'

< (t + 1)

; t'++)

faire

/* parours de tous les mots se terminant à l'instant t' */

pour (i = 0; i

<

nombre de motsse terminant à l'instant

t

; i++)

faire

soit

[w , τ , t ]

le

i

e mot

/* test sur les ontraintes temporelles */

si (

τ ≥ (τ − dec)

)et (

τ ≤ (τ + dec)

)

alors

/* test sur la longueur du mot */

si(lg'

(lg - de))et (lg'

(lg + de))

alors

/* test si le mot est déjà dans l'ensemble

E

*/

si la graphie de

w

estdéjà dans

E

alors

sile sore aoustiquede

w

estmeilleur queelui déjà dans

E

alors

on onserve

w

dans

E

àlaplae del'anien représentant sinon

on gardel'anien représentant

n

sinon

On ajoute

w

àl'ensemble

E

n

n

n

n

n

Deplus, nous devons également parourir pour haque

w p

, tous les mots

w pp

dont l'instant de

nvaut

τ p − 1

puisaluler laprobabilitétrigramme

p(w |w p w pp )

.

Algorithme3.2:Algorithmedealuldunumérateuretdudénominateurdelamesurede

onane fondéesurlaprobabilitétrigrammeave gestionparmaximisation etpréédents

temporels(Eq.3.13)

numérateur=0

dénominateur=0

/* parours des toutes les ourrenes des mots de l'ensemble

E

*/

pour haque

[w , τ , t ] ∈ E

faire

SommeTrigramme=0

/* parours de tous les mots du graphe préédant

w

*/

t p

=

τ − 1

pour (i= 0; i

<

nombre de motsnissant à l'instant

t p

; i++)

faire

[w p , τ p , τ − 1]

le

i

e mot

/* parours de tous les mots du graphe préédant

w p

*/

t pp = τ p − 1

pour (j= 0; j

<

nombre de motsnissant à l'instant

t pp

; j++)

faire

[w pp , τ pp , τ p − 1]

le

j

e mot

/* alul du sore linguistique onnaissant

w p

et

w pp

et umul de

ette valeur */

SommeTrigramme+=

(P (w |w p w pp )P(w p |w pp )P (w pp )) β

n

n

/* umul dans le dénominateur de la somme des trigrammes de

w

*/

dénominateur+=

P (x t τ ′ |w ) α

.SommeTrigramme si

w = w

alors

numérateur=

P (x ˆ t ˆ τ | w) b α

.SommeTrigramme

n

n