• Aucun résultat trouvé

Nousallonsanalyser laomplexité de nosmesuresde onane.Soient:

N

,lenombremoyen demots seterminant àune trame

t

dans legraphe,

T

,lenombredetrames àtraiter,

V

,lataille en tramesdu voisinage dumotanalysé dansleasdes mesuresloales,

D

,ladurée moyenneen tramed'unmot.

3.5.1 Mesures trame-synhrones

Que nousonsidérions les gestions des ourrenes multiplespar maximisation ou par som-mation, lemême paroursdu graphe de mots doit être eetué an de onstruirel'ensemble

E

ou

Eb

. La onstrution de es ensembles néessite l'analyse d'un nombrede trames en fontion du fateur de relâhement

ε

utilisé. La omplexité de ette onstrution est ainsi en

O(εDN)

, 'est-à-dire

O(N)

.

Une foises ensemblesdéterminés, lealuldes mesuresde onanepeuts'eetuer. Pourlamesureunigrammeauuneautreopérationimportanten'estnéessairepouraluler lavaleur deonaned'unmot.Laomplexité delamesureunigrammeestdon en

O(N)

pour unmot.Laomplexitéobtenuepourlealuldelavaleurdeonanedetouslesmotsdugraphe esten

O(T N

2

)

arilya enmoyenne

T N

mots danslegraphe.

Conernant la mesure bigramme, dans le pire as nous devons parourir pour haque mot

[w

, τ

, t

]

de

E

tous les mots

[w

p

, τ

p

, t

p

]

du graphe tels que

t

p

= τ − 1

an de aluler les probabilitésbigrammes. L'ensemble

E

ontient au pire

N

éléments, maisilest plusraisonnable de onsidérerque

E

ontient

kN

éléments ave

k < 1

.Le alulde lamesure pour un mot est don de omplexité

O(kN

2

)

etpour lealul surtous les mots du graphe, la omplexité est en

O(kT N

3

)

,ave

k <1

.

Pourlamesuretrigramme,une profondeur de reherhesupplémentaireest dénie augmen-tant ainsi la omplexité pour un mot en

O(kN

3

)

et don pour tous les mots du graphe en

O(kT N

4

)

ave

k <1

.

3.5.2 Mesures loales

Nos mesures de onane loales néessitent pourêtre alulées l'estimation par réurrene desprobabilités forward etbakward

Φ

et

Ψ

(f. setion 3.3). Pour un mot analysé

[w, τ, t]

,es probabilités ne dépendant que desmots

[w

p

, τ

p

, t

p

]

tels que

t

p

= τ −1

, laomplexité de alul

d'uneitérationest

O(N)

.Maisommenousdevonsaluler

Φ

et

Ψ

pourtousles mots du sous-grapheassoiéau voisinage dela mesureloale,laomplexité totaledu alulde

Φ([w, τ, t])

,et de

Ψ([w, τ, t])

,esten

O(V N

2

)

.Oresdeuxquantitésdoiventêtreévaluéesetdon laomplexité après esétapesest

O(2V N

2

)

.

Toutefois, pouraluler la probabilité a posteriorid'un mot

[w, τ, t]

nousdevonségalement estimer laprobabilité

P(o

T

1

)

qui est la somme des probabilités forward desmots dont l'instant de norrespond à landu voisinage.Cetteopérationesten

O(N)

.

Ainsi,lealuldelavaleurdeonaned'unmotesten

O(2V N

2

)

.Delamêmefaçonquepour lesmesures trame-synhrones,ilyaen moyenne

T N

mots danslegraphe etdon laomplexité de alulde touslesmots est en

O(2T V N

3

)

Si nous onsidérons la mesure loale ave un voisinage passé qui prend en ompte tous les mots depuis le début de la phrase, il est possible de diminuer la omplexité de alul de ette mesure. En eet,les probabilités forward peuvent être onservéesd'un motanalysé à un autre. Ainsi

N

opérationssusent pouraluleresprobabilitéspourunmotanalyséetnon

V N

2.La omplexitédu alulde lamesuredevient alors

O(V N

2

)

pourunmotet

O(T V N

3

)

pourtoutle graphe.

Une estimation desquantitésmisesen jeudansesomplexitésseradonnéedanslehapitre suivant, unefois nosonditions expérimentalesintroduites.

3.6 Conlusion

Dans e hapitre,nousavonsprésentélesmesures de onaneque nousavonsintroduites. Nous avons déni des mesures de onane fondées sur un rapport de vraisemblane entre l'hypothèseàtesteretlesmots onurrentsde ettehypothèse.Cesmesures ont pourprinipale aratéristique de pouvoir être alulées de manière trame-synhrone, 'est-à-dire au fur et à mesure de laprogression du déodage de la phrase par le moteur de reonnaissane.Cette a-ratéristique permet de les intégrerdansle proessusde déodagean d'inuer surle alulde lavraisemblane delasolutiontrouvée parlesystème.D'autres mesuresfondéessurun rapport de vraisemblane ont été déniesdans l'état de l'art, maiselles-i ne pouvaient gérer leadre d'unsystèmegrandvoabulaire,ontrairementà nosmesures.

La probabilité a posteriori d'unmotest présentéeommeune valeur pertinenteen tantque mesure de onane dans [Jiang05℄. Plusieurs travaux ont proposé des mesures de onane estimant laprobabilitéa posteriorid'unmot maisen néessitant lareonnaissaneomplète de toutelaphrase[Weintraub97,Wessel01℄. Nousavonsproposédesmesuresdeonanefondées suruneestimationloaledeetteprobabilitéenutilisant lemêmealgorithmede alulqueelui présentédans[Wessel01℄. Nosmesuresestiment ette probabiliténon passurlaphraseentière, maisuniquement surunvoisinagedu motdont nousvoulons alulerlavaleur deonane.Ce voisinage est déni par un nombrexe de trames qui préédent et qui suivent le mot analysé. La prise en omptedu ontexte futur du mot induit un délai an d'attendre lagénération des donnéesnéessairesaualul.Deefait, esmesuresnesontpastrame-synhronesmaisloales. Nousavonsintroduitdeuxtypesdevoisinage,symétriqueetasymétrique,andepouvoirprendre en ompteplus d'informations passées et don déjà déodées parle moteur de reonnaissane, sansaugmenterle délai induitparle voisinagefutur.

Toutefois, leourt délai néessaire à génération desinformations du voisinage futurdu mot analysé dans le alul de la mesure de onane n'est pas gênant pour les appliations que nous visons. En eet, pour des appliations omme la transription d'émissions télévisées ou la transription de ours en salle de lasse pour des enfants malentendants, un déalage est

initialement introduit an d'éviter des dérapages pour les émissions et an de permettre la resynhronisationdesenfantsentrelatransription érite etleslèvres duprofesseur.

Ilnesutpasdedénirdenouvellesmesuresdeonane,ilfautlesévalueretéventuellement lesompareràd'autres.Pourelanousavonsdéidédenousplaer dansdesonditions réelles: système de reonnaissane grand voabulaire et appliations onrètes de transription et de détetionde mots lés.Ces expérimentationssont dérites danslestroishapitres quisuivent.

Conditions expérimentales

Sommaire

4.1 Introdution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.2 Moteur de reonnaissane :Julius . . . . . . . . . . . . . . . . . . . . 82 4.2.1 LapremièrepassedeJulius . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.2.2 LadeuxièmepassedeJulius. . . . . . . . . . . . . . . . . . . . . . . . . 83 4.2.3 Optionsdeompilation . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.2.4 Legraphedemots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.3 Paramétrisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.4 Modèles aoustiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.4.1 Monophones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.4.2 Triphones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.5 Lexiqueetmodèlede langage . . . . . . . . . . . . . . . . . . . . . . . 86 4.5.1 Utilisésonjointementavelesmodèlesmonophones . . . . . . . . . . . 86 4.5.2 Utilisésonjointementavelesmodèlestriphones . . . . . . . . . . . . . 86 4.6 Corpusde développement etde test . . . . . . . . . . . . . . . . . . . 87 4.7 Complexitéde nos mesures de onane . . . . . . . . . . . . . . . . 87 4.7.1 Mesurestrame-synhrones . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.7.2 Mesuresloales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.8 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.1 Introdution

Dans e hapitre, nousprésentons les onditions dans lesquelles nous avons mené les expé-rienesdevalidationetd'évaluationdenostravaux.Cesonditionssontliéesenpartieaumoteur de reonnaissane Julius ainsi qu'aux modélisations aoustiques et linguistiques telles qu'elles étaient disponibles au ommenement des travaux de ette thèse dans l'équipe PAROLE. Ces onditions générales d'expérimentation ont étédéniesetutilisées danslaphasede test à blan de la ampagne d'évaluation ESTER. Fondé sur des modèles aoustiques monophones, e sys-tème aobtenules meilleuresperformanesparmil'ensembledessystèmes partiipant àe testà blan. Nousavonsonservée systèmepourlaplupart denostravauxan depouvoiromparer nosrésultatsentreeux toutau longdela thèse.

Toutefois,dansleadrede laphasedetest réelledel'évaluationdelaampagneESTER,un nouveau système de reonnaissane a étédéni au sein de l'équipe ave notamment l'adoption de modèles aoustiques triphones. Cette modélisation a d'ailleurs été utilisée par la majorité despartiipants. Nousavonshoisienouveau systèmepournosexpérienesd'intégrationd'une mesure de onane au sein de la phase de déodage du moteur de reonnaissane et pour l'appliationdetransriptionpourlesélèvesmalentendants.Eneet,pouresexpérienes,nous évaluons l'impat de l'intégration de la mesure de onane sur le taux de reonnaissane du système, alors que dans les autres expérienes, nous évaluons la pertinene des mesures elles-mêmes.Ainsi,hangerde systèmepourette tâhe n'inueen rienl'interprétation desrésultats obtenus.

Lespointsimportantsdel'environnementd'expérimentation sont lesmodélisations utilisées, le système de reonnaissane, etles orpus de développement et de test. Nous présentons dans un premier temps le moteur de reonnaissane qui est au ÷ur de notre étude. En eet, nos mesuressontfondéessurl'utilisationintensivedugraphedemotsgénéréparlemoteurde reon-naissane.Puisnousdérivonsàlafoisl'aspetaoustiquedel'environnement(paramétrisation, modélisations phonétiques)et les modèles de langage. Ensuite, nous introduisons les orpus de développementetdetest,issusdelaampagned'évaluationESTER,quenousavonsutilisésan de nousplaer dansdesonditions expérimentalesréelles.

Documents relatifs