• Aucun résultat trouvé

Notre approhe de séletion dynamique de gaussiennes

Comme nous l'avonsdérit dans 4.1.2, l'approhe PDE permet une rédution du temps de alul de probabilité avoisinant les 30%. Toutefois, ette méthode implique une approximation danslavaleur deprobabilitéestimée :laprobabilité d'unGMMestapproximée par la probabi-litéde lagaussienneprépondérante. Cette approximationpourraitengendrer unebaisse dansla préision de lareonnaissane.

Fig.4.1Pourentagedeséletiondesgaussiennesd'unGMMparl'approheEPDE,enfontion duparamètreletdurangdelagaussienneséletionnée.Calulésenutilisant40phonèmesanglais àtroisétats,desGMMde128gaussiennesparétatetsur10000observationsduorpusHIWIRE. Ladimensiondesveteursestde39éléments.Parexemple,laméthodeEPDE,aveunparamètre

l= 10,séletionne la meilleur gaussienne (derang 1) dans 90% desas. Demême, la méthode EPDE,ave unparamètre l= 5,séletionne lagaussiennede rang2 dans16%desas.

Par ailleurs, dans lasetion 4.1.3, nous avons vu queles approhes de séletion statique de gaussiennes permettent une rédution signiative dans le temps de alul de probabilité, de l'ordre de 85%. Ces méthodes ont également l'avantage de préserver la préision de la reon-naissane voale, ave une augmentation minime du taux d'erreur. Cependant, es méthodes impliquent un inonvénient onernant la apaité de stokage requise. En eet, les listes de gaussiennespré-alulées doivent être enregistrées onjointement ave les modèles aoustiques, multipliant onsidérablement l'espaede stokage néessaire.

Lespropriétésdesdeuxméthodes(PDEetVQpourlealuldeprobabilité)ontmotivéle tra-vail quenousavonspublié danslesartiles [CaiandBouselmi, 2008 ℄,[Bouselmi and Cai,2008 ℄, et [Cai etal., 2008 ℄. Nous désirons une approhe de alul rapide de probabilité qui soit plus préisequel'approhe PDE sansauuneaugmentation del'espae de stokage.La séletion dy-namiquedegaussiennes(DynamiGaussian Seletion, DGS)quenousproposonsn'utiliseniun partitionnement de l'espae aoustiquenideslistes degaussiennespré-alulées. Contrairement àl'approhePDE,laméthodeDGSapproximelaprobabilitéd'émission,pouruneobservationx, parlasommedesprobabilitésd'émissiondesgaussienneslesplusprépondérantesdansunGMM. L'approheDGS omplémentel'approhePDE etsebasesurles résultatsde ettedernière. Les résultatsdualul deprobabilité par l'approhe PDE sont utilisés ande séletionner les gaus-siennes prépondérantes à retenir dansun GMM. Ces gaussiennes séletionnées ontribueront à la probabilité du GMM. Les gaussiennes onsidérées omme non signiatives sont ignorées et n'auront auuneontribution danslaprobabilité nale duGMM.

Dansleadredel'approhePDE,laplupartdesvaleursdedistaneentrelesgaussiennesd'un GMMetl'observationx sont desdistanes partielles.Nous nedisposons pasdesvaleursde dis-tanesomplètes puisquelaméthode PDE nealuleles distanes omplètes quepour quelques

unes des gaussiennes. Il n'est pas possible de d'estimer les distanes entre les gaussiennes d'un GMMetuneobservation.Iln'estdonpaspossibledetrieresgaussiennesand'enséletionner les plus prohes à l'observation en ours. An de remédier à et inonvénient, nous proposons d'utiliserlerangbkauquell'approhePDEarrête lealuldelog-probabilitépourunegaussienne

b

G(f.et4.1.2).Cerangpeutêtreonsidéréommeuneheuristiqueindiquantladistaneentrela gaussienne Gb etl'observation x.Plus préisément, e rang d'arrêt estun indiateur permettant deomparerlesdistanes(log-probabilités)desdeuxgaussiennesGbetG.Eneet,pluslavaleur de e rang bk est élevée, plus la valeur de log-probabilité de la gaussienne Gb est prohe de la valeur de log-probabilité de G(la distane optimale). Demême, plus lavaleur de e rang bkest basse,pluslavaleurdelog-probabilité delagaussienneGbestéloignée de(inférieureà) lavaleur de log-probabilitéde G.

Dans notre approhe DGS, nous proposons de séletionner les gaussiennes G dont le rang d'arrêt bk est supérieur à un seuil γ. Rappelons que l'approhe PDE arrête la boule de alul de la distane (log-probabilité) d'une gaussienne G,et e lorsqu'au rang bk ladistane partielle

Dbk(x|G)b est inférieure à ladistane optimale (obtenue jusqu'à présent). Si lerangd'arrêt de la boule dealulPDEpourunegaussienne Gb vériebk > γ,alorsGbestséletionnée. Lealulde log-probabilitédelagaussienneGbestreprisaurang(bk+1)eteandealulerlalog-probabilité totaleDN(x|G)b .

LaprobabilitétotaleduGMM(notéS)estdénieommelasommepondéréedesprobabilités des gaussiennes séletionnées, omme dansl'equation (4.12). La log-probabilité totale de S est donnéedansl'équation (4.13).

p(x|S) = ΣiI ωip(x|µi,Σi) (4.12)

ℓ(x|S) =log(ΣiI e(x|µi,Σi)) (4.13) I estl'ensembledesindies desgaussiennesséletionnées.

Voii l'algorithme del'approhe DGS ombinée ave l'approhe BMP :

Algorithme : DGS+BMP

Entrées :x :un veteur d'observation dedimension N unGMMde dgaussiennes,Σdi=1ωiℵ(µi,Σi) γ :paramètre de laméthode DGS

B :index de lameilleuregaussienne pourla dernièreobservation

Sorties:De :logarithmenatureldelasommedesprobabilitésdesgaussiennesséletionnéespour l'observation x

e

B :index de lameilleuregaussienne pour x

Variables : D:distane partiellede lagaussienneen ours

˚

D :distanede lameilleuregaussienne DEBUT 1. D˚log(ωB) +ZB 2. Pourk=1 àN . Faire . . D˚D˚1 2 (xk−µBk)2 ΣBk . Fin Pour . Be←B ; De ←D˚ . Pouri=1 àd . Faire

. . Si(i=B) AlorsPasser àlagaussienne suivante

. . Alors

. . . i←i+ 1

. . . Aller à l'étape 2. //passage à lagaussienne suivante

. . Fin Si . . D←log(ωi) +Zi . . Pourk =1à N . . Faire . . . D←D−12(xk−µik)2 Σik . . . Si(D <D˚) . . . Alors . . . . Si(k≥γ) . . . . Alors . . . . . Pourj =k+ 1àN . . . . . Faire . . . . . . D←D−12(xj−µij)2 Σij . . . . . Fin Pour . . . . . De ←log(eDe +eD) . . . . Fin si . . . . i←i+ 1

. . . . Aller à l'étape 2. // passage àla gaussiennesuivante

. . . Fin Si . . Fin Pour . . De ←log(eDe +eD) . . ˚ D←D . . Bei . Fin Pour 3. Retour(De, Be) FIN