• Aucun résultat trouvé

Modiation des HMM en fontion des règles de onfusions phonétiques

phonétiques

Dansetteétape,il s'agitde prendreenompte lemodèle deprononiation non-nativedont l'extration a été détaillée dans le paragraphe préédent. Nous voulons modier le système de RAP an que les erreurs de prononiation soient moins pénalisantes pour les performanes de e dernier. En d'autres termes, il s'agit de faire en sorte que le système aepte, pour haque phonème,laprononiation de référeneainsique haune desprononiationsalternatives.

Dansles travauxdepréédents,es modiationsont étéintroduites dansdiérentsniveaux du système de RAP. Un système de RAP (fondé sur des HMM) se ompose prinipalement d'un modèle de langage, un ditionnaire phonétique, un ensemble de modèles aoustiques et d'un moteur de reonnaissane. Les modèles aoustiques représentent haque son ou phonème de la langue ible ave les variantes intrinsèques à la langue. Un modèle aoustique est une représentation paramétrique d'unphonème permettant deledistinguer des autresphonèmes de la langue. Le ditionnaire phonétique, ou enore lexique, établit le lien entre la représentation sonore et la graphie de haque mot de la langue : à haque mot est assoié une (ou plusieurs) prononiation quionsiste en unesuite de phonèmes, ommeillustrédansletableau suivant.

Tab.2.2 Prononiations du motanglais Message dans leditionnaire phonétique du CMU 5

Mot Prononiation

Message [m℄[E℄[s℄ [℄ [dZ℄ Message [m℄[E℄[s℄ [i:℄ [dZ℄

An depermettre ausystème deonsidérer les prononiationsnon-nativesommeétant des variantes des phonèmes de référene, l'approhe la plus direte et la plus simple onsisterait à modier le lexique en introduisant toutes les ombinaisons de prononiations possibles. Cei reviendrait à remplaer les phonèmes de référene par les suites de phonèmes orrespondantes (selonlemodèle deprononiation)etintroduire autantd'entrées danslelexiquequede pronon-iations possibles. Malheureusement, ette approhe augmente la taille du lexique de manière exponentielle. En eet, en supposant que dans le modèle de prononiation non-native on ait r

prononiations diérentes par phonème, un mot omposé de p phonèmes engendrerait (r+ 1)p

ombinaisons deprononiations.

Cet aroissement de la taille du lexique est un handiap majeur puisque la taille du di-tionnairerésultant seraitdiile à gérer.Dans e as, unltrage desombinaisons possibles de phonèmes devra être eetué. Par onséquent, seulement un petit nombredes ombinaisons de prononiations pourra être inlus dans le système. Dans le paragraphe suivant, nous dérirons notre approhe qui onserve l'ensemble des ombinaisons ave un aroissement linéaire de la omplexitédesparamètres.

2.5.1 Ajout de nouveaux hemins dans les modèles HMMs

Comme nousl'avonsremarqué plushaut, l'approhe laplus naturellepour l'introdution de nouvellesprononiationsseraitde modierlelexiquedusystèmedeRAP.Dansnotreapprohe, voulonsprendreenomptetouteslesombinaisonsphonétiquespossibles.Aulieud'introduireles ombinaisons deprononiationsau niveau dulexique, nousproposonsd'eetuer elaau niveau desmodèles aoustiquesmêmes,i.e.lesmodèles HMMsdansnotreas(Hidden MarkovModel ouModèlede MarkovCahés.

Un HMM est un automate probabiliste onçu pour modéliser l'émission de suites d'obser-vations. Dans notre as, les observations sont les éléments du signal de parole disrétisé (et éventuellement transformépar un proédédeparamètrisation). Ahaquesond'une langue par-tiulièreestassoié unmodèle HMMreprésentant e sonetpermettant de ledisriminer parmi

l'ensemble desphonèmes possibles. Classiquement,les modèles HMMutilisés dansles systèmes deRAPseprésententsouslaformed'unensembleden états(3ouplus)liéspardestransitions donnant une topologie dite gauhe-droite. Cette topologie, omme illustré dans la gure 2.9, préonise que la réalisation d'un phonème se produit en plusieurs intervalles de temps les aratéristiquesdusonsont onstantes ouontdesvariationsonstantes. Cettetopologieprévoit quehaque étatduHMM modélise unede esparties temporelles dansun ordrehronologique.

Fig. 2.9 Topologie d'un modèle HMM gauhe-droite.

Dans notre approhe, nous proposons de modier la topologie des modèles aoustiques (HMMs) des phonèmes de la langue ible en ajoutant des hemins alternatifs orrespondant aux prononiations non-natives. En d'autres termes, pour un phonème p de C, haque règle

rp ∈Rp donneralieuàunhemind'étatsalternatifsdanslemodèledepquiseraomposédela onaténationdesmodèles desphonèmes présentsdanslapartiedroite derp.Lemodèlemodié du phonèmep ontiendra don :

un hemin orrespondant au modèle anonique de p,i.e. lemodèlede p sans auune mo-diation

unhemin alternatif supplémentaire orrespondant à haquerègle de Rp

An d'illustrer ette proédure, onsidérons l'exemple de règles de onfusions phonétiques pour le phonèmeanglais [tS℄dansleasoù lalangue maternelleest lefrançais:

- règle 1 : [tS℄ [t℄[S℄, P( [tS℄→ [t℄ [S℄) =0.6 - règle 2 : [tS℄ [S℄, P( [tS℄→ [S℄ ) =0.4

Dansetexemple,lemodèlemodiéduphonème[tS℄estreprésentédanslagure2.10, dans leasoùles modèlesomportent3états.Commeon peutleonstatersurettegure, lemodèle ontient3heminsdistintsreprésentant respetivementlaprononiationanoniqueduphonème [tS℄, la 1ere

prononiation non-native ([S℄) et la 2eme

prononiation non-native ([t℄, [S℄). Ces heminssont disjointset mutuellement exlusifs, 'est-à-direqu'en parourant etautomate de l'étatinitialjusqu'àl'étatnal,unseulheminpourraêtreempruntésanspossibilitésdepassage par des états intermédiairesd'autres hemins. En d'autre termes, à laphase de reonnaissane, une seule prononiation pourra être hoisie et assoiée à un seul hemin de e modèle. Les probabilités a priori des règles de onfusions phonétiques sont reportées sur les transitions de sorties del'étattifde départdemanièreà respeter unedespropriétés desHMMs:lasomme desprobabilités destransitions sortantesest égale à1. Lefateur β ∈]0..1[dansette gureest une pondération entre laprononiation anoniqueetles prononiationsnon-natives.

De ette manière, le modèle modié représentera, en parallèle, la réalisation anonique du phonème p ainsique toutes les diérentes prononiations non-natives présentes dansle modèle de prononiation.Cemodèlerésultant pourraêtre utilisé danslesystèmede RAPà laplaedu

Fig. 2.10 Modèle modié duphonème anglais [tS℄.

modèleoriginalduphonèmep.Notonségalementque,àladiérenedelamodiationdulexique, notre approhe résulte en un simple aroissement linéaire de la omplexité de es modèles aoustiques. En eet, en supposant que le nombre maximal de prononiations non-natives par phonème soit k et que le nombre maximal de phonèmes dans la partie gauhe des règles de onfusions phonétiques soit l, le fateur maximal d'aroissement du nombre de paramètres aoustiquessera :l(k+ 1).