• Aucun résultat trouvé

Pourunmotanalysé

[w, τ, t]

,lesmesures deonanetrame-synhronesdéniesdansla se-tionpréédentenesontfondéesquesurdesindiesdisponiblesdanslemoteurdereonnaissane

àl'instant

t

.

Au ontraire, pour les mesures de onane que nous dénissons dans ette setion, nous

introduisonsdes onnaissanes postérieures au temps

t

. C'est pourquoi es mesures ne peuvent

plus être trame-synhrones, mais uniquement loales. Un délai est introduit an d'attendre la

disponibilitédesinformationsnéessairesaualuldelamesure.L'intérêtprinipalestdeprendre

enompteunontextepluslargeautourdumotàanalyser.Destravauxontmontréquelaprise

en ompte des mots postérieurs au mot analysé par le biais de modèles de langage inverses

représenteun apportd'information important[Weintraub97,Duhateau 02a℄.

Ces nouvelles mesures de onane se distinguent entre elles par la dénition du voisinage

loalutilisé.

3.3.1 Mesures fondées sur la probabilité a posteriori

Nousavonshoisidedéniresmesuresdeonaneloalessurl'estimationdelaprobabilité

a posterioridesmots.

Le alul eetif de nos mesures de onane loales est fondé sur la méthode dérite par

Wessel et al. dansle adre de la dénition de leur mesure de onane estimant la probabilité

a posteriori (f. setion 2.3.6.2) [Wessel01℄. Pour rappel, ette méthode de alul onsiste à

aluler réursivement les probabilités forward et bakward,

Φ([w, τ, t])

et

Ψ([w, τ, t])

, du mot

[w, τ, t]

analysé,selon les équations suivantes:

Φ([w, τ, t]) = p(o t τ |w) α X

La probabilitéa posterioriestalorsestiméeainsi:

p(w|O) = p([w, τ, t]|o T 1 ) = Φ([w, τ, t])Ψ([w, τ, t]) p(o T 1 )p(o t τ |w) α

Sahant quelaprobabilitéde l'observation

p(o T 1 )

peutêtre aluléede lamanièresuivante:

P (O) = p(o T 1 ) = X

w

X

τ

Φ([w, τ, T ])

Le prinipedenosmesures deonaneestdedénir unvoisinageautourdumotanalyséen

prenant en ompte, de part et d'autre du mot,un nombrexe de trames. Ainsi lataille totale

en trames du voisinage

V

d'un mot

w

est lasomme de lalongueur du mot

w

et deslongueurs

desvoisinagespassé etfutur. Lataille totaledu voisinageest don dépendantedu motanalysé.

A partir du voisinage

V

, nous extrayons du graphe de mots la partie orrespondant à

V

,

'est-à-direomprise entreletempsde débutdu voisinage

V

etletempsde nde

V

.Puis dans

e sous-graphe,nouséliminonsleslienspassésetfutursà

V

.Silevoisinage

V

débuteàl'instant

d

et termine à l'instant

f

,les liens éliminés orrespondent aux mots

[w, τ, t]

tels que

τ < d < t

ou

τ < f < t

.Deplus,danslesous-graphe,ertainsmotsseretrouvent isolésarils nesontplus liésà desheminspartant du débutdel'extrait à lan deelui-i.

Nousalulons alorssurlesous-graphe résultant laprobabilitéaposterioridumot

w

,parla

méthodedéritesetion2.3.6.2,dont nousavonsdonnéunbrefrappelauparagraphepréédent,

dansleadredeprobabilitésbigrammes.Dansetteméthode,lesmotsisolésn'ontpasd'inidene

surlealulde lamesuredeonane arl'algorithmedealulforward-bakwardimpliqueque

seuls les mots appartenant à un hemin allant du début à la n du graphe sont onsidérés et

peuventavoirune valeurde onane.Toutefoisilpossiblequelemot analysé

w

lui-même n'ait

plusdeliaisondanslegrapheextraitetainsiauunevaleurdeonanenepeutluiêtreattribuée

paretteméthode.Ceasseprésented'autantplusfréquemmentquelatailleduvoisinage

V

est

petite.Nousavonsalorshoisid'aeterauxmotsanalysésn'ayantpasdevaleurdeonane,la

probabilitéa prioriqu'a unmotd'êtreorret.Cetteprobabilitéa prioriorrespond autauxde

mots orretsdusystèmedereonnaissane,'est-à-dire

(1 − CER)

,CERétantletauxd'erreur

de onaneprésentésetion2.4.2.

3.3.2 Dénition des voisinages

Nousdénissons deuxtypesde voisinage :

un voisinagesymétrique pourlequel lestaillesdes voisinagespasséetfutursontégales,

un voisinage asymétrique pour lequel les tailles des deux voisinages passé et futur sont

déniesindépendamment l'unede l'autre.

La mesure de onane dite symétrique est dépendante d'un paramètre qui dénit la taille

en trame des voisinages passé et futur. La gure 3.4 représente le voisinage

V

assoié au mot

analysé

w

ave un paramètre detaille

x

.

x

x

-

-t

V w

Fig. 3.4 Illustration du voisinage pris en ompte pour la mesure de onane symétrique de

paramètrede taille

x

.

La mesurede onanedite asymétriqueintroduitdeuxparamètres dénissant lestailles de

esdeuxvoisinages. Lagure3.5 montrelevoisinage

V

onsidéré pourlemot analysé

w

etune

mesuredeonane asymétriquede taille devoisinagepassé

x

etdetaille de voisinagefutur

y

.

x

-

y

-t

V w

Fig.3.5 Illustrationdu voisinage pris en omptepourlamesurede onane asymétrique de

paramètrede taille

x

et

y

.

Lamesurediteasymétriquepermetparrapportàlamesuresymétriquedeprendreenompte

plusd'informationsissuesduvoisinagepassédumotanalysé

w

,sansaugmenterledélaiintroduit

parle voisinagefuturde

w

.

3.3.3 Introdution d'un fateur de exibilité

η

Le problème des ourrenes multiples se pose aussi pour ette mesure. En eet, dans le

sous-grapheextrait il est possible queplusieursourrenes dumot analysé puissent apparaître

à des positions temporelles similaires. Par la méthode de alul forward-bakward utilisée, une

estimation de la probabilitéa posteriori est alulée pour haque mot du graphe, etdon pour

haunedesourrenesdumotanalysé.N'enretenirqu'uneseulesous-estimelavraieprobabilité

a posterioridu mot.

An degérere problèmed'ourrenesmultiples, nousintroduisonsunfateur deexibilité

η

etsommons les estimations desourrenes du mot analysé qui respetent un ertain ritère

dépendant de

η

.

Soit le mot analysé

[w, τ, t]

dont nous voulons estimer la onane, soit

η

le fateur de

exibilitéetsoit

d

lalongueur dumot

w

.

d = t − τ + 1

(3.14)

Pour dénir la mesure de onane de

[w, τ, t]

, nous sommons les valeurs de onane des

ourrenes

[ w, e τ , ˜ ˜ t]

de

w

, appartenant au sous-graphe extrait et qui réalisent les ontraintes suivantes :

τ − η d ≤ τ ˜ ≤ τ + η d

(3.15)

t − η d ≤ ˜ t ≤ t + η d

(3.16)

(1 − η) d ≤ d ˜ ≤ (1 + η) d

(3.17)

Cesontraintess'appliquentsurlesous-graphedemotsextraitquiestassoiéaumotanalysé.

Soit

F

l'ensembledesourrenesd'unmot

w

réalisant lesontraintesdonnéesparleséquations

préédentes,la valeur de lamesure de onane

C([w, τ, t])

est ainsidonnée parl'équation

sui-vante:

C(w, τ, t]) = X

[ w,˜ e τ , t]∈F ˜

p([ w, e τ , ˜ t]|o ˜ f d )

(3.18)

o f d

estlaséquened'observationsquiorrespondaugraphedemotsassoiéauvoisinagedéni parlamesureetparlemot analysé.

Remarque : Les équations 3.15 à 3.17 ressemblent aux équations 3.3 à 3.5 mais e fateur

de exibilité

η

n'a rien à voir ave le fateur de relâhement

ε

introduit pour les mesures de

onane trame-synhrone :

pour nos mesures trame-synhrones, le fateur de relâhement sert à déterminer un

en-sembled'ourrenes de mots onurrents du mot analysé an de déterminer l'hypothèse

alternative danslerapport devraisemblane,

pour nos mesures loales fondées sur la probabilité a posteriori, le fateur de exibilité

permetdeprendreenompteuniquementlesourrenesdumotanalysédanslevoisinage

V

,puisde sommer lesvaleursde onanede hauned'elles.