Pourunmotanalysé
[w, τ, t]
,lesmesures deonanetrame-synhronesdéniesdansla se-tionpréédentenesontfondéesquesurdesindiesdisponiblesdanslemoteurdereonnaissaneàl'instant
t
.Au ontraire, pour les mesures de onane que nous dénissons dans ette setion, nous
introduisonsdes onnaissanes postérieures au temps
t
. C'est pourquoi es mesures ne peuventplus être trame-synhrones, mais uniquement loales. Un délai est introduit an d'attendre la
disponibilitédesinformationsnéessairesaualuldelamesure.L'intérêtprinipalestdeprendre
enompteunontextepluslargeautourdumotàanalyser.Destravauxontmontréquelaprise
en ompte des mots postérieurs au mot analysé par le biais de modèles de langage inverses
représenteun apportd'information important[Weintraub97,Duhateau 02a℄.
Ces nouvelles mesures de onane se distinguent entre elles par la dénition du voisinage
loalutilisé.
3.3.1 Mesures fondées sur la probabilité a posteriori
Nousavonshoisidedéniresmesuresdeonaneloalessurl'estimationdelaprobabilité
a posterioridesmots.
Le alul eetif de nos mesures de onane loales est fondé sur la méthode dérite par
Wessel et al. dansle adre de la dénition de leur mesure de onane estimant la probabilité
a posteriori (f. setion 2.3.6.2) [Wessel01℄. Pour rappel, ette méthode de alul onsiste à
aluler réursivement les probabilités forward et bakward,
Φ([w, τ, t])
etΨ([w, τ, t])
, du mot[w, τ, t]
analysé,selon les équations suivantes:Φ([w, τ, t]) = p(o t τ |w) α X
La probabilitéa posterioriestalorsestiméeainsi:
p(w|O) = p([w, τ, t]|o T 1 ) = Φ([w, τ, t])Ψ([w, τ, t]) p(o T 1 )p(o t τ |w) α
Sahant quelaprobabilitéde l'observation
p(o T 1 )
peutêtre aluléede lamanièresuivante:P (O) = p(o T 1 ) = X
w
X
τ
Φ([w, τ, T ])
Le prinipedenosmesures deonaneestdedénir unvoisinageautourdumotanalyséen
prenant en ompte, de part et d'autre du mot,un nombrexe de trames. Ainsi lataille totale
en trames du voisinage
V
d'un motw
est lasomme de lalongueur du motw
et deslongueursdesvoisinagespassé etfutur. Lataille totaledu voisinageest don dépendantedu motanalysé.
A partir du voisinage
V
, nous extrayons du graphe de mots la partie orrespondant àV
,'est-à-direomprise entreletempsde débutdu voisinage
V
etletempsde ndeV
.Puis danse sous-graphe,nouséliminonsleslienspassésetfutursà
V
.SilevoisinageV
débuteàl'instantd
et termine à l'instantf
,les liens éliminés orrespondent aux mots[w, τ, t]
tels queτ < d < t
ou
τ < f < t
.Deplus,danslesous-graphe,ertainsmotsseretrouvent isolésarils nesontplus liésà desheminspartant du débutdel'extrait à lan deelui-i.Nousalulons alorssurlesous-graphe résultant laprobabilitéaposterioridumot
w
,parlaméthodedéritesetion2.3.6.2,dont nousavonsdonnéunbrefrappelauparagraphepréédent,
dansleadredeprobabilitésbigrammes.Dansetteméthode,lesmotsisolésn'ontpasd'inidene
surlealulde lamesuredeonane arl'algorithmedealulforward-bakwardimpliqueque
seuls les mots appartenant à un hemin allant du début à la n du graphe sont onsidérés et
peuventavoirune valeurde onane.Toutefoisilpossiblequelemot analysé
w
lui-même n'aitplusdeliaisondanslegrapheextraitetainsiauunevaleurdeonanenepeutluiêtreattribuée
paretteméthode.Ceasseprésented'autantplusfréquemmentquelatailleduvoisinage
V
estpetite.Nousavonsalorshoisid'aeterauxmotsanalysésn'ayantpasdevaleurdeonane,la
probabilitéa prioriqu'a unmotd'êtreorret.Cetteprobabilitéa prioriorrespond autauxde
mots orretsdusystèmedereonnaissane,'est-à-dire
(1 − CER)
,CERétantletauxd'erreurde onaneprésentésetion2.4.2.
3.3.2 Dénition des voisinages
Nousdénissons deuxtypesde voisinage :
un voisinagesymétrique pourlequel lestaillesdes voisinagespasséetfutursontégales,
un voisinage asymétrique pour lequel les tailles des deux voisinages passé et futur sont
déniesindépendamment l'unede l'autre.
La mesure de onane dite symétrique est dépendante d'un paramètre qui dénit la taille
en trame des voisinages passé et futur. La gure 3.4 représente le voisinage
V
assoié au motanalysé
w
ave un paramètre detaillex
.x
x-
-t
V w
Fig. 3.4 Illustration du voisinage pris en ompte pour la mesure de onane symétrique de
paramètrede taille
x
.La mesurede onanedite asymétriqueintroduitdeuxparamètres dénissant lestailles de
esdeuxvoisinages. Lagure3.5 montrelevoisinage
V
onsidéré pourlemot analyséw
etunemesuredeonane asymétriquede taille devoisinagepassé
x
etdetaille de voisinagefutury
. x-
y-t
V w
Fig.3.5 Illustrationdu voisinage pris en omptepourlamesurede onane asymétrique de
paramètrede taille
x
ety
.Lamesurediteasymétriquepermetparrapportàlamesuresymétriquedeprendreenompte
plusd'informationsissuesduvoisinagepassédumotanalysé
w
,sansaugmenterledélaiintroduitparle voisinagefuturde
w
.3.3.3 Introdution d'un fateur de exibilité
η
Le problème des ourrenes multiples se pose aussi pour ette mesure. En eet, dans le
sous-grapheextrait il est possible queplusieursourrenes dumot analysé puissent apparaître
à des positions temporelles similaires. Par la méthode de alul forward-bakward utilisée, une
estimation de la probabilitéa posteriori est alulée pour haque mot du graphe, etdon pour
haunedesourrenesdumotanalysé.N'enretenirqu'uneseulesous-estimelavraieprobabilité
a posterioridu mot.
An degérere problèmed'ourrenesmultiples, nousintroduisonsunfateur deexibilité
η
etsommons les estimations desourrenes du mot analysé qui respetent un ertain ritèredépendant de
η
.Soit le mot analysé
[w, τ, t]
dont nous voulons estimer la onane, soitη
le fateur deexibilitéetsoit
d
lalongueur dumotw
.d = t − τ + 1
(3.14)Pour dénir la mesure de onane de
[w, τ, t]
, nous sommons les valeurs de onane desourrenes
[ w, e τ , ˜ ˜ t]
dew
, appartenant au sous-graphe extrait et qui réalisent les ontraintes suivantes :τ − η d ≤ τ ˜ ≤ τ + η d
(3.15)t − η d ≤ ˜ t ≤ t + η d
(3.16)(1 − η) d ≤ d ˜ ≤ (1 + η) d
(3.17)Cesontraintess'appliquentsurlesous-graphedemotsextraitquiestassoiéaumotanalysé.
Soit
F
l'ensembledesourrenesd'unmotw
réalisant lesontraintesdonnéesparleséquationspréédentes,la valeur de lamesure de onane
C([w, τ, t])
est ainsidonnée parl'équationsui-vante:
C(w, τ, t]) = X
[ w,˜ e τ , t]∈F ˜
p([ w, e τ , ˜ t]|o ˜ f d )
(3.18)o f d
estlaséquened'observationsquiorrespondaugraphedemotsassoiéauvoisinagedéni parlamesureetparlemot analysé.Remarque : Les équations 3.15 à 3.17 ressemblent aux équations 3.3 à 3.5 mais e fateur
de exibilité
η
n'a rien à voir ave le fateur de relâhementε
introduit pour les mesures deonane trame-synhrone :
pour nos mesures trame-synhrones, le fateur de relâhement sert à déterminer un
en-sembled'ourrenes de mots onurrents du mot analysé an de déterminer l'hypothèse
alternative danslerapport devraisemblane,
pour nos mesures loales fondées sur la probabilité a posteriori, le fateur de exibilité
permetdeprendreenompteuniquementlesourrenesdumotanalysédanslevoisinage