Nouveau calcul des probabilités a posteriori des mots

5.3 Extension pour la reconnaissance d’écriture manuscrite

5.3.2 Nouveau calcul des probabilités a posteriori des mots

Comme le réseau de confusion correspond au graphe de mots et que les ensembles de confusion s’obtiennent immédiatement (voir sous-section 5.3.1), les probabilités a posteriori sont directement associées aux mots du graphe. Comme précédemment, le calcul des probabi-lités a posteriori s’appuie sur l’algorithme forward-backward.

Nous donnons tout d’abord le nouveau calcul des probabilités forward et backward, sur les ensembles de confusion étendus, et permettant également de prendre en compte la longueur des chemins. Ces probabilités seront ensuite utilisées pour calculer les nouvelles probabilités

a posteriori de chacun des mots du graphe.

5.3.2.1 Calcul des probabilités forwardα

L’algorithme 5.2 donne le calcul de la probabilité forward de chacun des mots du graphe. Le scorescore(s_i|w_i)est normalisé par rapport aux scores minimal et maximal parmi ceux des mots ayant le même nombre de traits descendants quewi. Comme ce score correspond es-sentiellement au scorescore_lexique(wi)du motwi, il correspond à la distance d’édition mini-male pour obtenir ce mot (voir chapitre 1, section 1.4). Il est donc dépendant de la longueur du mot puisqu’un mot long nécessite généralement plus d’opérations d’édition qu’un mot court. D’où cette normalisation.

Pour rappel, la probabilité forward d’un mot wi correspond à la somme des probabilités des chemins allant du début du graphe jusqu’au motwi considéré. La figure 5.5 indique les mots pris en compte dans le calcul de la probabilité forward du mot straight.

La probabilité forward d’un motwiest ainsi calculée à partir de celle de chacun des mots

w_j, appartenant à une des listes de mots candidats d’un des arcsa^t_t⁻₋^y_y₋_x. Comme, dans notre méthode de génération du graphe de mots, un nœud ne peut pas avoir plus de 3 arcs prédé-cesseurs et plus de 3 arcs sucprédé-cesseurs (voir chapitre 3), les valeurs de x ety sont telles que

x, y ∈ {1,2,3}. Néanmoins, comme l’algorithme présenté est générique, il peut s’appliquer aux cas où plus de 3 arcs successeurs ou prédécesseurs sont présents.

Les arcsa^t_t⁻₋^y_y₋_xconsidérés sont les prédécesseurs du nœudn_t₋_y, qui correspond au nœud de début de l’arcat

t−y auquel appartient le motw_i (straight, dans l’exemple de la figure 5.5).

Nous souhaitons également prendre en compte la longueur des chemins (calculée en nombre de mots), afin de ne pas défavoriser les chemins comportant beaucoup de mots. Pour cela, lors du calcul de la probabilité a posteriori du motw_i, nous décomposons les probabilités forward

Algorithme 5.2 : Algorithme de calcul des probabilités forward des mots. Données :

G: le graphe de mots;

P(wi|wj): la probabilité du bigrammewjwi, donnée par le modèle de langage;

score_norm(s_i|w_i): le score normalisé du motw_i; Résultat :

α: les probabilités forward des mots du grapheG;

début

pour chaque nœudn_tdu grapheG, dans un ordre topologique faire

pour chaque arca^t_t₋_y prédécesseur du nœudntfaire pour chaque mot candidatw_ide l’arcat

t−yfaire

pour chaque arca^t_t⁻₋^y_y₋_xprédécesseur du nœudn_t₋_yfaire pour chaque mot candidatw_jde l’arca^t_t⁻₋^y_y₋_xfaire

pour chaque longueur de cheminl_kdeα[t−y][x][j]faire

α[t][y][i][k+ 1] + = α[t−y][x][j][k]∗P(w_i|w_j)γ∗score_norm(s_i|w_i)ζ; fin authorize nothingness hinges begin its in _straight nt nt−y nt−y−1 nt−y−2 nt−y−3

FIG. 5.5 – Mots pris en compte dans le calcul de la probabilité forwardαdu mot straight.

selon les différentes longueur de chemins allant du nœud de début du graphe jusqu’au nœudnt

pour lequel la probabilité forwardαest calculée.

5.3.2.2 Calcul des probabilités backwardβ

L’algorithme 5.3 donne le calcul des probabilités backward des mots du graphe.

Le calcul s’effectue de manière similaire à celui des probabilités forward. Cependant, comme la probabilité backward d’un mot correspond à la somme des probabilités des chemins

Algorithme 5.3 : Algorithme de calcul des probabilités backward des mots. Données :

G: le graphe de mots;

P(wi|wj): la probabilité du bigrammewjwi, donnée par le modèle de langage;

score_norm(s_i|w_i): le score normalisé du motw_i; Résultat :

β : les probabilités backward des mots du grapheG;

début

pour chaque nœudn_tdu grapheG, dans un ordre topologique inverse faire

pour chaque arca^t_t₋_yprédécesseur du nœudntfaire pour chaque mot candidatw_ide l’arcat

t−y faire

pour chaque arca^t_t⁺^xprédécesseur du nœudn_tfaire pour chaque mot candidatw_j de l’arca^t_t⁺^xfaire

pour chaque longueur de cheminlkdeβ[t+x][x][j]faire

β[t][y][i][k+ 1] + =

β[t+x][x][j][k]∗P(wj|wi)γ∗scorenorm(sj|wj)ζ;

fin

allant de ce mot jusqu’à la fin du graphe, nous parcourons les nœuds du graphe, en commençant par celui de fin. Le calcul de la probabilité backward d’un motw_is’effectue alors à partir des probabilités backward des mots wj, appartenant à une des listes de mots candidats d’un des arcsa^t_t⁺^x(avecx∈ {1,2,3}), comme illustré par la figure 5.6, pour le mot straight.

li i lid bid ^lines tines straight nt−y nt nt+1 nt+2 nt+3

Comme pour les probabilités forward, les probabilités backward sont décomposées selon les différentes longueurs de chemins allant du nœudn_tconsidéré jusqu’au nœud de fin du graphe.

5.3.2.3 Calcul des probabilités a posterioriP_post(w_i)

En utilisant les probabilités forward et backward calculées précédemment, l’algorithme 5.4 donne le calcul des probabilités a posteriori de chacun des mots du graphe.

Algorithme 5.4 : Algorithme de calcul des probabilités a posteriori des mots. Données : G: le graphe de mots;

P(w_i|w_j): la probabilité du bigrammew_jw_i, donnée par le modèle de langage;

scorenorm(si|wi): le score normalisé du motwi;

α: les probabilités forward des mots du grapheG;

β: les probabilités backward des mots du grapheG;

denom: la somme des probabilités de tous les chemins du graphe; Résultat :

Ppost(wi): la probabilité a posteriori associée à chacun des motswi du grapheG;

début

pour chaque nœudn_tdu grapheG, dans un ordre topologique faire

pour chaque arcat

t−y prédécesseur du nœudn_tfaire pour chaque mot candidatw_ide l’arca^t_t₋_yfaire

pour chaque arca^t_t⁻₋^y_y₋_xprédécesseur du nœudn_t₋_yfaire pour chaque mot candidatw_jde l’arca^t_t⁻₋^y_y₋_xfaire

pour chaque longueur de cheminl_kdeα[t−y][x][j]faire pour chaque longueur de cheminl_ldeβ[t][y][i]faire

P_post(w_i) + = α[t−y][x][j][k]∗P(w_i|w_j)γ∗

score_norm(s_i|w_i)ζ∗β[t][y][i][l]∗δk+l;

P_post(w_i) = ^Ppost(wi)

denom ; fin

En reprenant la figure 5.5, la probabilité a posteriori du mot straight est obtenue en com-binant la probabilité backward de ce mot aux probabilités forward de chacun des mots wj, appartenant aux arcs précédant l’arc auquel appartient straight. Cela permet ainsi de prendre en compte tous les chemins passant par le mot straight, à partir des chemins arrivant à ce mot et de ceux y commençant. La longueur de chacun des chemins considérés est alors la somme des longueurs des sous-chemins se terminant par le mot straight et des longueurs de ceux débutant par ce mot. La longueur des chemins pondère le paramètreδ, qui permet de prendre en compte les sur- et les sous-segmentations.

somme des probabilités des chemins auxquels ils appartiennent par rapport à la somme de tous les chemins du graphe de mots (représentée par la variabledenom, dans l’algorithme 5.4).

Il reste alors à choisir l’hypothèse consensus, à partir des probabilités a posteriori des mots.

Dans le document Intégration de connaissances linguistiques pour la reconnaissance de textes manuscrits en-ligne (Page 119-123)