• Aucun résultat trouvé

3.2 Binarisation hybride de texte

3.2.2 Optimisation de l’algorithme de correction gamma

La quantité de calcul requise pour la correction gamma est considérable d’après sa com- plexité algorithmique calculée dans la section précédente. Nous proposons d’accélérer ce traitement en réduisant la quantité de calcul et en conservant la qualité des résultats.

Pour ceci, nous proposons une optimisation algorithmique qui prédit une sous-rangée de valeurs gamma ou la valeur optimale est supposée être trouvée par la méthode originale.

Algorithme 6 Règle 3 pour l’estimation de la valeur Gamma : Cas où l’énergie E est

inférieure au pic de l’énergie P e et le contraste C est inférieur au pic du contraste P c

Entrées : T abIns : tableau d’instances, Ps, Pc, Pe

Sortie : γopt : Gamma optimale

1: Si (E < P e)et(C < P c) Alors

2: Trouver les instances Ins : (E >= 0.1)

3: Si (plusieurs instances Ins) Alors

4: selectionner une instance max(C) > 100 pour tout γ ∈ [1, 10] 5: Retourner la valeur gamma optimale

6: Sinon Si (Une seule instance) Alors

7: Retourner la valeur gamma optimale

8: Sinon Si (Pas d’instances) Alors

9: Selectionner une instance dans l’intervalle γ ∈ [0.1, 1] avec un seuil SOtsu le

plus proche possible de P s

10: Retourner la valeur gamma optimale

11: Fin Si

12: Fin Si

Dans la suite nous nommons notre Accélération de la Méthode de Correction Gamma par (AGCM).

L’AMCG utilise un ensemble de règles issues d’une analyse comportementale des para- mètres. Elle est expliquée dans la suite.

Étude comportementale des paramètres utilisés dans GCM Nous étudions le

comportement des courbes d’énergie, de contraste, de seuil Otsu et des valeurs gamma optimales. Cette étude permet de construire des relations entre les comportements de ces paramètres et des sous-rangées des valeurs gamma susceptibles de contenir la valeur gamma optimale.

La figure 2.16 illustre les courbes de contrastes, de l’énergie et de seuil Otsu calculées par la méthode GCM. Ces courbes sont construites à partir des 100 valeurs gamma calculées par GCM. En fonction des pics et des changements brusques dans la courbe de contraste, chaque image est classée comme ayant un contraste strictement croissant, décroissant ou constant. Les changements brusques sont appelés discontinuités. Ils représentent un chan- gement radical dans le rendu de l’image résultante. Ces courbes montrent de façon claire le comportement des caractéristiques et nous permettent d’extraire les relations entre la courbe et la valeur gamma optimale, non pas par des critères numériques, mais plutôt par la forme de la courbe.

Une courbe de contraste strictement croissante (voir figure 2.16a) possède une valeur gamma optimale égale à 10 et signifie généralement que l’image possède des caractéristiques de seuil Otsu, d’énergie et de contraste qui varient légèrement. Dans une courbe strictement décrois- sante, en général, la valeur gamma optimale se situe à proximité de son point de pic. Ce

Co ntra ste croi ssan t Co ntra ste co n stan t Co ntra ste dé croi ssan t (a) (b) (c)

Figure 2.16: Classifications des images et les courbes de caractéristiques correspondantes : (a) : Images originales, (b) Courbes de caractéristiques de GCM ; (c) : Courbes de caracté- ristiques échantillonnées. Courbe de contraste (rouge), Énergie (bleu), seuil d’Otsu (le vert) et la valeur gamma optimale (ligne verticale magenta).

pic est toujours situé dans l’intervalle γ = [0.9, 3.5] [196]. (Voir figure 2.16b). Une courbe de contraste constante (voir figure 2.16c) désigne une image qui est plus influencée par le comportement de la courbe de l’énergie que par le comportement de la courbe de contraste. Dans ce cas, si la courbe d’énergie est strictement croissante cela indique la présence d’une faible valeur gamma.

En outre, une courbe échantillonnée peut produire une version simplifiée et fiable des courbes tout en évitant le calcul des valeurs qui ne sont pas des candidats pour la valeur gamma optimale.

Échantillonnage de la courbe Nous proposons de calculer les paramètres de contraste,

de l’énergie et de seuil d’Otsu sur des points particuliers. Ces points correspondent à quelque valeurs gamma parmi les 100 valeurs possibles. Ils sont donnés par l’ensemble γ suivant :

Ces valeurs ont été choisies parmi les valeurs gamma qui définissent le comportement des courbes de paramètres de sorte que la courbe entière peut être classée de façon fiable comme dans la méthode de correction gamma originale.

La figure 2.16 montre trois échantillons d’images représentatives des trois classes de la base d’image et leurs courbes continues de caractéristiques. Les courbes échantillonnées peuvent être comparées aux courbes continues où nous pouvons voir que les allures des courbes ex- traites sont entièrement conservées.

Prédiction de la sous-rangée Gamma Les relations fournies par l’étude comporte-

mentale peuvent être appliquées afin de prédire la sous-rangée où se trouve la valeur gamma optimale. Ces relations sont formalisées dans l’organigramme de la figure 2.17.

Trouver la valeur C maximale Trouver un pic dans E

Courbe C est toujours croissante? (1) Ins│ ɣ ϵ [9.9, 10.0] Courbe C est décroissante ?

Pic dans SOtsuet

grand changement dans E ?

(2) Ins│ ɣ ϵ[i, i+1]

(3) Ins│ ɣ ϵ[0.1, i]

(4) Ins│ ɣ ϵ[i, i+2]

(5) Ins│ ɣ ϵ[i, i+1 ]

(6) Ins│ ɣ ϵ [9.9, 10.0]

E est stable

? Pic dans SOtsu

? Oui Oui Oui Oui Non Non Non Non Non Oui

Figure 2.17: Prédiction de la sous-rangée de valeurs gamma. Avec C = contraste, E = énergie, SOtsu = Seuil Otsu, Ins : intervalle contenant gamma optimale.

L’organigramme comporte 6 branches possibles numérotées de (1) à (6). Ces branches peuvent être regroupées en 3 principales : Dans la branche (1), la courbe de contraste est strictement croissante. Dans les branches (2) et (3), la courbe de contraste est décroissante.

Enfin pour les branches (4), (5) et (6) la courbe de contraste est constante.

En examinant les résultats de GCM, nous pouvons remarquer que les images qui présentent un fond lisse ou une image qui est sombre avec un peu de lumière produira une valeur gamma optimale égale à γopt = 10.0, alors que les images avec du texte clair et un fond

hétérogène ont généralement une valeur gamma optimale qui appartient au milieu de toutes les valeurs considérées, mais elle ne se trouve jamais dans les limites supérieure ou inférieure de la plage des valeurs.

Une fois la valeur gamma optimale estimée, l’image en niveau de gris qui correspond à cette valeur gamma sera binarisée pour séparer le texte de l’arrière-plan. Pour assurer cette séparation, nous proposons de remplacer le seuillage Otsu de la méthode GCM [71] par une nouvelle classification hybride qui combine des approches locale et globale. Cette méthode sera appliquée également sur les régions de texte et non seulement sur les régions d’images. Nous appelons la correction gamma associée à la classification hybride basée sur Kmeans (CGCHK).

La sous-rangée prédite contiendra un nombre d’images largement inférieur à 100 images (N b0Images<< N bImages) ce qui diminuera la complexité totale de la méthode.