Extraction de zones d intérêts dans une image de textures

(1)

Extraction de zones d’int´ erˆ ets dans une image de textures

Rapport de stage

Giap Nguyen (giap.nguyen@univ-lr.fr)

Encadrant :

Micka¨el Coustaty (mickael.coustaty@univ-lr.fr) Jean-Marc Ogier (jean-marc.ogier@univ-lr.fr)

Laboratoire :

Laboratoire Informatique, Image et Interaction (L3I) Universit´e de La Rochelle

30 aoˆut 2009

(2)

Remerciements

Je tiens tout d’abord à remercier les professeurs d’informatiques et de fran¸cais de l’Institut de la Francophonie pour l’Informatique (IFI) qui nous ont dispensés les cours pendant mes années de Master.

Je souhaite également remercier mes encadrants de stage, M. Jean-Marc Ogier et M. Mickaël Coustaty, pour leur aide précieuse et leurs encouragements.

Enfin, je voudrais remercier les personnes du L3i pour leur sympathie et leur accueil.

(3)

R´ esum´ e

Ce travail se concentre sur l’extraction de zones d’intérêts dans les lettrines (images de lettre décorées), qui se trouvent dans les documents anciens conservés dans des bibliothèques, des musées et des archives publiques. Notre objectif principal est de développer une méthode de segmentation de textures dans les lettrines. Les images que nous traitons sont obtenues par pression d’un tampon sur une feuille, et sont donc composées de traits. Pour cette raison, nous proposons une méthode reposant sur l’extraction et l’analyse de traits. Pour cela, nous extrayons d’abord des traits et les caractérisons. Les caractéristiques utilisées sont l’orientation, l’épaisseur et la courbure. Ensuite, une distance propre est précisée pour mesurer la similarité entre des traits. Enfin, nous utilisons une classification hiérarchique pour classer ces traites. Les traits voisins similaires sont groupés dans un segment.

Mots-cl´es: Reconnaissance des formes, indexation d’images, segmentation, signatures texturelles, signatures structurelles et topologiques.

Abstract

This work focuses on the extraction of interesting zones in drop caps (images of decorated letter), which can be found in historical documents. These documents are conserved by the libraries, the museums and the public archives. Our principal objective is to develop a texture segmentation method for drop caps. Drop caps were obtained by pressure of a stamp on paper, and therefore, contains strokes. Because of that, we suggest a stroke base method for drop caps segmentation. Firstly, we extract each stroke and get its features. The features used in our method are orientation, thickness and curvature. After that, a distance is defined to measure the similarity between the strokes extracted. Finally, we use the hierarchic classification to classify the strokes. In our results, the neighbor similar strokes will be grouped in a segment.

Keywords: Pattern recognition, image indexing, segmentation, textural features, structural and topological features

(4)

Table des mati` eres

Remerciements i

R´esum´e ii

Abstract ii

Table des figures v

Liste des tableaux vii

1 Introduction 1

1.1 Probl´ematique . . . 1

1.2 Motivation . . . 2

1.3 Objective . . . 3

1.4 Contribution . . . 3

1.5 Environnement de stage . . . 4

2 Etat de l’art´ 5 2.1 Texture . . . 5

2.2 Extraction de caract´eristiques de textures . . . 6

2.2.1 Matrice de co-occurrence . . . 6

2.2.2 Fonction d’auto-corr´elation . . . 9

2.2.3 Méthodes basées modèle . . . 9

2.2.4 Filtrage . . . 10

2.2.5 Le diagramme de Vorono¨ı . . . 12

2.3 Segmentation et classification de textures . . . 16

2.3.1 Segmentation de textures . . . 16

2.3.2 Classification de textures . . . 17

3 Segmentation de textures de lettrines 18 3.1 Caract´eristiques de lettrines . . . 18

(5)

3.2 Proc´edure de la segmentation de textures de lettrines . . . 18

3.3 Pr´e-traitement . . . 18

3.3.1 Binarisation d’images . . . 19

3.3.2 D´ebruitage . . . 20

3.4 Extraction des traits . . . 20

3.4.1 D´etermination de couleur de traits . . . 20

3.4.2 Squelettisation . . . 22

3.4.3 Transform´ee en distance . . . 23

3.5 Caract´erisation des traits . . . 25

3.5.1 Epaisseur . . . .´ 27

3.5.2 Orientation . . . 27

3.5.3 Courbure . . . 32

3.6 Classification des traits . . . 32

3.6.1 Distance . . . 33

3.6.2 Construction d’arbre de grappes . . . 35

3.6.3 Inconsistance . . . 35

3.7 Segmentation des traits . . . 36

3.7.1 Voisinage . . . 36

3.7.2 Description de texture d’une image . . . 38

4 Exp´erimentation 39 4.1 L’environnement d’impl´ementation . . . 39

4.2 Impl´ementation . . . 39

4.3 R´esultat . . . 40

5 Conclusion 43 5.1 Conclusion . . . 43

5.2 Perspective . . . 43

Bibliographie 45

(6)

Table des figures

1.1 Lettrine . . . 1

2.1 Matrice de co-occurrence . . . 7

2.2 Fractal . . . 10

2.3 La dimension fractale . . . 11

2.4 Filtre de Gabor . . . 12

2.5 Le diagramme de Voronoi . . . 13

2.6 La triangulation de Delaunay . . . 13

2.7 Divise and conquer . . . 14

2.8 Balayage . . . 15

3.1 Otsu . . . 19

3.2 Binarisation . . . 20

3.3 Bruits . . . 21

3.4 La couleur de traits . . . 21

3.5 La couleur de traits . . . 22

3.6 Squelettisation . . . 23

3.7 La transformation en distance . . . 24

3.8 Les pixels de candidat . . . 26

3.9 La longueur . . . 27

3.10 L’´epaisseur . . . 28

3.11 L’´epaisseur approximative . . . 28

3.12 Transform´ee de Radon . . . 30

3.13 Projection d’un angle Θ dans la transforme de Radon . . . 31

3.14 Exemple d’orientation des traits . . . 31

3.15 La courbure de traits . . . 32

3.16 La vision humaine sur la longueur . . . 34

3.17 La longueur relative du trait . . . 34

3.18 La construction d’arbre . . . 35

3.19 Les distances de groupage . . . 36

3.20 La territoire de traits . . . 37

3.21 Une cat´egorie de texture dans une image . . . 38

4.1 D´ecoupage de la lettre H . . . 40

4.2 Erreur de fusion des traits . . . 41

4.3 Des points . . . 41

4.4 Des bruits . . . 42

(7)

5.1 La répétition des primitives . . . 44 5.2 La répétition des graviers . . . 44

(8)

Liste des tableaux

2.1 Indices de matrice de co-occurrence . . . 8

3.1 Proc´edure de segmentation de textures de lettrines . . . 18

3.2 La structure de donn´ees de texture d’images . . . 38

3.3 L’exemple de la description de texture . . . 38

(9)

Chapitre 1

Introduction

1.1 Probl´ ematique

Aujourd’hui, nous pouvons trouver facilement des applications de l’informatique dans la plupart des domaines de la vie. Dans les domaines qui ré-exploitent des documents, en particulier, avec des grosses masses de document, l’informatique s’exprime comme un outil très utilisé. Dans ce contexte, le traitement d’image fait une grande contribution. Il réalise automatiquement des traitements sur les images : analyse, caractérisation, détection des informations intéressantes, segmentation des zones homogènes, . . . Ces résultats nous permettent de développer des applications d’indexation ou celles de recherche basées sur le contenu d’image.

Ce stage s’intègre dans le projet NAVIDOMASS¹. Le but de celui-ci est de créer un outil qui permette d’indexer des images par le contenu pour faciliter le travail des historiens. Les images que nous traitons sont des lettrines (images de lettre dé- corées) (les images de la figure 1.1) sont difficiles à traiter et à reconnaˆıtre de part la masse d’informations qu’elles contiennent. Cette information est difficile à isoler et à segmenter.

(a) (b) (c)

Fig. 1.1 – Lettrine

1NAVigation Into DOcument MASSes - Navigation dans des masses de documents (http ://l3iexp.univ-lr.fr/navidomass/)

(10)

Pour indexer des images par le contenu, nous devons faire d’abord l’étude du contenu de l’image. Cette étude peut correspondre simplement à l’extraction de ca- ractéristiques globales, comme l’histogramme des couleurs par exemple. Cependant, ce type de caractéristique n’est pas suffisant et l’indexation d’images ne donne pas de résultats satisfaisant. C’est pourquoi nous avons pensé à extraire des caractéris- tiques de différentes zones de l’image. Cela pose encore une fois un autre problème qui n’est pas toujours facile à résoudre : la segmentation d’images.

Il est couramment utilisé des critères de similarité pour segmenter l’image en zones. Par exemple, nous pourrions utiliser le niveau gris comme critère. Dans le cas d’images de documents anciens, le niveau gris de chaque zone segmentée varie faiblement et toutes les zones semblent homogènes, ce qui ne donne pas de résultats intéressants. Pour améliorer la segmentation, nous avons cherché à utiliser d’autres caractéristiques d’image, et en particulier, nous avons principalement étudié la texture puisqu’elle est une caractéristique très particulière des différentes zones.

Les textures présentes sur des lettrines sont différentes des textures classiques de part la nature même des images. Elles sont des images obtenues par impression d’un tampon sur une feuille, et sont donc composées de traits. Il est donc nécessaire de ré-explorer les méthodes de la littérature, pour les adapter ou même de trouver des nouvelles méthodes.

1.2 Motivation

Les méthodes de segmentation de textures proposées dans la littérature pré- sentent souvent des limitations. Parmi ces méthodes générales, nous pouvons citer celles basées sur la matrice de co-occurrence [Haralick 73, Marc Bartels 05], ou reposant sur des filtres de Gabor [Dunn 98, Teuner 95, Dunn 95]. D’autres méthodes ont été élaborées pour des textures particulières, comme les textures répétitives ou naturelles. Bien que ces méthodes fonctionnent assez bien dans les expérimentations, les résultats obtenus en application réelle sur nos images ne sont pas satisfaisants.

Chaque type de texture a des caractéristiques particulières, auxquels il faut associer des méthodes adaptées.

Les lettrines sont des images composées de traits (la figure 1.1). Pour les segmenter convenablement, il conviendra d’extraire les traits qui les composent. Ce stage propose une méthode qui calcule des statistiques sur les traits qui composent la texture des lettrines. Cette approche diffère des approches classiques qui opèrent généralement au niveau des pixels. Les méthodes de segmentation à base de calcul de primitives sur des textures présentent deux grands avantages :

– Analyse la texture de manière similaire à la vision humaine. Les opérations réalisées au niveau des pixels ne collent pas directement à la vision humaine, contrairement à notre approche qui repose sur des calculs de statistiques et des comparaisons au niveau de primitives textures.

– Diminuer le temps de calcul dans la phase de classification, puisqu’il n’est plus

(11)

1.3. Objective nécessaire de comparer les pixels un-à-un mais plutôt des traits entre eux. De plus, nous pouvons être sur que le nombre de primitives texture est beaucoup plus petit que celui des pixels. Donc le nombre de comparaison, dans la phase de classification ou de segmentation, est diminué.

Cette approche repose donc sur une ´etape clef, qui consiste tout d’abord `a extraire les primitives de texture.

1.3 Objective

Le but de ce stage est de chercher une méthode pour segmenter les textures dans les lettrines. Une lettrine contient plusieurs textures réunies en plusieurs zones, et ce stage consiste à trouver un plus petit nombre de zones satisfaisant la condition :

”une zone contient une seule catégorie de texture”. Le résultat de la segmentation d’une image nous donnera donc un ensemble de zones homogènes.

Pour arriver à notre objectif, nous devons identifier des caractéristiques propres aux textures des lettrines. La seconde étape consiste alors à définir une procédure pertinente associée à ces caractéristiques. Enfin, ce stage doit également privilégier l’exactitude aux temps de calculs.

D’autre part, nous voulons proposer une structure qui représente l’image par des zones segmentées, elle reprend seulement des informations intéressantes des textures contenues dans une image. Cette structure facilite la démarche d’indexation et de recherche par le contenu.

Toutes les méthodes développées ont été testées sur une base de 916 images contenant des lettrines.

1.4 Contribution

La contribution de ce stage porte sur l’analyse et la segmentation des textures dans les lettrines. Ce travail doit faciliter et accélérer les travaux des historiens qui travaillent sur les lettrines [CESR 09]. Notre analyse des textures repose sur une nouvelle approche, basée sur l’extraction de primitives textures. Dans le cas des lettrines, ces primitives sont des traits, puisque présent dans toutes les lettrines. Notre méthode pourrait également être utilisée sur d’autres types d’images contenant des textures avec le désir d’améliorer les résultats de travaux pré-existants, par exemple, nous pouvons utilisons la matrice de co-occurrence ou la fonction d’auto-corrélation pour faire la statistique sur des primitives.

(12)

1.5 Environnement de stage

Le stage est effectué au sein de l’équipe Imedoc ² du laboratoire L3i ³ à l’uni- versité de La Rochelle en France. Créé en 1993, le laboratoire L3i comporte 80 chercheurs dont 34 permanents travaillant sur les domaines de l’Informatique, l’Image et leurs interactions.

Le L3i est le laboratoire de recherche du domaine STIC ⁴ de l’Université de la Rochelle associant très efficacement les chercheurs de l’IUT⁵ et du Pôle Sciences en informatique puisque la grande majorité des enseignants-chercheurs en Informatique et en Génie informatique de l’université de la Rochelle se retrouvent au sein du L3I.

En terme de politique scientifique, le laboratoire L3i est résolument tourné vers les réseaux de recherche régionaux (PRIDES ⁶, ERT ⁷ ”Interactivité numérique”), nationaux et internationaux dans les secteurs de visibilité de son action scientifique, et notamment autour du flux vidéo (cinéma), de l’ingénierie documentaire et de l’interactivité numérique. Ceci est consolidé par une politique volontariste de participation ou de pilotage de projets de recherche labellisés (ANR⁸, PCRD⁹, . . . ).

Son action internationale est actuellement renforcée avec des liens privilégiés avec les centres de recherche tels que le CVC ¹⁰ de Barcelone, le laboratoire Regim de Sfax (Tunisie), le MSI ¹¹(Unité de l’IRD¹²) et le MICA¹³ (unité internationale du CNRS ¹⁴) d’Hano¨ı (Vietnam) et l’Université de Kuala Lumpur (Malaisie).

Le laboratoire possède le label d’équipe d’accueil du Ministère de la Recherche (EA 2118) depuis 1997 et dispose par ailleurs du label d’ Équipe de Recherche Tech- nologique (ERT) avec ses partenaires, label attribué par le ministère de la recherche.

Les points d’entrée scientifiques de l’équipe Imedoc portent sur l’imagerie du vi- sible à l’invisible, les séquences d’images (de la pellicule au flux vidéo) et les systèmes d’informations documentaires (du patrimoine au document numérique).

2Image, M´edia Num´eriques et Documents

3Laboratoire Informatique, Image et Interaction - http ://l3i.univ-larochelle.fr/

4sciences et technologie de l’information et de la communication

5Institut Universitaire de Technologie de La Rochelle - http ://www.iut-larochelle.com/

6Pôle Régional de Recherche en Images, Données et Systèmes

7Equipe de Recherche Technologique´

8Agence nationale de la recherche - http ://www.agence-nationale-recherche.fr/

9Programme Cadre de Recherche et D´eveloppement

10Centre de vision par ordinateur

11Mod´elisation et Simulation Informatique

12’Institut de recherche pour le d´eveloppement

13Multim´edia, information, communication et application

(13)

Chapitre 2

Etat de l’art ´

2.1 Texture

La texture est une propriété de la surface, elle dépend l’aspérité ou la distribution des couleurs des surfaces. Elle est une composante riche en information d’une image, elle devient donc un paramètre très important pour la compréhension et l’interpré- tation d’image. Son importance dans l’interprétation d’images explique l’intérêt que l’on lui porte dans l’analyse d’images et le nombre de méthodes d’analyse d’images qu’elle est prise en compte.

Si on utilise la texture comme critère pour différencier des régions, une zone avec l’homogénéité texturelle est limitée par le contour qui est la variation d’intensité texturelle. Nous pouvons reconnaˆıtre la texture par des sens tactiles ou par la vision [Chen 00]. Une texture peut être fine ou grosse. Ou bien, elle est retrouvée par la distribution des couleurs. Elle est peut-être détectée par sa primitive - le textel (texture element), dans ce cas, la texture est une répétition des textels.

Cependant, on n’a pas pu trouver une définition formelle de ce qu’est la texture et c’est la raison pour l’abondance des méthodes pour déterminer ou différencier des textures. On se contente donc de trouver un modèle adéquat pour l’étude à mener.

En conséquence, les définitions de texture proposées varient selon les domaines de recherche et les conceptions des auteurs. Les caractéristiques utilisées souvent pour la conception des modèles sont :

– Une texture peut être périodique ou elle est une répétition d’un motif de base – Mais, une texture peut quand-même être non périodique, elle est désordonnée.

Dans le premier cas, on essaie de trouver le motif de base de la texture. Ensuite, on cherche à extraire des caractéristiques du motif et la fréquence des motifs. Ces caractéristiques vont représenter la texture. C’est un bon modèle pour les textures artificielles répétitives mais il est difficile d’appliquer ce modèle pour les autres types de texture. Par exemple, des textures naturelles sont par hasard formées, c’est difficile à définir le motif et la fréquence.

Le deuxième cas est juste pour la plupart des textures, pourtant, il ne suggère pas de déterminer l’orientation de la texture. Pour cela, on peut essayer de trouver la

(14)

distribution, la corrélation des couleurs. De fa¸con plus avancée, on essai d’appliquer le premier modèle à ces textures en généralisant le concept de motif.

L’analyse de texture est très utile dans la vision par ordinateur, elle a plusieurs application dans la vie réelle, par exemple, l’analyse d’image médicale, l’analyse de document, l’analyse d’empreinte digitale, . . . Les textures différentes nous aident

`

a distinguer diff´erentes surfaces, en cons´equence, elles facilitent la distinction des objets dans les images.

Pour reconnaˆıtre la texture, nous avons deux types opérations principaux : la classification de texture et la segmentation de texture. La classification de texture sélectionne une classe de texture (pré-définie) pertinente à chaque région de texture dans une image. La segmentation de texture cherche des contours des régions de texture. Pour résoudre ces problèmes, nous pouvons diviser ces problèmes en sous-problèmes comme l’extraction de caractéristiques de texture, l’extraction de primitives et le partitionnement de données. Pour ces deux opérations, nous devons réaliser la phase commune : extraction de caractéristiques de texture.

2.2 Extraction de caract´ eristiques de textures

Bien que les textures soient des informations difficiles à extraire, on a trouvé quelques méthodes pour extraire des caractéristiques de textures. Pourtant, ces mé- thodes n’ont pas donné des résultats parfaits.

L’extraction de caractéristiques de texture est la phase élémentaire de la classification et la segmentation de texture. De bon résultat à cette étape facilitent les

´

etapes suivantes.

Dans cette section, nous supposons que nous travaillons avec des images homo- gènes d’un point de vue texturelle, les caractéristiques extraites vont proprement représentées la texture. Nous considérons aussi que les images de textures sont défi- nies par une fonction qui se réfléchit sur le niveau de gris des pixels.

Les méthodes représentées dans ce qui suit sont des méthodes connues pour la texture et elles peuvent être profitables ou évoquent des idées intéressantes pour les textures des lettrines.

2.2.1 Matrice de co-occurrence

La matrice de co-occurrence est largement utilisée dans l’analyse de texture. Elle est très facile à mettre en œuvre et donne de bons résultats sur plusieurs types de texture. Dans la plupart des applications, les images utilisées sont représentée en niveaux de gris et la matrice de co-occurrence est connue sous le nom GLCM (Gray Level Co-occurrence Matrix).

(15)

2.2. Extraction de caractéristiques de textures La matrice de co-occurrence C d’un vecteur de déplacement (∆x,∆y) d’une imageI de la taille (m∗n) est définie par la formule 2.1

C_∆x,∆y(x, y) =

n

X

p=1 m

X

q=1

1, ifI(p, q) =iand I(p+ ∆x, q+ ∆y) =j

0, otherwise (2.1)

Pour améliorer la performance de la méthode, nous pouvons réduire la taille de la matrice. Pour le faire, nous pouvons grouper des niveaux gris de l’image par les techniques de partitionnement de données (clustering).

L’image 2.1 montre la fa¸con dont est calcul´ee la matrice de co-occurrence du vecteur de d´eplacement (1,0)

Fig.2.1 – Calcul de la matrice de co-occurrence d’une image

Le choix du vecteur de déplacement est toujours très important pour la réussite de la méthode. Normalement, nous voulons obtenir des matrices de co-occurrence de plusieurs vecteurs de déplacement sur des directions et des distances différentes.

Le problème est la combinaison des indices des matrices pour que nous pussions utiliser cette méthode avec des orientations et des échelles différentes. À côté de ce problème, nous voulons réduire le nombre de matrice de co-occurrence matrice cal- culé. Pour faire cela, nous devons évaluer l’importance des vecteurs de déplacement par rapport des types de textures. Plusieurs études ont été menées pour déterminer une distance ou une orientation optimale. En pratique, une distance courte donne généralement de bons résultats [Karathanassi 00, Iftene 04].

La masse d’informations sur cette matrice est trop grande et nous ne pouvons pas retirer directement des remarques utiles pour l’analyse de texture. Quatorze indices intermédiaire (Table 2.1) sont proposé par Haralick en 1973 [Haralick 73]. Ces indices réduisent l’information contenue dans la matrice de co-occurrence et permettent une meilleure discrimination entre les différents types de textures.

En outre, nous pouvons réduire le nombre d’indice utilisé dans 14 caractéristiques de Haralick. Pour l’indépendance de la taille d’image et pour l’expression en termes de probabilité, nous utilisons la matrice de co-occurrence normalisée pour calculer

(16)

Tab.2.1 – Quatorze indices de matrice de co-occurrence propos´e par Haralick

(17)

2.2. Extraction de caract´eristiques de textures

des indices.

2.2.2 Fonction d’auto-corr´elation

Du fait que la grossièreté (ou la finesse) soit une propriété facilement reconnais- sable de la texture, cette mesure est utile pour l’analyse de texture. Dans des images de texture, des pixels voisins sont connexes ou dépendants, toutefois, des distances du voisinage sont différentes, elles dépendent de la grossièreté de la texture. Basé sur cette propriété, nous pouvons utiliser la fonction d’auto-corrélation pour analyser des textures. Le résultat de la fonction d’auto-corrélation d’une image I(x, y) de taille (m, n) est une matrice A donnée par la formule 2.2.

A(u, v) = Pm

x=0

Pn

y=0I(x, y)∗I(x+u, y+v) Pm

x=0

Pn

y=0I(x, y)² (2.2)

Plus la texture est grossi`ere, plus sa matrice d’auto-corr´elation diminue douce- ment.

Pour calculer entièrement l’auto-corrélation, nous devons d’abord réduire proprement la taille de l’image car la taille de la matrice est égale celle de l’image.

Sinon, nous calculons seulement des ´el´ements importants de la matrice.

2.2.3 Méthodes basées modèle

Les méthodes basées modèle supposent que la texture est formée par un modèle et on considère que les paramètres de ce modèle sont des caractéristiques de la texture.

Par exemple, si on utilise un champ aléatoire de Markov ¹⁵ comme modèle, en considérant que l’image est un champ aléatoire de Markov. La probabilité qu’un pixel re¸coive une intensité doit être positive et markovienne. La caractéristique markovienne émet l’hypothèse que la distribution d’intensité des pixels dépende uni- quement de ses voisins, elle est indépendante du reste de l’image. Ce modèle vise

`

a capturer des statistiques de ces voisinages et de les représenter comme des para- mètres du modèle. Dans quelques modèles basés sur le champ aléatoire de Markov, on utilise l’équivalent entre le champ aléatoire de Markov et celui de Gibbs pour extraire des paramètres avec la formule (2.3) de probabilité de Gibbs [Cross 83, Besag 74, Derin 87].

P(X=x) = 1

Ze^−U(x) (2.3)

OùU(x) est une fonction d’énergie etZ une constante de normalisation appelée la fonction de partition. La fonction d’énergie est généralement calculée sur la clique formée par des pixels voisins. La fonction d’énergie est ensuite exprimée en terme

15Markov Random Field - MRF

(18)

de fonction potentielle Vc(x) dans l’ensemble des cliques Q:U(x) =P

c∈QVc(x).

Un autre exemple de modèle repose sur le modèle fractal. Un objet fractal (2.2) est une forme géométrique complexe qui présente une auto-similarité à différentes

´

echelles, il s’inscrit donc dans une hiérarchie de structures géométriques.

Fig.2.2 – Fractal

En analyse de texture, la dimension fractale, qui est une mesure du degré d’ir- régularité d’un objet, décrit une certaine propriété de la texture. Le modèle fractal de texture est basé essentiellement sur l’estimation par des méthodes spatiales de la dimension fractale de la surface représentant les niveaux de gris de l’image. La dimension fractale d’un ensemble A est définie par la formule 2.4

D= logN

log (1/r) (2.4)

Telle que N soit le nombre total de copies distinctes similaires à A et 1/r cor- respond au facteur d’échelle avec lequel Aest divisé.

Plusieurs méthodes ont été développées pour calculer la dimension fractale dans le cas auto-similaires. La plus utilisée est la méthode des ”boˆıtes”, qui est considérée comme la plus simple pour le calcul de la dimension fractale. Les mesures consistent dans le nombre de ”boˆıtes” nécessaires pour couvrir l’objet fractal ; les dimensions des boˆıtes correspondent au pas de mesure.

Par exemple, dans l’illustration 2.3, la rectangle est divis´ee par 8∗14 = 112 boites (r = 1/112), et il y a 26 boites qui contiennent une partie de la courbe (en gris) (N = 26). Donc,

D= log 26

log 112 (2.5)

2.2.4 Filtrage

Les filtres sont très utilisés pour extraire des caractéristiques de texture. Nous pouvons trouver des exemples qui utilisent des filtres simples comme le filtre de Ro- berts, le filtre laplacien ou les filtres plus compliqués comme le filtre de Fourier ou celui de Gabor.

(19)

Fig.2.3 – La dimension fractale

Avec le filtre de Roberts ou le filtre laplacien, nous pouvons faire la convolution et extraire des contours de l’image de texture. En suite, nous faisons directement la segmentation basée sur ces contours ou en calculant la densité de contours, qui peuvent être utiles pour l’analyse de textures.

La transformation de Fourier permet de passer d’une représentation de l’image dans le domaine spatial à une représentation dans le domaine fréquentiel. On peut ainsi analyser le contenu fréquentiel de ce signal, et ensuite le travailler où l’analyser en profondeur.

L’extraction de paramètres de texture à partir de la transformée de Fourier permet d’établir un modèle compact pour les textures périodiques. Normalement, nous choisissons quatre directions (0ô,45ô,90ô,135ô) et certaines fréquences. Le nombre de fréquences dépend de la taille de l’image. Typiquement, avec une image de taille M∗N(M <=N), les fréquences choisies sont 2⁰,2¹, ...,2^t avec t= logM−1.

Un filtre de Gabor est une sinuso¨ıde modul´ee par une gaussienne (la figure 2.4).

Dans le domaine fréquentiel, il s’exprime comme étant une gaussienne centrée sur une fréquence déterminée. En 2D, un banc de filtres de Gabor va s’exprimer comme

´

etant un ensemble de filtres, chacun sélectionnant une fréquence particulière dans une dimension particulière.

L’utilisation d’un banc de filtres de Gabor permet d’extraire de l’image consi- dérée des informations pertinentes, à la fois en espace et en fréquence, relatives à la texture. Avec les filtres de Gabor, nous pouvons analyser la texture à différentes

´

echelles et diff´erentes orientations.

(20)

Fig. 2.4 – Filtre de Gabor [AlainBoucher 08]

2.2.5 Le diagramme de Vorono¨ı

Le diagramme de Vorono¨ı et la relation avec la triangulation de Delaunay Le diagramme de Vorono¨ı (la partition de Voronoi ou la pavage de Vorono¨ı) a

´

eté largement étudié dans le domaine de la géométrie et appliqué dans différentes disciplines. En ce qui concerne l’analyse de texture, elle réalise la division de manière dynamique par rapport à l’information image. Cette segmentation est très utile si tant est que la texture est aléatoire. Ensuite de la phase de construction du diagramme de Vorono¨ı, nous pouvons extraire des paramètres par des statistiques des caractéristiques géométriques des diagonales dans le diagramme de Vorono¨ı.

Le diagramme de Vorono¨ı (la figure 2.5)consiste à générer un partitionnement du plan en polygones, ces polygones s’appellent des sites du diagramme. Pour faire la génération, nous devons préciser des germes, pour chaque germe, il y un site équi- valent. Ces sites doivent satisfaire la condition suivante : les germes de deux sites voisins sont équidistants à la frontière (l’arête commune).

Nous présentons ici aussi la triangulation de Delaunay, le graphe dual du diagramme de Voronoi, qui est utile pour la construction du diagramme de Voronoi. La triangulation de Delaunay d’un ensembleP de points du plan est une triangulation DT(P) telle qu’aucun point de P n’est à l’intérieur du cercle circonscrit d’un des triangles deDT(P) (la figure 2.6 (a)).

La triangulation de Delaunay d’un ensemble discret P de points est le graphe dual du diagramme de Voronoi associé à P, c’est à dire les points de P sont des germes pour construire le diagramme de Voronoi. Ces points sont reliés entre eux par une arête si les sites sont voisins. On remarquera que les arêtes du diagramme de Vorono¨ı sont sur les médiatrices des arêtes de la triangulation de Delaunay (la figure 2.6 (b)), alors nous pouvons construisons facilement le diagramme de Voronoi si la triangulation de Delaunay équivalente a été construite.

Pour construire le diagramme de Voronoi, nous pouvons donc générer directement le diagramme de Voronoi ou réaliser d’abord la construction de la triangulation de Delaunay. Plusieurs algorithmes ont été proposés pour les faire, ces algorithmes peut-être groupés dans trois classes principales : méthodes incrémentales, méthodes

(21)

Fig. 2.5 – Le diagramme de Voronoi

(a) (b)

Fig. 2.6 – La triangulation de Delaunay

(22)

”divide and conquer”, et m´ethodes de balayage.

Algorithmes du type ”divide and conquer”

Les algorithmes du type ”divide and conquer” consistent à diviser le problème général en sous-problèmes de plus petites tailles. La division se fait de fa¸con récursive jusqu’à obtenir des problèmes simples à résoudre (lorsqu’il ne reste plus que trois points par exemple). Chaque sous-problème est traité de fa¸con indépendante, et une

´

etape de fusion est n´ecessaire pour unifier les sous-probl`emes. L’image 2.7 est une illustration pour la construction d’une triangulation de Delaunay du type ”divide and conquer”.

Fig. 2.7 – Divise and conquer

Algorithmes de balayage

Les algorithmes de balayage construisent les structures géométriques en balayant le plan par une droite suivant un axe privilégié, et mettent à jour la structure chaque fois qu’un point est rencontré. Fortune a proposé son algorithme de ce type. L’algorithme de balayage de Fortune est connu comme l’algorithme le plus efficace pour construire le diagramme de Voronoi d’un ensemble fini S de points du plan. Cet algorithme consiste à balayer le plan avec une ligne horizontale (ou verticale, au choix) en tenant à jour un certain nombre d’informations nécessaires à la détermination des sommets du diagramme de Voronoi. Remarquons d’abord que le lieu des points

´

equidistants entre un site et la droite de balayage est une parabole.

En conséquence, si i et j sont deux sites, D la droite de balayage, et d la fonction distance, le point d’intersection p des deux paraboles est tel que d(i, p) = d(p,D) = d(j, p). Donc l’intersection des deux paraboles est à égale distance des deux sites, et, lors du déplacement de la droite de balayage, cette intersection décrira la mé- diatrice des deux sites, c’est-à-dire précisément la frontière que l’on recherche entre les zones associées aux sites. Toutefois, toutes les médiatrices ne font pas partie du diagramme de Voronoi. Il faut donc gérer, pendant le balayage, les événements de création et de destruction des arcs de paraboles, dont on sait qu’ils généreront des segments de médiatrice faisant partie du diagramme de Voronoi. L’enveloppe des arcs de paraboles utiles à la mise à jour du diagramme de Voronoi peut être vue

(23)

(a) (b)

Fig. 2.8 – Balayage

diagramme de Voronoi, lorsque la ligne de balayage se d´eplace.

Un arc de parabole sera créé à chaque fois que la ligne de balayage rencontre un site et un arc de parabole disparaˆıtra lorsqu’il sera réduit à un point. Dans ce cas, les deux arcs de paraboles voisins de celui qui disparaˆıt s’intersectent au point auquel se réduit ce dernier.

Algorithmes incr´ementaux

Les algorithmes incrémentaux consistent insérer les germes, les uns après les autres, et modifier la structure chaque itération. La modification ne se fait que de fa¸con locale. Pour la triangulation de Delaunay incrémentale, lors de l’insertion d’un point p, seuls les triangles dit ”en conflit” avec p sont modifiés.

Pour appliquer le diagramme de Voronoi, nous devons définir une distance appro- priée entre points de l’image et choisir un ensemble de sites. La distance est définie en considérant les attributs de bas niveau de l’image et, en particulier, l’information fournie par le niveau gris. Une fois la distance définie, le problème suivant qui se pose est la sélection d’un ensemble de sites adéquats pour cette tâche. D’une part, les sites doivent être représentatifs du contenu de l’image ; D’autre part, chaque structure significative doit en contenir au moins un. Dans le cas des images en niveaux de gris, les maxima de niveaux gris s’avèrent être des candidats naturels pour les sites.

Extraction de caract´eristiques des sites

Après construction du digramme de Vorono¨ı, les caractéristiques des sites de Vorono¨ı vont être extraites pour les autres applications. Par exemple, dans la seg-

(24)

mentation de textures, les sites avec des caractéristiques similaires sont regroupés pour construire des régions de texture uniforme. Les moments calculés sur les sites de Vorono¨ı sont des caractéristiques utiles, qui reflètent à la fois la distribution spatiale et la forme des sites dans l’image.

Les moments d’ordres (p+q)ième d’une région R avec les coordonnées (x₀, y₀) sont définis par la formule 2.6.

m_pq= Z Z

R

(x−x₀)^p(y−y₀)^qdxdy (2.6)

2.3 Segmentation et classification de textures

Avec ces méthodes d’extraction des caractéristiques de textures ou de modélisa- tion de textures, nous pouvons trouver plusieurs travaux connexes à la texture. À coté des travaux de création de textures comme la synthèse de texture ou la créa- tion de formes à partir des textures, nous avons la segmentation de textures et la classification de textures. Ces applications servent à la compréhension du contenu des images.

2.3.1 Segmentation de textures

La segmentation de textures est un problème difficile parce que généralement l’on n’a pas de connaissances à priori sur les types et le nombre de textures dans l’image. En fait, aucune connaissance sur les textures existantes dans l’image n’est nécessaire afin de faire la segmentation de texture. La seule chose nécessaire est une manière pour dire que deux textures sont différentes.

Les deux approches générales de l’exécution texture segmentation sont équiva- lentes aux méthodes de la segmentation d’images : l’approche de région ou l’approche de contour. Dans l’approche de région, on essaie d’identifier les régions de l’image qui ont une texture uniforme. Les pixels ou de petites régions sont fusionnés en raison de la similitude de certaines propriétés de texture. Les régions ayant diffé- rentes textures sont alors considérées comme des régions segmentées. Cette méthode a l’avantage que les frontières des régions sont toujours fermées et, par conséquent, les régions contenant différentes textures sont toujours bien séparées. Cependant, il faut préciser le nombre de textures différentes présentes dans l’image à l’avance. En outre, les seuils de similitude des valeurs sont nécessaires.

L’approche par contour cherche les différentes textures dans les régions adja- centes. Ainsi, les frontières (contour) sont détectées où il existe des différences dans la texture. Dans cette méthode, nous n’avons pas besoin de connaˆıtre le nombre de régions dans la texture de l’image à l’avance. Toutefois, les trous qui apparaissent sur les frontières posent un problème, les régions ne sont plus fermées et ne sont plus clairement séparées.

(25)

2.3. Segmentation et classification de textures Ces deux approches reposent sur la recherche de différences ou de similarité de textures. Cependant, la comparaison entre les pixels ne peut pas mener à un bon résultat parce que l’intensité des pixels individuels ne représente pas la nature de la texture. Pour segmenter correctement, nous devons faire la comparaison sur des autres objets, qui représente mieux la nature de la texture. Par exemple, nous pouvons extraire pour comparer des sous-fenêtres en divisant l’image en plusieurs fenêtres. Cela cause un problème, quelle taille de fenêtres va être utilisée ? Cette taille doit être assez petite pour détecter correctement la position des changements de textures et elle doit aussi être assez grande pour que les caractéristiques extraites représentent bien des textures.

Le diagramme de Vorono¨ı présenté précédemment est aussi une solution, nous pouvons faire la comparaison des textures dans les sites de Vorono¨ı. En outre, nous pouvons faire une extraction des primitives ou des éléments de textures. Pourtant, cette solution n’est pas toujours facile à réaliser.

2.3.2 Classification de textures

La classification de textures a pour but de déterminer la classe de chaque texture. Nous avons plusieurs techniques pour la faire, elles sont divisées en deux types principaux, la classification supervisée et non supervisée. Cependant, appliquer la classification supervisée sur les textures n’est pas pratique, parce que nous ne savons par à l’avance le nombre de classes de textures de l’image.

Dans les méthodes de classification non supervisée, k-means est une méthode très connue. K-means est une méthode de partitionnement de données, qui vise à au partitionnement de n observations en k grappes (cluster) dans lesquels chaque observation appartient à la grappe avec la moyenne la plus proche. Il y a aussi des variations de cette méthode, qui supprime des grappes vides ou ajoute de fa¸con rai- sonnable des grappes. Dans ce cas, le nombre de grappes n’est pas toujours égal à k.

Pour appliquer cette méthode, il faut connaitre à priori le nombre de classes ce qui n’est pas pratique pour les textures. Nous devons donc estimer le nombre de classes de textures en fonction des autres caractéristiques d’images.

En outre, nous pouvons utiliser les méthodes hiérarchiques pour la classification non supervisée. Dans ces méthodes, on construit d’abord un arbre de données, puis on définit des critères pour couper cet arbre, les sous-arbres coupés sont les grappes de résultat. Plusieurs fa¸cons existent pour construire l’arbre de données.

Par exemple, on considère au début que chaque observation est une grappe. Tant que le nombre de grappes est supérieur à 1, on groupe les deux grappes les plus proches. En réitère cette étape afin d’arriver à un nombre de grappes égal à un.

Le critère pour couper l’arbre de données peut être la hauteur de sous-arbres, la distance minimale entres les grappes ou l’inconsistance maximales d’un sous-arbre.

(26)

Segmentation de textures de lettrines

3.1 Caract´ eristiques de lettrines

Les lettrines sont des images de lettres décorées. Elles sont caractérisées par leur lettre et par leur arrière plan. Dans la plupart des lettrines, leur arrière plan est composé de traits (voir figure 1.1). Nous nous concentrons sur cette caractéristique pour faire l’extraction des caractéristiques de textures de lettrines.

A cot´` e des traits, nous trouvons aussi des points et des lettres. Cependant, nous pouvons considérer que les points sont les courts traits et les lettres sont des gros traits. Alors, avec une fa¸con de modéliser des traits, nous pouvons représenter la texture de lettrines par ses éléments, qui peuvent être des traits, des points ou des lettres.

3.2 Proc´ edure de la segmentation de textures de let- trines

Nous utilisons la procédure 3.1 pour réaliser la segmentation de textures de lettrines. Cette procédure va être expliquée dans les sections suivantes.

Pr´e-traitement → Extraction des traits → Caract´erisation des traits

→ Classification des traits → Segmentation des traits.

Tab.3.1 – Proc´edure de segmentation de textures de lettrines

3.3 Pr´ e-traitement

Dans cette étape, nous faisons des opérations auxiliaires, qui facilitent des étapes suivantes et augmentent la performance de la procédure. Nous faisons d’abord la bi-

(27)

3.3. Pr´e-traitement

narisation de l’image, en suite, nous la d´ebruitons.

3.3.1 Binarisation d’images

Les images de lettrines sont des images obtenues par impression d’un tampon sur une feuille, en conséquence, leurs origines sont des images binaires. Désormais, la binarisation de ces images ne perd pas ses caractéristiques principales.

Les images fournies sont des images en niveaux de gris, pour les binariser, nous devons trouver des seuils pertinents pour d´ecider quelles intensit´es vont correspondre au blanc et le reste au noir. Nous pouvons utiliser un seuil fixe, par exemple, seuil

´

egal 128 pour les 256 intensités grises. C’est un seuil général pour toutes les images.

M´ethode d’Otsu

Un seuil comme celui en haut produit des résultats agréables. Cependant, nous pouvons utiliser des méthodes de partitionnement de données pour trouver un seuil qui est plus adapté à l’image concrète. Par exemple, avec la méthodek-means avec k = 2, nous pouvons grouper des intensités grises en deux groupes : noir et blanc.

Dans cette procédure, nous utilisons la méthode d’Otsu pour chercher le seuil, cette méthode produit rapidement le bon seuil pour une image d’entrée.

En fait, la méthode d’Otsu est une méthode de partitionnement de données et on a appliqué cette méthode pour réduire le nombre d’intensité de gris dans les images, il choisit des seuils pour minimiser les variances intraclasses. Dans le cas de la binarisation, il choisit le seuil pour minimiser la variance intraclasse de noir et blanc (la figure 3.1).

Fig.3.1 – M´ethode d’Otsu

La figure 3.2 démontre le résultat (la figure 3.2 (b)) de la binarisation avec le seuil d’Otsu de l’image d’entrée 3.2 (a).

(28)

(a) (b) Fig. 3.2 – Binarisation

3.3.2 D´ebruitage

Nous connaissons plusieurs méthodes pour débruiter des images, par exemple, nous pouvons appliquer le filtre gaussien ou le filtre médian. Ces filtres sont difficile- ment applicables dans le cas d’images binaires, puisque seules deux valeurs de pixels (noir et blanc) sont présentes.

Nous considérons que les bruits d’une image sont des composantes connexes très petites, qui n’attirent pas notre attention. Pour débruiter ces images, nous définissons un seuil pour dire que les composantes connexes avec le nombre de pixels inférieur

`

a un seuil sont du bruit, et nous les nettoyons. Il y a `a la fois les bruits de couleur blanc (la figure 4.4 (a)) et ceux de couleur noire (la figure 4.4 (b)).

3.4 Extraction des traits

Pour extraire des traits, nous devons déterminer quelle est leur couleur parmi les deux (blanc et noir). Ensuite, nous extrayons des traits par squelettisation basée sur la transformation en distance, qui nous permet de bien séparer des traits et de retenir quelques caractéristiques importantes des traits.

3.4.1 D´etermination de couleur de traits

La précision de la couleur de trait a une importance sur l’extraction des traits et en conséquence, elle influence le résultat de la procédure de segmentation. Cepen- dant, quand nous regardons certaines images de lettrine, ce n’est pas toujours facile

`

a dire quelle couleur est celle des traits (la figure 3.4 (b)).

Nous voulons une couleur de traits qui est la meilleur pour la segmentation de

(29)

3.4. Extraction des traits

(a) (b)

Fig.3.3 – Bruits

(a) (b)

Fig.3.4 – La délicatesse à détermination de la couleur de traits

(30)

textures à la fin et nous pensons qu’un découpage plus fin d’une image en morceaux va nous aider à bien caractériser des traits. Cela nous permet de bien segmenter la texture. Désormais, nous cherchons la couleur qui ont le nombre de composantes connexes plus grand. Une comparaison du nombre de composantes connexes de chaque couleur (la caractéristique d’Euler [Pratt 07]) va nous permettre de faire cela.

NE = 315 NE = -7

CC = blanc CC = noir

(a) (b)

Fig.3.5 – La délicatesse à détermination de la couleur de traits

Les figures 3.5 démontre de cas différent de la sélection de couleur de traits.

Le N E est le nombre d’Euler, il est la soustraction du nombre des composantes connexes blances `a celui des composantes connexes noires. Dans la figure 3.5 (a), le nombre d’Euler N E = 315, ¸ca veut dire que le nombre des composantes connexes blances est plus grand que lequel des composantes connexes noires, par cons´equent, la couleur choisie (CC) pour des traits est le blanc. Par contre, dans la figure 3.5 (b), la couleur choisie est le noir.

3.4.2 Squelettisation

Après de faire la détermination de couleur de traits, nous cherchons une méthode

`

a extraire des traits.

Nous considérons que l’image de lettrine contient seulement des traits, elle est une disposition spatiale des traits. Le résultat d’une exacte méthode va être un ensemble qui satisfait que chaque trait soit équivalent à un de ses éléments et vice versa. Pour notre but de la segmentation de textures de lettrine, une bonne méthode d’extraction de traits doit représenter bien les traits avec les deux propriétés suivantes :

– La position, – La forme.

La position va ˆetre utile dans la phase de segmentation parce qu’elle est la base

(31)

3.4. Extraction des traits pour dire quels traits sont voisins, cela est nécessaire pour l’étape élémentaire de la segmentation. Dans cette étape, nous décidons seulement l’homogénéité des traits voisins, nous ne pouvons pas travailler directement sur des traits lointains. La forme est nécessaire pour la classification, nous disons que deux traits sont semblables si leurs formes sont identiques. Dans ce cas, les traits semblables vont être groupés dans une même classe.

La squelettisation permet la conservation de ces propriétés de traits. Le squelette (la figure 3.6 (b)) d’une forme est une version mince de cette forme, qui est à équi- distance de ses frontières. D’une méthode classique de squelettisation, nous pouvons utiliser l’érosion successives pour squelettiser une forme. L’érosion s’arrête si elle va rompre la forme actuelle (la figure 3.6).

origine squelette

(a) (b)

Fig. 3.6 – La squelettisation

La squelette d’un trait est une courbe mince en son cœur, elle peut donc retenir la position du trait. Cependant, avec la méthode classique, nous ne conservons que la longueur et la courbure du trait. Cette méthode ne conserve pas l’épaisseur, d’une propriété importante du trait.

3.4.3 Transform´ee en distance

Pour retenir l’épaisseur, nous pouvons utiliser la carte de distance (la figure 3.7), qui peut à la fois générer la squelette et fournir l’information sur l’épaisseur.

Une carte de distance est le résultat d’une transformée en distance d’une image binaire. C’est une nouvelle représentation de cette image, de même taille que l’image d’origine. Dans cette représentation, la valeur de chaque pixel est sa distance au pixel de contour le plus proche.

(32)

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 1 2 2 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 2 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 2 2 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 3 2 2 2 1 1 1 0 0 0 0 0 0 0 0 0 0 1 2 3 3 3 3 2 2 2 1 1 0 0 0 0 0 0 0 0 0 1 2 3 3 3 2 2 2 2 2 1 0 0 1 1 0 0 0 0 1 1 2 3 3 2 2 1 1 1 2 1 0 0 1 1 0 0 0 0 1 2 2 2 2 2 1 1 0 1 2 1 0 0 1 1 0 0 0 1 1 2 2 1 1 1 1 0 0 1 2 1 0 0 1 1 0 0 0 1 2 2 2 1 0 0 0 0 1 1 2 1 0 0 1 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

origine carte de distance

(a) (b)

Fig. 3.7 – La transformation en distance

(33)

3.5. Caract´erisation des traits

Plusieurs métriques existent pour réaliser la transformation. La distance utilisée entre deux points (x₁, y₁) et (x₂, y₂) est définie par :

– La distance euclidienne : p

(x₁−x₂)²+ (y₁−y₂)², – La distance de Manhattan : |x₁−x₂|+|y₁−y₂|, – La distance d’´echiquier : max(|x₁−x2|,|y₁−y2|).

Dans ce stage, nous utilisons la distance d’échiquier, la distance entre deux pixels voisins est égale à 1 (pour le système de voisinage8-voisin).

Après avoir calculé la transformée en distance, nous faisons en suite la squelettisation. Nous la réalisons par deux étapes :

– D´etermination des pixels de candidat du squelette, – Erosion.´

Rappelons que le squelette d’une forme est équidistante de ses frontières. Sur la carte de distance, les maximas sont les pixels équidistants des frontières de la forme, nous retenons d’abord les maximas de la carte de distance. La figure 3.8 (a) montre les maximas retenus, les * sont les pixels qui ne sont pas choisis et les 0 sont les pixels du fond.

De plus, pour chaque forme, le squelette est unique parce que sa transformation en distance est unique, ainsi, nous ajoutons proprement des pixels qui lient des groupes détachées de maximas d’une forme (les * dans la figure 3.8 (b)). Reconnais- sons que deux groupes adjacents peuvent être reliées par un seul pixel.

Après la détermination des pixels de candidat du squelette, nous avons une version amincie de la forme, cependant, cette version peut être épaisse. Nous réalisons en suite l’érosion pour amincir au maximum le squelette, cette érosion est la squelettisation classique de la forme des pixels candidats.

3.5 Caract´ erisation des traits

Après d’extraire des traits, nous allons les étiqueter pour les différencier et les caractériser. Les caractéristiques extraites vont être nécessaires pour les étapes suivantes.

Un trait contient une infinité de caractéristiques, cependant, il n’est pas néces- saire d’extraire beaucoup de caractéristiques pour différencier des traits. Nous choisissons l’épaisseur, l’orientation et la courbure comme les caractéristiques de traits.

La différenciation des traits par ces caractéristiques est proche de la fa¸con que la vision humaine le fait. Nous n’utilisons pas la longueur du trait parce qu’elle ne ca- ractérise pas bien le trait, c’est à dire que deux traits avec une longueur différentes peuvent être groupés dans une même classe (la figure 3.9).

(34)

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 * * * * 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 * 2 2 * 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 * * * * 1 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 * * * 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 * * 2 * * 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 * * * * * * 0 0 0 0 0 0 0 0 0 0 0 0 0 0 * * 3 * * * * * 0 0 0 0 0 0 0 0 0 0 0 0 * * 3 3 * * * * * * 0 0 0 0 0 0 0 0 0 0 * * 3 3 3 3 * 2 2 * * 0 0 0 0 0 0 0 0 0 * * 3 3 3 * * 2 2 2 * 0 0 1 1 0 0 0 0 * * * 3 3 * * * * * 2 * 0 0 1 1 0 0 0 0 * 2 * * * * * * 0 * 2 * 0 0 1 1 0 0 0 * * 2 2 * * * * 0 0 * 2 * 0 0 1 1 0 0 0 * 2 2 2 * 0 0 0 0 1 * 2 * 0 0 1 1 0 0 1 * * * * * 1 0 0 1 1 * * * 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 * 2 2 * 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 * 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 * 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 3 3 3 * 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 3 3 3 0 0 2 2 2 0 0 0 1 1 0 0 0 0 0 0 0 3 3 0 0 0 0 0 2 0 0 0 1 1 0 0 0 0 0 2 * 0 0 0 0 0 0 0 2 0 0 0 1 1 0 0 0 0 0 2 2 0 0 0 0 0 0 0 2 0 0 0 1 1 0 0 0 * 2 2 2 0 0 0 0 0 1 * 2 0 0 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

maximas liaison

(a) (b)

Fig. 3.8 – Les pixels de candidat

(35)

Fig. 3.9 – La longueur

3.5.1 Epaisseur´

Avec le squelette que nous prenons depuis la carte de distance, c’est facile à retirer les informations sur l’épaisseur d’un trait. Chaque pixel du squelette est équi- distant aux frontières et la valeur de ce pixel est sa distance à la frontière (c’est à dire la distance au pixel le plus proche sur la frontière), alors, l’épaisseur du squelette de chaque pixel du squelette est approximativement égale au double de sa valeur (dans le cas de l’épaisseur paire (la figure 3.10 (a)) ou le double de valeur - 1, dans le cas de l’épaisseur paire(la figure 3.10 (b))). Ainsi, nous pouvons utiliser les valeurs du squelette pour caractériser l’épaisseur.

En fait, cette ´evaluation n’est pas formelle, elle n’est qu’une approximation de la mesure r´eelle.

3.5.2 Orientation

Nous considérons que l’orientation est aussi une caractéristique pour classifier des traits dans les lettrines, elle peut être inutile dans des autres cas de la réalité.

Les traits ne sont pas toujours des lignes droites, la fa¸con `a mesurer l’orientation de trait n’est donc pas simple. De plus, une forme compliqu´ee peut avoir raisonna- blement plusieurs orientations.

Nous proposons une m´ethode pour mesurer l’orientation principale qui est bas´ee sur la transformation de Radon.

(36)

´epaisseur = 3∗2 = 6 ´epaisseur= 3∗2−1 = 5

(a) (b)

Fig. 3.10 – L’´epaisseur

Fig. 3.11 – L’´epaisseur approximative

(37)

Transformation de Radon

La transformation de Radon d’une image est la projection de cette image avec des angles différents. Le nombre d’angle est précisé avant la transformation, par exemple, nous pouvons utiliser la transformation de Radon avec 180 angles différents (de 0 à 179 degrés). Le centre de l’image est choisi comme le pivot de la rotation pour avoir des projections d’angles différentes. Le résultat de la transformation est une matrice RT de la taillem∗n, avecm est le nombre d’angles etnest le nombre de pixels du diamètre de l’image.

Les valeurs de la matrice RT est pr´ecises par (la figure 3.12) :

RT(i(θ), x⁰) =R_θ(x⁰) = Z ∞

−∞

f(x⁰cosθ−y⁰sinθ, x⁰sinθ+y⁰cosθ)dy⁰ (3.1) Avec

– θsoit l’angle de projection,

– f(a, b) soit l’intensit´e du pixel `a la position (a, b) de l’image, –

i(θ) = θ∗m

π (3.2)

–

x⁰ y⁰

=

cosθ sinθ

−sinθ cosθ

∗ x

y

(3.3)

D´etermination de l’orientation de traits

Chaque ligne de la matriceRT_m∗nest équivalente à la projection de l’image d’un angle précis, la lignetreprésente la projection de l’angleθ= ^π∗t_m. L’énergie (formule 3.4) de chaque ligne représente la force d’une orientation de l’image, la ligne t est

´

equivalente `a l’orientation θ+^π₂ = ^π∗t_m +^π₂ (la figure 3.13).

e(t) =

n

X

i=1

RT²(t, i) (3.4)

Maintenant, nous pouvons comparer les forces des diff´erentes orientations de l’image pour pr´eciser son orientation principale P O (formule 3.5), qui a la plus grande force :

P O(s) =arcmax

t=1..ne(t) (3.5)

Les figures 3.14 (a) et (b) montrent deux résultats de cette méthodes avec deux images d’entrée différentes.

Cette approche fonctionne aussi bien sur des images avec plusieurs traits, son r´esultat est l’orientation dominante de l’image entr´ee (la figure 3.14 (c)).

(38)

Fig.3.12 – Transform´ee de Radon

(39)

Fig. 3.13 – Projection d’un angle Θ dans la transforme de Radon

80ô 173ô 230ô

(a) (b) (c)

Fig.3.14 – Exemple d’orientation des traits

(40)

3.5.3 Courbure

Nous définissons la courbure d’un trait comme la valeur maximale du rapport entre l’orientation d’un trait par rapport à l’orientation orthogonale. Si l’orientation d’un trait estα, son orientation orthogonale estα+^π₂, sa courburec(s) est calculée par la formule 3.6.

c(s) = e(t_s)

e(to_s) (3.6)

Avec t_s soit la ligne équivalent à l’orientationα du trait s(l’angle de projection θ=α−^π₂) ettos soit la ligne équivalent à l’orientation orthogonaleα+ ^π₂ du trait s(l’angle de projection θ=α).

Cette définition de courbure exprime assez bien la courbure réelle, c’est à dire qu’un trait courbe a sa courbure plus grande que la courbure d’un trait droit (la figure 3.15 (a) et (b)), la valeur de courbure est dans (0,1). De plus, sur deux traits droits, le trait le plus mince aura une courbure plus petite (la figure 3.15 (b) et (c)).

Courbure 0.2214 0.1583 0.1112

(a) (b) (c)

Fig.3.15 – La courbure de traits

3.6 Classification des traits

Maintenant que nous avons extrait des caractéristiques des traits, chaque trait est représenté par un vecteur de trois caractéristiques : l’épaisseur, l’orientation et la courbure. Nous pouvons ré-exploiter des méthodes de classification pour classer ces traits. Par exemple, nous pouvons utiliser la méthode k-means (voir 2.3.2). Cepen- dant, cette méthode ne segmente pas bien les traits, parce que nous devons préciser le nombre de classes de traits par avance et ce n’est pas convenable pour notre cas.

Pour bien segmenter des traits, il faut que nous améliorons des méthodes de ce type ou chercher d’autres méthodes qui peuvent s’adapter convenablement pour la segmentation de traits.

Pour ce sujet de stage, nous utilisons la m´ethode classification hi´erarchique pour

(41)

3.6. Classification des traits

sans connaˆıtre le nombre de classe pr´ealablement.

3.6.1 Distance

Pour classifier des traits, nous devons définir d’abord une distance entre deux vecteurs de caractéristiques de trait, qui exprime la similarité ou la différence entre deux traits. Une bonne distance doit bien représenter ces notions, c’est à dire que la distance entre deux traits différents est plus grande que celle entre deux traits similaires.

Nous avons trois caractéristiques pour chaque vecteur, l’épaisseur est toujours importance pour la différenciation tandis que l’importance de deux autres caracté- ristiques est variée. L’orientation et la courbure deviennent moins importantes si les traits à comparer sont trop court.

Nous essayons d’utiliser la distance connue euclidienne pour les traits, avec deux traits et leurs caractéristiques (l’épaisseur, l’orientation et la courbure, tour à tour) : t₁ = (e₁, o₁, c₁), t₂ = (e₂, o₂, c₂), cette distance est définie par la formule 3.7.

d=p

(e₁−e₂)²+ (o₁−o₂)²+ (c₁−c₂)² (3.7) Cependant, cette distance accorde la mˆeme importance aux trois caract´eristiques.

En raison de cela, nous utilisons des poids différents pour exprimer l’importance des caractéristiques dans la distance, une caractéristique est un élément important de la distance si le poids équivalent est grand. Dans ce cas, nous assignons un grand poids à l’épaisseur et des petits poids pour les deux autres caractéristiques. Ici, nous fixons le poids de l’épaisseur à 1 (p_e = 1), les autres poids varient en fonction des segments (0,1) (po, pc∈(0,1)) :

d=p

(e₁−e₂)²+p_o(o₁−o₂)²+p_c(c₁−c₂)² (3.8) De plus, l’importance de ces caractéristiques varie en fonction de la longueur du trait. Il faut donc que nous définissions les poids en fonction de la longueur du trait. En fait, pour la vision humaine, les caractéristiques ”long” et ”court” d’un trait dépendent à la fois de la longueur et de l’épaisseur. Nous pensons que deux traits de même longueur paraitront différents si leurs épaisseurs sont différentes (la figure 3.16). C’est pour cela que nous avons défini une longueur relative du trait (la formule 3.9).

l_relative = l

2∗e (3.9)

Avec l soit la longueur réelle (par pixel) du squelette du trait et e la moitié de l’épaisseur réelle du trait (e est la l’épaisseur extraite du squelette, voir la figure 3.17).

Maintenant, nous pr´ecisons une r`egle pour les poids en fonction de cette longueur relative :

1. po =pc= 1 silrelative ≥2,

2. po =pc=lrelative−1 si 1≤lrelative<2

(42)

(a) (b)

Fig. 3.16 – La vision humaine sur la longueur

Fig. 3.17 – La longueur relative du trait

(43)

3.6. Classification des traits

3.6.2 Construction d’arbre de grappes

Pour classifier des traits par la méthode hiérarchique, nous devons d’abord construire l’arbre de grappes des traits, c’est l’étape principale de la classification.

Dans cette construction, quand nous avons plus d’une grappe, nous groupons les deux grappes les plus proches au sein d’une même grappe (la figure 3.18). Pour reconnaˆıtre deux grappes plus proches, nous appliquons la distance définie précédem- ment. La distance entre deux grappes (la distance de fusion) est la distance entre deux traits plus proches qui appartiennent à deux grappes différentes. Au début, nous considérons que chaque trait est une grappe.

Fig.3.18 – La construction d’arbre

A la fin de cette construction, nous avons un arbre binaire qui nous permet` de classifier facilement les traits avec le nombre de classe pr´ecis´e ou l’inconsistance maximum d’un sous-arbre (la section 3.6.3).

3.6.3 Inconsistance

L’inconsistance d’un sous-arbre est un critère pour décider de la conservation ou de la fusion de deux sous-arbres. Avec un seuil d’inconsistance précisé par avant, nous conservons un sous-arbre si son inconsistance est inférieure à ce seuil, par contre, nous le coupons sinon.

Le calcul de l’inconsistance nous demande de tracer tout le sous-arbre, cependant, pour simplifier la méthode et améliorer la performance de l’algorithme, nous utilisons seulement trois distances de fusion, un de ce sous-arbre (d1), deux autres de deux de ses sous-arbres immédiats (d₂ etd₃) (la figure 3.19). L’inconsistance est calculée par la formule 3.10.

I = d₁−d¯

σ (3.10)