Architectures parallèles pour la morphologie mathématique géodésique

(1)

HAL Id: tel-00003040

https://tel.archives-ouvertes.fr/tel-00003040

Submitted on 23 Jun 2003

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

D. Noguet

To cite this version:

D. Noguet. Architectures parallèles pour la morphologie mathématique géodésique. Micro et nanotech-nologies/Microélectronique. Institut National Polytechnique de Grenoble - INPG, 2002. Français. �tel-00003040�

(2)

THÈSE

présentée par

D

OMINIQUE

N

OGUET

pour obtenir le grade de

DOCTEUR

de l'INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE

(Arrêté ministériel du 30 mars 1992)

Spécialité:

MICRO-ÉLECTRONIQUE

ARCHITECTURES PARALLÈLES

POUR LA MORPHOLOGIE MATHÉMATIQUE GÉODÉSIQUE

Date de soutenance: 26 janvier 1998

Composition du jury:

Président:

Didier

Demigny

Rapporteurs:

Didier

Demigny

Jean-Pierre

Dérutin

Pierre

Marchal

Examinateurs:

Dominique

David

Alain

Guyot

Fernand

Meyer

Michel

Ollivier

(3)

(4)

THÈSE

présentée par

D

OMINIQUE

N

OGUET

pour obtenir le grade de

DOCTEUR

de l'INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE

(Arrêté ministériel du 30 mars 1992)

Spécialité:

MICRO-ÉLECTRONIQUE

ARCHITECTURES PARALLÈLES

POUR LA MORPHOLOGIE MATHÉMATIQUE GÉODÉSIQUE

Date de soutenance: 26 janvier 1998

Composition du jury:

Président:

Didier

Demigny

Rapporteurs:

Didier

Demigny

Jean-Pierre

Dérutin

Pierre

Marchal

Examinateurs:

Dominique

David

Alain

Guyot

Fernand

Meyer

Michel

Ollivier

(5)

(6)

à ma famille, à Alice, à Valérie, à mes amis.

(7)

(8)

Remerciements

Ce travail de recherche a pu être mené à bien grâce aux compétences et au soutien de nom-breuses personnes. Je suis heureux qu'il me soit donné ici l'occasion de les remercier vivement. Ainsi, je souhaite exprimer ma gratitude:

à Étienne Pochon, Pierre Darier, Pierre Jeuch, Pierre Puget, pour leur accueil au sein

du Département Systèmes.

à Didier Demigny, pour avoir accepté non seulement la lourde tâche de rapporteur, mais également pour m'avoir fait l'honneur de présider le jury de cette thèse.

à Jean-Pierre Dérutin qui a pris la charge du travail de rapporteur, en y apportant son regard d'architecte.

à PierreMarchal, rapporteur, qui m'a fait part de nombreuses remarques pour l'améliora-tion du document nal.

à FernandMeyer, pour avoir apporté l'analyse du spécialiste de la morphologie

mathéma-tique dans ce jury.

à Dominique Davidqui a suivi mes recherches tout au long de cette thèse, en apportant ses points de vue tant sur le travail réalisé que sur le manuscrit. Merci pour tes prises de position pour faire valoir mes travaux au sein du laboratoire, ainsi que pour la conance et la liberté dont j'ai bénécié.

à Michel Ollivier qui, bien que basé de l'autre côté de la France, m'a apporté un soutien

inestimable. Ses compétences techniques, sa sympathie et sa volonté de me faire découvrir le côté industriel de ce projet ont été un encouragement permanent.

à Alain Guyot qui a bien voulu prendre la direction de cette thèse dans des conditions délicates. Je tiens à le remercier pour les conseils et les discussions fructueuses que nous avons eues.

à MichelSchaeffer, directeur initial de cette thèse, pour sa compréhension et son

enthou-siasme.

à RosolinoLionti, responsable CEA au début de ce projet. Il m'a fait proter de ses éclair-cissements sur les circuits programmables et les architectures pour la vision.

à Alain Merle qui m'a fait partager son enthousiasme pour la morphologie géodésique. Je le remercie d'avoir mis ce projet sur des rails solides. Faut-il te remercier de m'avoir repeint la première version du manuscrit?

à DidierLattard, pour son expertise sur les méthodes de conception, pour les heures passées

derrière la station de travail. Merci pour la relecture du manuscrit, ainsi que pour les moments passés à prendre du recul...

à Dominique Derou qui s'est proposée volontaire pour la relecture du manuscrit (avec le sourire!). Pour ta gentillesse et pour ton souci de mon sort, encore merci.

à mon père, dont la qualité de la relecture et le souci de rigueur du mathématicien ont largement contribué à la qualité du manuscrit.

à ValérieNassqui a réalisé la triple performance de supporter mon humeur massacrante de

(9)

n de thèse, de traduire mes idées dans un Français compréhensible et d'avoir dactylographié la totalité du manuscrit en LATEX, bien que réfractaire à l'idée même d'allumer l'ordinateur.

à Louis Chabanas, qui a dessiné la carte du module SPIDDO. Ses compétences, doublées d'une gentillesse et d'un sens aigu de la pédagogie, m'ont donné envie de passer des heures à lui poser des questions. Dommage que je n'aie pas eu plus de temps pour le faire.

à GérardRobert, pour ses éclaircissements sur les circuits programmables et pour le temps passé à répondre à mes interrogations.

à Georges Gonon, pour ses coups de main en C.

à nos ingénieurs système, André Jacquin et Gérard Hatchadourian, qui ÷uvrent dans l'ombre pour que nous puissions travailler dans de bonnes conditions.

à Michel Paccaud, Henri Grateau et Laurent Hérault qui m'ont hébergé dans leur

bureau. Merci à Henri pour le montage vidéo et son soutien logistique lors de la soutenance. Merci à Laurent, dont j'ai dévalisé la bibliothèque, pour ses conseils.

aux agents du groupe Microsystèmes et Vision que j'ai côtoyés au quotidien et dont j'ai pu apprécier la sympathie. Une pensée pour Patrick.

à la joyeuse équipe de stagiaires et thésards qui ont largement participé à l'ambiance agréable: Jean-Luc, Colette, Dominique, Patrick, Noël, Pierre-Hugues, Christine, Joël, Gilles, Yanis, Phi-lippe, Sébastien, PhiPhi-lippe, Eric, Olivier, Frédéric, Valérie, Florent, Jérôme, Stéphane, Nicolas, Yann, Nicolas, Vincent...

à Pierre-Hugues Rebut pour nos discussions perplexes sur Mentor et VHDL.

à Caroline Privault, pour les crayons de couleur, pour ses compétences en théorie des

graphes et pour son regard unique.

à Nicolas Pellerin, avec qui j'ai eu plaisir à travailler.

aux personnes avec lesquelles j'ai eu l'occasion de discuter à EDIXIA et qui m'ont fourni de bien belles images...

à ma famille et à mes amis pour leur soutien de tous les instants. à Alina Mogaet Moncef Gabboujpour leurs encouragements.

à ceux qui, aux quatre coins du monde, ont répondu à mes S.O.S. J'ai toujours été impres-sionné par la pertinence et la courtoisie de ces anonymes, qui ont eu à c÷ur de me débloquer de situations délicates.

au forum de discussion de l'association Gutemberg, pour son expertise en LATEX.

à tous ceux qui m'ont apporté leur enthousiasme et leurs encouragements durant toutes mes années d'études.

(10)

Table des matières

Abréviations

1 Notations

3 Introduction

5 1 Segmentation d'images par morphologie mathématique géodésique

11

1.1 Introduction . . . 11

1.2 Géodésie et idempotence en morphologie mathématique . . . 11

1.2.1 Introduction . . . 11

1.2.2 Distance et géodésie dans les images . . . 12

1.2.3 Géodésie et morphologie mathématique . . . 13

1.2.4 Exemple de la reconstruction binaire . . . 15

1.2.5 Conclusion . . . 16

1.3 Famille d'opérateurs basés sur la géodésie et l'idempotence . . . 16

1.3.2 Extension de la géodésie aux images numériques: la reconstruction numé-rique . . . 16

1.3.3 Étiquetage de régions . . . 18

1.3.4 Extrema régionaux . . . 20

1.3.5 Squelette par zones d'inuence . . . 22

1.3.6 Ligne de partage des eaux . . . 22

1.4 Exemples d'applications de la reconstruction . . . 28

1.4.2 Ouverture et fermeture par reconstruction . . . 28

1.4.3 Chapeau haut de forme . . . 29

1.5 Utilisation de la LPE et marquage . . . 32

1.5.2 Placement des marqueurs a priori . . . 32

1.5.3 Vers un marquage automatique . . . 33

1.5.4 Sélection des marqueurs selon un critère de contraste . . . 33

1.5.5 Sélection de marqueurs selon un critère de taille ou de forme . . . 36

1.6 Conclusion . . . 40 vii

(11)

2 Algorithmes et architectures

43

2.2 Classes d'architectures et d'algorithmes . . . 44

2.2.2 Classication des architectures . . . 44

2.2.3 Modes de balayage de l'image . . . 47

2.2.4 Algorithmes parallèles . . . 47

2.2.5 Algorithmes séquentiels . . . 48

2.2.6 Algorithmes à balayage optimisé . . . 51

2.3 Algorithmes et architectures à ot de données simple pour le calcul de la LPE . . 55

2.3.2 LPE par chute d'eau . . . 55

2.3.3 LPE par immersion . . . 56

2.3.4 Algorithme parallèle pour la ligne de partage des eaux . . . 58

2.3.5 Algorithme séquentiel pour la LPE par intégration . . . 60

2.3.6 Algorithmes à balayage dépendant des données pour la LPE . . . 63

2.4 Parallélisme gros grain pour le calcul de la LPE . . . 68

2.4.2 Répartition des données entre processeurs . . . 68

2.4.3 Calcul de la LPE dans une image partitionnée . . . 70

2.4.4 Performances . . . 72

2.4.5 Vers une autre répartition des tâches . . . 73

2.5 Machine massivement parallèle pour le calcul de la LPE . . . 74

2.5.2 Automate cellulaire et calcul de la LPE . . . 74

2.5.3 Calcul des zones d'inuence géodésiques . . . 76

2.5.4 Récurrence entre niveaux . . . 78

2.5.5 Structure matérielle . . . 79

2.5.6 Vers une réalisation matérielle . . . 80

2.5.7 Résultats de simulations . . . 81

2.6 Conclusion . . . 87

3 Architecture pipe-line à balayage optimisé

91

3.2 Unication des opérateurs . . . 92

3.2.2 Opérateurs utilisant des sources connues a priori . . . 92

3.2.3 Algorithme générique à propagation séparée . . . 95

3.2.4 Opérateurs utilisant des sources inconnues a priori . . . 97

3.2.5 Algorithme générique à propagation imbriquée . . . 99

3.2.6 Aperçu des principaux organes de notre architecture . . . 100

3.2.7 Conclusion . . . 102

3.3 Augmentation de la bande passante mémoire . . . 102

(12)

Table des matières ix

3.3.2 Extraction de voisinage sur un ot régulier . . . 103

3.3.3 Parallélisme de données et organisation des pixels en mémoire . . . 103

3.3.4 Codage des adresses . . . 107

3.3.5 Réseau d'interconnexions . . . 111

3.3.6 Conclusion . . . 111

3.4 Structure de la le d'attente . . . 112

3.4.2 Parallélisme de données et le d'attente . . . 112

3.4.3 Parallélisme de ux et de contrôle dans la le d'attente . . . 114

3.4.4 Conclusion . . . 120

3.5 Parallélisme et séquencement des opérations . . . 120

3.5.2 Unité de test de propagation . . . 120

3.5.3 Séquencement des opérations lors de la propagation . . . 121

3.5.4 Anticipation et cohérence des données . . . 123

3.5.5 Phase de recherche des sources de propagation . . . 125

3.5.6 Bilan et ot de traitements . . . 126

3.5.7 Conclusion . . . 130

4 Mise en ÷uvre

131

4.2 Environnement et choix d'une structure système . . . 131

4.2.2 Choix de la taille des images . . . 132

4.2.3 Système hôte . . . 133

4.2.4 Choix d'un module déporté . . . 134

4.2.5 Conclusion . . . 135

4.3 Méthodologie de conception . . . 135

4.3.2 Choix d'un outil de description . . . 136

4.3.3 Validation des opérateurs de traitement d'images . . . 136

4.3.4 Description de modèles synthétisables . . . 137

4.3.5 Description VHDL du module dans son environnement . . . 137

4.3.6 Conclusion . . . 140

4.4 Choix d'une technologie cible . . . 140

4.4.2 Les ASIC . . . 140

4.4.3 Besoins du module SPIDDO . . . 141

4.4.4 Conclusion . . . 143

4.5 Démonstrateur . . . 143

4.5.2 Les circuits programmables . . . 144

4.5.3 Utilisation de la reprogrammabilité en cours de traitement . . . 145

4.5.4 Synthèse logique sur technologie FPGA . . . 145

4.5.5 Résultats de synthèse et choix d'un composant . . . 147

4.5.6 Spécications fonctionnelles . . . 149

(13)

4.5.8 Conclusion . . . 150

Conclusion générale

153 Annexes

157 A Éléments de topologie discrète

159

A.1 Images binaires et numériques . . . 160

A.2 Rappels sur les graphes . . . 160

A.3 Trame et voisinage . . . 161

A.4 Connexité dans les images . . . 163

A.5 Homotopie . . . 164

A.6 Connexité et distance . . . 166

B Notions de morphologie mathématique

169

B.1 Un cadre théorique pour la morphologie mathématique . . . 169

B.2 Propriétés élémentaires des opérateurs morphologiques . . . 170

B.3 Transformations de base . . . 171

B.4 Propriétés algébriques de l'érosion et de la dilatation . . . 174

B.5 Ouvertures et fermetures . . . 175

B.6 Chapeau haut-de-forme . . . 176

B.7 Filtres morphologiques . . . 177

B.8 Gradients morphologiques . . . 178

B.9 Squelettisation . . . 180

B.9.1 Squelette par boules maximales . . . 180

B.9.2 Érodé ultime . . . 182

B.9.3 Squelettes connexes . . . 182

Liste des dénitions

185 Liste des algorithmes

187 Bibliographie

189

(14)

Abréviations

ASIC

Application Specic Integrated Cicuit: circuit intégré spécique.

AHDL

Altera Hardware Description Language: langage de descripiton matériel pro-posé par Altera.

BV

Bassins Versants.

CLA

Contrôleur Local des Adresses.

DSP

Digital Signal Processor: processeur de traitement du signal.

EDIF

Electronic Design Interchange Format: format d'échange de schéma électro-nique.

EPLD

Embedded Programmable Logic Device: circuit programmable.

FIFO

First In First Out: premier entré premier sorti.

FAH

File d'Attente Hiérarchique.

FPGA

Field Programmable Gate Array: circuit programmable.

GIZ

Geodesical Inuence Zones: zones d'inuence géodésique.

HdF

chapeau Haut de Forme.

HDL

Hardware Description Langage: langage de description matériel.

IGOR

ImaGe processOR.

LPE

Ligne de Partage des Eaux.

LPM

Library of Parameterized Modules: librairie de modules paramétrables.

LUT

Look Up Table: table d'équivalence.

MFA

Mémoire de File d'Attente.

MIMD

Multiple Instruction stream, Multiple Data stream: machine à ots d'ins-tructions multiples et à ots de données multiples.

MISD

Multiple Instruction stream, Single Data stream: machine à ots d'instruc-tions multiples et à ot de données simple.

NOP

No Operation: processeur inactif.

PC

Personal Computer: ordinateur personnel.

PE

Processeur Élémentaire.

pF

poids Fort.

pf

poids faible.

RAM

Random Access Memory: mémoire à accès aléatoires.

RISC

Reduced Instruction Set Computer: processeur à jeu d'instructions réduit. 1

(15)

RTL

Register Transfer Level: description au niveau transfert de registre.

SIMD

Single Instruction stream, Multiple Data stream: machine à ot d'instruc-tions simple et à ots de données multiples.

SISD

Single Instruction stream, Single Data stream: machine à ot d'instructions simple et à ot de données simple.

SFS

Segment de File Simple.

SKGIZ

Skeleton by Geodesical Inuence Zones: squelette par zones d'inuence géo-désique.

SKIZ

Skeleton by Inuence Zones: squelette par zones d'inuence.

SPMD

Single Program Multiple Data: programme unique, données multiples.

SPIDDO

Superscalar Processor for Image Data Driven Operators: processeur su-perscalaire pour le traitement d'images à balayage dépendant des données.

TD

Transformée Distance.

TDG

Transformation Distance Géodésique.

TLCA

Table Locale de Conversion d'Adresses.

VHDL

Very high speed integrated circuit Hardware Description Langage: langage de description de matériel pour le développement rapide de circuits intégrés (VHDL est une norme).

VLIW

Very Long Instruction Word: machine à mots d'instructions très longs.

VLSI

Very Large Scale Integration circuit: circuit à haut niveau d'intégration.

VME

Versatil Module Europe.

(16)

Notations

Symboles de relation

a ^ b,(resp: a _ b) : inf(a,b), (resp. sup(a,b)); V

p2X

(f(p))(resp: W

p2X

(f(p))) : borne inférieure (resp. supérieure) de f sur le domaine X ;

Ensembles, graphes et images

x;X : élément x, ensemble X ;

Xc _{: ensemble complémentaire de l'ensemble X ;}

^

B : transposé de l'ensemble B ;

card(X) : cardinal de X, nombre d'éléments de X ; = : soustraction ensembliste;

D;D

0 : domaine de dénition d'une image; p(x;y) : pixel p de coordonnées x et y ;

G=(X;U) : graphe dont l'ensemble des sommets est X et celui des arêtes U ; NG(p) : voisinage de p dans la grille G;

p;q : chemin reliant p et q ;

,p;q : ensemble des chemins reliant p et q ; l( ) : longueur du chemin ;

dE,dc ,4

,dc

,8 : distance euclidienne, distance

city-block, distancechessboard; c : fonction c de support

;

Opérateurs morphologiques

B()

(p) : boule de rayon centrée en p;

ou (resp: ou ") : dilatation (resp. érosion);

() ou ()

(resp:

() ou "()

) : dilatation (resp. érosion) par une boule de rayon ; HdFB(X) (resp: HdF

B(X)) : chapeau haut de forme (resp. haut de forme conjugué) de X avec l'élément structurant B ;

B (resp: B) : ouverture (resp. fermeture) avec l'élément structurant B ; SBM(X) : squelette de X par boules maximales;

Ult(X) : érodé ultime de X ; IZ(Y) : zone d'inuence de Y ;

SKIZ(Y) : squelette de Y par zones d'inuence;

SKIZD(Y) : squelette de Y par zones d'inuence, basé sur la distance D ; U(f) : ombre de f ;

(17)

LPE(f) : ligne de partage des eaux de f ;

MR(f)(resp: mR(f)) : maxima (resp. minima) régionaux de f ; g(f);g

+ (f);g

,

(f) : gradient, gradient extérieur, gradient intérieur de f ; SDynh

(f) : seuillage par dynamique de f et de valeurh; er(X) : étiquetage des composantes connexes de X ;

~;;} : transformation tout ou rien, épaississement, amincissement;

Géodésie

B()

gX(p) : boule géodésique dans X de rayon centrée en p; () gX ou () gX (resp: () gX ou "()

gX) : dilatation (resp. érosion) géodésique de taille dans Xi;

gX (resp: gX) : ouverture (resp. fermeture) par reconstruction dans X ; HdFR

B(X) : chapeau haut de forme par reconstruction (resp. haut de forme conjugué par reconstruction) de X avec l'élément structurant B ;

gX(Y) : reconstruction négative de Y dans X ; IZgX(Y) : zones d'inuence géodésique de Y dans X ;

SKIZgX(Y) : squelette de Y par zones d'inuence géodésique dans X ; gS : épaississement géodésique dans S ;

dgS : distance géodésique dans S ;

Algorithmes et opérateurs logiques

3 : condition requise; :; a : négation;

: aectation; MOD : modulo;

pf; pF : poids faible, poids fort;

(M) : code binaire de l'adresse de la mémoire M ; T((M)) : taille (nombre de bits) de (M); n,m

(18)

Introduction

Mesurez tout ce qui est mesurable et rendez mesurable tout ce qui ne l'est pas encore.

Galilée

L

e traitement d'images est une branche du traitement du signal qui connaît un essor important depuis quelques décennies. L'évolution des techniques matérielles et algorith-miques a largement participé à l'engouement des scientiques pour cette discipline, intérêt qui s'est vite transformé en optimisme eréné. La communauté pensait que la seule évolution tech-nologique permettrait de bâtir des systèmes de calcul capables d'analyser une scène avec une pertinence approchant celle de l'÷il humain. Elle a cependant rapidement compris que la tâche qu'elle s'était xée était extrêmement complexe. Les dicultés théoriques nouvelles ne permet-taient pas de restreindre le traitement d'images à une extension bidimensionnelle du traitement du signal monodimensionnel dont la modélisation commençait à donner des résultats satisfai-sants. Les problèmes auxquels se trouvaient confrontés les scientiques rendaient les industriels réticents, d'autant plus que les coûts des systèmes de traitement étaient très élevés.

Diérentes écoles se sont développées pour étudier de nouvelles théories en vue d'une meilleure appréhension de la notion même d'image. Elles cherchent à répondre à l'interrogation: Que voit-on dans une image? . Le problème est que la machine n'y voit pas la même chose que nous! Pour elle, une image se résume à un ensemble de points de luminance variable, soit un nombre gigantesque de signaux élémentaires véhiculant chacun une quantité d'information quasi nulle. Pour extraire l'information d'une image, on essaie d'établir des relations entre les signaux élémentaires an de diminuer le nombre de sources d'information en augmentant la quantité d'information contenue dans chacune d'elle. C'est la segmentation. Le type de relation utilisée dépend de la nature de l'information recherchée. On parle de segmentation en régions, contours, texture.

Aujourd'hui, la situation a évolué vers le réalisme. Le recul nous aide à mieux cerner les possibilités et les limites du traitement d'images. Les systèmes de traitement se sont démocratisés et leurs prix ont chuté pour des performances toujours accrues. L'augmentation actuelle du nombre des systèmes de vision sur plate-forme Personal Computer (PC) illustre bien cette évolution. En 1996, 50 % des applications de vision industrielles en France évoluent sur ce type de matériel. Autre signe de cette tendance: les fabriquants réputés dans le domaine des carte d'acquisition sur PC, comme MATROX, proposent maintenant des cartes de traitements achant des performances élevées.

(19)

Contexte de la vision industrielle

Notre étude se place dans le cadre d'un partenariat entre le LETI et EDIXIA, fabricant de systèmes de vision. Ce contexte nous pousse à prendre en considération la position du marché de la vision industrielle. On observe actuellement trois tendances principales.

L'évolution du marché des systèmes génériques (OEM) prouve la démocratisation des sys-tèmes de vision et représente 14 % du marché français en 96.

À l'opposé, les applications spéciques constituent toujours un secteur important. Elles né-cessitent de fortes compétences en traitement d'images et en dispositifs d'éclairages qui restent coûteux. Les traitements mis en ÷uvre pour ces applications utilisent des opérateurs pouvant être complexes, qui doivent souvent travailler à des cadences élevées. Ces méthodes sont variées et touchent dans 80 % des cas le domaine du contrôle: inspection, contrôle dimensionnel.

Enn, on trouve les systèmes à coût très bas de type capteur intelligent utilisés dans des applications de détection élémentaire.

Actuellement, les unités de traitement des systèmes de vision industrielle se composent d'un processeur général assisté, pour certaines tâches spéciques, par des co-processeurs dédiés. Ceux-ci implantent ecacement les opérations dites de bas niveau comme le ltrage, la corrélation, la morphologie mathématique élémentaire, la détection de contours. Ces étapes de traitement sont donc aujourd'hui bien maîtrisées.

Besoins actuels

Le besoin d'opérateurs de traitement câblés plus évolués se fait sentir aussi bien pour les mar-chés OEM que pour celui des applications spéciques. Les opérateurs de segmentation sont mal couverts par les circuits existants dans les systèmes industriels. Or, l'extraction de paramètres signicatifs d'une image brute ou prétraitée se rencontre dans de très nombreuses applications. Nous nous proposons d'étudier des opérateurs et les architectures qui leur sont associées pour répondre à ce besoin. Les fortes contraintes de coût conduisent à des solutions intégrées devant implanter des algorithmes généraux qui donnent accès à une gamme d'opérateurs variés. Ces opé-rateurs devront couvrir un large spectre d'applications. L'implantation d'opéopé-rateurs génériques et aisément paramétrables permettra de toucher le marché OEM, mais diminuera également le temps de développement sur une application et donc le coût d'ingénierie associée. Il sera pri-mordial que les opérateurs implantés soient faciles à mettre en ÷uvre. En eet, on notera que le prix d'un système de vision (250 kF en moyenne) se répartit en parts égales entre matériel et prestations, dont le développement logiciel de traitement d'image représente environ 30 %. Des opérateurs diciles à paramétrer ne peuvent être envisagés avec de telles contraintes. En-n, ces traitements devront être robustes pour diminuer le coût lié aux dispositifs d'éclairages, qui constitue une part importante du coût total d'un système de vision, et pour abiliser les traitements en milieu industriel où les conditions de prise d'image sont diciles à maîtriser.

Choix d'une méthode de segmentation

Des études sur les opérateurs de segmentation montrent clairement qu'il n'existe pas de technique universelle mais que chaque approche donne un résultat plus ou moins bon selon le type d'application. Une étude, menée par le Groupe De Recherche (GDR) sur le Traitement Du Signal et des Images (TDSI) (voir par exemple (Cocquerez et al., 1995)), souligne cette

complémentarité.

Nous avons écarté un certain nombre de méthodes qui ne répondent pas au critère de fa-cilité d'utilisation sur des applications industrielles variées. Citons par exemple les approches

(20)

Introduction 7 markoviennes pour lesquelles l'ajustement des paramètres de la fonction d'énergie est délicat et qui exigent une connaissance a priori de la scène observée, les méthodes de croissance de régions par relaxation (Monga, 1988) dans lesquelles le critère d'arrêt est dicile à déterminer automatiquement, les contours actifs sensibles à l'initialisation (Bossart, 1994).

Selon l'étude du GDR, les méthodes mixtes contour-région se révèlent des approches per-tinentes, dans lesquelles les défauts de chacune des deux méthodes se compensent au moins partiellement.

La morphologie mathématique, apparue dans les années 60 sous l'impulsion de G.Matheron

et J.Serra, met en avant l'adéquation imparfaite entre la combinaison linéaire de signaux uti-lisée dans le traitement du signal classique et les phénomènes rencontrés en traitement d'images comme l'occlusion. Elle expose un ensemble de concepts non linéaires décrivant cette catégorie de phénomènes. À partir d'observations de caractéristiques typiques de la notion d'images, la morphologie mathématique s'est développée, touchant à la fois les aspects théoriques et appli-qués. Cette interaction permanente en fait une théorie proche des préocupations du traiteur d'images.

La morphologie mathématique propose une méthode de segmentation basée sur la construc-tion de régions à partir d'informaconstruc-tions contenues dans l'image de gradient: la Ligne de Partage des Eaux (LPE). Lors de l'élaboration de la LPE, la propagation des données s'adapte aux carac-téristiques de l'image au cours du traitement, sans qu'il soit nécessaire de xer de paramètres. L'ensemble des points sources de la propagation reste le seul choix laissé à l'utilisateur. Ces points désignent les objets à segmenter. L'utilisateur dispose donc d'une méthode automatique d'extraction des objets qu'il a préalablement sélectionnés dans l'image. De plus, les contours obtenus sont fermés par construction. Cette approche correspond d'autant mieux à nos attentes, que la désignation des objets à segmenter est simple, dans bien des applications où la position des objets est connue approximativement.

Au sens large, la LPE peut être vue comme un opérateur mettant en jeu la propagation de données en fonction d'une contrainte imposée par une image de référence. Ce comportement est partagé par toute une famille d'opérateurs issus de la morphologie mathématique géodésique appliqués à l'extraction de zones signicatives de l'image (comme les extrema), à l'identication et au comptage d'objets (comme l'étiquetage) ou au ltrage adaptatif (comme la recons-truction). Ces opérateurs sont, en particulier, largement utilisés pour l'élaboration automatique d'une image de marquage pour la LPE, lorsqu'une désignation directe ne peut être eectuée. Les paramètres nécessaires à ces opérateurs sont issus de grandeurs physiques facilement appréhen-dables à partir des données présentes dans l'image. On trouvera les notions de sélection selon le critère vertical de contraste ou celui, horizontal, de taille ou de forme.

Ces opérateurs permettent l'extraction de données caractéristiques et/ou de mesures sur l'image: coordonnées de points contours, nombre et taille des régions. De ce fait, ils sont classés parmi les traitements de niveau intermédiaire tout en s'acquittant des tâches de ltrage dévolues aux opérateurs de bas niveau.

Les opérateurs de morphologie mathématique basés sur la géodésie et l'idempotence ré-pondent aux critères que nous nous sommes imposés, comme nous le montrerons plus en détail dans le chapitre 1:

robustesse:

le résultat est souvent stable lorsque les paramètres varient. Par exemple, le posi-tionnement de la LPE est peu sensible au posiposi-tionnement des marqueurs dans les objets.

généricité :

deux niveaux de généricité sont à noter dans le cas de ces traitements. Du point de vue du concepteur d'architecture, les opérateurs présentent des caractéristiques communes que nous mettrons en évidence pour élaborer des algorithmes génériques paramétrables (cf.

(21)

chapitre 3). Du point de vue de l'utilisateur, ces traitements sont ecaces dans une large gamme d'applications, comme le prouve l'abondante littérature sur le sujet.

facilité de mise en ÷uvre:

les seuls paramètres à régler dans une chaîne de traitements par morphologie géodésique sont issus de grandeurs liées à des informations physiques de l'image et donc mesurables simplement. Le résultat donné par ces opérateurs a un aspect intuitif qui aide l'utilisateur à dénir rapidement la chaîne de traitements la plus appropriée à son application. Enn, un ensemble de chaînes de traitements types a été identié en fonction des cas à traiter et guide le choix de l'utilisateur. Nous avons répertorié ces chaînes dans (Noguet, 1995).

D'autre part, notre expérience des opérateurs morphologiques élémentaires nous a convain-cus de la pertinence de leur portage sur machine câblée. Nous pensons que l'implantation des opérateurs de la morphologie géodésique sera ecace.

L'implantation logicielle de ces opérateurs présente des temps d'exécution insusants pour les applications industrielles sur machine conventionnelle. L'algorithme le plus performant donne lieu à un temps de traitement de 3,6 s pour le calcul de la LPE sur une image 512512 sur une

SUN SPARC 10. Au moment où nous avons commencé cette étude, aucune machine dédiée à ces opérateurs n'était connue sur le marché ou en laboratoire. La seule implantation à laquelle nous pouvions faire référence concernait l'utilisation du processeur de morphologie mathématique PIMM1 (Peyrard, 1992) qui conduit à un temps de traitement de l'ordre de 15 s.

Objectifs

Notre objectif est de proposer une architecture dédiée aux opérateurs de

seg-mentation par morphologie mathématique géodésique, en visant des cadences de

traitement de l'ordre de 40 ms, c'est-à-dire 100 fois plus rapides que l'implantation

la plus rapide connue au début de cette étude sur machine conventionnelle.

Elle marquerait un saut signicatif par rapport à l'implantation sur machine conventionnelle qui justierait la réalisation d'un processeur dédié. Un tel facteur d'accélération porterait la vitesse de traitement à un niveau de l'ordre de celui de la cadence vidéo.

Pour atteindre cet objectif, nous analysons les développements algorithmiques les plus récents et proposons des architectures de traitements nouvelles pour lesquelles l'accent est mis sur la vitesse de traitement. Nous dénirons l'architecture la mieux adaptée dans le contexte d'un transfert direct vers l'industrie.

Organisation du document

Ce document se décompose en quatre chapitres et deux annexes. Sa lecture complète com-mence par les annexes, aussi les résumons-nous en premier.

L'annexe A présente les notions de base et le formalisme associé aux notions d'images dis-crètes. De nombreuses dénitions permettent, par un cheminement que nous avons voulu rigou-reux, de passer en revue les notions de topologie largement utilisées dans le reste du document. L'annexe B est une introduction aux opérateurs classiques de la morphologie mathématique. Les opérateurs les plus simples sont décrits avec le même souci de rigueur. On se rend compte petit à petit qu'ils décrivent clairement des ensembles de points caractéristiques des images.

(22)

Introduction 9 Ainsi s'aperçoit-on, au l de cette annexe, que la morphologie mathématique fournit un cadre théorique solide qui conduit à une approche intuitive de l'image. Des notions de contraste, de forme, de taille... constituent les paramètres des opérateurs. La morphologie mathématique permet à l'utilisateur d'interagir en permanence avec l'image en fonction de ce qu'il y voit, en manipulant des concepts qui lui paraissent directs, presque intuitifs. C'est là une de ses forces: l'utilisateur n'a pas besoin d'une grande expérience dans une théorie complexe pour régler, de façon délicate, un ensemble de paramètres abstraits.

Le chapitre 1 est un prolongement de cette annexe. Il présente une nouvelle catégorie de trai-tements basés sur les notions de géodésie et d'idempotence. Ces notions, ainsi que les opérateurs, sont décrits dans la première partie du chapitre. On constate que ces opérateurs ont la propriété de s'adapter aux données traitées et qu'il n'y a plus réellement de paramètres à ajuster. La seconde partie en atteste. Elle présente des cas d'applications sur lesquels nous avons travaillé en début de thèse. Nous décrivons, en particulier, la segmentation par LPE qui, associée à un détecteur de gradient, est un formidable outil de détection de contours. Nous montrons qu'elle consiste en une approche mixte contour-région car elle résulte de l'agglomération itérative de points en fonction d'un critère de gradient. Elle établit des contours bien positionnés et fermés par construction, à partir du seul choix d'ensembles de marquage désignant les objets à seg-menter. On pourrait croire qu'on s'est contenté de déplacer le problème de la segmentation vers la détermination des marqueurs. En fait, le choix des marqueurs est nettement moins délicat à résoudre, de par la localisation extrêmement robuste de la LPE par rapport à la position des marqueurs dans les objets. Des techniques automatiques de marquage sont présentées. Elles reposent, là encore, sur des opérateurs morphologiques et sont basées sur les concepts intui-tifs de contraste, d'une part, de surface et de taille de l'autre. Nous présentons des exemples d'images bruitées, et/ou texturées, pour lesquelles des solutions simples sont proposées. Cette étude nous conduit à un choix de traitements que devra réaliser notre architecture. Nous écartons les opérateurs de morphologie classique qui ont déjà fait l'objet de circuits spéciques ecaces, notamment IGOR (David et Lattard, 1994) présent sur le système IA512 d'EDIXIA. Nous avons ainsi centré notre étude sur les opérateurs géodésiques.

Nous constatons que les opérateurs de morphologie géodésique sont très puissants, encore faut-il que les techniques de calcul soient adaptées et rapides pour permettre leur utilisation dans des applications industrielles. Nous développons cette étude dans le chapitre 2. Il fait l'inventaire des possibilités algorithmiques et architecturales à notre disposition. Nous présentons dans un premier temps les algorithmes parallèles et récursifs à balayage régulier ainsi que les algorithmes récursifs à balayage dépendant des données. Nous montrons ensuite comment ces algorithmes sont appliqués au cas de la LPE sur une vaste gamme d'architectures allant de la machine conven-tionnelle à la matrice de processeurs à grain n, en passant par les machines multi-processeurs gros grain. Les cadences maximales sont atteintes lorsque tous les points des fronts de propaga-tion sont suivis en même temps. Une architecture massivement parallèle originale qui exploite ce processus est présentée. L'enjeu de son étude est la compréhension approfondie de la propa-gation des données au cours du traitement. La compréhension de ces processus nous oriente vers un choix architectural réaliste dans un contexte industriel mettant en ÷uvre l'implantation des algorithmes à balayage dépendant des données sur une architecture pipe-line.

Le chapitre 3 est consacré à la description de notre architecture. Elle repose sur l'implantation de deux algorithmes génériques paramétrables. Nous montrons que le choix des paramètres permet la conguration de l'architecture en vue d'un traitement particulier et proposons un jeu

(23)

de paramètres correspondant aux opérateurs que nous avons choisis. Nous expliquons le rôle de ces paramètres et la façon dont nous pouvons les modier pour augmenter l'éventail des possibilités de notre machine. Nous passons ensuite à l'étude de l'architecture proprement dite. Nous avons surtout concentré nos eorts sur les dicultés posées par les algorithmes à balayage dépendant des données.

Le principal goulet d'étranglement de ce type d'algorithme est lié au nombre d'accès aux mémoires images, d'une part, et de le d'attente de l'autre. Dans le but d'augmenter le débit des mémoires images, nous proposons une structure de mémorisation originale permettant, en un seul cycle mémoire, d'accéder en parallèle aux voisins d'un point quelconque. En nous basant sur la théorie des graphes, nous montrons que la structure que nous proposons est optimale, en ce sens qu'elle n'introduit aucune redondance. Nous présentons ensuite la structure de le d'attente utilisée pour le parcours dépendant des données. Nous montrons que les techniques appropriées pour les mémoires images, ne le sont pas pour la mémoire de le d'attente. Nous nous tournons alors vers une solution basée sur le comportement statistique des algorithmes. La structure choisie exploite le parallélisme de ux et de contrôle.

Tirant les enseignements des machines Reduced Instruction Set Computer (RISC), nous mon-trons ensuite comment le ot d'opérations élémentaires peut être régularisé en employant des techniques d'anticipation. Enn, nous présentons l'enchaînement d'opérateurs morphologiques en montrant que, là encore, certaines opérations peuvent être parallélisées. Nous donnons les cadences de traitement dans le cas du traitement le plus critique: la LPE. Les performances moyennes mesurées sont de 3,8 cycles/pixel, ce qui fait de notre architecture la machine mono-processeur la plus rapide connue à ce jour.

Nous avons conçu un prototype mettant en ÷uvre l'architecture décrite au chapitre 3. C'est l'objet du chapitre 4. Ce prototype doit s'insérer dans le système de vision. IA512 que nous pré-sentons rapidement. Notre prototype fera l'objet d'un module déporté disposant de ses propres ressources mémoires. Il communiquera avec le système IA512 par le bus VME et par un bus de données accessible sur l'IA512. En cernant la complexité de notre architecture (23 000 portes), nous choisissons une technologie cible. Pour l'instant, les technologies Application Specic Inte-grated Cicuit (ASIC) sont écartées pour des raisons économiques. Le choix d'un circuit program-mable de substitution est pris en fonction des spécicités de notre architecture. Nous décrivons ensuite la méthodologie de conception fondée sur la description VHDL à toutes les étapes de conception. Un émulateur du système hôte nous permet de simuler notre module dans son envi-ronnement système. Des échanges entre l'envienvi-ronnement KHOROS et notre module permettent la validation des résultats de simulation avec les modèles algorithmiques initiaux. La synthèse VHDL sur circuits programmables soulève encore des dicultés que nous évoquons. Nous mon-trons pourquoi les performances envisagées en fréquence ne sont pas obtenues, ce qui n'est pas forcément problématique dans le cadre d'un démonstrateur. Ce chapitre se termine par la ré-capitulation des fonctionnalités de notre module et la présentation d'un exemple de chaîne de traitements utilisant diérentes ressources système: IA512, module IGOR, ainsi que notre mo-dule.

Ce document a été doté d'un glossaire des abréviations et des notations, et d'un index. Nous espèrons qu'ils contribueront à la clarté de notre exposé.

(24)

Segmentation d'images par

morphologie mathématique

géodésique

Extending the principles of mathe-matical morphology from two to three dimensions reveals a surpri-sing landscape of beauty and utility. Stanley R. Sternberg

1.1 Introduction

La morphologie mathématique introduite par G. Matheron et J. Serra à la n des an-nées 60 donne un cadre théorique à un ensemble d'opérations non linéaires bien adaptées au traitement d'images. Elle ore les moyens d'une analyse quantitative des images par l'étude des objets qui les composent. Le champ d'application de la morphologie mathématique couvre un domaine de plus en plus vaste, qui résulte de l'apparition permanente de nouveaux traitements génériques mieux adaptés aux contraintes de l'analyse d'images et à l'extension d'opérateurs binaires vers des opérateurs numériques.

Dans ce chapitre, nous présentons les notions fondamentales de la morphologie géodésique. Nous montrons que de telles notions conduisent à une vaste famille d'opérateurs pour la seg-mentation d'images. Ces opérateurs sont brièvement décrits et nous passons en revue leurs applications dans plusieurs cas industriels. Pour nir, nous dressons une liste des traitements que devra pouvoir réaliser notre architecture.

1.2 Géodésie et idempotence en morphologie mathématique

1.2.1 Introduction

Il existe plusieurs façons de décrire des opérateurs de morphologie mathématique. La plus classique (Matheron, 1975) consiste à étudier les relations entre un objet et un élément

(25)

turant en se basant sur des notions de formes (cf. annexe B). Dans le cas des images digitales, on peut envisager l'utilisation d'un opérateur de voisinage dont l'élément structurant est déni point par point. C'est par exemple le cas des opérateurs basés sur les éléments structurants de Golay (Golay, 1969). Une dernière méthode consiste à dénir une métrique décrivant le concept de voisinage dans l'image. Les opérateurs dépendent alors de la métrique choisie. C'est une approche particulièrement adaptée à l'étude des transformations géodésiques dont nous ferons grand usage dans ce chapitre.

Les transformations géodésiques sont des opérateurs de morphologie mathématique modiés de telle sorte qu'ils n'agissent que sur une partie de l'image. En d'autres termes, tout se passe comme si l'élément structurant s'adaptait aux données de l'image en changeant de forme au cours du traitement. On dispose alors d'outils permettant une analyse ne d'une portion de l'image sans en modier le reste.

Après avoir déni la notion de géodésie, nous passerons en revue un certain nombre d'opé-rateurs basés sur ce concept. Nous ne reviendrons pas sur les opéd'opé-rateurs non géodésiques de la morphologie mathématique qui sont décrits en annexe B.

1.2.2 Distance et géodésie dans les images

Une dénition générale de la distance dans les images binaires est donnée par:

Dénition 1 (Distance)

On appellera distance

d

(

p;q

), entre deux points

p

et

q

, la longueur, selon la métrique utilisée, du plus court chemin reliant

p

à

q

parmi l'ensemble des chemins ,p;q entre

p

et

q

:

8(

p;q

)2D

; d

(

p;q

) = ^

2,p;q

l

(

) (1.1)

Cette dénition ne fait pas apparaître la métrique utilisée. Le choix d'une métrique est lié à un compromis entre justesse et rapidité de calcul de la distance. Nous détaillons ce point en annexe A.

Lantuejoul et Maisonneuve(Lantuejoul etMaisonneuve, 1984) cherchent à quan-tier la longueur de bres. Ils montrent que la distance classique n'est pas appropriée. En eet, pour mesurer la longueur de la bre de la gure 1.1, il convient de mesurer la longueur de l'arc

2 intérieur à la bre et reliant ses extrémités. La distance classique donne en général des

résul-tats inférieurs à ceux escomptés car aucune contrainte n'est imposée aux chemins (

1) reliant

les extrémités de l'objet. Les chemins contraints à l'intérieur d'un objet dénissent la notion de géodésie. Cette notion est à la base d'une métrique dépendant des objets à analyser qui servira à dénir une famille d'opérateurs particulièrement bien adaptés à la segmentation d'image.

Dénition 2 (Chemin géodésique)

Soit

S

un ensemble connexe de D (

S

D). On appelle chemin géodésique et on note

gS(

p;q

)

et

8

i

2[0

;l

[

;

(

p

i

;p

i +1)

)

entre deux points

p

et

q

((

p;q

)2

S

(26)

)

La distance géodésique d'un point

p

à un sous-ensemble

X

de

S

(

X

S

1.2.3 Géodésie et morphologie mathématique

Nous venons d'aborder une métrique appropriée à la description de la notion de connexité, donc d'objets. Dans un espace qui utilise cette métrique, les opérateurs de base de la morphologie mathématique (Serra, 1982;DoughertyetAstola, 1994) ont une description très proche de leurs équivalents euclidiens. Les opérateurs géodésiques que nous présentons ici sont d'une grande utilité pour l'analyse des objets indépendamment les uns des autres, plutôt que de l'image dans sa globalité. La gure 1.2 illustre la diérence entre une dilatation classique et son équivalent géodésique. Elle met en évidence l'adaptation de l'opérateur géodésique à l'objet traité.

Voyons à présent les dénitions des opérateurs géodésiques de base.

Dénition 4 (Boule géodésique)

On appelle boule géodésique dans

S

de rayon

et de centre

p

notée

B

()

gS(

p

), l'ensemble des points

q

dont la distance géodésique à

p

est au plus égale à

:

B

()

(27)

a

λ

S

X

b

Fig. 1.2 Comparaison entre morphologie classique (a) et géodésique (b) dans le cas de la dilatation.

Dénition 5 (Dilatation géodésique binaire)

La dilatation géodésique binaire de

X

B

^ =

() gS(

X

)

Dénition 6 (Érosion géodésique binaire)

L'érosion géodésique binaire de

X

S

Dans le cadre des opérateurs morphologiques, la boule géodésique

B

()

gS est également appelée

élément structurant géodésique de taille

.

Remarquons que l'expression donnée équation 1.5 est équivalente à une dénition basée directement sur la distance géodésique:

() gS(

X

) =f

p

2

S

:

d

gS(

p;X

)

g (1.7) Lorsque

= 1, on a également:

(1) gS(

X

) = (

X

B

^ (1)) \

S

(1.8)

qui est la dilatation élémentaire de

X

conditionnelle à

S

en trame digitale. Cette égalité donne une expression de la dilatation géodésique très pratique à manipuler. Cependant, elle n'est vraie que lorsque

= 1. En trame digitale, le dilaté de taille

>

1 sera obtenu en itérant

(1)

gS comme

le permettent les propriétés des opérateurs morphologiques (cf. annexe B). Ainsi:

() gS(

X

) = (

(1) gS

:::

(1) gS) | {z } fois (

X

) (1.9)

(28)

1.2. Géodésie et idempotence en morphologie mathématique 15 De même:

"

() gS(

X

Y

) les noyaux des cellules. Quelles sont les cellules de

X

qui sont entières? Ce sont celles dont le noyau gure dans

Y

. Nous allons donc reconstruire les cellules de

X

marquées par un noyau dans

Y

. Il s'agit de formaliser l'idée intuitive décrite par la gure 1.3.

λ

S

X

, notée

X(

Y

),

est la réunion des composantes connexes de X qui contiennent au moins un pixel à 1 dans

Y

(Vincent, 1993b).

gX(

Y

) = [

Y\Xi6=;

X

i (1.11)

gX (

Y

) =

ngX(

Y

), alors les particules sont

complètement reconstruites, comme le montre la gure 1.3.

Dénition 7 (Reconstruction binaire)

La reconstruction d'un ensemble binaire

X

(appelé ensemble de référence) par

Y

(appelé ensemble de marquage) et notée

gX(

) (1.12)

Le +1 signie jusqu'à idempotence, c'est-à-dire

(+1)

gX (

Y

) =

(n)

gX avec

n

tel que

(n+1)

gX (

Y

) =

(n)

(29)

1.2.5 Conclusion

Les notions de base de la morphologie géodésique ont été présentées dans cette section. Elles donnent lieu à des opérateurs extrêmement puissants car basés sur une métrique adaptée à la description d'objets dans les images. Nous avons évoqué l'exemple de la reconstruction binaire. Cette transformation peut être vue comme un opérateur de croissance de germes.

Les méthodes de croissance de germes sont dénies par quatre principaux paramètres: le choix des germes initiaux;

le choix d'un critère de propagation; le choix de la donnée à propager; le choix d'un critère d'arrêt.

Les techniques classiques de croissance de régions (regroupements itératifs de points ou d'ensembles de points, split and merge (Pavlidis, 1977), regroupements avec relaxations de

contraintes (Monga, 1988)) xent ces paramètres à partir de données statistiques sur la répar-tition des valeurs des pixels. L'approche est ici complètement diérente: c'est la topologie de l'espace à étudier qui guide ces choix. Le critère de propagation est lié à la notion de géodésie: c'est le

X

dans

(+1)

gX (

Y

). Le critère d'arrêt est lié à la notion d'idempotence, c'est-à-dire au fait

que les objets ont des bords: c'est le +1 dans

(+1)

gX (

Y

). Le type de données à propager est

trivial dans l'exemple de la reconstruction binaire, quant au choix de l'ensemble de marquage, il est laissé à la discrétion de l'utilisateur. Dans l'exemple ci-dessus, nous avons choisi l'ensemble les noyaux des cellules (

Y

). Nous allons voir que ces notions fondamentales restent valables dans le cas des images numériques.

1.3 Famille d'opérateurs basés sur la géodésie et l'idempotence

1.3.1 Introduction

Nous venons d'aborder les concepts de base que sont la géodésie et l'idempotence. En fait, les quatre degrés de liberté que nous avons cités sur le choix d'un opérateur (ensemble d'initia-lisation, critères de propagation, donnée à propager, critère d'arrêt) ouvrent la voie à une vaste famille d'opérateurs dans le domaine numérique ou binaire. Dans la présente section, tentons d'en dresser un rapide inventaire.

. Par cette opération, appelée reconstruction positive, seuls les dômes de

g

marqués par

f

sont reconstruits totalement ou partiellement. La gure 1.4 montre l'eet de la reconstruction positive sur un signal monodimensionnel.

(30)

1.3. Famille d opérateurs basés sur la géodésie et l idempotence 17

g

f

ρgg(f)

Fig. 1.4 Reconstruction positive.

Dénition à l'aide d'opérateurs binaires

L'utilisation de la décomposition de l'image numérique en images binaires constitue une première approche pour dénir la reconstruction numérique. Cette technique a été proposée pour les ltres à piles1 (Fitch et al., 85; Wendt et al., 1986) qui sont appropriés au ltrage

d'ordre2 dont le ltre médian est le plus connu. Cette méthode a ensuite été utilisée pour les

opérateurs de base de la morphologie mathématique (MaragosetSchafer, 1987b;Maragos

et Ziff, 1990). L'intérêt de cette technique est de conduire à une mise en oeuvre simple (Shih

et Mitchell, 1989). Une telle approche revient à considérer l'image numérique

f

comme une pile d'images binaires (cf. gure 1.5) dénies par:

T

h(

f

) =f

p

Le reconstruit numérique de

g

par

f

est alors déni point par point dans (Vincent, 1991a):

gg(

f

)(

p

) =

h;

avec

h

=_k max

2f0;:::;N,1g

(

p

2

kgg(

f

)) (1.16)

Dénition basée sur la géodésie numérique

Une autre méthode revient à se placer directement dans le cas des images numériques. La dilatation géodésique numérique élémentaire s'écrit:

(1) gg) | {z } n fois (

f

) (1.18)

La reconstruction numérique peut donc se dénir, comme dans le cas binaire, par une dila-tation géodésique jusqu'à idempotence:

gg(

f

) =

(+1) gg (

f

) = _ n1

(n) gg (

f

) (1.19)

Reconstruction duale

L'opération duale de la reconstruction positive est la reconstruction négative ou reconstruc-tion duale. Elle se dénit par l'érosion géodésique jusqu'à idempotence de

f

au-dessus de

g

qui s'écrit

gg(

f

).

La gure 1.6 montre le résultat de la reconstruction négative dans le cas d'un signal mono-dimensionnel.

1.3.3 Étiquetage de régions

L'étiquetage de régions est une transformation classique qui vise à assigner une valeur parti-culière appelée étiquette à chaque point d'une même composante connexe. On peut trouver dans la littérature de nombreux algorithmes pour le calcul de l'étiquetage de régions (Rosenfeld

etPfaltz, 1966;David, 1980;Lumiaet al., 1983;Vincent, 1990;Alnuweiri etPrasanna, 1992;Olsson etPenman, 1992;Nicol, 1993; Balsara et Irwin, 1993; Nicol, 1995). L'éti-quetage de régions permet d'identier chaque point de l'image en fonction de l'objet auquel il appartient. Il présente une complexité particulière liée à l'utilisation et à la mise à jour simulta-nées d'informations locales (la connexité) et d'informations globales (les étiquettes). Décrivons une dénition basée sur la notion de géodésie (Bleauet al., 1992).

(32)

g f

ρ*gg(f)

Fig. 1.6 Reconstruction négative.

Considérons comme image de départ l'image

f

qui, en tout point

p

(

x;y

), prend la valeur:

f

(

x;y

) =

n

c

:y

+

x

(1.22)

où

n

c est le nombre de colonnes de l'image. Soit

g

l'image binaire des régions à étiqueter et

prenant ses valeurs dansf0;+1g(0 pour le fond, +1 pour les objets). L'étiquetage de régions,

noté

er

(

g

), peut être déni simplement par:

er

(

g

) =

gg(

f

) (1.23)

f

g

OBJ2

OBJ1

Fig. 1.7 Étiquetage de régions par reconstruction.

Dans ces conditions, l'étiquette choisie est la valeur de

f

au point le plus à droite dans la ligne la plus basse de la composante connexe, comme le montre la gure 1.7 dans le cas monodimensionnel. On peut aussi dénir

er

(

g

) à partir de

lorsque

g

prend pour valeur +

1

pour le fond, 0 pour les objets. On a alors:

er

(

g

) =

gg(

f

) (1.24)

Dans ce cas, les étiquettes que prennent les composantes connexes correspondent à la valeur de

f

au point le plus à gauche dans la ligne la plus haute.

L'inconvénient pratique de cette méthode réside dans la construction de l'image

f

initiale. Cette technique aboutit à des étiquettes dont les valeurs, en général peu nombreuses et éparses, s'étendent à l'intérieur d'un ensemble pouvant être très grand (f0

;::: ;n

l

n

cg). Ceci est lié au

fait que le problème de l'assignation d'étiquettes, qui correspondent aux informations globales à propager, a été résolu a priori en étendant l'espace des valeurs des étiquettes jusqu'à les

(33)

transformer en données locales: chaque point a une étiquette propre au départ. Nous sommes ramenés dans ce cas à une propagation où seules des informations locales sont échangées, ce qui simplie grandement l'algorithme de traitement.

Lorsque nous cherchons à réduire l'ensemble des valeurs permises pour les étiquettes, nous sommes à nouveau confrontés au problème d'échange d'informations globales. C'est dans cette perspective que de nombreuses approches ont été envisagées, an de limiter le nombre d'éti-quettes utilisées à un instant donné. Nous verrons dans les prochains chapitres comment se résout cette question dans l'approche que nous avons choisie.

1.3.4 Extrema régionaux

Dénition 8 (Maximum régional)

Un maximum régional est un ensemble connexe de points de même altitude duquel ne part aucun chemin ascendant. (Serra, 1982) en donne la dénition suivante: une composante connexe

)

\

M

\

M

=;c'est-à-dire

T

h(

f

,1)\

M

; la relation 1.26 peut être donnée pour tout

h

à partir de la reconstruction numérique:

MR

(

f

) =

f

,

gf(

f

,1) (1.27)

La gure 1.8 donne un exemple de ce résultat dans le cas monodimensionnel.

f

f-1

ρgf(f-1)

MR(f)

(34)

Dénition 9 (Minimum régional)

). On a donc:

h-dôme(

f

) =

f

,

) (1.32)

où toutes les données sont alors positives. Cette opération est illustrée par la gure 1.9.

h f

f-h

h_dômes

Fig. 1.9 h-dômes.

p;M

i)

< d

(

p;M

j)g (1.35)

j).

Cette ligne est appelée Skeleton by Inuence Zones (SKIZ). Elle est dénie par:

SKIZ

(

M

) =D

=IZ

(

M

) (1.36)

Les points appartenant au SKIZ sont situés sur la ligne de crête de la fonction distance. L'analogie avec la squelettisation (cf. annexe B) lui vaut la dénomination d'exosquelette puisqu'il forme un squelette du fond (cf. gure 1.10). On notera que les zones d'inuence ne préservent pas l'homotopie de l'ensemble initial. De même, le SKIZ ne préserve pas l'homotopie du fond.

Fig.1.10 Exosquelette.

1.3.6 Ligne de partage des eaux

La notion de LPE nous vient de l'hydrologie. C'est un concept très intuitif. Considérons un relief topographique. Supposons qu'une goutte d'eau tombe en un point de ce relief. Cette

Architectures parallèles pour la morphologie mathématique géodésique

THÈSE

présentée par

D

OMINIQUE

N

OGUET

pour obtenir le grade de

DOCTEUR

de l'INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE

(Arrêté ministériel du 30 mars 1992)

Spécialité:

MICRO-ÉLECTRONIQUE

Composition du jury:

Président:

Didier

Rapporteurs:

Didier

Jean-Pierre

Pierre

Examinateurs:

Dominique

Alain

Fernand

Michel

THÈSE

présentée par

D

OMINIQUE

N

OGUET

pour obtenir le grade de

DOCTEUR

de l'INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE

(Arrêté ministériel du 30 mars 1992)

Spécialité:

MICRO-ÉLECTRONIQUE

Composition du jury:

Président:

Didier

Rapporteurs:

Didier

Jean-Pierre

Pierre

Examinateurs:

Dominique

Alain

Fernand

Michel

Remerciements

Table des matières

Abréviations

1

Notations

3

Introduction

5

1 Segmentation d'images par morphologie mathématique géodésique

11

2 Algorithmes et architectures

43

3 Architecture pipe-line à balayage optimisé

91

4 Mise en ÷uvre

131

Conclusion générale

153

Annexes

157

A Éléments de topologie discrète

159

B Notions de morphologie mathématique

169

Liste des dénitions

185

Liste des algorithmes

187

Bibliographie

189

Abréviations

Liste des dénitions

Dénition 1 (Distance)