• Aucun résultat trouvé

en fr

N/A
N/A
Protected

Academic year: 2021

Partager "en fr "

Copied!
274
0
0

Texte intégral

(1)

HAL Id: tel-00944164

https://tel.archives-ouvertes.fr/tel-00944164

Submitted on 10 Feb 2014

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Agents situés dans l’image et organisés en pyramide

irrégulière: Contribution à la segmentation par une

approche d’agrégation coopérative et adaptative

Edouard Duchesnay

To cite this version:

Edouard Duchesnay. Agents situés dans l’image et organisés en pyramide irrégulière: Contribution

à la segmentation par une approche d’agrégation coopérative et adaptative. Intelligence artificielle

[cs.AI]. Université Rennes 1, 2001. Français. �tel-00944164�

(2)

THÈSE

présentée

DEVANT L'UNIVERSITÉ DE RENNES 1

pour obtenir

legrade de : DOCTEUR DE L'UNIVERSITÉ DE RENNES 1

Mention : Traitement du Signal et Télé ommuni ations PAR

Édouard Du hesnay

Équipe d'a ueil

: Laboratoiredu Traitementdu Signalet de l'Image/

Groupede Re her he en Ar hite tures Intelligentes Distribuées É ole do torale

: Mathématiques, Informatique, Signal,Éle tronique, Télé ommuni ations

Composante universitaire

: Stru ture etPropriétés de la Matière

Agents situés dans l'image et organisés en

pyramide irrégulière

Contribution à la segmentation par une appro he

d'agrégation oopérative et adaptative

Soutenue 13Dé embre 2001 devant la ommissiond'examen

COMPOSITION DU JURY : Christian Roux président MarinetteRevenu rapporteur Jean-Mi hel Jolion rapporteur MireilleGarreau examinateur

Lot Senhadji examinateur

Jean-Ja ques Montois dire teur de thèse de lathèse

(3)
(4)

Je tiens à remer ier tout parti ulièrement M. Jean-Ja ques Montois, maître de onféren e HDR à l'IUT de St-Malo, pour m'avoir a ueilli et impliqué au sein du GRAID (Groupe de Re her he en Ar hite tures Intelligentes Distribuées), groupe qu'il avait onstitué lors de son arrivée à St-Malo. Sa onan e, son onstant et ee tif en adrement s ientique, la pertinen e de ses remarques et, last but not least, ses qualités humaines ont permis la réation dans un site délo alisé d'une thématique de re her he déli ate ar émergenteet interdis iplinaire.

Jeremer ie MmeMarinetteRevenu,Professeur àl'universitéde Caen,pour avoir a epté d'êtrerapporteur de ma thèse ainsi que pour ses remarques judi ieuses qui ont permis d'en pré iser ertains aspe ts s ientiques. J'ai été sensible à l'intérêt qu'elle a porté très tt à notre thématique de re her he.

Jeremer ieégalementM.Jean-Mi helJolion,Professeuràl'INSAdeLyon,d'avoir a epté d'êtrerapporteur de mathèse etpour lesoin qu'il a onsa ré à ette tâ he. Ses travaux sur les pyramides irrégulières sont à l'origine de leur utilisation dans notre ar hite ture.

Jeremer ieM.ChristianRoux,Professeuràtélé omBretagne,pouravoira epté de présider lejury de thèse.

Jeremer ieM.Jean-LouisCoatrieux,dire teurde re her he àl'INSERMet dire -teur du LTSI (Laboratoirede Traitement du Signal etde l'Image), dont le GRAID fait partie, pour la onan e qu'il a a ordé à notre jeune équipe ainsi que pour m'avoir a ueilliausein d'un laboratoiremotivantet agréableàvivre.

En outre, je suis très sensible à l'honneur que me font Mme Mireille Garreau, maîtrede onféren e,ainsiqueleProfesseurLotSenhadji,del'universitédeRennes1, d'a epter de faire partie de mon jury de thèse, manifestantainsi leur intérêt pour mon travail.

Jetiens àremer ierYann Ja queletdo torantetvoisin de tableauLTSI/GRAID pournoslonguesdis ussionssurl'IAetl'imageainsiquepourl'aidequ'ilm'aapporté lorsdes expérimentations.

Je n'oublie pas non plus l'équipe enseignante du département GTR de l'IUT de St-Malo pour l'ambian e de travail, la bienveillan e à l'égard de la re her he et la ompréhension dontils ont faitpreuve lorsde maréda tion de thèse.

(5)

amené un peu de soleil amerounais dans nos ontrées bretonnes.

Commerien nesauraitsefairesansnan ement,je souhaiterairemer ier :la mai-riede St-Malo, l'universitéde Rennes 1,l'IUTde Rennes etleLTSI. Ces stru tures etleurs responsablesrespe tifsont bienvoulu roireen nousen nous fournissantles moyens indispensables à l'émergen ede lare her he à St-Malo.

Il y aaussi tous eux qui ont favorisé l'aboutissement de mathèse d'une manière personnelle dire teou indire te.

J'aurai tout d'abord une pensée pour toi,Anna, tuas patiemment relu maprose (je ne suis pas un littéraire). Tu as su garder ma motivation inta te en me faisant rêver qu'un jour nous lirions la Camif devant un feu durant nos longues soirées d'hiver!

À mes parents, ma grand mère et mon frère (qui a aussi hoisi de faire arrière dans l'informatiqueet ommen e à parlerbizarrement).

Àmes amisde quinzeans etmes nouveaux amisbretons(quine sontpas tous al ooliques)pour nosdiversesa tivitésdiurnesetno turnesetpourm'avoirsouvent demandé mais au fait, 'est quoi le sujet de ta thèse? puis avoir attentivement é outé laréponse.

Je dois aussi e goût pour la re her he et l'enseignement à l'inuen e qu'ont eu sur moitrois enseignants de l'EPITA : Mohamed Regraguipour m'avoirfait aimer les mathématiques, Pierre Oysel pour m'avoir fait appré ier les belles hoses de l'informatique (ave beau oup de

λ

, ( dr ...) et autre reg-exp) et Miklos Santha pour m'avoir intéressé àl'algorithmique.

(6)

1 Introdu tion 11

1.1 Positionnement de la thématique de la thèse . . . 11

1.2 État de l'art et identi ation des besoins ( hapitres 2à 5) . . . 13

1.3 Propositions ( hapitres 6à 10) . . . 14

I État de l'art et identi ation des besoins 15 2 Segmentation 17 2.1 Introdu tion . . . 18

2.2 Classi ation . . . 19

2.2.1 Méthodes monodimensionnellesou seuillage . . . 19

2.2.2 Méthodes multidimensionnelles . . . 19

2.3 Appro hes frontière . . . 22

2.3.1 Lesopérateurs de déte tion de ontours. . . 22

2.3.2 Lo alisationdes ontours . . . 23

2.3.3 Suivide ontours . . . 24

2.3.4 Con lusionsur lesappro hes ontour . . . 25

2.4 Appro hes stru turales ouagrégatives . . . 26

2.4.1 Appro hes des endantes par division ré ursive . . . 27

2.4.2 Appro hes as endantes par fusionde régions regionmerging 27 2.4.3 Appro hes as endantes par agrégationde pixels . . . 28

2.4.4 Con lusionsur lesappro hes stru turales . . . 29

2.5 Appro hes oopératives. . . 29

2.5.1 Coopération onfrontativepar fusionde données . . . 30

2.5.2 Coopérationintégrative . . . 30

2.5.3 Coopérationdynamique par inuen e mutuelle . . . 31

3 Les Stru tures pyramidales 33 3.1 Introdu tion . . . 34

3.2 Aspe t multirésolution :pyramidesGaussienne et Lapla ienne . . . . 34

3.3 Modèles de dé omposition hiérar hique de l'image . . . 35

3.3.1 Modèle rigide de partitionnement . . . 35

3.3.2 Partitionnement non rigide. . . 36

3.4 Introdu tionauxpyramidesirrégulièresetgraphesd'adja en ederégion 37 3.5 Dé imation sur un graphe . . . 38

3.5.1 Introdu tion . . . 38

3.5.2 Dé imationsto hastique . . . 39

3.5.3 Dé imationadaptative . . . 41

3.6 Constru tion du graphe du pro hain niveau : fusiondes sommets. . . 42

(7)

3.6.1.1 Graphe de similarité: seuillageglobal . . . 42

3.6.1.2 Graphe de similarité: seuillagelo al . . . 43

3.6.2 Dé imation sur legraphe de similarité . . . 44

3.6.3 Fusion sur le graphe de similarité . . . 45

3.6.4 Constru tion du graphed'adja en e du niveau supérieur . . . 46

3.7 Constru tionde lapyramide de graphes . . . 46

3.8 Perspe tives et on lusions sur lespyramides de graphes . . . 46

3.9 La pyramide irrégulière dualeet lesnoyaux de ontra tionéquivalents 47 3.9.1 Introdu tion . . . 47

3.9.2 Graphe dual

G

. . . 48

3.9.3 Paramètres de dé imation et ontraintes asso iées . . . 48

3.9.4 Dé imation duale . . . 49

3.9.5 Noyaux de ontra tions équivalents . . . 50

3.9.6 Perspe tives . . . 50

4 Les systèmes de vision 51 4.1 Introdu tion . . . 52

4.2 Méthodologiesde l'analyse des systèmes de vision . . . 52

4.2.1 De l'appro he traditionnelle . . . 52

4.2.2 Vers une appro he systémique . . . 53

4.2.3 Dis ussion . . . 55

4.2.3.1 Digression sur les diérents ourants de pensée . . . 55

4.2.3.2 Quelle méthodologie? . . . 56

4.3 Lesinformations omposantla théorie omputationnelle. . . 58

4.3.1 Connaissan es des riptivessymboliques . . . 59

4.3.2 Connaissan es des riptivessémantiques . . . 61

4.4 Lestâ hes omposant lathéorie omputationnelle . . . 64

4.4.1 Les prétraitements . . . 64

4.4.2 Les tâ hes d'analyse d'image . . . 64

4.4.3 Les tâ hes de niveau intermédiaire . . . 65

4.4.4 Con lusion. . . 67

4.5 Les stratégies de navigation parmi leséléments omposant la théorie omputationnelle . . . 68

4.5.1 Stratégies as endantes & des endantes . . . 68

4.5.2 La fo alisation . . . 69

4.5.3 Génération et véri ation d'hypothèses . . . 70

4.5.4 Résolutionde onits . . . 71

4.5.5 Plani ation de tâ hes . . . 72

4.6 Te hniques de représentation de la onnaissan e . . . 72

4.6.1 Les diérents formalismes . . . 73

4.6.1.1 Le formalismepro édural . . . 73

4.6.1.2 Les langagesobjets . . . 73

4.6.1.3 Les formalismesdé laratifs. . . 73

4.6.1.4 Les règles de produ tion . . . 74

4.6.2 In ertitude et impré ision . . . 76

(8)

4.6.2.2 Lemodèle de Dempster-Shafer . . . 78

4.6.2.3 Lemodèle des ensembles ous . . . 81

5 Ar hite tures logi ielles de ontrle et SMA 83 5.1 Problématique, ou pourquoi l'IAD? . . . 84

5.2 L'intelligen e arti ielledistribuée . . . 85

5.2.1 Lestableaux noirs . . . 85

5.2.2 Lessystèmes multi-agents . . . 86

5.3 Types d'agents etstru tures de ontrle . . . 87

5.3.1 Agents réa tifs . . . 87

5.3.2 Agents ognitifs . . . 88

5.3.2.1 États mentaux à ara tère représentationnel . . . 89

5.3.2.2 États mentaux à ara tère motivationnelou onatifs 89 5.3.3 Ar hite tures de ontrle des agents ognitifs. . . 90

5.3.3.1 Automatesà états nis. . . 90

5.3.3.2 ASIC . . . 91

5.3.3.3 BDI . . . 92

5.4 So iétéset organisations . . . 92

5.4.1 La oopération . . . 93

5.4.2 La oordination . . . 94

5.5 Typologie des systèmes de visionà base de SMA . . . 95

5.5.1 Lesappro hes entrées tâ he . . . 95

5.5.1.1 Lesystème MAVI : une variantede VAP . . . 96

5.5.1.2 SIGMA (bla kboard) . . . 96

5.5.1.3 MESSIE-II (bla kboard) . . . 98

5.5.2 Lesappro hes entrées modèle . . . 98

5.5.2.1 VISIONS/S hema System . . . 98

5.5.2.2 SMApour lare onnaissan e de forme:appro he de Yanai & Degu hi . . . 99

5.5.3 Lesagentssitués dans l'image . . . 100

5.5.3.1 Agents oopératifs àappro he in rémentale . . . 100

5.5.3.2 Segmentationpar agentsmigrateurs :appro he de Liu& Tang . . . 102

II Propositions et expérimentations 103 6 Problématique, démar he et adre on eptuel 105 6.1 Problématique . . . 106

6.1.1 Unproblème parti ulier: image de s anner du sein . . . 106

6.1.2 Lané essité de oopération . . . 107

6.1.3 Lané essité d'adaptationlo ale . . . 109

6.1.4 Lané essité de représentation de l'a priori etde l'in ertitude 110 6.2 Problématique étendue àla vision . . . 111

6.3 Cadre on eptuel . . . 112

(9)

7 Plate-forme logi ielle 117

7.1 Introdu tion . . . 118

7.2 Cara téristiques et vuegénérale de la plate-forme . . . 119

7.3 Le mi ro-noyau etles agents système . . . 122

7.3.1 Gestion des agentset des groupes . . . 123

7.3.2 Les messages . . . 124

7.3.3 Envoi de messages . . . 125

7.3.4 Ordonnan ement des agents etgestion du temps . . . 129

7.3.4.1 Pro essus légers outhreads . . . 129

7.3.4.2 Syn hronisation et y le d'exé ution . . . 132

7.3.5 Con lusion sur le mi ro-noyauetles agents système . . . 134

7.4 L'agent. . . 135

7.4.1 Stru ture de ontrle . . . 135

7.4.1.1 Les handlers de messages . . . 137

7.4.1.2 Le moniteur . . . 137

7.4.1.3 L'agenda . . . 138

7.4.1.4 Le séquen eur . . . 138

7.4.1.5 Exemples de mise en ÷uvre du ontrle . . . 140

7.4.1.6 Modélisationàl'aide de réseaude Pétri . . . 141

7.4.2 La boîte aux lettres . . . 144

7.4.3 Tableau noir lo al . . . 146

7.4.3.1 Les royan es de l'agent . . . 147

7.4.4 Spé ialistes . . . 148

7.4.5 Système à base de onnaissan e . . . 149

8 La so iété d'agents organisée en pyramide irrégulière 151 8.1 Introdu tion . . . 152

8.2 Une algorithmiquedistribuée de traitement des pyramides . . . 153

8.2.1 Les stru tures de données . . . 153

8.2.2 Constru tion du graphed'adja en e . . . 154

8.2.3 Constru tion du graphede similarité . . . 155

8.2.4 Dé imation sur legraphe de similarité . . . 155

8.2.5 Création du niveau

k + 1

et ratta hement des sommets du niveau

k

. . . 157

8.2.6 Synthèse . . . 158

8.3 La pyramide irrégulière :une organisation de ontrle so ial . . . 160

8.3.1 Agents région& agents ontour . . . 162

8.3.2 Transposition d'un espa e opératoire à un espa e omporte-mental . . . 162

8.3.3 Cara téristiques de l'organisation . . . 164

8.4 Lesagents interfa e etenvironnement . . . 164

8.4.1 L'agentenvironnement (EnvAgt). . . 165

8.4.2 L'agentinterfa e utilisateur(IHMAgt) . . . 165

8.5 Initialisation: de l'image àl'organisationd'agents . . . 166

8.5.1 Initialisationdes agents région . . . 167

(10)

8.5.3 Constru tiondes relationsd'a ointan e . . . 169

8.6 Constru tion de la pyramide . . . 170

8.6.1 Syn hronisation etpassage d'un niveau à l'autre . . . 170

8.6.2 Conditions sur lan d'exé ution. . . 171

9 L'agent et ses omportements 175 9.1 Introdu tion . . . 176

9.2 Stru ture de ontrle de l'agent . . . 177

9.3 Les royan es de l'agent . . . 178

9.4 Comportementde marquagede territoire . . . 179

9.5 Comportementd'exploration . . . 181

9.6 Comportementde plani ationdes fusions . . . 184

9.6.1 Cal uldes anitésasso iées à haque voisin . . . 185

9.6.2 Ledésir de fusion . . . 186

9.6.3 Adaptationlo aledel'importan edesdiérentesanitésdans l'évaluationdu désir . . . 187

9.6.4 L'in ertitude . . . 188

9.6.5 Adaptation lo ale du désir né essaire . . . 189

9.6.6 Synthèse sur la plani ationdes fusions. . . 190

9.7 Du graphede similarité auxintentions de fusions . . . 191

9.8 Comportementde oopération . . . 192

9.8.1 Coopérationrégion/région . . . 194

9.8.2 Coopérationrégion/ ontour . . . 196

9.8.3 Fusion des ritiques . . . 199

9.8.4 Re lassement des hypothèses in ertaines . . . 199

9.8.5 Retoursur le onsentement mutuel . . . 200

9.9 Comportementde dé imation . . . 202

9.9.1 Cal ulde l'utilitéd'un plan . . . 202

9.9.2 Transposition agentde lapro édure de dé imation . . . 203

9.10 Comportementde ratta hement des non-survivants . . . 206

9.11 Comportementde reprodu tion . . . 209

10 Expérimentations 211 10.1 Introdu tion . . . 212

10.2 Évaluationma ros opique et omparative. . . 213

10.2.1 Images d'expérimentation . . . 213

10.2.2 Méthodes évaluées . . . 216

10.2.3 Capa ité d'une appro he àsegmenter une image . . . 218

10.2.4 Robustesse à ladégradation de l'informationa priori . . . 230

10.2.5 Capa ité àtraiter plusieursimages . . . 232

10.3 Évaluationdétaillée: dans l'intimité des agents . . . 233

10.3.1 Analyse organisationnelle. . . 234

10.3.1.1 Évolution de la populationà travers lesniveaux . . . 234

10.3.1.2 Lesrelations de voisinage . . . 235

10.3.1.3 Lesintentions de fusion . . . 236

(11)

10.3.2 Analyse des intera tions . . . 238

10.3.2.1 Les é hanges de messages . . . 238

10.3.2.2 Lesintera tions entreagentsmodientleurs intentions239 10.3.2.3 La oopérationfa e àl'in ertitude . . . 241

11 Con lusions et perspe tives 243 11.1 Synthèse et bilan . . . 243

11.2 Perspe tives . . . 244

III Annexes 247 A Compléments sur les méthodes de segmentation 249 A.1 Classi ation . . . 249

A.1.1 Les lassieurs supervisés . . . 249

A.1.2 Les lassieurs non supervisés . . . 251

A.1.3 Remarques et on lusions . . . 252

A.1.4 Classi ation :méthodes markoviennes . . . 253

A.2 Filtrageet transformées . . . 254

A.3 Appro hes frontière :fermeture de ontours . . . 255

B Compléments sur les te hniques de représentation de la onnais-san e 259 B.1 Mé anismes d'inféren e des systèmes experts . . . 259

B.2 Lesframes . . . 260

(12)

1

Introdu tion

1.1 Positionnement de la thématique de la thèse

La on eptiond'unsystèmedeper eption,limitéàl'analysed'imageouintégrant touteslesétapesde lavision,est un problème omplexedont il onvientd'identier lairementles diérents niveaux d'analyse. Les trois niveaux d'analyse [Mar82℄ des systèmes de vision proposés par David Marr nous aident à situer les thématiques abordéespar ettethèse.Cesdernièressontaunombredetrois,etellessontillustrées gure 1.1.

1.Méthodologie. On her heuneméthodologieappli ableensegmentationd'image et plus largement en vision. L'identi ation de nouvelles ontraintes est une orien-tation dans lare her he de nouvelles méthodologies.

Il est ependant né essaire de pré iser la nature de es ontraintes, par onsé-quent,dans le adre généraldes méthodologiessystémiques, nous en proposonsune basée sur trois paradigmes : l'intégration, l'adaptation (fo alisation)et la oopéra-tion.

2. Ar hite ture logi ielle. À lamanièredes langagesobjets qui sontla tradu -tion d'une méthodologie, nous proposons une ar hite ture logi ielle, basée sur des agents situés dans l'image, permettant de penser et de mettre en ÷uvre notre méthodologie.

3. Méthodologie logi ielle. L'utilisationdes SMAdans la on eption d'un sys-tèmed'information né essite l'emploide méthodologieslogi iellessystémiques qui mettent l'a ent sur la on eption individuelle,les intera tions ausein d'une stru -ture organisationnelle etles ara téristiques globalesémergentes.

Nous n'avons pas omme obje tif de proposer un nouvelle méthode de segmen-tation, nos travaux se situent plus sur un axe transversal et méthodologique sur lequel on her he un adre on eptuel ri he et exible permettant une expression harmonieuseet e a e des a tivitésde lavision par ordinateur.

(13)

chap. 8

chap. 9

chap. 10

(segmentation & vison

logiciel

Le comment

matériel

Le comment

distribution

Agents et

du calcul

Plate−forme

(chap. 7)

Description

Description

locale

structurelle

Analyse

globale

Agents situés

dans l’image

Représentation et algorithme

Théorie computationnelle

Méthode

Domaine

chap. 2, 3 et 4)

ou niveau conceptuel

Le quoi

Niveau d’abstarction

(architectures logicielles

chap. 5)

Reconstruction

Guidée

par les buts

analytique

systémique

de contraintes

Recherche

(focalisation)

Adaptation

Intégration

Coopération

(chap. 6)

systémique

analytique

(Méthodes de GL)

Implémentation matérielle

sémantique

syntaxique

image

interprétation

groupement de primitives

Fonctions

segmentation

Informations

descendantes

mixtes

hétérarchiques

ascendantes

Approches

Approches

centrées modèle

Informations

Fonctions

centrées tâche

Contrôle

Centralisé.

Distribué

Statégies

Fig. 1.1 : Lestrois niveauxd'analyse dessystèmes vision,et,engrisé,les thèmesabordés par la thèse.

Nousallonsutiliserune métaphoreissuedel'évolutiondeslangagesinformatiques pour illustrernos préo upations.Deux programmes ontlamême fon tionnalité (le quoi), le premier est é rit en langage assembleur, le deuxième en langage objet (ils dièrent sur la méthodologie de on eption et sur le omment logi iel). De nom-breuses ritiques peuvent être adressées au programme onçu en objet (ainsi qu'à notre appro he) : il est plus lent; plus volumineux; il réalise le même obje tif; e n'est qu'unhabillage on eptuel danslequel desvo ables ommeenvoide message ont rempla é appel de fon tion. Ces ritiques sont justiées sur le niveau d'ana-lyse de lathéorie omputationnelle,mais onne peut négligerl'apport on eptuelet méthodologiquedes méthodes objet au niveau de laréalisationlogi ielle.

Si et exemple n'est qu'une métaphore et quenous proposons bien une appro he agent,etnonsimplementobjet,ilillustrebien lepositionnementde nostravaux,les apports que l'on peut en espérer et les ritiques quel'on peut leur adresser.

(14)

5)

1.2 État de l'art et identi ation des besoins

( ha-pitres 2 à 5)

Les langages de ommuni ation utilisés par les humains sont d'avantage qu'un simple habillagede la pensée, ilsla stru turent. De la mêmemanière, une ar hite -ture logi ielle de ontrle doit fournir un adre méthodologique permettant une intégration etune expression harmonieuse des diérents omposantsdu système.

Il est don indispensable d'identier au préalable les besoins et les problèmes ren ontrés lorsdes diérentes étapesdu traitementdes informationspar lesystème de per eption. Cette étape onsiste à remonter au niveau de la théorie omputa-tionnellepour identierles besoinset lesproblèmes an de pouvoir fournirun outil logi ieladapté.

La segmentation d'imageétant le domaine d'appli ation entral de notre ar hi-te ture de ontrle, nous lui onsa rons les hapitres 2 et 3 ( e dernier hapitre étant dédié aux représentations pyramidales). L'étude de diérentes appro hes de segmentation nous a permis d'identier trois besoins ren ontrés à e niveau de la vision:

1. lesbesoins d'adaptation lo ale des traitements;

2. lesbesoinsd'intégrationetd'expressionplusoumoinspré isede l'information a priori;

3. lesbesoins d'appro hes oopératives.

Notre obje tif futur étant d'intégrer les étapes du moyen et du haut niveau de la vision, nous présentons un état de l'art des systèmes de vision au hapitre 4. Plusieursraisons justient ette étude :

 L'élargissement du domaine d'analyse est indispensable à la on eption d'un module de segmentation dont la vo ation est d'être intégré dans un système plus vaste.

 Les re her hes sur les systèmes de vision ont donné lieu à des réexions sur une méthodologieplus générale de on eptiondes systèmes de visionin luant l'étapedesegmentation.Ces ourantsdepensée,dontnousessayons de rendre ompte, ont grandement inuen é notre appro he.

 Les systèmes de vision fournissent des exemples d'ar hite tures logi ielles de ontrle quenous ne pouvions ignorer.Le hapitre 5 leur est onsa ré.

L'étude des systèmes de visionnous a permis d'identier trois types de besoins : 1. besoinsd'intégrationdemoduleshétérogènestraduisantdes onnaissan es

opé-ratoireset des riptives;

2. besoins de spé i ation du problème du ontrle du système et des stratégies de re onnaissan e d'objets;

(15)

1.3 Propositions ( hapitres 6 à 10)

Comme évoqué au hapitre 6 ( hapitre introdu tif de la deuxième partie) les propriétés dessystèmes multi-agentssitués dans l'imageen fontune appro he adaptée àla on eption d'unear hite ture logi iellede ontrle permettantla mise en ÷uvre des besoins identiés i-dessus. Ils sont l'expression en informatique d'un ourant depensée ontemporain (systémique,holisme,émergentisme) visantà om-plexier l'analyse des systèmes par une observation globale d'intera tions lo ales. On retrouve des tra es de ette appro he, basée sur la dynamique et l'in arnation des systèmes qui s'opposent à l'appro he analytique lassique,dans lare her he en systèmes de vision(vision a tive, intentionnelle,animée).

Ilnoussemblepertinentd'ins rirenotredémar he dans e ourantde penséequi fournit despistes sur lamanièrede rendre omptede la omplexitéd'unsystème de vision.

Nous présentons au hapitre 7 une plate-forme multi-agents générique pouvant servir àd'autres appli ationsque l'image.

Nousutilisons etteplate-formepour onstruireunear hite turelogi ielled'agents situés dans l'image. La des ription et l'analyse de ette dernière respe te une mé-thologie de on eption de logi iels arti uléeen trois niveaux :

1. Des ription globale et stru turelle de l'organisation regroupant les agents. Cette étape de des ription, présentée au hapitre 8, s'atta he à établir les liens entre agents. Nous proposons omme élément organisationnel la pyramide irré-gulière qui va imposer sa stru ture à la population d'agents an de garantir un omportementglobalement ontrlable et onvergent de es derniers.

2. Des riptionlo aleetfon tionnelledesagents omposantlesystème.Au oursdu hapitre9nousdonnonsune des riptionindividuelledu ontrledes omportements de l'agentet des intera tions lo ales ave ses voisins dans l'organisationévoquée i-dessus.

Dans e adre on eptuel,nous proposons une mise en ÷uvreparti ulière de l'ar- hite ture logi ielle de ontrle dans laquelle deux famillesd'agents, qui traduisent des primitivesrégionet ontour, interagissent au sein de la pyramide.

Notreobje tifestde montrer omment etteméthodologiepermetune implémen-tation ri he, exible et distribuée des aspe ts pré édemment identiés; à savoir : l'adaptation lo ale, l'intégration et l'expression d'in ertitudes dans l'information a priori etdes traitements oopératifsrégion/région etrégion/ ontour.

3. Finalement,une analyseglobale, omparative etfon tionnelle présentée au ha-pitre 10 vérie que l'ensemble des intera tions lo ales produit une bonne segmen-tation des images. Nous omparons notre appro he ave d'autres méthodes de

(16)

seg-État de l'art et

(17)
(18)

2

Segmentation

La segmentation d'imageétant le domaine d'appli ation entral de notre ar hi-te ture de ontrle, il est indispensable d'identier au préalable les besoins et les problèmes ren ontrés lors de ette étape de traitement de l'image.

Dans e hapitrenousprésenterons ertainesméthodesdesegmentationpuisnous on lurons ave les appro hes oopératives.

Lorsde etteétudedeste hniquesdesegmentation,nousidentieronstroisbesoins qui, selon nous, sont essentiels si l'on souhaite améliorer la qualité et la robustesse de l'analyse d'image.Ces besoins sont :

1. lesbesoins d'adaptation lo ale des traitements;

2. lesbesoins d'intégration etd'expression plus ou moinspré isément de l'infor-mationa priori;

(19)

2.1 Introdu tion

La segmentation est une étape essentielle du pro essus de vision. Elle a pour obje tif de partitionnerl'imageen zonesstationnaires qu'on espère lesplus pro hes possible des objets ou régions d'objets réellement présents dans l'image. En règle générale, les régionsextraites ne orrespondentque partiellement auxobjetset une intera tion ave les ou hes haut niveau de vision , qui utilisent des onnaissan es spé iques au domaine, s'avère né essaire.

Cetteintrodu tionde onnaissan es spé iquesaudomainediviseles her heurs du domaine: ertains onsidérent que ette étapepeut s'ee tuer indépendamment du domaine à l'aveugle, quitte à reporter la omplexité du traitement dans les étapesde visionhaut niveau; d'autres her heurs, au ontraire,pensentqu'il fauty introduireauplus tt de l'informationa priori an d'éviterleserreursde partition-nement qui ompliquent ou même induisent en erreur l'interprétation onduisant, dans le meilleur des as, à une reprise de la segmentation ave de nouveaux para-mètres.

Quoiqu'ilensoit, l'étapede segmentationdoittransformer l'imageenune infor-mationquantitativementréduiteou/etqualitativementrehaussée.Cette transforma-tion par regroupement ou lassi ation est onfrontée aux problèmes d'ambiguïtés et de bruit qui ae te ertainspixels de l'image.

Leste hniques de segmentation peuvent être lassées en trois grandes familles: 1. les appro hes de type lassi ation dans lesquelles nous retrouvons des

mé-thodesmonodimensionnelles(seuillage),multidimensionnellesetmarkoviennes; 2. les appro hes frontières;

3. les appro hes régions.

Les deuxième et troisième appro hes étant duales, la frontière entourant haque région dénit un ontour fermé et haque ontour fermé dé rit une région.

Pour haque appro he de segmentation abordée,nousessayerons d'en dégagerles limites, puis nous évoquerons les solutions proposées en réponse à es problèmes. Ces solutionss'arti ulentsouvent autour des trois prin ipessuivants:

1. adaptation lo ale de lastratégiede segmentation; 2. oopération de plusieurs te hniques;

3. introdu tion d'informationsa priori.

Ces trois prin ipes justient en partie l'utilisation d'une ar hite ture basée sur des agents qui utilisent à bon es ient des te hniques lassiques de segmentation. Par à bon es ient nous entendons : adaptation lo ale et ontextuelle des traitements et des paramètres, aptitude à utiliser plusieurs appro hes de façon oopérative et apa ité àreprésenteretàmettreen÷uvreles onnaissan esquel'onadu domaine.

(20)

2.2 Classi ation

2.2.1 Méthodes monodimensionnelles ou seuillage

L'attributanalysé est, dans laplupartdes as, leniveau de gris. Uneanalyse de l'histogramme de l'image permet de dégager automatiquement des lasses et don des seuils séparant es lasses. Les seuils sont les minima lo aux de l'histogramme permettant de séparer les modes ( lasses) entre eux. Pour les images dont l'histo-grammenepossèdepasdevallées nettes(minimafaiblesoulo aux),deste hniques [Ros82℄ permettentdans l'histogrammed'en dégagerdes modes.

Il est parfois né essaire d'adopter une appro he lo ale lorsque l'histogramme est globalement inexploitable (histogramme global unimodal résultant de la superpo-sition de plusieurs modes). Dans la méthode proposée par Nakagawa [Nak79℄, on ee tue une dé oupe de l'image en blo sde taille xe à dénir. Une analyse lo ale de l'histogrammede haque blo est menéeand'extraireun seuil ( asbimodal)ou deux seuils( as trimodal).Si etteanalyse ne permetpas de dégagerdes modes, les seuilssontobtenuspar interpolationdes seuilsdesblo svoisins.Ainsionpeut ee -tuer une analyse d'histogramme al ulé sur une sous-image résultant du dé oupage de l'image.

Ces appro hes, f. [Sah88℄, ont l'avantage de la rapidité des traitements; elles appliquent pour la plupart le même traitement sur toute l'image. Elles né essitent entout asdexerdesparamètres(seuils,nombresde lassessouhaitées,paramètres des distributions)traduisantune informationa priori onditionnantlaqualitéde la segmentation obtenue.

2.2.2 Méthodes multidimensionnelles

Lesappro hesmultidimensionnellessont ourammentutiliséesenanalysed'images issues de la télédéte tion [Lum83℄. Elle permettent de traiter (i)les images multi-spe trales(ii)etlesimagestexturéesdontlasimpleanalyseduniveaudegrisserévèle insusante. Nousabordonsi i un ensembled'outils de dis rimination/ lassi ation quisont aussiemployés dansla visionhautniveau. Nousnous on entrerons sur les appro hes de dis rimination statistique. Les appro hes neuronales de lassi ation seront abordées dans lase tion portantsur l'interprétation.

Dans le as d'images texturées, il devient né essaire d'analyser haque pixel à l'aide d'un groupe d'attributs al ulés lo alement, sur une fenêtre entrée sur le pixel.On parleraalorsde texel (abréviation de textureélément), omposé des oor-données du pixel, de la taillede la fenêtre d'analyse et du ve teur d'attributs. Ces attributs peuvent être de simples moments statistiques omme la moyenne ou la varian e. Ils peuvent aussi prendre en ompte l'aspe t anisotropique d'une texture (matri es de oo urren e)et mêmel'aspe t ontour si onleur ajoutelessorties de ltres déte teurs de ontours (orientés ou non). Il devient alors possible de prendre en ompte simultanément l'aspe t ontour et région et don de mettre en ÷uvre

(21)

une oopération simple région/ ontour. La onstru tion d'un outil de lassi ation omporte aumoins lesquatre étapes suivantes :

1. al ul des attributsdes texels;

2. séle tiondes attributsdis riminants; ette étape est abordée i-dessous; 3. onstru tion du lassieur (phase d'apprentissage); ette phase est présentée

en annexe (ŸAp. 249);

4. utilisationdu lassieur sur l'ensemble des texels (phase d'exploitation); La séle tion des attributs dis riminants par l'analyse en omposantes prin ipales. Cette séle tion peut être faite par le traiteur d'images ou à l'aide de méthodes omme l'analyse en omposantes prin ipales (ACP Analyse en Com-posantes Prin ipalesoutransformée Karhunen-Loeve). Nousverronsultérieurement l'usagede etteméthode (Ÿ9.6.3p.187) ande permettreauxagentsd'ajuster lo a-lementet automatiquementles oe ientsde pondération portant sur les attributs région. À et eet, nous allons donnerles prin ipaux on epts de l'ACP. Uneétude approfondie peut être trouvée dans [Leb95℄.

On onsidère un nuage de

n

individus (les texels) dans l'espa e des

p

attributs (IR

p

). On her he à déterminer un sous-espa e ve toriel IR

q

IR

p

de dimension faible (

q << p

) qui lorsque l'on y projette les individus, déforme le moins possible les distan es entre individus projetés, ouautrement ditmaximisel'inertie du nuage projeté.

X =

les p attributs

z

}|

{

x11

. . . x1p

. . .

xij

. . .

xn1

. . . xnp

 les n individus

Dans l'analyse générale, on her he toutd'abordun sousespa eve torielàune dimension passant par l'origine qui maximise l'inertie du nuage projeté et, don , minimise, au sens des moindres arrés, la distan e entre l'individu et sa proje tion sur ladroite :

R

p

O

Mi

Hi

u

Fig. 2.1 : Axe de proje tion maximisant l'inertie d'un nuage depoint : asgénéral.

min

n

X

M

i

H

i

2

⇐⇒ max

n

X

OH

2

i

(22)

or

n

X

i=1

OH

i

2

= (Xu)

T

Xu = u

T

X

T

Xu

X

T

X

étant lamatri e de varian e/ ovarian e. On her he don :



maxu

u

T

X

T

Xu

sous la ontrainte de normalisation :

u

T

u = 1

On minimisele lagrangien :

L = u

T

X

T

Xu

− λ(u

T

u

− 1)

δ

L

δu

= 2X

T

Xu

− 2λu

Enannulantla dérivée du lagrangien, onobtient :

X

T

Xu = λu

u

est don le ve teur propre asso ié àla valeur propre

λ

, omme

u

T

X

T

Xu = λ

Il faut don que

λ

soit la plus grande possible. Il faut que les axes de proje tion hoisis soientlesve teurs propres

ui

asso iés auxplus grandes valeurspropres de la matri e

X

T

X

(matri ede varian e/ ovarian e).

Dansl'analyse en omposantesprin ipales, lesaxesnepassentpasfor ément parl'origine.On vadon ee tuerun re entragede nos données pourseramener au as général.

R

p

O

u

Fig. 2.2 : Axe deproje tion maximisantl'inertie d'un nuage de point.

Ainsi traitée, notre matri e de varian e/ ovarian e risque d'être mal ondition-née. En eet, les attributs ayant une grande é helle porteront les axes fa toriels prin ipaux. À et eet, onréduit notre matri een divisant lesvaleurs des attributs parl'é arttypepourseramener ainsiàune valeursans é helle.Lamatri edes don-nées

X

sera rempla ée par une matri e de données entrée et réduite

Y

de terme

(23)

général :

yij

=

xij

− xj

Sj

n

xj

=

1

n

n

X

i=1

xij

S

j

2

=

1

n

n

X

i=1

(xij

− x

j

)

2

Les

q

axesfa toriels prin ipaux( eux asso iés aux plus grandesvaleurs propres) de

RXX

= Y

T

Y

(matri ede orrélation)forment une base orthogonale du sous-espa e ve torielportantl'essentieldel'inertiedunuagedesindividus.L'analysesefaitdon dans un sous-espa e de taille réduite (ex :

q = 2

), faisant intervenir seulement les attributsles plus dis riminants.

2.3 Appro hes frontière

Nousallonsprésenterlesdiérentstraitementsdel'information ontourquenous utilisons pour générer lesagents ontour (Ÿ8.5.2 p.168).

Nous présentons en annexe A.3 un traitement omplémentaire (fermeture de ontour) permettant de naliserune segmentation par appro he ontour.

Les appro hes ontour ont pour obje tif de déte ter les dis ontinuités en ni-veauxde gris, ouleursoutexturesdansl'image.Onpro èdegénéralementenquatre étapes :

1. appli ation d'un opérateurde déte tion de ontours (Ÿ2.3.1);

2. lo alisationdes ontours,devant orrespondreaux frontièresentre régions ho-mogènes de l'image(Ÿ2.3.2 p.23);

3. suivi des points de ontour pour extraire les haînes de pointsqui onstituent les frontières (Ÿ2.3.3p. 24);

4. fermeturedes ontoursan d'obtenirlesrégionsdénissantainsiune partition de l'image(ŸA.3 p. 255).

2.3.1 Les opérateurs de déte tion de ontours

Les appro hes dérivatives pro èdent par une déte tion des variations de lumi-nan edansl'image.Unepremièrete hnique onsisteàappliquerdesltresàréponse impulsionnelle nie (RIF) qui al ulent une approximation de la dérivée première ou se onde du signalbidimensionnelasso ié àl'image.

LesopérateursdePrewitt&Sobelsontdesmasquesde onvolutionquidéte tent un gradientdans une dire tiondonnée. On peut de ettefaçonextrairelanorme du gradientetsa dire tion.

L'opérateur de Marr-Hilbert (appro he dérivative de se ond ordre) se présente sous la forme d'un masque déni selon le lapla ien d'une gaussienne et dont les

(24)

Ces opérateurs sont des ltres passe-haut qui ont tendan e à amplier le bruit. Cettesensibilitéaubruit,en oreplusfortepourlesopérateursdese ondordre(d'où lagaussienne),peutêtrediminuéeenaugmentantlatailledumasque,permettantpar làmêmeuna roissementdurapportsignalàbruit.Cetteappro he al'in onvénient de multiplierlesréponses orrespondant àun ontour donné, e quinuitàlabonne lo alisationdes ontours.

L'appro he de Canny [Can83℄ her he un ltre optimal pour déte ter un é helon noyédans un bruit blan selon trois ritères:

1. une bonne déte tion qui onsisteà avoirle meilleurrapportsignal à bruit; 2. unebonnelo alisationdu ontourquisupposequeladistan eentre laréponse

maximaledu ltreet le ontour réel doit être faible; 3. lafaible multipli itédes réponses pour un seul ontour.

CannyproposeunesolutionàbasedeltresRIF[Can86℄ ombinantdérivéede gaus-sienne ommeréponsedu ltreetlapla iende gaussiennepour labonnelo alisation du ontour.Lerésultatest seuilléparhystérésispuis étudiéàdiérentesé helles(on modie lavarian ede la gaussienne).

Les appro hes paramétriques : onse doted'un polynme modélisantune sur-fa e plane ou non; puis on her he les paramètres du polynme approximant au mieuxlasurfa edel'image.Cepro édéest répété pour haque pixelen prenanten omptepour l'approximationun voisinageplus oumoinsétendu etun polynmede degré hoisi.Harali kpropose lefa et model [Har81℄danslequel haquefa ette re-présenteun polynmed'approximation.Ondoit ensuite omparer haque polynme aux polynmesmodélisantles ontours an de jugerde laprésen e d'un ontour.

Cetteappro he autoriseunedes riptionplusnedes ontours,permettantmême une étude sub-pixelique grâ e à l'introdu tion d'une modélisation analytique du ontour.

2.3.2 Lo alisation des ontours

Certains déte teurs de ontour (appro he optimale) ont déjà pris en ompte le problèmedelabonnelo alisationdes ontours.Maisleste hniquesdesimpleltrage de type Sobelfournissent une imagede gradient qu'il onvient de traiteran de ne onserverquelespixelsde ontour orrespondant àune vraiefrontièredansl'image. Pour ertains problèmes, un simple seuillage peut souvent permettre d'extraire les points de ontour signi atifs si l'on dispose de susamment d'informations a priori.Le hoixd'un telseuil est spé ique autype d'imagetraitée:un seuiltrop baslaisseratrop de pointsde ontour ( ontours épaisetfaux ontoursdus aubruit) tandis qu'un seuil trop haut éliminerades pointsde ontours de façonpré o e.

Un tel seuil global est don souvent di ile voire impossible à déterminer. Une appro he lo ale etadaptativepeut souventdonner de bons résultatssi l'on apporte denouvelles ontraintes (informationsapriori )àlaséle tiond'unpointde ontour.

(25)

Les ontraintestraduisentlefaitqu'un pointde ontoursigni atiffaitpartied'une ligne de rête 'est-à-dire:

1. la réponse du ltre (legradient)en e point doit être forte;

2. le gradient le long de la ligne reste fort, autrement dit le gradient des sites perpendi ulaires à ladire tiondu gradientest fort;

3. le gradient s'aaiblit à droite et à gau he de la ligne de rête, autrement dit legradientdes sites pla és dans ladire tion(devant, derrière) du gradientest plus faible qu'au site ourant.

De es ontraintes supplémentaires, a été extrait un ensemble d'algorithmes per-mettant de lo aliser les points de frontière. Citons l'algorithme de suppression des non-maximums lo aux [Son99℄ qui supprime tous les points dont la norme du gra-dientn'estpassupérieureà elledesdeuxpointssituésdansladire tiondugradient. Un seuillage par hystérésis pro ède dans une première étape à un marquage de tous les sites dont la norme du gradient est supérieure à un seuil

t1

. Ce seuil doit être susamment élevé pour éliminer les ontours dûs au bruit. Dans une se onde étape, onanalyse tous les sites dont la norme du gradient est supérieureà un seuil

t0

(ave

t0

< t1

) et qui ont un voisin marqué. On itère ette deuxième étape tant qu'il y aau moins un nouveau site marqué.

2.3.3 Suivi de ontours

Lespointsde ontour signi atifs étant lo alisés, ils'agit maintenantd'extraire les haînes de points qui onstituent les frontières entre les régions de l'image. Il existeunvasteé hantillond'algorithmestraitant eproblème,ayanten ommunune appro he lo ale sur le hoix du pro hain point de ontour à ajouter à une haîne. Ils sont plus ou moins bien adaptés à une bonne prise en ompte de l'information a priori qui onditionnelaqualité durésultat obtenu.Prenonspar exemple[Son95℄ le as de l'extra tion de veines (ou artères) qui sont des stru tures nes omposées de deux haînes de points de ontour parallèles; ette information a priori peut être intégrée omme ontrainte supplémentaire dans une pro édure de onstru tion simultanée des deux haînes (de points de ontour) parallèles. Cette méthode est ainsi plus robuste fa e àun artefa t lo alsur une des deux haînes.

Le suivi de ligne de rêtepar appro he lassique [Pit93℄ her he àfabriquer une haîne de points de ontour à partirdes sites oùlegradient est maximum.An d'éviter les ontoursdûs aubruit, l'imagedes gradientsest seuillée;une alternative onsisteàrajouterdes ontraintesauxseuilsportantsur lesnormesdegradientdans les pro édures expliquées i-dessous. Cette onstru tion in rémentale s'appuie sur les ritèresénon és àla se tion2.3.2.

Soient

|g

i

|, φ

i

la norme et la dire tiondu gradient au site

i

qui est le site à l'ex-trémité de la haîne ouranteen onstru tion.

(26)







*

pre

gi

Fig. 2.3 : Les deuxsous-voisinages :

V

i

et

V

i

dusite ourant (au entre) enfon tion du gradient

g

i

en e site.

Onpartitionnelevoisinagede site

i

endeux sous-voisinages

V

i

et

V

i

en fon tion de

φi

et du site pré édent

prec

de la haîne de ontour. On hoisit un site

j

parmi

V

i

,lesiteprolongeantaumieuxle ontour 'est-à-dire eluiquioptimiseles ritères suivants:

1.

j = arg min

|φi

− φj

| mod 2π

2.

j = arg max

|g

j

|

Les deux ritères donnent des résultats similaires,onpourra par exemple hoisir le deuxième ritère dans un voisinageoù l'on aura retiré les sites dont la dire tiondu gradient varie trop, 'est-à-dire :

j = arg max

|g

j

|

telque

j

∈ V

i

− {k ∈ V

i

telque

i

− φ

k

| mod 2π > T }

2.3.4 Con lusion sur les appro hes ontour

Ces appro hes basées sur la déte tion de ruptures de stationnarités ne peuvent supporter à elles seules un système robuste de segmentation, e i pour plusieurs raisons :

1. Ellesnesontpas adaptées auximagestexturées, employéesseules elles fourni-raient un résultat sur-segmenté.

2. Ellessont sensibles au bruit de par leur nature passe-haut, e qui peut pro-voquer la réationde faux ontours.

3. La fermeture de ontour est une tâ he ardue, ar de nombreuses erreurs sur lesquelles il est di ile de revenir, peuvent être ommises; la fusion de deux ontours distin ts en est un exemple. Une ertaine robustesse peut être ob-tenue ave l'ajout d'un grand nombre d'informations a priori apportant des ontraintes supplémentaires an d'éviter leserreurs. Parexemple, en segmen-tationd'imagerieaérienne, l'extra tion des routesest fa ilitéepar lastru ture parallèledes deux bords de laroute.

Les appro hes ontour apportent une information signi ative sur la qualité des ruptures tant en intensité (longueur et gradient le long d'une haîne de ontours) qu'en lo alisation,informationqui doit être intégrée à travers un pro essus de seg-mentation par appro he région, et qui peut même servir en interprétation sur la ara térisationde la formed'une région.

(27)

2.4 Appro hes stru turales ou agrégatives

Dans es appro hes, lestraitementssont transposés dans un univers s'appuyant sur des stru tures de données. On utilisera par exemple un arbre quaternaire quadtree (Ÿ3.3.1 p. 35) ou bien un graphe d'adja en e de région (RAG) (Ÿ3.4 p. 37), e dernier pouvant même être utilisé dans une stru ture hiérar hique (pile de graphes) [Mon91℄.

Les méthodes stru turales [Har85, Ada94, Cha94℄ sont aussi appelées méthodes agrégatives ou in rémentales [Bel98℄ ar elles her hent à onstituer de façon itérative(paragrégation oudivision) unepartitiondel'imageen régionshomogènes

Ri

respe tant un ritèred'homogénéité (

H(Ri) = V RAI

)àpartir d'unensemble de régions initiales.

Ellesfournissent un adre dé isionnel ri he (priseen ompteaisée de l'infor-mationapriori)etlo al.Cedernierpointautoriseuneparallélisationdestraitements permettant de ontrebalan er l'important oût al ulatoirepropre à es appro hes.

On distingue deux famillesde méthodes :

1. les appro hes des endantes :dé oupe ré ursive(split);

2. les appro hes as endantes de type a roissement de régions (régiongrowing). Les appro hes varient suivant le ritère d'homogénéité adopté. Les appro hes as- endantes appliquent e prédi at sur l'union des régions andidates àla fusion. Les appro hes des endantes,quantàelles,l'appliquentàunerégionquiseradiviséesile prédi at n'est pas respe té. Le prédi at d'homogénéité

H()

seuille lerésultat d'une fon tion, évaluantl'homogénéité

h()

d'une région oulasimilaritéde deux régions :

H(R

p

∪ Rq

) =



VRAI si

h(R

p

∪ Rq

)

≤ T

FAUX sinon

Voi iles ritèresles plus ouramment employés:

1. Une simple ontrainte sur ladiéren e entre lavaleur maximum etminimum des niveaux de grisdans la région:

htrivial(Rp

∪ Rq) =

| max

x

p

∈R

p

∪R

q

(xp)

− min

x

q

∈R

p

∪R

q

(xq)

|

2. Une mesure de similarité entre les moyennes des niveaux de gris de deux ré-gions :

hmoy(Rp

∪ R

q) =

|moy(R

p)

− moy(R

q)

|

3. Une mesure de similarité multidimensionnelle portant sur des attributs a-ra térisant les textures respe tives des deux régions omme par exemple les matri esde oo urren e [Che78℄.

4. Unemesuredu ontrasteentrelesdeux régions.Soit

Fpq

lespixelsde

Rp

ayant dans leur 4-voisinage

V4(xi)

un voisin appartenant à

Rq

. Le ontraste mesure les variationsen niveau de grislelong de ette frontière (de longueur

L(Fpq

)

)

hcont(Rp

∪ R

q) =

1

L(Fpq)

X

x

∈F

X

x

∈V

(x

)

|x

i

− x

j

|

(28)

5. Les ritèrespeuventaussiportersurdesaspe tsgéométriques.L'uniondedeux régions doit, par exemple, être susamment ompa te : al ul du fa teur de ir ularité (périmètre/surfa e).

2.4.1 Appro hes des endantes par division ré ursive

Cettepro édureré ursiveproposée parHorowitzetPavlidis[Hor74℄s'appuiesur un arbre quaternaire quadtree (Ÿ3.3.1 p. 35). Elleprend en paramètre une image qui est divisée en quatre sous-images si un ritère d'homogénéité (prédi at) n'est pas respe té. La pro édure est appelée ave une fenêtre de la taille de l'image à segmenter. Le résultatest lenoeud ra ine de l'arbre.

split(image, fenêtre, noeud)

si (

H

(fenêtre, image) ou taillede lafenêtre =1)noeud.fenêtre

fenêtre sinon

 noeud.NO

split(image,new fenêtre(

i1

,

(i1

+ i2)/2

,

j1

,

(i1

+ i2)/2

),new noeud)  noeud.NE

split(image,new fenêtre(

i1

,

(i1

+ i2)/2

,

(i1

+ i2)/2

,

j2

),new noeud)  noeud.SO

split(image,new fenêtre(

(i1

+ i2)/2

,

i2

,

j1

,

(i1

+ i2)/2

),new noeud)  noeud.SE

split(image,new fenêtre(

(i1

+ i2)/2

,

i2

,

(i1

+ i2

)/2

,

j2

),new noeud) n si

retourne noeud

Algo. 2.1 : Segmentation des endante par dé oupe ré ursive sur une stru ture de quad-tree. Les stru tures de données fenêtre et noeud sont présentées (Ÿ3.3.1 p. 35).

Cette appro he top down est plus adaptée que les appro hes as endantes aux texturesgrosgrain ar,ave unprédi atadapté,ladivisions'arrêteàl'é helledela texturesans provoquer de sur-segmentation.Ce i est obtenugrâ e àune estimation des statistiques ee tuéesur des zones étendues dès le départ.

Cependant, on onstate un eet de pavage des segmentations obtenues (voir hap.10).Cet eetest auséparunseuil uniqueappliquéàtoutel'image, e dernier devantêtresusammentélevépouréviteren ertainsendroitsunesur-segmentation, mais qui sur d'autres zones de l'imageprovoque une sous-segmentation.

Deplus,onpeutobtenirdeuxrégions onnexes

Rp, Rq

pourlesquellesleprédi at est vérié

H(Rp

∪ R

q) = V RAI

.Cette situationpeutseproduire silesdeux régions nesontpasdanslemêmesous-arbre dedé ouperé ursive.D'oùl'intérêtd'adjoindre un algorithme de fusion de régions.

2.4.2 Appro hes as endantes par fusion de régions region merging

Cette appro he as endante va itérativement fusionner les régions dont l'union respe teleprédi atd'homogénéitéjusqu'à equeplusau unefusionnesoitpossible.

(29)

intermédiaire

Résultat

Partition initiale

RAG correspondant

(4−connexité)

Première

Étape

fusion

Fig. 2.4 : Graphe d'adja en e de région (RAG) asso ié à une partition initiale (obtenue à l'aide d'un split)puis appli ation de la pro édure de fusion.

Letravails'ee tuesurungraphed'adja en ederégions(RAG:RegionAdjan y Graph) (Ÿ3.4 p. 37). Outre le hoix du prédi at d'homogénéité, le point lé de et algorithme est l'ordre dans lequel les fusions sont ee tuées. Il est don né essaire ( omme le pré ise Bellet [Bel98℄) de trier les régions andidates à la fusion sur la valeurde lafon tiond'homogénéitéand'ee tuerenpremierlesmeilleuresfusions.

Region Merging

{R1

, R

2

, ..., R

n} ←

ee tuer une première (sur)segmentation (ex. : split)

G(S, A)

onstruire legraphe d'adja en e

pour tout(les ouples(

sp, sq

)tels que

∃(p, q) ∈ A

) 

h

pq

← h(Rp

∪ Rq

)

// fon tion d'homogénéité

 si (

hpq

≤ T

)insérer

(sp, sq, hpq)

dans liste par ordre de

hpq

roissant n pour tout

tant que(listen'est pas vide)

 fusionner le meilleur ouple:

(sp, sq, hpq

)

pop( liste );

sn

= sp

∪ s

q

 mettre à jour le graphe d'adja en e

G(S, A)

prenant en ompte le retrait de

s

p

, s

q

etl'ajoutde

s

n

 al uler lesattributs du noeud

sn

résultantde lafusion des sommets

sp

, sq

 retirer les ouples de liste où l'une des 2 régions

sp

ou

sq

intervient  pour tout(les ouples(

s

n

, s

q

)tels que

∃(n, q) ∈ A

)



hnq

← h(R

n

∪ R

q)

 si (

hnq

≤ T

) insérer

(sn, sq, hnq

)

dans liste par ordrede

hnq

roissant n pour tout

n tant que

Algo. 2.2 : Segmentation as endante par fusion de régions sur une stru ture de graphe d'adja en e.

Une ombinaisonde divisions etde fusions(algorithme splitand merge[Hor74, Pav77℄)permetde proterdes avantages des deux appro hes.

2.4.3 Appro hes as endantes par agrégation de pixels

(30)

initiales)est similaire à elle de la fusion de régions à e i près que l'entité de base agrégéeest lepixel.

2.4.4 Con lusion sur les appro hes stru turales

Jiang et Toriwaki [Jia93℄ proposent une analyse omparativedes diérents opé-rateurs.Onpeutdégager deux tendan esgénérales dépendantdes méthodes d'agré-gation :

 Entermede pré ision, on hoisira pluttlesopérateurs d'agrégationde pixels naturellementpluspré isquelesopérateursdefusionderégionsdontl'élément primitifd'agrégationest une fenêtre arrée.

 Entermede sensibilitéaubruit,latendan e s'inverse en faveurdes fusions de régionsdontlesattributssont al uléssurunplusgrandnombred'é hantillons permettantainsi un lissage du bruit.

L'évaluation doit ensuite être diéren iée suivant le prédi at de fusion hoisi. En terme de fa ilité de paramétrage et de rapidité d'exé ution, les appro hes utilisant des ritèressimples de type

htrivial

donnentde meilleursrésultats quelesappro hes multidimensionnelles ouutilisant des heuristiques. Lesappro hes simples (monodi-mensionnel à un seuil global) produisent des imagessur-segmentées sur des images texturées ou même sur des images où la distribution globale des niveaux de gris résulte d'une fusion de plusieurs distributions lo ales empê hant la détermination d'un seuil global [Bev89℄.

Cesargumentsjouentenfaveurd'appro heshybridesadaptantlo alementet tem-porellement(tempsd'exé utionde l'algorithmedefusion)le ritèredefusion.Chang etLi [Cha94℄proposentun test d'homogénéité adapté à:

1. ladistributiondes niveaux de grisdes régionslo ales,en faisantvarierleseuil autorisantla fusion;

2. latailledesrégions onsidérées,permettantainsilapriseen omptedunombre d'é hantillons utilisés pour l'estimation des paramètres.

Beveridge et al. [Bev89 ℄ proposent de dé ouper l'image en se teurs permettant une lassi ationsur la base d'histogrammes al uléslo alement.Unalgorithme de fusionde régionsest ensuite appliquépour fusionner lesrégions onnexes ne faisant pas partie du même se teur.

2.5 Appro hes oopératives

Lestravaux omparatifs[Co 95, Jia93℄ sur lesdiérentes te hniques de segmen-tationn'ontpas dégagéune prééminen e(indépendammentdu typed'image)d'une appro he parti ulière. La tendan e a tuelle pour espérer une ertaine robustesse et des qualités tout terrain onsiste don à faire oopérer diérents types d'algo-rithmes. La ri hesse de la littérature sur les pro édures oopératives n'est pas en adéquation ave l'apport qu'on pourrait en espérer. Ce manque est peut être dû selon Pavlidis et Liow[Pav90℄à la di ulté du problème :

(31)

The general prin iple of integration is well a epted in vision. But ar-rying out the general prin ipleis quite hallenging and this may explain the sparsity of the literature on integrated te hniques.

Ou selon Pavlidis[Pav92 ℄ àla manière dont les her heurs du domaineabordent le problème :

The main obsta le to integration of methodologies is that various ap-proa hes are oered as pana eas rather thanas member of a toolset.

La plupart des appro hes oopératives exploitent la dualité ontour/région. Cette dualitéentraduitsouventuneautre:ladualitélo al/global[Cho97℄.Eneet,les ap-pro hes ontour sont souvent lo ales, don plus sensiblesau bruit,mais permettent unebonnelo alisationdesruptures.Au ontraire,lesappro hess'appuyantsur l'ho-mogénéité entre régions sont plus globales (de part la dénition de leurs seuils) et robustes au bruit, mais elles aboutissent à une mauvaise lo alisation des frontières (on obtient souvent des frontières dé hiquetées, voir hapitre10). On distingue plu-sieursappro hes oopératives,dé rites i-après,exploitantladualité ontour/région.

2.5.1 Coopération onfrontative par fusion de données

Dans ette première lasse de méthodes la oopération intervient omme un onsensus ou une onfrontation a posteriori entre plusieurs segmentations on ur-rentes.

ChuetAggarwal[Chu93 ℄suggèrentl'intégrationaposteriori de artesde segmen-tation al ulées en parallèle. Ces artes de ontours sont issues de l'appli ation de déte teurs de ontours et de l'extra tion des ontours après une segmentation par appro he région.Ils utilisent,deplus,plusieurssour esde lamêmes ène. L'intégra-tion nale her he à générer un onsensus entre les diérentes segmentations sur la base d'une pondération, réglablepar l'utilisateur,apportée à ha une des artes.

ChoetMeer[Cho97℄proposentuneappro hebaséesurle onsensusentreplusieurs segmentations. Les résultats des diverses segmentations permettent la onstru tion d'un graphe(RAG)reétantpour haquepaire de pixelslaprobabilitéde oo ur-ren e,autrementdit, laprobabilitéd'appartenan e àlamêmerégion.Le onsensus est obtenu en traitant e RAG de façon lassiquean de regrouper les pixelsayant une forte probabilité d'appartenirà lamême région.

2.5.2 Coopération intégrative

Dans ette deuxième lasse de méthodes, l'information ontour est intégrée sous formede ontrainteparuneappro herégion.La oopérationn'estpas omplètement dynamique en e sens quel'informationde ontour est extraite de façon statiqueet ne protepas de l'informationrégion.

(32)

Pavlidis etLiow [Pav90 ℄ proposent un traitement en trois étapes:

1. l'image est sur-segmentée par une appro he de division-fusion sur arbre qua-ternairepermettantainside dégagerune arte de ontours fermés àpartirdes régions;

2. lesfrontièresentrerégions onnexessontéliminéessurdes ritèresde ontraste etde hangement de dire tion;

3. es frontières sont ensuite dépla ées an d'être mieux lo alisées, e i à l'aide d'uneappro he par ontours a tifstravaillantsur une image de ontours. WrobeletMonga[Wro87℄ee tuentune pré-segmentationand'obtenir unRAG initialdontles noeuds portent lesattributs des régionset dontles arêtes sont pon-déréespar une artedes ontourspré- al ulée.Cettepondération omptelenombre de points de la frontière où le ontraste est supérieur à un seuil et la longueur de ette frontière. Les fusions de deux régions dont le rapport (longueur de fron-tière)/(nombre de points de ontraste) est inférieur à un seuil sont empê hées. On obtient ainsi une oopération par ontrainte.

Anderson et al. [And87℄ utilisent une déte tion de ontours pour initialiser et assister une pro édure de roissan e de régions basée sur le al ul d'un seuil de similaritélo ale.Ce dernierest aussiinuen é par des informationsa priori omme lenombre de régionsdans l'image.

Xiaohan et al. [Xia92℄ utilisent une information de gradient lo al pour ontrler un pro essus de roissan e de région.

Bertolino [Ber96, Ber95℄ propose une appro he basée sur une pyramide de RAG (pyramideirrégulière)oùde l'informationfourniepar une artede ontour (obtenue par un déte teur 1D spé ique) est prise en omptelors de l'évaluation des fusions entre régions voisines. L'informationde ontour se présente omme un ouple

(r, c)

qui pondèreles arêtesdu graphed'adja en e;

r

et

c

représentant respe tivement le nombre d'éléments de région (faible réponse au déte teur de ontour) et lenombre d'éléments de ontour (forte réponse) à la frontière des deux régions. Une analyse lo ale de

r

et

c

permetde for er oud'interdiredes fusions entre sommetsadja ents du RAG an d'éviterla réationd'artefa ts ouladisparition de détailssigni atifs.

2.5.3 Coopération dynamique par inuen e mutuelle

Dans ette dernière lasse de méthodes, les diérentes appro hes s'inuen ent mutuellementetdynamiquementau ours du pro essus de segmentation. C'estune voie qui semble prometteuse ar l'information extraite par une méthode est utili-sée au plus ttpar lesautres appro hes. La di ulté ren ontrée est leproblème du ontrledesmodulesetdeladiusiondel'informationenleursein.C'estdon natu-rellementqueles her heurssesontportésvers des appro hes utilisantl'intelligen e arti ielle. L'IA propose une panoplie d'ar hite tures et d'outils (tableaux noirs,

(33)

agents,systèmes experts) permettantune intégration distribuée d'une onnaissan e omplexe etle ontrle entre les diérents modulesde onnaissan e.

Salotti,Belletetal.[Bel94,Bel98℄(Ÿ5.5.3.1p.100)proposentuneappro heàbase de pro essussitués dansl'image.Certains de espro essus exé utentune roissan e de régiontandisquelesautresexé utent unsuivide ontour;ils oopèrentde façon opportuniste et dynamique pour faire émerger de l'information supplémentaire au as où ils ne peuvent dé ider quel nouveau pixel peut être agrégé à la primitive en onstru tion.

Nazif et Levine [Naz84℄ proposent un système expert omportantdes règles per-mettant l'analyse de primitives région et ontour. Ces règles agissent sur les pri-mitivesen les divisant,fusionnant suivant les situations lo ales respe tives des pri-mitivesen ondition dans les règles. Ce i autorise la prise en ompte de primitives ontour dans l'a tion àmener sur des primitivesrégion,et ré iproquement.

(34)

3

Les Stru tures

pyramidales

Une ar hite ture de ontrle àbase de systèmemulti-agentsne peut être globa-lementanalyséequesil'on apro édéàunespé i ation rigoureusede l'organisation stru turant la populationd'agents.

Nous proposons d'utiliser la pyramide irrégulière omme élément stru turant et régulant l'a tivitéde es derniers.

Nous allons lors de e hapitre présenter les stru tures pyramidales en analyse d'image.Nousévoqueronsd'abordlesaspe tsmultirésolution,puisnousdétaillerons plusparti ulièrementlespyramidesirrégulières,pournirparévoquerlespyramides duales.

Certaines ara téristiques des stru tures pyramidales, omme le parallélisme, en font un modèle organisationnelparti ulièrementadapté à notreproblématique.

(35)

3.1 Introdu tion

Lesstru turespyramidalesontété introduitespar TanimotoetPavlidis[Tan75℄. Il s'agit d'un empilement de stru tures de données représentant à haque niveau l'image (ou une bandede fréquen es de l'image)observée à une ertaine résolution. On sedote d'une pro édurede dé imation (généralementré ursive)pour passer du niveau

k

à

k + 1

. En partant de la base qui représente l'image (ou l'image ltrée), on aboutit progressivement, par simpli ation de l'information,à l'apex, ledernier niveau de lapyramide, omportant un minimumd'informations quantitatives. Sou-lignons deux des prin ipauxaspe ts liésà e type d'appro he :

Le parallélisme, inhérent à la stru ture pyramidale, permet une implantation naturelle sur des ma hines parallèles de type multigrilles aussi appelées ma hines pyramidales. La lo alité des al uls permet ave un nombre de

N

2

pro esseurs 1 d'obtenir une omplexité en temps de

O(log N)

. Thomson Leighton propose une introdu tion générale aux ar hite tures et ma hines parallèles dans [TL92℄, tandis que Mérigot dans [Jol01℄ hap. 6traite plus parti ulièrement de la vision parallèle. On trouvera dans [Mér86℄ un exemple d'ar hite ture pyramidalepour le traitement d'image.

La multirésolution, obtenue par lasimpli ationniveau par niveau de la quan-tité d'informations, permet de hoisir la résolution d'analyse la plus adaptée au problème. À basse résolution, l'atténuation du bruit et les détails non signi atifs permettent un traitement robuste et rapide. Les résultats ([Pav77 , p.74℄ obtenus à basse résolution peuvent être utilisés [Son95℄ omme informations a priori ou ontraintes supplémentaires pour guider un traitement ee tué à plus forte résolu-tion dans un environnement bruité.

Toutefois, et aspe t omporte deux in onvénients :

 la simpli ation de l'information s'a ompagne de la disparition de frontières signi atives entre régions;

 ette simpli ation peut aussi générer et amplier, au fur et à mesure de la roissan e, l'apparitionde frontières quin'existentpas ousontpeu a entuées dans l'image originale.

3.2 Aspe t multirésolution : pyramides Gaussienne

et Lapla ienne

La pyramide Gaussienne [Bur81℄ est onstruite suivant une appro he bottom up où haque niveau

G

k+1

est une opie basse résolution (ltrage passe-bas puis dé imation)duniveauinférieur

Gk

.Cetypedereprésentationprésentelesavantages évoqués i-dessus:analyserapideàbasserésolutiondontlesrésultatsoriententou/et a élèrent lestraitementsaux plus fortes résolutions.

1

N

2

(36)

Dans [Li97℄une segmentationàbase de hampsde Markov est ee tuéeàbasse résolution (niveau

Gn

). L'information olle tée ( hamps d'étiquettes) est propagée vers leniveauinférieur

Gn−1

ommeinformationapriori ,permettantune a éléra-tionde lasegmentationà e niveau.Lapro édurede propagationpuisde segmenta-tionest appliquée su essivement à haque niveau,de manièredes endante, jusqu'à l'obtention d'une segmentation de l'image sour e.

Ce type de transformation pyramidale est aussi un outil utilisé dans le domaine du odage ( ompression) où le sou i est d'exploiter les redondan es dans l'image aussi bien lo alement que sur de grandes étendues. C'est l'obje tif de la pyramide Lapla ienne [Bur83℄ qui ne omporte que les erreurs de prédi tions propagées du haut vers lebas.

Après obtention de lapyramideGaussienne

{G0, ..., Gk, ..., Gn}

,onestime haque niveau

G

k

àpartirduniveausupérieur

G

k+1

parun sur-é hantillonnageetune inter-polation (une expansion de l'image). L'erreur entre l'estimation

EXP AND(Gk+1)

et

Gk

représente un niveau de la pyramide Lapla ienne :

L

k

= G

k

− EXP AND(Gk+1

)

Finalement on ne transmet que

{G

n, Ln−1, ..., L0

}

.

Gn

est une représentation om-pa te basse fréquen e de l'image on entrant l'essentiel de l'énergie, les

Lk

sont les erreurs d'estimation exploitant les redondan es sur de grandes puis de petites étendues. LapyramideLapla ienne ontient desinformationsde typepasse-bandes, dont les valeurs sont souvent faibles ou nulles. Ce qui permet, à l'aide d'une om-pressionstatistique et/oud'une quanti ation, de réduiresigni ativementle débit asso ié à l'image. Le odage par pyramide Lapla ienne augmente la robustesse de l'informationen as de rupture de transmission.

3.3 Modèles de dé omposition hiérar hique de l'image

Lespyramidesinterviennenti i ommeunmodèlededé ompositionhiérar hique de l'image. Ces pyramides servent de squelettes aux appro hes de segmentation stru turales de type dé oupe ré ursive (Ÿ2.4 p. 26). Elles sont don onstruites de façon des endante.

Nous allons maintenant évoquer les diérentes te hniques de partitionnement géométrique et adaptatif de l'image. Un partitionnement est dit adaptatif si la po-sition de l'élémentde partitionest fon tiondu ontenuinformatifde l'image. Cette adaptation au ontenu informatif est guidé par un algorithme de type dé oupe ré- ursivesplit.

3.3.1 Modèle rigide de partitionnement

Danslequadtree [Hor74℄,l'élémentdepartitionnementestun arré.Lapyramide est ré ursivement onstruite par une appro he de dé oupe ré ursive des endante (Ÿ2.4.1p. 27).

Figure

Fig. 1.1 : Les trois niveaux d'analyse des systèmes vision, et, en grisé, les thèmes abordés
Fig. 2.4 : Graphe d'adja ene de région (RAG) assoié à une partition initiale (obtenue
Fig. 3.2 : (a) Partitionnement de l'image par le diagramme de Voronoï en traits pleins,
Fig. 3.6 : T rois méthodes de déimation/fusion ; la valeur portée par les sommets est is-
+7

Références

Documents relatifs

Objectifs : - Réaliser un montage sur un banc d’optique de façon à observer une image sur un écran - Déterminer la distance focale d’un miroir sphérique convergent.. Objectifs

Les formes engendrées peuvent être plus ou moins organiques : sortes de plantes ou de créatures tout d’abord, avec Sims elles perdent progressivement leur référent naturel

4.. Variation expliquée et inexpliquée But d’un modèle de régression linéaire : expliquer une partie de la variation de la variable expliquéeY. La variation de Yvient du fait de

Les biens et services marchands sont destinés normalement à être vendus sur le marché à un prix calculé pour couvrir leur coût de production?.

Mettre en place une évaluation à 180° pour les directeurs/directrices de projets et à 270/360° pour les chefs/cheffes de services et sous-directeurs/directrices, en incluant

a- Une activité sportive qui développe le bien-être chez un individu b- Une discipline scolaire qui développe les capacités chez un individu c- Une activité sportive qui

a- Est également utilisé au saut en hauteur b- Est également utilisé aux sauts horizontaux c- Est également utilisé aux sauts verticaux d- Aucune réponse n’est

La construction de l’image financière d’une entreprise joue donc un rôle central durant toute la vie de l’entreprise tant sur le plan interne qu’externe..