Impl´ementation des filtres non-lin´eaires de rang sur des architectures universelles et reconfigurables

(1)

Facult´ e de Sciences appliqu´ ees

Service des Syst` emes Logiques et Num´ eriques

Impl´ementation des filtres non-lin´eaires de rang sur des architectures universelles et reconfigurables

Dragomir Milojevic

Promoteur : Prof. Philippe Van Ham

Travail pr´ esent´ e en vue de l’obtention du titre de Docteur en Sciences Appliqu´ ees

Ann´ ee Acad´ emique 2003-2004

(2)

(3)

Je tiens à remercier plus particulièrement le Prof. Philippe Van Ham pour ses conseils, pour son soutien et surtout pour ce goˆ ut du savoir qu’il a réussi à me faire partager.

Un grand merci également au Prof. Nadine Warzée, pour son soutien, son efficacité et pour sa grande disponibilité.

Je remercie ´egalement :

Le Prof. Marc Acheroy et les membres du SIC de l’ ´ Ecole Royale Militaire avec lesquels j’ai eu l’opportunité de faire de la recherche appliquée dans un but huma- nitaire et de réaliser des expériences pas comme les autres.

Le Prof. Eduardo Sanchez pour son accueil au sein du Laboratoire des Systèmes Logiques de l’EPFL et pour ce séjour inoubliable à Lausanne.

Les Prof. Pierre Mathys, Prof. Marcel Dotrimont, Prof. Patrick Merken pour avoir accepter de faire partie de mon jury.

Un tout grand merci à Frédéric Robert qui a pu trouver un moment pour me lire et pour m’encourager.

Je tiens à remercier aussi tous les membres de l’équipe du laboratoire des Systèmes Logiques et Numériques avec qui j’ai partagé beaucoup plus que le quotidien : prof. Jean Florine, Christophe De Hauwer (¸ca va être vite fait), Olivier Debeir (on va mettre encore une couje), Serge Joris (ma biche), Don Patrick Bischop (vive la Westmalle), Xavier Baele (le thé vert au jasmin est dans mon tiroir), Claude Verbeek (Led Zep à 7h du matin annoncent une belle journée), Constant Hubert (il n’y a qu’un ampli à lampes qui sonne bien), Denis Haumont, Laurent Mundeleer, Cédric Laugerotte, Thierry Leloup et tous les autres ...

Merci à Bill, Ella, Sarah, Billie, Isao, Eva, Patricia, et les autres de m’avoir accompagné à tout moment.

Enfin je tiens `a remercier ma Julie, pour son amour, pour sa patience et pour la volont´e

qu’elle a eue de corriger mon mauvais fran¸cais entre les bains de Dora et Sasha et ses dossiers

des r´efugi´es Rwandais.

(4)

(5)

Table des mati` eres

R´ esum´ e 1

Abstract 1

1 Introduction 5

1.1 Présentation générale . . . . 5

1.2 Contenu et contributions . . . . 8

1.2.1 Contenu . . . . 8

1.2.2 Contributions . . . . 9

1.3 Traitement . . . . 10

1.3.1 Images et transformations . . . . 10

1.3.1.1 Notations . . . . 10

1.3.1.2 Transformations ponctuelles . . . . 12

1.3.1.3 Transformations spatiales . . . . 12

1.3.2 Filtres non-lin´eaires . . . . 13

1.3.2.1 Classification . . . . 13

1.3.2.2 Filtres non-lin´eaires de Classe I . . . . 14

1.3.2.3 Filtres non-lin´eaires de Classe II . . . . 18

1.3.2.4 Exemples d’application des filtres non-lin´eaires . . . . 20

1.4 Machine . . . . 23

1.4.1 Historique . . . . 23

1.4.2 Classification des architectures . . . . 27

1.4.2.1 Taxinomies des architectures universelles . . . . 27

1.4.2.2 Taxinomies des architectures d´edicac´ees . . . . 31

1.4.2.3 Taxinomies des architectures selon la configurabilit´e . . . . . 32

1.5 Performance . . . . 33

1.5.1 Performance du mat´eriel . . . . 33

1.5.1.1 Param`etres classiques . . . . 34

1.5.1.2 Param`etre commun . . . . 35

1.5.2 Performance d’une application . . . . 37

1.5.2.1 Temps d’ex´ecution . . . . 37

1.5.2.2 Acc´el´eration . . . . 37

1.5.2.3 Mesure sp´ecifique pour le traitement d’images . . . . 38

(6)

2 Architecture universelle 39

2.1 Parall´elisme des architectures universelles . . . . 40

2.1.1 Parall´elisme intra-processeur . . . . 40

2.1.1.1 Parall´elisme des instructions . . . . 40

2.1.1.2 Problèmes liés à l’exploitation du parallélisme des instructions 45 2.1.1.3 Parallélisme des données . . . . 48

2.1.2 Parall´elisme inter-processeur . . . . 49

2.1.2.1 Parallélisme des systèmes à mémoire partagée . . . . 49

2.1.2.2 Parallélisme des systèmes à mémoire repartie . . . . 52

2.1.3 Processeurs actuels . . . . 52

2.1.4 Architectures universelles cibl´ees . . . . 53

2.1.4.1 Architecture standard . . . . 53

2.1.4.2 Extensions . . . . 55

2.1.4.3 Diff´erences entre Pentium 2 et Pentium 4 . . . . 57

2.1.4.4 Performance de la m´emoire . . . . 57

2.1.5 Exploitation des diff´erents niveaux de parall´elisme . . . . 58

2.1.5.1 Acc`es au parall´elisme intra-processeur . . . . 58

2.1.5.2 Acc`es au parall´elisme inter-processeur . . . . 60

2.2 Exploitation de l’architecture standard . . . . 62

2.2.1 Implémentation de filtre de rang généralisé . . . . 63

2.2.1.1 Tri `a bulle (Bubble sort) . . . . 63

2.2.1.2 Tri par s´election (Selection sort) . . . . 63

2.2.1.3 Tri par insertion (Insertion sort) . . . . 64

2.2.1.4 Tri rapide (Quicksort) . . . . 64

2.2.1.5 Tri par fusion (Merge sort) . . . . 66

2.2.1.6 Tri par tas (Heap Sort) . . . . 67

2.2.1.7 Tri par classement (Bucket sort) . . . . 67

2.2.2 Impl´ementation des filtres sp´ecifiques . . . . 70

2.2.3 Conclusion . . . . 70

2.3 Exploitation de parall´elisme intra-processeur . . . . 73

2.3.1 Librairie de traitement des images Intel . . . . 74

2.3.2 Programmation des extensions : filtres sp´ecifiques Min/Max . . . . 74

2.3.2.1 Description g´en´erale de l’algorithme . . . . 74

2.3.2.2 Parcours horizontal . . . . 80

2.3.2.3 Parcours vertical . . . . 82

2.3.2.4 Analyse `a l’aide de VTune . . . . 83

2.3.3 Programmation des extensions : filtre M´edian . . . . 85

2.3.4 Programmation des extensions : filtre d’un rang quelconque . . . . 86

2.3.5 Filtres d´eriv´es et/ou la chaˆıne de traitement . . . . 86

2.3.6 Filtre de rang généralisé . . . . 86

2.4 Exploitation du parall´elisme inter-processeur . . . . 88

2.4.1 Ex´ecution sur deux processeurs . . . . 88

2.5 Conclusion . . . . 90

(7)

3 Architectures d´ edicac´ ees 91

3.1 Circuits FPGAs . . . . 92

3.1.1 Architecture . . . . 92

3.1.1.1 Description g´en´erale . . . . 92

3.1.1.2 Ressources typiques des FPGAs actuels . . . . 93

3.1.2 Impl´ementation des circuits logiques dans les FPGA . . . . 95

3.1.2.1 Processus d’impl´ementation . . . . 95

3.1.2.2 Perspectives de la description des circuits . . . . 97

3.1.2.3 Efficacit´e des outils actuels d’impl´ementation . . . . 98

3.1.3 Applications des FPGAs . . . . 100

3.2 Parall´elisation du calcul des filtres non-lin´eaires . . . . 101

3.2.1 Classification des algorithmes et des architectures existants . . . . 101

3.2.2 Architectures matricielles . . . . 104

3.2.2.1 Mode bit-s´erie . . . . 104

3.2.2.2 Mode bit-parall`ele . . . . 105

3.2.3 R´eseaux de tri . . . . 106

3.2.4 Architectures bit-s´erie . . . . 109

3.2.4.1 Algorithme pour le filtre de rang . . . . 109

3.2.4.2 Cas particulier de filtre m´edian . . . . 111

3.2.4.3 G´en´eralisation de l’algorithme pour les filtres Min/Max . . . 114

3.2.4.4 Généralisation pour les autres filtres non-linéaires . . . . 115

3.2.5 Architectures d´edi´ees aux filtres de piles . . . . 116

3.3 Conclusion . . . . 118

3.3.1 Performance des systèmes dédicacés existants . . . . 118

3.3.2 Remarques . . . . 119

3.3.2.1 Remarques g´en´erales . . . . 119

3.3.2.2 Remarques sp´ecifiques `a l’architecture . . . . 120

3.3.3 Objectifs . . . . 122

4 Architecture reconfigurable 123 4.1 Description globale du système dédicacé reconfigurable . . . . 126

4.1.1 Introduction . . . . 126

4.1.2 Parties constitutives . . . . 127

4.1.2.1 Partie traitement . . . . 128

4.1.2.2 M´emoire globale . . . . 129

4.1.2.3 Unit´e de contrˆole . . . . 131

4.1.3 Hypoth`eses de travail . . . . 132

4.2 M´emoire locale des unit´es de traitement . . . . 133

4.2.1 Description de la m´emoire locale source . . . . 133

4.2.2 Description de la m´emoire locale destination . . . . 138

4.2.3 Validation de la description . . . . 139

4.2.4 Impl´ementation . . . . 141

4.2.5 Discussion . . . . 143

4.3 Unit´es de traitement . . . . 144

4.3.1 Algorithmes . . . . 144

4.3.1.1 Algorithme Max . . . . 144

4.3.1.2 Algorithme Min . . . . 146

(8)

4.3.1.3 Algorithme pour le filtre généralisé . . . . 146

4.3.2 Description de l’unit´e de traitement pour les filtres Max/Min . . . . . 149

4.3.3 Description de l’unité de traitement pour le filtre de rang généralisé . 153 4.3.3.1 Algorithme d’élimination successives des maxima/minima lo- caux . . . . 153

4.3.3.2 Algorithme de Danielsson . . . . 154

4.3.4 Validation de la description . . . . 156

4.3.5 Impl´ementation . . . . 159

4.3.5.1 Unit´e de traitement bas´ee sur l’algorithme Min/Max . . . . . 161

4.3.5.2 Unit´e de traitement bas´ee sur l’algorithme de Danielsson . . 161

4.3.5.3 Discussion . . . . 162

4.4 Syst`eme reconfigurable complet . . . . 163

4.4.1 Description du syst`eme complet . . . . 163

4.4.2 Impl´ementation d’un module de traitement . . . . 164

4.4.3 Etablissent d’une correspondance entre ressources n´ecessaires et res- ´ sources disponibles . . . . 169

4.4.4 Impl´ementation du syst`eme complet . . . . 170

4.4.5 D´ebit des pixels trait´es . . . . 171

4.5 Conclusion . . . . 172

5 Discussion et conclusion 173 5.1 Problème, motivation et intérêt . . . . 173

5.2 Impl´ementation sur l’architecture universelle . . . . 174

5.3 Implémentation sur des architectures dédicacées reconfigurables . . . . 175

5.4 Am´eliorations possibles . . . . 177

5.5 Conclusion finale . . . . 178

A Architecture universelle 181 A.1 Présentation générale de l’application . . . . 181

A.2 Mesure de temps d’ex´ecution d’une proc´edure . . . . 183

A.2.1 Diff´erentes m´ethodes de mesure de temps . . . . 183

A.2.2 Analyse des mesures pour les proc´edures types . . . . 183

A.3 Fonctionnement en mode multithread . . . . 187

A.3.1 M´ecanisme . . . . 187

A.3.2 Influence de la priorit´e des threads sur le temps d’ex´ecution . . . . 187

A.4 Mesure de performance de la m´emoire . . . . 188

A.5 Code auto-modifiable pour le calcul d’adresses . . . . 188

B Circuits FPGAs Xilinx 191 B.1 Architecture des FPGAs Virtex . . . . 192

B.1.1 Cellule logique ´el´ementaire . . . . 192

B.1.2 Modes de fonctionnement d’un CLB . . . . 193

B.1.3 Bloc de m´emoire RAM . . . . 194

B.1.4 Multiplicateur . . . . 194

B.1.5 Digital Clock Manager - DCM . . . . 195

B.1.6 Blocs d’entr´ee/sortie . . . . 195

B.1.7 R´eseau d’interconnexions . . . . 195

(9)

B.1.8 Architecture . . . . 196 B.2 Circuits FPGAs de la famille Virtex II . . . . 196 B.3 Performance des FPGAs . . . . 196

C Architecture reconfigurable 199

C.1 Implémentation des circuits proposées . . . . 199 C.2 Validation des unités de traitement pour des voisinages de 5 × 5 et 7 × 7 pixels 203 C.3 Validation des modules de traitement après placement et routage . . . . 207

Glossaire 211

Bibliographie 213

(10)

(11)

R´ esum´ e

Les filtres non-linéaires de rang sont souvent utilisés dans le but de rehausser la qualité d’une image numérique. Leur application permet de faciliter l’interprétation visuelle et la compréhension du contenu des images que ce soit pour un opérateur humain ou pour un traitement automatique ultérieur. Dans le pipeline d’une chaˆıne habituelle de traitement des images, ces filtres sont appliqués généralement dans la phase de pré traitement, juste après l’acquisition et avant le traitement et l’analyse d’image proprement dit.

Les filtres de rang sont considérés comme un important goulot d’étranglement dans la chaˆıne de traitement, à cause du tri des pixels dans chaque voisinage, à effectuer pour tout pixel de l’image. Les temps de calcul augmentent de fa¸con significative avec la taille de l’image à traiter, la taille du voisinage considéré et lorsque le rang approche la médiane.

Cette thèse propose deux solutions à l’accélération du temps de traitement des filtres de rang.

La première solution vise l’exploitation des différents niveaux de parallélisme des ordina- teurs personnels d’aujourd’hui, notamment le parallélisme de données et le parallélisme inter- processeurs. Une telle approche présente un facteur d’accélération de l’ordre de 10 par rapport

à une approche classique qui fait abstraction du matériel grâce aux compilateurs des langages

évolués. Si le débit résultant des pixels traités, de l’ordre d’une dizaine de millions de pixels par seconde, permet de travailler en temps réel avec des applications vidéo, peu de temps reste pour d’autres traitements dans la chaˆıne.

La deuxième solution proposée est basée sur le concept de calcul reconfigurable et réalisée à l’aide des circuits FPGA (Field Programmable Gate Array). Le système décrit combine les algorithmes de type bit-série et la haute densité des circuits FPGA actuels. Il en résulte un système de traitement hautement parallèle, impliquant des centaines d’unités de traitement par circuit FPGA et permet d’arriver à un facteur d’accélération supplémentaire de l’ordre de 10 par rapport à la première solution présentée. Un tel système, inséré entre une source d’image numérique et un système hôte, effectue le calcul des filtres de rang avec un débit de l’ordre de centaine de millions de pixels par seconde.

Mots-clefs

Traitement des images, filtres non-lin´eaires, filtres de rangs, calcul parall`ele, calcul reconfigu-

rable, algorithmes bit-s´erie, circuits FPGA.

(12)

(13)

Abstract

Ranking filters are non-linear filters frequently used in digital image processing for image restoration and enhancement. Their application makes the visual interpretation and the com- prehension of the content of the image easier, that is for a visual inspection of human operator or a later automatic treatment. In the pipeline of the image processing chain, these filters are generally applied at the stage of pre-processing, just after the acquisition and before the actual image processing or analysis tasks take place.

Ranking filters represent a serious bottleneck in the image processing chain because we need to sort pixels in each neighborhood, the operation has to be repeated for every pixel of the image to be processed. The computing time increases to a significant degree with the size of the image to be treated, the size of the neighborhood considered and when the rank approaches the median.

This thesis proposes two solutions for the problem of ranking filter computing time accelera- tion.

The first solution aims the exploitation of the various levels of parallelism of personal compu- ters today and in particular the data parallelism and the parallelism between processors. Such an approach shows a factor of acceleration of about 10, compared to a traditional approach, which disregards the underlying hardware thanks to the compilers of the advanced computer languages. If the resulting data throughput makes it possible to work in real time with video applications, for the rates of about 10 million of pixels per second, little time remains for other treatments in the processing chain.

The second solution is based on a concept of reconfigurable computing and FPGA (Fied Programmable Gate Array) circuits. The described system combines the power of bit-serial algorithms and the high density of today’s FPGA circuits. The resulting system is highly parallel, implying hundreds of processing elements per FPGA and exhibits a supplementary factor of acceleration of 10 compared to the first solution proposed. Such a system, that can be easily inserted between the source of the digital image and a host system, carries out the computation of ranking filters at the rates of about hundred millions of pixels per second.

Keywords

Image processing, non-linear filtering, ranking filters, parallel computation, reconfigurable

computing, bit-serial algorithms, FPGA circuits.

(14)

(15)

Introduction

1.1 Pr´ esentation g´ en´ erale

La discipline de traitement des images numériques est souvent représentée comme une chaˆıne composée de trois maillons : l’acquisition de l’image, le traitement et/ou l’analyse suivis de l’exploitation des données obtenues. L’image, au départ représentée par un signal analogique, est transformée dans le domaine discret lors de l’acquisition. Le passage du monde analogique vers le monde numérique est souvent accompagné par une dégradation de l’infor- mation, dˆ ue principalement aux imperfections du processus d’acquisition, de conversion et de transmission. Lors du traitement, l’aspect visuel de l’image numérique acquise peut être amélioré en effectuant diverses opérations de filtrage. Dans la phase d’analyse, une ou plusieurs caractéristiques significatives sont extraites de l’information numérique d’une seule ou d’une série d’images. Les paramètres ainsi obtenus sont ensuite utilisés par un opérateur humain ou par un système doté d’une intelligence artificielle afin de mieux saisir l’information visuelle, de prendre une décision particulière, ou encore d’automatiser entièrement une activité.

Actuellement, le processus d’acquisition des images numériques peut se faire avec une très grande précision

¹

et vitesse

²

ce qui a pour conséquence un débit de données qui peut facilement atteindre plusieurs dizaines de mégaoctets par seconde, auquel le système de traitement et d’analyse

³

doit pouvoir faire face. Si à une aussi grande quantité de données on ajoute la complexité sans cesse croissante des traitements, le système qui automatise le processus de traitement doit pouvoir présenter une importante puissance de calcul.

Pour atteindre une telle puissance de traitement trois solutions s’imposent d’avantage : 1. augmenter la vitesse des syst`emes de traitement existants,

1En 2004, les circuits CCD courants sont dotés d’une résolution de l’ordre de plusieurs megapixels, chaque pixel étant quantifié sur 8 à 12 bits, par composante couleur acquise. Une seule image est donc représentée par une quantité d’information de l’ordre de quelques mégaoctets.

2Pour les caméras numériques rapides, la fréquence d’acquisition peut atteindre plusieurs centaines d’images par seconde.

3La phase de traitement devra de toute fa¸con faire face à toute la quantité de données acquises. Dans la phase d’analyse on peut imaginer travailler sur une quantité d’information plus réduite : passage à la représentation par objets, régions d’intérêt, codage des contours etc.

(16)

2. distribuer le calcul entre plusieurs systèmes de traitement existants : la parallélisation, 3. ou créer des systèmes dédicacés, éventuellement parallèles.

Nous d´evelopperons chacune de ces solutions dans les trois paragraphes suivantes.

L’augmentation de la vitesse des systèmes informatiques suit la prédiction de Gordon Moore annoncée déjà en 1965 [Moo65]. Cette prédiction, plus connue sous le nom de la loi de Moore, stipule que la vitesse de fonctionnement des processeurs double tous les 18 mois, chiffre qui se voit vérifié depuis

⁴

. Cependant la raison nous suggère que le respect de cette loi ne pourra pas continuer indéfiniment car une limite, imposée par des lois physiques, doit exister. En 2000, les prévisions sur le développement de la technologie fixent cette limite dans deux décennies [BW00].

Des facteurs d’accélération beaucoup plus importants peuvent être obtenus en distribuant le calcul entre plusieurs systèmes de traitement. Le parallélisme et le traitement d’images ont une longue histoire dont les débuts remontent aux années ’80 [Duf83]. Depuis, d’impor- tantes avancées technologiques dans la fabrication des composantes électroniques ont permis la réalisation de systèmes d’un parallélisme de plus en plus important, pour un prix de plus en plus faible.

La naissance de la nouvelle g´en´eration des circuits logiques programmables - les FPGA

⁵

en 1986 [CDF

⁺

86], introduit un important changement du paradigme de calcul automatisé, celui du calcul reconfigurable. Grâce à ces circuits il est possible de concevoir les systèmes de trai- tement o` u le matériel “s’adapte” à un problème particulier de calcul, d’ou leur appellation. Le haut degré d’intégration des FPGAs implique la possibilité de parallélisation du traitement au sein d’un même circuit, dont le degré dépendra, bien entendu, de la complexité du traite- ment souhaité. Enfin le prix des FPGA n’est pas prohibitif, il s’agit de circuits commerciaux, destinés à l’industrie électronique de faible volume de production ou l’usage des ASIC

⁶

ne serait pas rentable.

Les deux dernières solutions au problème du traitement des images numériques méritent donc d’être étudiées de plus près et représentent le principal fil conducteur de cette thèse.

Cette brève présentation générale a permis de mettre en évidence trois pôles : le traitement, la machine et la performance qui dictent la structure de ce chapitre d’introduction, qui comporte quatre autres sections :

Section 2 - Propose une brève description du contenu de cette thèse ainsi que sa contribution dans le domaine de l’accélération du temps de calcul d’un type de traitement particulier.

Section 3 - Donne une introduction au problème particulier du traitement des images numériques qui nous intéresse : les filtres non-linéaires. Par leur nature, ces traitements s’avèrent particulièrement inadaptés aux architectures classiques et représentent souvent le goulot d’étranglement dans la chaˆıne de traitement.

4Dans le texte original Moore parle de 12 mois, chiffre qui a été correct durant les quelques premières années qui ont suivi la publication de l’article. Ensuite, la course a quelque peu ralenti et le chiffre a été corrigé

`

a 18 mois.

5Field Programmable Gate Array.

6Application Specific Integrated Circuit.

(17)

Section 4 - Propose un parcours des différentes architectures informatiques. Plusieurs taxi- nomies présentées permettrons de se familiariser avec les notions générales liées au calcul parallèle et nécessaires pour le développement de la suite.

Section 5 - Nous nous int´eressons `a la performance de calcul et cette section a pour but

de montrer comment elle peut être mesurée. A la même occasion, une comparaison de la

puissance brute de calcul des processeurs et des FPGAs permettra de justifier l’emploi de ces

derniers au probl`eme pos´e.

(18)

1.2 Contenu et contributions

1.2.1 Contenu

Cette thèse traite du problème de l’accélération du temps de calcul d’une classe particulière des filtres non-linéaires à l’aide des architectures universelles et des architectures dédicacées reconfigurables, massivement parallèles.

De tous les filtres non-linéaires utilisés dans le traitement des images numériques nous allons nous limiter uniquement aux filtres de rang, car ces filtres représentent la brique de base pour la construction de la plupart des filtres non-linéaires. Ce choix est encore justifié par le fait qu’il s’agit de filtres efficaces, mais lents, surtout lorsqu’il s’agit de les calculer à l’aides des architectures traditionnelles de type SISD.

Les impl´ementations propos´ees mettent en opposition deux approches distinctes des architec- tures informatiques :

1. Approche des unités de traitement très rapides mais d’un parallélisme faible.

2. Approche d’un parall´elisme d’unit´es de traitement beaucoup plus massif, mais de vitesse de fonctionnement plus faible.

Rien ne nous permet de dire a priori laquelle des deux approches est la plus avantageuse. La réponse est fortement liée à un tout indissociable : le problème - l’algorithme - le programme - le matériel. Ce dernier maillon est fortement lié à un moment précis des technologies déployées pour sa fabrication et aura une influence directe sur la performance du traitement.

Mis `a part ce Chapitre d’introduction, cette th`ese en propose quatre autres : Chapitre 2 - Architecture universelle

Ici nous allons traiter de l’implémentation des filtres de rangs sur des ordinateurs person- nels en tant qu’exemple type d’une architecture universelle, dotée d’un faible nombre d’unités de traitement fonctionnant à grande vitesse. Nous allons montrer les limita- tions de tels systèmes surtout lorsqu’il s’agit de calculer les filtres considérés pour des voisinages de grande taille.

Chapitre 3 - Architectures d´ edicac´ ees

Dans ce Chapitre on trouvera la description d’un ensemble d’algorithmes et de systèmes dédicacés existants permettant de calculer les filtres de rangs. Ce parcours nous aidera

à mettre en évidence les désavantages des systèmes proposés jusqu’à présent et justifier la nécessité d’une approche alternative.

Chapitre 4 - Architecture reconfigurable

Ce Chapitre contient la description d’un système reconfigurable de traitement original, caractérisé par un grand nombre d’unités de traitement d’une vitesse faible de fonction- nement. Néanmoins nous allons montrer qu’un tel système permet d’arriver à un débit de traitement beaucoup plus important que celui d’une architecture universelle et des architectures dédicacées existantes.

Chapitre 5 - Discussion et conclusion

Enfin dans ce dernier Chapitre nous allons comparer les diff´erents r´esultats obtenus, ce

qui nous permettra de conclure.

(19)

1.2.2 Contributions Architecture universelle

L’opération de tri constitue la tâche la plus récurrente dans le monde de l’informatique. De ce fait un grand nombre d’algorithmes de tri a été proposé, surtout pour des architectures universelles de type SISD. Malheureusement ces algorithmes ne sont pas vraiment adaptés au parallélisme de type SIMD et MIMD (ici on fait référence aux stations multi-processeurs à mémoire partagée) intégrés dans la plupart d’architectures universelles d’aujourd’hui.

1. La contribution principale de cette th` ese dans l’´ etude des architectures uni- verselles se situe dans la conception d’algorithmes et de programmes ori- ginaux, permettant une exploitation optimale des diff´ erents niveaux de pa- rall´ elisme pour le calcul des filtres de rang. La d´ emarche, celle d’une ´ etude du mat´ eriel sous-jacent, de la conception d’algorithmes et de leur codage en fonction du mat´ eriel, d´ emontre que pour ces applications particuli` eres il est possible d’obtenir d’importants facteurs d’acc´ el´ eration par rapport ` a une d´ emarche classique o` u la seule ´ etude algorithmique fait abstraction compl` ete du mat´ eriel.

Architecture reconfigurable

Les différentes implémentations des filtres de rang dans les architectures dédicacées proposées jusqu’à présent ne concernent que des voisinages de petite taille et des valeurs de rang pour les- quelles les algorithmes peuvent être considérablement simplifiés. De plus, les implémentations existantes n’envisagent pas la parallélisation du traitement, actuellement possible à une grande

échelle grâce au haut degré d’intégration des circuits intégrés.

2. Le principal apport de cette th` ese dans l’acc´ el´ eration du calcul des filtres de rang ` a l’aide des architectures reconfigurables est li´ e au d´ eveloppement d’un syst` eme de traitement original, ayant les caract´ eristiques suivantes :

(a) Le syst` eme de traitement permet de travailler avec des voisinages dont la taille et la forme sont param´ etrables. C’est un point important car on souhaite pouvoir adapter au mieux le type de filtre ` a l’application donn´ ee.

(b) Le syst` eme permet de calculer les filtres de n’importe quelle valeur de rang, ce qui donne l’acc` es ` a une multitude des filtres diff´ erents, utilis´ es

`

a des fins diff´ erentes.

(c) L’emploi des algorithmes en bit-s´ erie permet de maximiser le nombre

d’unit´ es de traitements pour un circuit FPGA de haute densit´ e ainsi que

leur vitesse de fonctionnement. Ces deux points ont pour corollaire la

possibilit´ e d’un haut d´ ebit des pixels trait´ es, beaucoup plus important

que celui obtenu avec des architectures universelles.

(20)

1.3 Traitement

Traitement

Performance

Machine ...we would like to recall that the present knowledge of the human visual system indicates that it possesses nonlinear cha- racteristics. This should be taken into account in image filtering.

Fundamentals of non linear digital filtering.

Jakko Astola, Pauli Kuosmannen.

1.3.1 Images et transformations

1.3.1.1 Notations

Une image numérique monochromatique est un signal de luminosité bidimensionnel, dis- cret, présenté sous forme d’une matrice notée I [i, j ] avec 0 ≤ i < I

x

et 0 ≤ j < I

y

. Pour des raisons de simplicité d’écriture, nous allons noter l’image sous forme d’un vecteur I[i], o` u chaque pixel est identifié par un seul indice i avec 0 ≤ i < N

I

et o` u N

I

= I

x

∗ I

y

.

On d´efinit le voisinage d’un pixel comme un ensemble de pixels qui se trouvent dans son entourage directe, dans un espace de forme rectangulaire. La taille de cette espace est d´efini par les distances V

x1

, V

x2

, V

y1

et V

y2

dans les quatre principales directions en partant du pixel considéré (voir Figure 1.1). Comme pour l’image, le voisinage d’un pixel est présenté sous forme d’une matrice notée V [m, n]. Pour des raisons de simplicité d’écriture nous utiliserons un seul indice pour désigner un élément de ce voisinage : V [m] avec 0 ≤ m < N

V

et o` u N

V

= V

x

∗ V

y

= (V

_x1

+ V

_x2

+ 1) ∗ (V

_y1

+ V

_y2

+ 1).

Pour tous les ´el´ements du vecteur I , i.e. tous les pixels de l’image, dont l’indice i respecte la condition suivante :

i

₀

+ n · (I

nx

+ V

_x1

) ≤ i ≤ i

₀

+ n · (I

nx

+ V

_x1

) + I

nx

(1.1) o` u :

n ∈ { 0, . . . , I

_ny

} i

₀

= I

x

· V

_y1

+ V

_x1

I

nx

= I

x

− (V

_x1

+ V

_x2

)

I

ny

= I

y

− (V

y1

+ V

y2

) (1.2)

on peut d´efinir un voisinage V , not´e V

i

. Le parcours du vecteur I `a l’aide de l’indice i permet

donc d’obtenir un voisinage V “glissant” sur l’image. Signalons que les pixels du vecteur I

qui ne satisfont pas l’´equation 1.1 appartiennent au bord de l’image.

(21)

On définit une fenêtre de l’image I comme une partie de cette image, de forme rectangulaire, notée sous forme d’une matrice F [k, l] avec 0 ≤ k < F

x

, 0 ≤ l < F

y

et o` u F

x

, F

y

désignent respectivement la taille horizontale et verticale de la fenêtre. Pour une fenêtre F et une image I nous avons toujours F

x

≤ I

x

et F

y

≤ I

y

. Tout comme pour l’image et le voisinage, une fenˆetre sera not´ee sous forme d’un vecteur F [k], avec 0 ≤ k < N

F

.

L’image I est découpée en un ensemble de fenêtres F qui présentent un recouvrement de V

x1

+ V

x2

et V

y1

+ V

y2

pixels (voir Figure 1.1). Cet ensemble de fenêtres permet d’accéder à tous les voisinages V

i

d´efinis par l’´equation 1.1.

La Figure 1.1 montre une image et deux fenêtres successives de cette image (en trait pointillé et en trait plein). Pour chaque fenêtre on peut définir (F

x

− V

_x1

− V

_x2

) ∗ (F

y

− V

_y1

− V

_y2

) voisinages : les pixels appartenant aux deux rectangles grisés. Pour la première fenêtre il s’agit du rectangle gris clair et pour la deuxième fenêtre du rectangle gris foncé. Un agrandissement de la première fenêtre illustre deux voisinages successifs des pixels i (en trait plein) et i + 1 (en trait pointillé).

F

i

F F

F_y F F

F_x F F

I

_y

II

V_x1 V

V VVV_x2

F

i+1

I

_ny

II

I

x

II I

_nx

II

V_x1 V

V VVV_x2

V_y1 V V

V_y2 V V

Vi

V V VVVi+1

Fig. 1.1: Notations utilis´ees pour l’image, la fenˆetre et le voisinage.

On considère toutes les fenêtres F d’une image I permettant de couvrir tous les pixels définis par l’équation 1.1. Comme en toute généralité nous avons :

I

_x

mod(F

_x

− V

_x2

)

6 = 0 I

_y

mod(F

_y

− V

_y2

)

6 = 0 (1.3)

un certain recouvrement des fenêtres aux extrémités de l’image est nécessaire afin de couvrir

tous les pixels indiqu´es.

(22)

Dans le domaine spatial, le filtrage d’une image numérique consiste à appliquer un opérateur de transformation de chaque pixel de l’image initiale I[i] en fonction des valeurs des pixels définis dans le voisinage V

_i

. D’une manière tout à fait générale cette transformation est notée : I ˜ = T { I, V

i

} , ou alors I ˜ (i) = T { I(i), V

i

} (1.4) o` u ˜ I repr´esente l’image r´esultante.

1.3.1.2 Transformations ponctuelles

Si le voisinage du pixel est nul, les transformations appliquées sont alors dites ponctuelles (les opérateurs de pixel). L’exemple type d’un tel traitement est le seuillage, couramment utilisé pour séparer les objets de leur arrière plan. Un autre exemple sont les modifica- tions linéaires ou non-linéaires de l’histogramme qui peuvent être utilisées pour améliorer le contraste de l’image. De telles opérations peuvent être réalisées à l’aide de tables pré-calculées avant le traitement, afin de limiter le temps de calcul exclusivement au temps d’accès à la mémoire.

1.3.1.3 Transformations spatiales

Si le voisinage V

_i

n’est pas nul, nous avons des transformations dites spatiales (les opérateurs de voisinage), permettant de s’attaquer aux divers problèmes habituellement rencontrés dans le traitement des images numériques : la suppression du bruit, le rehaussement, la restauration, l’analyse morphologique et autres. La transformation doit être calculée pour chaque voisinage en particulier, car pour les tailles habituelles de voisinage, à savoir les voisinages carrés de 3 × 3, 5 × 5 et 7 × 7 pixels et pour le nombre des niveaux différents sur lesquels la luminosité d’un pixel est quantifiée, les tables pré-calculées dépasseraient largement la limite des mémoires actuelles.

Filtres lin´ eaires et non-lin´ eaires

Il existe une analogie entre les transformations spatiales et la notion de filtrage défini par la théorie du traitement des signaux analogiques, unidimensionnels. Le filtrage y est défini comme une transformation du signal à l’entrée par un système linéaire, invariant dans le temps

⁷

: le filtre.

La notion de filtrage d’un signal unidimensionnel et continu peut être étendue aux signaux discrets, bi-dimensionnels, telles qu’une image numérique. Dans ce cas l’opération de filtrage consiste à calculer le produit de convolution entre l’image et la réponse impulsionnelle d’un filtre h, de taille H

_x

× H

_y

:

I(x, y) = ˜

H_x

X

i=0 Hy

X

j=0

I(i, j) ∗ h(x − i, y − j) (1.5)

7Le système est linéaire si la transformation du signal à l’entrée est linéaire :T(af1[t] +bf2[t]) =aT(f1[t])+

bT(f2[t]). Le système est invariant dans le temps si une translation dans le temps du signal à l’entrée se traduira par une même translation dans le temps du signal de sortie.

(23)

En fonction du type de filtre choisi, les différents effets peuvent être obtenus : suppression des fortes transitions des niveaux de luminosité et apparition de flou ; ou justement le contraire : suppression de la composante continue dans l’image et mise en évidence des variations rapides.

Par opposition aux filtres linéaires o` u la valeur filtrée de l’image est obtenue par une combi- naison linéaire des pixels du voisinage, dans le filtrage non-linéaire cette valeur est obtenue sur base de l’information statistique de pixels voisins. Ainsi, chaque voisinage V

i

est trié au préalable, et la valeur filtrée est choisie sur base d’une fonction de rang.

Dans le cadre de cette th`ese nous allons nous limiter aux filtres non-lin´eaires pour des raisons suivantes :

1. La parallélisation des filtres linéaires est un problème déjà largement étudié et leur implémentation dans les FPGAs est devenu une pratique courante (voir par exemple [CME93]).

2. La diversité des filtres non-linéaires est très importante et leur application fréquente pour un grand nombre des problèmes en traitement des images, comme nous allons le voir par la suite. Pour certains d’entre eux ils se montrent extrêmement efficaces, beaucoup plus efficaces que les filtres linéaires.

3. L’opération de tri est coˆ uteuse malgré l’existence d’algorithmes rapides et la grande vitesse des architectures actuelles. En effet, le tri dans le voisinage, même d’une petite taille, doit être effectué pour tout pixel de l’image initiale, c’est à dire de l’ordre du million de fois par image.

1.3.2 Filtres non-lin´ eaires

1.3.2.1 Classification

Astola et Kuosmanen décrivent dans [AK97], un grand nombre de filtres non-linéaires appliqués au traitement des images numériques et proposent deux taxinomies de ces filtres. La première introduit les classes suivantes : les filtres linéaires généralisés, les filtres basés sur le tri, les filtres morphologiques et une classe “autre”. La deuxième taxinomie est faite sur base de l’interprétation de filtre en tant qu’estimateur ou en tant que filtre géométrique (filtres morphologiques). Les deux auteurs soulignant qu’aucune des deux taxinomies ne prétend être complète. En outre, ils émettent une réserve quant à l’existence d’une taxinomie parfaite permettant de classer tous les filtres non-linéaires existants.

Comme nous nous intéressons aux aspects de calcul de ces filtres, nous proposons ici une classification basée sur la complexité des opérations impliquées. Nous définissons alors deux classes des filtres non-linéaires : la Classe I et la Classe II.

Les filtres de la Classe I nécessitent toujours une opération de tri, sur un voisinage complet ou sur un ensemble de sous-voisinages. D’autres opérations telles que la pondération, la sélection, le calcul de la valeur moyenne peuvent précéder ou suivre l’opération de tri.

Les filtres de la Classe II ne doivent pas forcement impliquer un op´erateur de tri, mais peuvent

impliquer le calcul de toute fonction non-lin´eaire imaginable.

(24)

La Table 1.1 montre l’appartenance des différents filtres non-linéaires décrits dans [AK97] aux deux classes introduites.

Filtres non-lin´eaires

Classe I Classe II

Filtres de rang Médians hybrides Filtres de rang sélectif Moyens tronqués Médians à multi-étages Moyens non-linéaires Morphologiques Filtres L et C

Filtres de piles Polynˆomiaux

Tab. 1.1: Classification des filtres non-lin´eaires

1.3.2.2 Filtres non-lin´ eaires de Classe I Filtres de rang et filtres pond´ er´ es de rang

⁸

Pour le calcul des filtres de rang on consid`ere un voisinage V

_i^t

, correspondant au voisinage V

i

, trié par l’ordre croissant. Le pixel de l’image résultante ˜ I [i], pour un rang r correspond à la r − 1 valeur du vecteur V

_i^t

:

I ˜ [i] = V

_i^t

[r − 1], r ∈ [1, N

V

], 0 ≤ i < N

I

(1.6) Les filtres particulièrement intéressants sont ceux déterminés par les rangs : r = 1, r = N

V

et r = N

V

/2. Il s’agit des filtres minimum, maximum et médian notés respectivement : min { I } , max { I } et med { I } . Les deux premiers filtres sont des opérateurs de base permettant la construction des filtres morphologiques tandis que le filtre médian est le plus souvent utilisé pour supprimer le bruit impulsionnel dans une image.

Les filtres pondérés de rang introduisent la possibilité de favoriser et/ou défavoriser certains pixels de voisinage V

i

et ainsi palier au probl`eme des filtres m´edians classiques ayant tendance

à supprimer les petits détails de l’image. Le calcul de ces filtres implique la recherche de la valeur médiane d’un voisinage initial V

_i

transformé : tous les éléments de V

_i

ont été répétés un certain nombre de fois. Le nombre de répétition de chaque élément de V

i

est défini par le vecteur de poids P et l’opérateur de répétition, noté ♦ .

Pour un vecteur de poids P et un voisinage V

i

nous avons donc un nouvel ensemble : P ♦ V

i

= { V

i

[0], · · · , V

i

[0]

| {z }

p[0] fois

, . . . , V

i

[N

V

− 1], · · · , V

i

[N

V

− 1]

| {z }

p[NV −1] fois

} (1.7)

Le filtre de rang pondéré peut alors être écrit comme :

I[i] = ˜ med { P ♦ V

_i

} , 0 ≤ i < N

_I

(1.8) Filtre de rang s´ electif

Dans les filtres de rang classiques, le rang choisi est le mˆeme pour toute l’image. Or il est

8Dans la litt´erature anglo-saxonneRank orderedetWeighted Rank Orderded Filters.

(25)

tout `a fait possible d’imaginer que le rang r soit variable pour chaque voisinage de l’image I . Dans ce cas, une fonction f des attributs A calcul´es sur le voisinage V

i

d´etermine le rang qui sera d’application pour le voisinage en question :

I ˜ [i] = V

_i^t

[f (A(V

_i

))], 0 ≤ i < N

_I

(1.9) Filtres m´ edians ` a plusieurs ´ etages

Ces filtres impliquent le calcul de la valeur médiane de plusieurs filtres médians réalisés sur q sous-voisinages différents, construits à partir d’un voisinage V

_i

:

I[i] = ˜ med { med { V

_i1

} , · · · , med { V

_iq

}} , 0 ≤ i < N

_i

(1.10) Pour un voisinage de forme carrée, on définit habituellement quatre sous-voisinages élémentaires typiques : V

1

, V

2

, V

3

et V

4

(Figure 1.2) ainsi que leurs diff´erentes combinaisons, par exemple V

₁

∪ V

₂

et V

₃

∪ V

₄

.

V

₁

V

₂

!"#$%&' ()*+,-./01

243457698

:;<=>

V

₃

V

₄

?@ABCDEFGH IJKLMNOPQR STUVWXYZ[\ ]^_`abcdef ghijklmnop

q r s t u

v w x y z

Fig. 1.2: Sous-voisinages types pour le calcul de filtre m´edian multi-´etage Filtres moyens tronqu´ es

Les valeurs extrêmes d’un voisinage trié peuvent jouer un rôle important sur le résultat final du filtrage. Afin de défavoriser les pixels trop éloignés de la valeur médiane, que l’on peut supposer moins significatifs, un filtre moyen tronqué calcule la moyenne d’un certain nombre d’éléments du vecteur de voisinage trié V

_i^t

. Les différentes fa¸cons de choisir ces éléments vont donner naissance aux diverses variantes de ce filtre. Ainsi, le filtre (r,s) fold trimmed mean filter fait exclusion des r premières et s dernières valeurs du vecteur V

_i^t

:

I ˜ [i] = 1 N

_V

− r − s

N_V−s

X

m=r+1

V

_i^t

[m], 0 ≤ i < N

_I

(1.11) ou encore remplace les r premi`eres et s derni`eres valeurs par les valeurs V

_i^t

[r+1] et V

_i^t

[N

V

− s] :

I ˜ [i] = 1 N

V

(r ∗ V

_i^t

[r + 1] +

N_V−s

X

m=r+1

V

_i^t

[m] + s ∗ V

_i^t

[N

V

− s]), 0 ≤ i < N

I

(1.12) Il est également possible de spécifier un intervalle, borné par des valeurs q

1

et q

2

. Le filtre est alors calcul´e comme une moyenne de V

_i^t

uniquement pour des valeurs V

_i^t

[m] telles que q

₁

< V

_i^t

[m] < q

₂

(filtre tronqué modifié). Une autre variante de ce filtre consiste à calculer la moyenne des K éléments les plus proches de l’élément central de la suite V

i

(filtre de K plus proches voisins).

Les filtres moyens tronqu´es permettent de combiner les effets positifs des filtres lin´eaires et

non-linéaires et s’appliquent aux images présentant à la fois un bruit Gaussien et un bruit

impulsionnel.

(26)

Filtres morphologiques

Les filtres morphologiques dérivent de la morphologie mathématique introduite par Mathe- ron et Serra en 1964[MS00] et dont l’application au traitement des images est décrite dans deux ouvrages clés [Mat74, Ser82]. Initialement, la morphologie mathématique était destinée aux images binaires, mais son extension aux images en niveaux de gris fˆ ut rendue possible, grâce à l’équivalence entre les notions ensemblistes et les fonctions (pour plus de détails voir [CC89] ou encore [Soi99]).

Les opérateurs de base de la morphologie mathématique sont dus à Minkowski qui en 1903 définit des opérations ensemblistes d’addition (dilatation) et de soustraction (l’érosion). On considère une image binaire I comme un ensemble occupé partiellement par un ensemble d’objets

⁹

noté X . On définit alors les deux opérateurs de base par la question : pour toute position p de l’espace de l’image I, est-ce que le voisinage

¹⁰

V est entièrement inclu dans l’ensemble X ou est-ce qu’il touche l’ensemble X ? L’ensemble de p des réponses positives forme l’image érodée/dilatée. De fa¸con un peu plus formelle :

Dilatation : I ˜ = DIL { I, V } = I ⊕ V = ∪ X

_V

= { p, V

_p

∩ X 6 = O }

Erosion : ´ I ˜ = ERO { I, V } = I V = ∩ X

V

= { p, V

p

⊆ X } (1.13) A partir des opérateurs de base il est possible de définir d’autres opérateurs, notamment :

Ouverture : I ◦ V = (I V ) ⊕ V Fermeture : I • V = (I ⊕ V ) V

Gradient morphologique : g(I, V ) = (I ⊕ V ) − (I V ) (1.14) o` u V repr´esente le voisinage transpos´e.

L’extension des op´erateurs morphologiques de base aux images en niveau de gris est d´efinie par la plus grande valeur de I dans le voisinage V

i

et la plus petite valeur pour l’´erosion :

I ˜ = DIL { I, V } = I ⊕ V = sup { I(u) : u ∈ V } (1.15) I ˜ = ERO { I, V } = I V = inf { I(u) : u ∈ V } (1.16) Du point de vue du calcul, les deux opérateurs ne sont donc rien d’autre que les deux filtres caractéristiques de rang, mentionnés plus haut. Nous avons donc : ERO { V } = min { V } = V

^t

[0] pour l’´erosion et DIL { V } = max { V } = V

^t

[N

_V

− 1] pour la dilatation.

9Dans une image binaire, une valeur est attribu´ee au fond de l’image et l’autre aux objets qui s’y trouvent.

10En morphologie mathématique le voisinage est appelé l’élément structurant. Comme nous définissons les opérateurs morphologiques comme une classe des filtres non-linéaires, définis avec la notion de voisinage, nous avons préféré, par souci de clarté, de garder l’appellation de voisinage.

10Le voisinageV d’un voisinageV est transpos´e par rapport au centre de celui-ci :

V V

Si le voisinage est symétrique par rapport à son centre, on peut alors écrireV =V.

(27)

Les différents filtres morphologiques classiques ne peuvent pas être utilisés pour le filtrage du bruit dans une image. Cependant, les filtres morphologiques mous (Soft Morphological Filters), introduits par Kuosmanen dans [KA95] sont utilisés pour une élimination très efficace du bruit impulsionnel. Pour les opérateurs mous de base, la notion de voisinage (de l’élément structurant), est étendue au système structurant composé d’un voisinage V , d’un centre C d’une certaine forme et taille

¹¹

et d’un rang r. Les op´erateurs de base sont alors d´efinis comme :

I[i] = ˜

( DIL { I, V } = sup {{ r ♦ V

m

: m ∈ C } ∪ { V

m

: m ∈ (V \ C) }}

ERO { I, V } = inf {{ r♦V

m

: m ∈ C } ∪ { V

m

: m ∈ (V \ C) }} (1.17) avec ♦ l’opérateur de répétition défini à l’équation 1.7.

A partir des opérateurs de base on peut définir les mêmes opérateurs dérivés de la morphologie mathématique classique tels que l ’ouverture, la fermeture et autres.

Filtres de piles

Il est possible de définir toute une nouvelle classe des filtres non-linéaires grâce à un codage des images particulier. Ce codage, désigné dans la littérature anglo-saxonne par threshold decomposition, consiste à transformer chaque pixel de l’image initiale I [i] en un vecteur binaire P [o] de 2

^b

bits, o` u b représente le nombre de bits utilisés pour coder la couleur. Les éléments de ce vecteur sont déterminés selon l’expression suivante :

P [o] =

( 1, I[i] ≥ o

0, I[i] < o , 0 ≤ o < 2

^b

(1.18) Pour un voisinage V transform´e, not´e ¨ V , nous avons donc 2

^b

plans de bits de N

V

bits chacun, notés ¨ V [o]. Notons que l’image n’a subi aucune transformation de contenu de l’information, il s’agit tout simplement d’une autre représentation de la même information.

Le filtre généralisé de piles consiste à appliquer à chaque plan de bits une fonction Booléenne positive

¹²

dans la littérature anglo-saxonne Positive Boolean Function ou PBF qui satisfait la propriété de piles :

si f ( ¨ V [k]) = 1 (1.19)

alors f ( ¨ V [o]) = 1 ∀ o ≤ k

Pour chacun des 2

^b

niveaux nous allons obtenir une valeur binaire. La somme alg´ebrique de 2

^b

bits ainsi obtenus donne la valeur du voisinage filtr´e.

Les filtres minimum et maximum possèdent la propriété des piles et il est possible de les calculer en employant les fonctions logiques ET et OU sur le ¨ V [o]. Le filtre médian possède

également cette propriété, avec comme fonction Booléenne la médiane binaire (M ED)

¹³

.

11En fait le centre est aussi un voisinage du pixel central, plus petit queV, nous avons donc toujoursC⊂V. LorsqueC= 0, le centre est le pixel central lui-mˆeme.

12Une fonction Booléenne positive est une fonction qui peut être écrite sous forme d’une expression composée de variables non-compleméntées.

13Une fonction Booléenne binaire qui renvoie la valeur médiane d’un vecteur trié des éléments binaires, par exempleM ED0,0,1,1,1 = 1.

(28)

La Figure 1.3 montre un exemple de calcul des filtres de rang classiques à l’aide des filtres de piles. Examinons les vecteurs ¨ V [o] d’un voisinage V initialement composé des valeurs { 1, 5, 3, 7, 3, 9, 5, 9, 1 } . Le voisinage trié et décomposé ¨ V

^t

est alors pr´esent´e sous la forme d’un tableau.

r V^t V¨[0] V¨[1] V¨[2] V¨[3] V¨[4] V¨[5] V¨[6] V¨[7] V¨[8]

min→ 1 1 1 0 0 0 0 0 0 0 0

2 1 1 0 0 0 0 0 0 0 0

3 3 1 1 1 0 0 0 0 0 0

4 3 1 1 1 0 0 0 0 0 0

med→ 5 5 1 1 1 1 1 0 0 0 0

6 5 1 1 1 1 1 0 0 0 0

7 7 1 1 1 1 1 1 1 0 0

8 9 1 1 1 1 1 1 1 1 1

max→ 9 9 1 1 1 1 1 1 1 1 1

min ET 1 1 0 0 0 0 0 0 0 0

med MED 5 1 1 1 1 1 0 0 0 0

max OU 9 1 1 1 1 1 1 1 1 1

Fig. 1.3: Filtres de piles

Depuis la table, on peut ais´ement voir comment l’application des fonctions logiques ET, MED et OU conduit au calcul de minima/median/maxima du voisinage.

1.3.2.3 Filtres non-lin´ eaires de Classe II Filtre m´ edian hybride

Il est possible de combiner les avantages des filtres linéaires et non-linéaires dans un seul filtre qui s’attaquera à la fois au bruit impulsionnel et au bruit Gaussien d’une image. Un filtre médian hybride implique le calcul de q filtres linéaires f il sur le voisinage V

i

avant l’application d’un filtre m´edian :

I ˜ [i] = med { f il

₁

{ V

_i

} , · · · , f il

_q

{ V

_i

}} , 0 ≤ i < N

_I

(1.20) Si le nombre q de filtres lin´eaires appliqu´es est faible devant la taille du voisinage N

V

, l’implémentation d’un tel filtre peut se faire de manière efficace puisque la recherche de la valeur médiane n’implique pas le tri du voisinage complet.

Filtres moyens non-lin´ eaires

La forme générale d’un filtre moyen non-linéaire est donnée par : I ˜ [i] = g

⁻¹

P

N_V−1

m=0

P [m] ∗ g(V

i

[m]) P

N_V−1

m=0

P [m]

!

(1.21)

(29)

o` u P est le vecteur des poids et g est une fonction. Dans le traitement des images les fonctions g le plus souvent employ´ees sont :

g(x) =



 



 



x , moyenne arithm´etique

log x , moyenne g´eom´etrique

1

x

, moyenne harmonique

x

^p

∈ R \{− 1, 0, 1 } , filtre moyen L

_p

.

(1.22)

Les moyennes arithmétique et géométrique sont largement utilisées pour combattre le bruit Gaussien, tandis que la moyenne harmonique et le filtre moyen L

p

sont plutˆot utilis´es pour le filtrage du bruit impulsionnel.

Filtres polynˆ omiaux

La forme générale d’un filtre polynômial d’ordre M est donnée par : I ˜ [i] =

N_V−1

X

i1=0

h

₁

(i

₁

)V [N

_V

− i

₁

] + . . . +

N_V−1

X

i1=0

. . .

N_V−1

X

iM=0

h

_M

(i

₁

, . . . , i

_M

)V [N

_V

− i

₁

] . . . V [N

_V

− i

_M

] (1.23) o` u les fonctions h

j

(i

1

, . . . , i

j

), 0 < j < M sont les kernels de Volterra.

Les filtres polynômiaux sont caractérisés par un important accroissement du temps de calcul pour les ordres supérieurs, la raison pour laquelle ils ne sont employés que très rarement dans le traitement des images. Néanmoins signalons que les filtres d’ordres inférieurs ont été utilisés avec succès pour la réduction du bruit des images faiblement contrastées [RS95], l’amélioration de la netteté [Ram95], la restauration [JBH95] et l’amélioration d’images numériques [BMM97].

Filtres L

L’un des principaux inconvénients des filtres médians classiques concerne le déplacement des bords et l’apparition des artefacts [Bov87]. Les filtres L permettent de palier ce problème en combinant les effets d’un filtrage linéaire et non-linéaire. Ils consistent à calculer la moyenne des éléments du vecteur trié V

_i^t

, pond´er´es par un vecteur des poids P :

I[i] = ˜

N_V

X

m=1

P [m] ∗ V

_i^t

[m] (1.24)

Filtres C

L’information spatiale de chaque pixel n’intervient pas dans le calcul des filtres de rang. Deux voisinages complètement différents peuvent avoir le même vecteur de voisinage trié et par conséquence le même résultat de filtrage. L’exclusion de l’information spatiale se traduit par une perte de l’information visuelle des petits détails de l’image. Les filtres C peuvent être considérés comme des filtres L mais à la place d’un simple vecteur des poids, on dispose d’une matrice. Le choix des poids utilisés pour la pondération de chaque pixel de V est fonction du rang et de sa position spatiale au sein du voisinage. On peut alors écrire :

I ˜ [i] =

NV−1

X

m=0

P [R(V

i

[m]), m] ∗ V

i

(1.25)

ou P repr´esente la matrice des poids et R(V

ⁱ

[m]) le rang de la valeur V

_i

[m] du voisinage V .

(30)

1.3.2.4 Exemples d’application des filtres non-lin´ eaires

La Figure 1.4 montre le résultat suite à l’application d’un filtre linéaire et un filtre non- linéaire sur une image présentant un bruit impulsionnel. A l’image bruitée de la Figure 1.4.a ont été appliqués :

– un filtre linéaire classique : la moyenne d’un voisinage de 5 × 5 pixels - Figure 1.4.b, – suivi d’un filtre médian de même taille - Figure 1.4.c

La Figure 1.4.d montre une zone d’intérêt agrandie et riche en détails : on peut remarquer sur les deux images filtrées une perte de détails (la texture de tissu), plus importante dans le cas d’un filtre médian.

a) b)

c) d)

Fig. 1.4: ´ Elimination de bruit impulsionnel : filtre lin´eaire (moyenne) et

filtre m´edian

(31)

La Figure 1.5 montre qu’il est possible d’arriver à un résultat de filtrage semblable avec des filtres morphologiques mous. La même image de l’exemple précédant - Figure 1.5.a, a été soumis :

– `a une ouverture classique avec un voisinage de 5 × 5 pixels - Figure 1.5.b.

– et puis `a une ouverture “molle”, aussi sur un voisinage 5 × 5 avec un centre C de rayon z´ero et le rang r = 5 - Figure 1.5.c

L’agrandissement d’une zone d’intérêt - la Figure 1.5.d, montre une plus mauvaise conserva- tion de détails par rapport au filtrage médian.

a) b)

c) d)

Fig. 1.5: ´ Elimination de bruit impulsionnel : filtres morphologiques mous

(32)

La Figure 1.6 montre l’application à l’image initiale - Figure 1.6.a d’un gradient mor- phologique - Figure 1.6.b. Les opérations morphologiques : la dilatation et l’érosion ont été calculées avec des voisinages de taille 5 × 5 pixels.

a) b)

Fig. 1.6: Gradient morphologique

(33)

1.4 Machine

Traitement

Performance

Machine

Ordinateur - Calculateur électronique doté de mémoires

`

a grande capacité, de moyens de traitement des informa- tions à grande vitesse, capable de résoudre des problèmes arithmétiques et logiques complexes grâce à l’exploitation automatique des programmes enregistrés.

Dictionnaire Robert.

Computer architecture - The attributes of a [computing]

system as seen by the programmer, i. e. the conceptual structure and functional behavior, as distinct from the organization of the data flows and controls, the logic design, and the phy- sical implementation.

Amdahl, Blaaw, et Brooks, 1964

1.4.1 Historique

L’histoire des machines permettant de réaliser le calcul de fa¸con automatisée peut être divisée en trois périodes remarquables. Les premières machines à calculer mécaniques capables de réaliser des opérations arithmétiques simples, ont été développées lors la première période remarquable, située entre le début de XVI-ème et la fin de XIX-ème siècle. Dans la deuxième période, qui couvre la première moitié du XX-ème siècle, les grandes découvertes liées aux mathématiques et à la logique ont permis de poser les bases théoriques de l’informatique.

Dès les années quarante, plusieurs machines construites, dites de la première génération des ordinateurs, marquent le début de la troisième période remarquable qui s’étend jusqu’à nos jours.

La première machine mécanique à calculer

¹⁴

fˆ ut construite par John Napier, math´ematicien

écossais qui au début de XVI-ème siècle (probablement vers 1610) construit les règles (dites de Napier), permettant d’effectuer les opérations arithmétiques de multiplication, de division et de racine carrée. En 1623, indépendamment de Napier, un autre “calculateur numérique”

mécanique fˆ ut introduit par Wilhelm Schickard, dont la connaissance nous est parvenue uniquement par ces écrits avec Kepler. Le seul exemplaire de cette machine à été brˆ ulé en 1624, dans un incendie, probablement volontaire, afin de protéger son auteur des accusations d’actes de sorcellerie.

Indépendamment de Napier et de Schickard, Blaise Pascal construit en 1643 la Pas- caline, un autre calculateur numérique capable d’additionner et de soustraire les nombres à plusieurs chiffres avec un report automatique. Quelques années plus tard, en 1673, Gott- fried Leibniz con¸coit une machine qui effectue les quatre opérations arithmétiques de base

à l’aide des engrenages. Sa machine réalise pour la première fois la multiplication comme l’ad- dition successive dans un accumulateur. Leibniz soulève également l’idée de l’existence d’un procédé universel permettant de trouver une solution à tout problème de fa¸con mécanique, par le calcul et sans “réfléchir”.

14Quoique en Chine, depuis 1300, on utilise couramment l’abacus pour effectuer les calculs arithm´etiques.

Les origines de ce “calculateur” remontent aux Babyloniens - 500 AJC.

(34)

En 1801, Joseph-Marie Jacquard con¸coit une machine de tissage programmable par des cartes perforées contenant l’information du motif. Plus tard, en 1822, Charles Bab- bage travaille sur la réalisation de la “Machine Différentielle” et de la “Machine Analy- tique”, mais aucune de ces machines ne fonctionna correctement. A cette même époque on constate la première commercialisation d’un calculateur numérique - l’arithmomètre de Tho- mas, construit par Charles Xavier Thomas de Colmar. Ce calculateur fˆ ut vendu en quelques centaines d’exemplaires entre 1821 et 1878[Mar94].

La fin de XIX-ème et le passage au XX-ème siècle marquent le début de la deuxième période remarquable et la reprise des idées de Leibniz sur la recherche des procédés permettant une automatisation de calcul. La reprise de ces idées trouve ses racines dans la volonté des mathématiciens de formaliser les mathématiques de fa¸con à éviter tout paradoxe qu’elles pour- raient engendrer, notamment ceux relevés par Cesare Burali-Forti (1899) et Bertrand Russell (1901) de la théorie des ensembles, formulée par Georg Ferdinand Cantor

¹⁵

d`es 1874.

L’idée d’une formalisation complète des mathématiques culmine avec le mathématicien David Hilbert qui est à l’origine d’un programme dans lequel toute démonstration serait purement syntaxique, dépourvu de son sens sémantique. En outre, toute démonstration peut être ramené

à un procédé, une procédure effective i.e. un algorithme

¹⁶

, qui d´ecrit seulement l’ordre de manipulation des symboles.

Le programme de Hilbert

¹⁷

vise la recherche d’un syst`eme formel

¹⁸

ainsi qu’une th´eorie de d´emonstration tels qu’il serait possible de :

1. Prouver la consistance

¹⁹

2. R´epondre aux questions de compl´etude

²⁰

3. Résoudre le problème de décision (Entscheidungsproblem)

²¹

.

Le théorème de complétude, démontré par Kurt G¨ odel en 1928, répond positivement aux deux premières questions pour la logique du premier ordre. Au sein de ce système formel, il est donc possible de mécaniser toute démonstration.

15Le paradoxe deRussellconcerne la question de la taille d’un ensemble universel. Pour un tel ensemble

`

a la question : “quelque chose se trouve-t-il dans l’ensemble universel ?”, nous avons toujours une réponse positive. SelonCantorla taille d’un ensemble composé de tous les sous-ensembles d’un ensemble donné est toujours plus grande que la taille de l’ensemble même. Or, ceci ne peut être appliquer sur l’ensemble universel car il contient déjà tout !

16En 820 AD,Muhammed idn Musa Al-Khwarizmi, écrit une encyclopédie des procédés de calcul connus de son temps. A l’époque médiévale cet ouvrage fût diffusé dans le monde entier et son nom fût latinisé en algorithmus, pour être repris au XIX-ème siècle parLady Ada Lovelacepour designer l’ensemble des règles opératoires propres à un calcul.

17On peut consulter l’excellent ouvrage [CN01] sur la vie et le programme deHilbert.

18Un ensemble d’axiomes et de r`egles d’inf´erences.

19La question de la consistance a été soulevé parHilbert pour la première fois en 1900, lors de son dis- cours au Congrès International des Mathématiciens à Paris[Hil02] et peut être énoncé comme suit : Certains raisonnements valides peuvent-ils conduire vers des absurdités ?

20Tout énoncé peut-il être soit prouvé soit réfuté ?

21Le problème de décision a été formulé parHilbertetAckermanndans [HA28] et peut être énoncé comme suit : Existe-il une procédure effective (i.e. algorithme), qui, en un nombre fini d’opérations, permet de dire si un énoncé mathématique est vrai ou faux ?