Quatri` eme partie : comparaisons des diff´ erentes architectures

1.3 Organisation du m´ emoire

1.3.4 Quatri` eme partie : comparaisons des diff´ erentes architectures

Les comparaisons de performance tiennent une place importante dans nos travaux, car elles permettent de juger des gains apportés par nos systèmes vis-à-vis d’architectures cibles répandues et performantes. Une méthodologie simple de test est proposée afin de mettre en exergue les points forts et faibles de chaque système. Des résultats numériques sont présentés et nous nous sommes attachés à proposer un indice de performance en terme de nombre de cycles par pixels produits. Cet indice étant indépendant de la fréquence, il permet de gommer les aspérités liées aux différentes technologies de fabrication ou de réalisation des accélérateurs et de proposer une comparaison juste et cohérente.

Chapitre 2

Processeurs de voisinage flots de

donn´ees

Un très grand nombre d’opérateurs avancés de morphologie mathématique découlent principalement de briques élémentaires basées sur des opérations de voisinage comme des ´

erosions, dilatations ou bien encore des opérations tout ou rien. Des algorithmes permettent de réaliser ces opérateurs sur des processeurs généralistes de manière efficace en exploitant des structures de données plus ou moins complexes telles que des histogrammes ou bien encore des files d’attente hiérarchiques. La réalisation d’architectures dédiées, exploitant de telles structures de données, donne souvent naissance à des systèmes très rigides, disposant parfois de plusieurs bancs mémoires ou encore ne fonctionnant pas dans un temps déter- ministe. Nous avons donc orienté notre travail vers la réalisation de briques élémentaires via des processeurs de voisinage flots de données. Ces derniers étant efficaces, simples à mettre en œuvre et ayant de fortes possibilités de parallélisation et de chaˆınage pour créer facilement les opérations avancées de morphologie mathématique.

Ce chapitre aborde les différentes structures des processeurs de voisinage ainsi que les différents calculs réalisables. Nous considérons ici un processeur flot de données comme ´

etant un opérateur câblé dont la transformation est sélectionnée avant l’acheminement, au fil de l’eau, des données. L’objectif est de disposer d’un système capable de traiter au plus vite les pixels d’une image avec un minimum de contrôle. Habituellement, ce type d’opérateur est relégué au niveau de la chaˆıne de prétraitement d’une application, car jugé trop rigide de par sa structure. Toutefois, nous montrerons leur intérêt dans le cadre de la morphologie mathématique au fil des chapitres.

Nous allons détailler les différentes structures des processeurs de voisinage et nous commencerons par en détailler l’architecture la plus commune. Nous analyserons et propo- serons ensuite des structures proches permettant la mise en place d’une récursion pendant le traitement des données ou bien encore une nouvelle structure d’extraction parallèle des voisinages. Cette dernière structure permet un accès simultané à des groupes de voisins contigus, améliorant ainsi les performances et diminuant la latence du traitement. Nous aborderons également d’autres architectures dédiées aux éléments structurants de type seg- ment et nous présenterons une nouvelle optimisation dans ce domaine afin d’économiser une grande partie de la mémoire employée. Enfin, une conclusion est proposée sous forme d’un récapitulatif et d’une analyse des performances des systèmes mis en jeu ici.

2.1 Avant propos

Dans le contexte des architectures dédiées au traitement d’images, il est possible de trouver un grand nombre de structures. Deux catégories existent, les architectures asyn- chrones [27] et les architectures synchrones. Étant focalisés sur un type de traitement bas niveau, nous ne nous intéresserons ici qu’aux architectures synchrones et parallèles.

Une classification des architectures des ordinateurs a été proposée par Flynn[29] et se décompose en quatre catégories :

– SISD, Single Instruction stream Single Data stream : il s’agit de la machine s´equen- tielle standard, ne contenant aucun parall´elisme.

– MISD, Multiple Instruction stream Single Data stream : très peu employée seule, cette architecture permet à plusieurs processeurs de travailler sur la même donnée – SIMD, Single Instruction stream Multiple Data stream : plusieurs processeurs exé-

cutent la mˆeme instruction sur plusieurs donn´ees (processeurs vectoriels...)

– MIMD, Multiple Instruction stream Multiple Data stream : plusieurs processeurs ex´e- cutent plusieurs instructions sur plusieurs donn´ees (multiprocesseur...)

Toutefois, cette classification des architectures met principalement en exergue le mode de fonctionnement du parallélisme via la configuration du réseau entre les différentes unités de calculs. Aucune hypothèse n’est formulée concernant la nature spatiale ou temporelle du parallélisme. C’est la raison pour laquelle nous différencions deux grandes classes de machine : les machines à répartition spatiale du parallélisme et les machines à réparti- tion temporelle du parallélisme. Il existe bien entendu des passerelles entre les deux, une machine peut travailler localement avec un parallélisme spatial, mais globalement avec un parallélisme temporel.

Dans le document Architectures flot de données dédiées au traitement d'images par morphologie mathématique (Page 32-35)