Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Choix d’une biblioth`eque de squelettes

Dans le document Prototypage rapide d'applications parallèles de vision artificielle par squelettes fonctionnels (Page 89-92)

2.4 Notre approche

2.4.1 Choix d’une biblioth`eque de squelettes

Comme nous l’avons vu au paragraphe 1.2.2, le TI peut ˆetre subdivis´e en

trois cat´egories distinctes : bas, moyen et haut niveau. Il est difficilement

envisageable de constituer une biblioth`eque de squelettes pouvant faire face

aux traitements issus d’un domaine aussi large. Face à ce délicat problème,

notre approche est de restreindre volontairement le champ d’application des

squelettes aux seuls algorithmes class´es en bas et moyen niveau. Cette

limi-tation délibérée est aisément justifiable par les raisons suivantes :

➟ Les traitements de bas et moyen niveau constituent de mani`ere ´evidente

les premi`eres ´etapes de toute chaˆıne de vision artificielle. De fait,

ceux-ci poss`edent un fort potentiel de r´eutilisation.

➟ Ces mˆemes traitements (et principalement ceux de bas niveau)

manipu-lent des quantités de données considérables et sont donc naturellement

candidats `a des phases de parall´elisation.

➟ Enfin, au moment où ces travaux ont débutés, nous avions en notre

pos-session une expérience conséquente aussi bien dans le développement

d’applications deTIbas et moyen niveaux que dans leur parall´elisation

sur la machine Transvision (par exemple, l’aide `a la conduite

auto-mobile a constitu´e un axe de recherche important `a travers le projet

européen Promotheus sur le véhicule expérimental Prolab[BDHR94]).

Toutefois, malgr´e cette restriction suppl´ementaire du domaine

d’application, il n’est pas trivial d’effectuer le choix d’une base de

squelettes. Le problème majeur à résoudre consiste à équilibrer la balance

entre spécificité et généralité. La spécificité impose un nombre

relative-ment important de squelettes hauterelative-ment spécialisés tandis que la généralité

est plutôt synonyme d’un faible nombre de squelettes d’ordre général.

Premièrement, considérons le cas de la spécificité. Cette approche offre

des opportunités d’efficacité puisque les implantations parallèles associées à

chacun des squelettes sont “taill´ees sur mesure”. A chaque nouveau probl`eme

ne pouvant ˆetre exprim´e facilement et/ou efficacement sous la forme d’une

composition de squelettes déjà existants, il est tentant d’insérer un nouveau

squelette dans la bibliothèque. Cette démarche a des répercussions directes

aux niveaux syst`eme et utilisateur. Du point de vue du syst`eme, l’effort

req-uis pour créer le nouveau squelette peut être suffisamment élevé pour rendre

cette approche rapidement impraticable. En effet, l’implantation de chaque

nouveau squelette est `a ´etudier pour l’ensemble des plates-formes pouvant le

supporter. De plus, le temps consacr´e au re-d´eveloppement des implantations

des squelettes en cas de changement d’architecture cible est proportionnel au

nombre de ces squelettes et peut de fait devenir prohibitif. Enfin, une

par-tie non négligeable des nouveaux squelettes créés est très spécifique à des

applications particuli`eres entraˆınant ainsi un taux d’utilisation faible.

Du point de vue de l’utilisateur, l’augmentation du nombre de squelettes

réduit inévitablement leur visibilité. Les développeurs inexpérimentés dans

le domaine de la programmation parallèle risquent alors d’être “noyés” sous

la pléthore d’opérateurs. L’expérience montre en effet qu’un programmeur

maˆıtrise intuitivement mieux un faible nombre de squelettes `a large

spec-tre qu’un grand nombre `a specspec-tre plus ´etroit. Une collection resspec-treinte de

squelettes de plus haut niveau, poss`ede donc intrins`equement un plus grand

potentiel de r´eutilisation. En contrepartie, l’optimisation des performances

et le développement de modèles analytiques de performances sont de manière

générale plus délicates à obtenir pour des squelettes très généraux.

Dans notre cas, le choix du nombre de squelettes et de leurs

car-actéristiques est résolu simplement de manière très pragmatique. La

bib-liothèque de squelettes associés au TI est définie à partir d’une analyse a

posteriori des applications de TI. Par chance, nous poss´edons dans le

do-maine de nombreuses réalisations dont quelques exemples ont été donnés au

paragraphe 1.2.1.

Les r´esultats de cette analyse mettent en ´evidence quatre classes

princi-pales de schémas pouvant être modélisés en squelettes :

➟ Les schémas dédiés au traitement géométrique des données. Ils

représentent les formes les plus simples du parallélisme de données

ef-fectuant des transformations de type image → image dans lesquelles

on applique un ensemble d’instructions sur chaque pixel de l’image.

L’image originale est divis´ee initialement en sous-domaines r´eguliers

(bandes horizontales ou verticales, imagettes, etc.) par une fonction

de découpage spécifique à l’application. Chacune des partitions est

alors traitée indépendamment des autres par le même opérateur.

Fi-nalement, l’image r´esultat est reconstruite par concat´enation des

sous-domaines résultats. Ce type de schémas de parallélisation est utilisé

principalement pour des op´erateurs deTI bas niveau tels que

convolu-tion, seuillage, etc.

➟ Les schémas dédiés aux phases d’extraction de caractéristiques à partir

des images. Dans ce cas là, une stratégie d’implantation similaire à

celle décrite précédemment est employée. La différence majeure vient

du fait que chaque r´esultat partiel ne repr´esente plus une portion de

l’image mais un ensemble d’attributs calculés d’où le recours à une

fonction spécialisée (et propre à l’application envisagée) de fusion de

ces résultats. Ce type de schémas est à la fois utilisé enTI bas niveau

(histogramme des niveaux de gris par exemple) et enTImoyen niveau

(chaˆınage de points contour par exemple).

➟ Les sch´emas encapsulant des structures de contrˆole de type fermes de

processeurs opérant soit sur des données (data farm), soit sur des tâches

(task farm). Ceux-ci sont principalement utilis´es dans les traitements

de moyen niveau (approximation polygonale d’une chaˆıne de points

connexes, division r´ecursive d’images. etc.) lorsque la complexit´e des

traitements est fortement dépendante des données d’entrée.

➟ Les sch´emas traduisant la nature it´erative des algorithmes de vision.

En effet, un grand nombre d’applications embarqu´ees dans des syst`emes

complexes manipulent non plus des images fixes mais des flots continus

de donn´ees. Parmi ceux-ci, citons les algorithmes de type

prédiction-vérification pour lesquels le traitement de l’imageidépend des résultats

issus des imagesi−1, · · ·,i−k. L’application de d´etection et de suivi

de véhicules décrite au paragraphe 1.2.1.2 repose sur ce type de schéma.

La premi`ere classe d’algorithmes apparaˆıt comme un cas particulier de

la deuxième catégorie puisque la phase de fusion finale est réduite à sa plus

simple expression c’est à dire une opération purement géométrique de

con-cat´enation d’images.

Deuxi`emement, la distinction entre les structures de contrˆole de type

data farm et task farm doit être effectuée. Même si les différences entre

ces squelettes semblent relativement fines en raison essentiellement de la

na-ture similaire de leurs mod`eles d’implantation, l’analyse des applications

re-posant sur de tels schémas montre qu’ils s’adressent réellement à deux classes

d’algorithmes s´eparables.

Ces constations étant effectuées, il apparaˆıt désormais que quatre

squelettes ´el´ementaires vont constituer les briques de base de notre

bib-lioth`eque de programmation parall`ele :

➟ SCM(Split-Compute-Merge) regroupe les sch´emas des deux premi`eres

cat´egories.

➟ DF(Data-Farming) et TF (Task-Farming) repr´esentent les structures

de contrˆole de type ferme de processeurs op´erant respectivement sur

des donn´ees et des tˆaches.

➟ ITERMEM(ITERate-with-MEMory) prend en compte la nature

con-tinue des flots d’images.

Ces quatre squelettes seront décrits plus précisément dans les paragraphes

2.4.2 `a 2.4.5. Mais, auparavant, il est indispensable d’effectuer les remarques

suivantes.

Tout d’abord, notre proposition reprend la s´eparation classique des

schémas à parallélisme de données et de contrôle. Cette distinction a déjà

été mise en évidence dans des méthodologies décrites précédemment comme

P

3

L. Dans notre cas, le squelette SCMest classé dans la première catégorie

alors que les squelettes DF,TFetITERMEMsont rattachés à la deuxième

famille.

Deuxi`emement, notre public cible est celui des programmeurs œuvrant

en TI qu’ils soient familiers ou non avec le parall´elisme. Ce but ne

pourra être atteint que si les squelettes proposés encapsulent des schémas

de parallélisation usuels dont la sémantique opérationnelle est aisément

compr´ehensible. C’est le cas par exemple du squelette SCM qui regroupe

les formes classiques de parallélisme de données dans lesquelles une même

fonction est appliquée sur des partitions différentes des données d’entrée. De

mˆeme, le squeletteITERMEMposs`ede un comportement relativement

sim-ple à comprendre pour un programmeur habitué aux formulations itératives

des algorithmes de TI. Par contre en ce qui concerne les squelettes DF et

TF, on ne peut que constater que ceux-ci atteignent probablement la limite

sup´erieure de complexit´e pour les programmeurs peu avertis.

Enfin, la proposition faite des quatre squelettes — `a partir de l’analyse

d’applications existantes — constitue une premi`ere biblioth`eque de base.

Rien ne peut assurer a priori que l’int´egralit´e du TI bas et moyen niveau

puisse ˆetre couverte par cet ensemble restreint. Cependant, nous avons jug´e

que la mise en place d’outils de parall´elisation reposant dans un premier

temps sur ces quatre squelettes entraˆınerait naturellement un accroissement

de notre expertise dans le domaine. D`es lors, si le besoin se fait sentir

d’insérer de nouveaux squelettes pour répondre à d’autres problèmes plus

spécifiques, rien ne pourra empêcher leur développement.

Dans le document Prototypage rapide d'applications parallèles de vision artificielle par squelettes fonctionnels (Page 89-92)

Télécharger maintenant "Prototypage rapide d'a..."

Outline

Documents relatifs