• Aucun résultat trouvé

Arbres couvrants en 6-connexité fonctionnelle, 8-connexité

Dans le document Asynchronisme dans les rétines artificielles (Page 160-167)

8.2 Réduction du coût d’implantation grâce à l’augmentation de la

8.2.5 Arbres couvrants en 6-connexité fonctionnelle, 8-connexité

à 2 entrées.

Les micropipelines convergents mis en jeu, dans le chemin asynchrone d’un ré- seau en 6-connexité fonctionnelle et matérielle, ont6 entrées. Le coût des opérateurs asynchrones présents dans ce chemin est donc plus de trois fois supérieur au coût des opérateurs présents dans les micropipelines à deux entrées. Une composante fortement connexe et un arbre couvrant associés sont proposés aux figures 8.13 et 8.14. Pour envisager une implantation 6-connexe du modèle des micropipelines associatifs dans les rétines artificielles, il est donc nécessaire de réduire ce coût d’im- plantation. Pour cela, augmentons comme précédemment la connexité physique du réseau afin de diminuer le nombre nécessaire d’entrées des opérateurs.

Nous avons montré dans les sections précédentes que l’utilisation de la 6-connexité

Fig. 8.13 – Composantes fortement connexes en 6-connexité fonctionnelle et matérielle

Fig. 8.14 – Arbre couvrant en 6- connexité fonctionnelle et matérielle matérielle pour implanter la 4-connexité fonctionnelle se traduit par une réduction des ressources matérielles nécessaires à l’implantation du chemin asynchrone dans chaque processeur élémentaire ainsi que d’une réduction du temps de calcul des primitives régionales. Dans cette partie, une extension de ces résultats à l’utilisa- tion de la 8-connexité matérielle pour implanter la 6-connexité fonctionnelle est présentée.

La méthode utilisée est exactement la même que pour la 4-connexité fonctionnelle. Il est nécessaire de construire de manière synchrone à l’initialisation une compo- sante fortement connexe sur la région. La construction de cette composante forte- ment connexe comporte deux étapes : la construction d’un anneau de connexions périphériques orienté (qui forme une composante fortement connexe) et le rat- tachement des pixels non-périphériques à l’anneau établi grâce à des connexions

tement connexe en 6-connexité fonctionnelle, 8-connexité matérielle, et n’utilisant que des opérateurs convergents à 2 entrées. Un arbre couvrant associé est proposé à la figure 8.16.

L’ajout de 2 possibilités de connexions supplémentaires dans le réseau permet donc

Fig. 8.15 – Composantes fortement connexes en 4-connexité fonctionnelle et 6 connexité matérielle

Fig. 8.16 – Arbre couvrant en 4- connexité fonctionnelle et 6-connexité matérielle

de réduire le nombre d’entrées des opérateurs convergents au minimum possible, à savoir2 entrées. L’algorithme utilisé pour établir la composante connexe fonctionne selon le même principe que celui qui a été utilisé pour le réseau en 4-connexité fonc- tionnelle et 6-connexité matérielle. Il est présenté à la partie suivante.

Algorithme d’établissement de la composante fortement connexe

La démarche de construction de l’algorithme permettant l’établissement de la composante fortement connexe est proposée ici. Cette construction commence par l’étude des configurations permettant d’installer un anneau de connexions périphé- riques orientées autour de la région considérée. Ces configurations sont présentées à la figure 8.17.

L’utilisation de ces configurations pour établir l’anneau de connexions périphériques conduit à l’utilisation d’opérateurs de propagation à3 entrées. Pour remédier à ce problème, il est possible d’augmenter la connexité matérielle du réseau. En utili- sant un réseau 8-connexe, il est possible de fusionner des paires de configurations pour en obtenir d’autres qui permettent d’utiliser uniquement des opérateurs à 2 entrées. Ainsi les configurations(b) et (c) de la figure 8.17 peuvent être remplacées par les configurations (a), (b) et (c) de la figure 8.18. De même les configurations (e) et (f) de la figure 8.17 peuvent être remplacées par les configurations (d), (e)

8.2. Réduction du coût d’implantation grâce à l’augmentation de la connexité matérielle du réseau

(a) (b) (c)

(d)

l

(e) (f)

Fig. 8.17 – Algorithme d’initialisation de la composante fortement connexe utili- sant un réseau matériel 6-connexe : configurations locales permettant d’établir un anneau de connexions périphériques orienté dans le sens des aiguilles d’une montre.

(a) (b) (c)

(d)

l

(e) (f)

Fig. 8.18 – Algorithme d’initialisation de la composante fortement connexe utili- sant un réseau matériel 8-connexe : configurations locales permettant d’établir un anneau de connexions périphériques orienté dans le sens des aiguilles d’une montre. et(f) de la figure 8.18.

Une fois les connexions périphériques en anneau établies à l’aide d’opérateurs à 2 entrées, il reste à connecter les points intérieurs aux régions par des connexions bidirectionnelles. Pour cela on utilise les deux configurations locales de la figure 8.19.

Finalement il reste 10 configurations à étudier, les configurations (a) et (d) de la figure 8.17, les6 configurations de la figure 8.18 et les 2 configurations de la figure 8.19. Les configurations(a) et (b) de la figure 8.18 peuvent respectivement se sim- plifier avec les configurations (a) et (b) de la figure 8.19. On obtient finalement 8 combinaisons à étudier, qui sont récapitulées à la figure 8.20.

L’algorithme utilisé pour réaliser les connexions est de type synchrone. Les connexions sont établies en étudiant les 8 configurations locales de pixels suivantes (fig.8.20). Le pixel entouré d’un double cercle est celui que dont on souhaite raccorder l’en- trée.

On vérifie que les configurations(a), (b), (c) et (d) de la figure 8.20 s’excluent mu- tuellement. Il en est de même pour les configurations(e), (f), (g) et (h) de la figure

(a) (b)

Fig. 8.19 – Démonstration de la validité de l’algorithme d’initialisation de la composante fortement connexe : configurations locales permettant d’établir des connexions bidirectionnelles intérieures aux régions.

(a)

l

(b) (c) (d)

(e) (f) (g) (h)

Fig. 8.20 – Algorithme d’initialisation de la composante fortement connexe : confi- gurations locales permettant d’établir un anneau de connexions périphériques orien- tées dans le sens des aiguilles d’une montre en utilisant un réseau 8-connexe au niveau matériel.

8.20. Ainsi deux configurations au maximum peuvent être vraies en même temps, et donc deux connexions entrantes sont nécessaires au maximum.

L’algorithme est donc obtenu par construction des configurations à étudier de ma- nière à créer un anneau de connexions orientées à la périphérie de la région, puis de manière à connecter les pixels intérieurs de la région par des connexions bidi- rectionnelles. Il faut toutefois noter que ces connexions bidirectionnelles intérieures peuvent former des sous-réseaux placés en quinconce et pouvant être déconnectés de l’anneau central. Pour corriger ce problème, il est nécessaire d’examiner deux configurations supplémentaires (fig. 8.21) après avoir établi le réseau à partir des 8 configurations préalablement décrites.

L’établissement d’une composante fortement connexe en 6-connexité fonctionnelle à l’aide d’un réseau 8-connexe s’effectue donc en deux étapes synchrones. La pre- mière consiste à examiner 8 configurations locales, la seconde consiste à examiner 2 configurations supplémentaires prenant en compte les connexions déjà établies. A l’instar du cas des composantes fortement connexes en 4-connexité, l’établis- sement de la composante fortement connexe en 6-connexité fonctionnelle dans une rétine peut donc se faire de manière synchrone massivement parallèle et donc très efficace. Les résultats sur la robustesse du réseau sont toujours valables et le gain matériel est bien évidemment encore plus important qu’en 4-connexité. Ce gain est

8.2. Réduction du coût d’implantation grâce à l’augmentation de la connexité matérielle du réseau

(a) (b)

Fig. 8.21 – Algorithme d’initialisation de la composante fortement connexe : confi- gurations permettant d’assurer le rattachement des sous-réseaux bidirectionnels internes à l’anneau périphérique

de l’ordre de 70 % en tenant compte de la nécessité de router les signaux req et

ack des 8 connexions possibles vers les 2 entrées du micropipeline convergent. La

vitesse de propagation de l’information dans un processeur élémentaire est réduite, ce qui tend à réduire le temps de calcul des opérations régionales (associations) dis- tribuées. Cette réduction de vitesse est toutefois à nuancer car l’arbre asynchrone n’utilisant que des fourches à 2 entrées a des branches plus allongées que dans le cas où l’on utilise des fourches à 4 entrées. Cet allongement des branches dépen- dant de la forme de la région considérée, il est difficile de quantifier la variation de vitesse due à cet effet. Toutefois, lors des simulations, nous avons pu constater que la vitesse globale de calcul est augmentée par la réduction du nombre d’entrées des opérateurs.

9

Les micropipelines associatifs :

évaluation des performances

L’architecture des micropipelines associatifs et ses améliorations ont été décrites dans les chapitres précédents. Dans ce chapitre, une évaluation de leurs perfor- mances est effectuée.

Tout d’abord, nous évaluons la structure de micropipeline convergent dans sa ver- sion à2 et 4 entrées en la comparant à la structure de contrôle des micropipelines et aux micropipelines existant dans la littérature. Puis nous estimons le temps né- cessaire au calcul d’une somme régionale sur une rétine de taille 200 pixels par 200 pixels dans un cas défavorable afin d’avoir une borne maximale pour le temps de calcul de cette opération.

9.1

Evaluation des micropipelines convergents

La validation du circuit a été effectuée à l’aide de modèles SPICE en utilisant les outils LT Spice, simulateur gratuit et disponible en téléchargement sur internet sur le site de Linear Technology, et de HSPICE, produit par SYNOPSYS et qui est l’un des simulateurs les plus performants du marché. Les modèles de transistors utilisés sont les modèles BSIM3V3 mesurés sur des wafers réels et téléchargeables sur le site de Mosis aux États-Unis. Nous avons évalué le circuit dans les technolo- gies suivantes :

– 0.35 µm AMS (Austria Mikro Systems) afin de permettre de se positionner par rapport à la technologie utilisée dans la dernière rétine PVLSAR.

– 0.25 µm TMSC (Taiwan Semiconductor) afin de pouvoir se positionner par rapport aux résultats présentés dans [Bee02].

– 0.18 µm TMSC (Taiwan Semiconductor) afin de quantifier les résultats que l’on pourra obtenir en réalisant le circuit dans les années futures.

sous LT Spice en utilisant le level 7 ou 8. Des comparaisons entre ces deux simu- lateurs ont montré une différence de comportement minime de l’ordre de 2 à 3 % sur les performances en terme de vitesse. Compte tenu de l’objet de notre étude, un tel écart est négligeable. Dans la suite, les résultats présentés ont été obtenus à l’aide de LT Spice.

Dans le document Asynchronisme dans les rétines artificielles (Page 160-167)