Caract´erisation de la plate-forme - Performance et validit´e fonctionnelle

CHAPITRE 7 CARACT´ ERISATION ET ESTIMATION

7.2 Performance et validit´e fonctionnelle

7.2.3 Caract´erisation de la plate-forme

La caractérisation de la plate-forme consiste en la caractérisation des éléments de la plate-forme qui sont génériques et ne sont pas spécifiques à une application particulière. Ces éléments comprennent notamment des composants matériels tels que des périphériques, des adaptateurs de bus, des bus, des processeurs ainsi que des composants logiciels tels qu’un RTOS et une API logicielle. Comme les composants matériels d’une plate-forme sont généralement stables et que leurs caractéristiques de performance sont souvent standardi- sées, on réalise une caractérisation manuelle de la performance de ces composants matériels.

Etant donné que les composants logiciels sont plus malléables et que leurs caractéristiques de performance peuvent facilement changer d’une version à l’autre, on présente une méthode automatisée de caractérisation de la performance des composants logiciels.

La caractérisation de la plate-forme permet notamment d’estimer le temps pris par les communications, les changements de contexte et le traitement des interruptions pour une architecture donnée ciblant cette plate-forme. Un paramètre important pour la caractérisation des composants matériels est leur largeur en octets : ce paramètre désigne le nombre maximal d’octets que le composant matériel est capable de recevoir ou envoyer en un seul transfert sur le bus. Si un module effectue une communication de n octets avec un composant matériel de largeur l tel que n > l, alors cette communication doit être scindée par l’adaptateur de bus en plusieurs transferts de taille inférieure ou égale à l, soit en ⌈n/l⌉ transferts.

Les méthodes présentées dans cette section pourraient s’appliquer à différentes plates- formes utilisant différentes types de bus, de processeurs et de RTOS. Ces méthodes sont présentées ici en utilisant la plate-forme virtuelle SPACE, qui cible un FPGA Xilinx muni de bus OPB CoreConnect IBM Corp. (1999), de processeurs MicroBlaze (Xilinx Inc., 2005) et d’un RTOS µC/OS II (Labrosse, 2002).

7.2.3.1 Caractérisation des périphériques

Les principaux paramètres de performance d’un périphérique sont sa largeur l en octets et le temps t qu’il prend pour traiter chaque requête. On suppose que le périphérique prend un temps t identique pour traiter deux requêtes différentes qui sont chacune de taille inférieure ou égale à l. Le temps que le périphérique prend pour traiter une requête de n octets est donné par ⌈n/l⌉t. Ce temps caractérise l’arc de séquence correspondant au traitement d’une requête par le périphérique dans le CPG de l’application. Il n’inclut pas les délais causés par le transfert de la requête ou de la réponse sur le bus : ceux-ci sont plutôt pris en compte dans la caractérisation du bus. Le tableau 7.4 présente les valeurs de ces paramètres de performance pour différents périphériques qui peuvent se brancher sur un bus OPB dans un

FPGA Xilinx. Les valeurs de t sont données en cycles d’horloge pour que cette caractérisation puisse s’appliquer à différentes fréquences d’horloge.

Tableau 7.4 Paramètres de performance pour différents périphériques avec interface OPB

Nom l t

BRAM (sur puce) 4 octets 1 cycle SDRAM (externe) 4 octets 14 cycles

UART 1 octets 1 cycle

7.2.3.2 Caract´erisation des adaptateurs de bus

Les adaptateurs de bus fournis par SPACE connectent chaque module implémenté en matériel à un bus et leur permettent de communiquer via leur bus respectif. Il est à noter que les autres composants matériels (tels les périphériques et les processeurs) n’ont pas besoin de ces adaptateurs de bus, car leur protocole de communication est déjà adapté au bus. Dans la plate-forme virtuelle SPACE, la largeur des adaptateurs de bus est présentement fixée à 4 octets. Ainsi, toute requête ou réponse envoyée ou re¸cue du bus par un module est scindée en transferts de 4 octets lors de la communication avec l’adaptateur de bus. Pour tous ces transferts à l’exception des acquittements, il y a un délai d’un cycle pour initier la série de transferts et l’adaptateur prend ensuite exactement un cycle pour recevoir 4 octets du module ou pour lui transmettre 4 octets. Il y a donc un délai de 1 + ⌈n/4⌉ pour une communication de n octets.

Cette valeur ne tient pas compte des délais de communications entre l’adaptateur et le bus : ceux-ci sont plutôt pris en compte lors de la caractérisation du bus. Dans le cas d’une écriture bloquante, le module transmetteur doit également attendre que le module récepteur ait retourné son acquittement. L’adaptateur de bus du module récepteur se charge de répondre avec un acquittement dès que le module récepteur a lu cette communication. Ce délai de réception de l’acquittement est indéterminé tant que les opérations de ces modules n’ont pas été ordonnancées : c’est donc l’estimateur d’ordonnancement qui permet d’obtenir ce délai.

7.2.3.3 Caract´erisation des bus et des ponts

Un bus est un canal de communication qui peut être partagé par plusieurs maˆıtres pour communiquer avec un ou plusieurs esclaves. Si plusieurs maˆıtres attendent d’obtenir le bus et que celui-ci se libère, un arbitre choisit quel maˆıtre obtient le bus. Une caractéristique d’un

bus est donc sa politique d’arbitrage. Un autre param`etre de performance est le d´elai ta que

prend le bus pour effectuer chaque arbitrage. Comme pour les autres composants mat´eriels, la largeur lb en octets d’un bus constitue un param`etre de performance important. Finalement,

le dernier param`etre de performance est le d´elai tcpour un transfert de lb octets ou moins sur

le bus lorsque le maˆıtre détient le bus. Si on suppose que le maˆıtre ne libère pas le bus tant qu’il n’a pas fini de transférer le paquet au complet, alors le temps nécessaire au transfert d’un paquet de n octets vers un destinataire de largeur ld se trouvant sur le même bus est

donn´e par :

ta+ ⌈n/min(lb, ld)⌉tc (7.2)

Ce temps donne le délai à partir du moment où s’effectue l’arbitrage qui donne le contrôle du bus à ce maˆıtre pour ce transfert. Le délai entre le moment où le maˆıtre demande l’accès au bus et le moment où cet arbitrage s’effectue ne sera connu que lorsque les opérations du système seront ordonnancées, étant donné qu’il dépend du moment où les autres maˆıtres demandent l’accès au bus.

Dans le cas où le destinataire se trouve sur un bus différent, il y a un délai d’arbitrage et de transfert sur chacun des deux bus en plus d’un délai de transfert sur le pont qui relie les deux bus. Le délai sur chaque bus est donné par l’équation 7.2. Le délai associé à chaque transfert sur le pont (de taille inférieure ou égale à min(lb, ld)) est égal à tp. On trouve donc

que le temps pour transférer un paquet de n octets d’un transmetteur sur un bus vers un récepteur sur un autre bus est donné par :

2ta+ ⌈n/min(lb, ld)⌉(2tc+ tp) (7.3)

Ce temps exclut, encore une fois, le temps pendant lequel un des deux bus est occup´e par une autre communication.

Le bus OPB supporte deux politiques d’arbitrage : la première utilise des priorités sta- tiques assignées à chaque maˆıtre et la seconde est un algorithme LRU qui donne le bus au maˆıtre qui a le moins récemment obtenu le bus. Ces deux politiques sont modélisées dans la plate-forme SPACE et dans la caractérisation du bus OPB. Pour les paramètres de performance du bus OPB et du pont OPB-OPB tels que modélisés dans SPACE, on obtient les valeurs présentées au tableau 7.5.

7.2.3.4 Caract´erisation du RTOS et de l’API logicielle

Le dernier élément de la plate-forme à caractériser est le temps requis pour les opérations du RTOS et de l’API logicielle. Cela inclut la gestion des communications logicielles, que

Tableau 7.5 Param`etres de performance du bus OPB et du pont OPB-OPB Param`etre Description Valeur

lb Largeur du bus 4 octets

ta D´elai d’arbitrage 3 cycles

tc D´elai de transfert 5 cycles

tp D´elai du pont 4 cycles

celles-ci se fassent à l’intérieur d’un même processeur, avec d’autres processeurs, avec des modules matériels ou avec des périphériques. Cela comprend également les changements de contexte et les traitements des interruptions du processeur. Les paramètres de performance du RTOS et de l’API logicielle sont présentés au tableau 7.6 et sont décrits plus en détails à l’annexe B.

Etant donné que le code logiciel associé au RTOS ou à l’API logicielle peut subir des mises à jour et que leur performance peut en être modifiée, une méthode automatisée est présentée pour caractériser automatiquement leurs paramètres de performance. Cette méthode utilise une application synthétique, dont la spécification exécutable est définie avec SPACE, pour exercer les différents cas d’utilisation des fonctions de communications de SPACE : lectures et écritures bloquantes ou non-bloquantes vers des modules ou des périphériques avec diffé- rentes tailles de paquet. Selon l’architecture qui l’implémente, l’application synthétique exerce aussi (indirectement) les fonctions de changement de contexte et les ISR du RTOS. Cette application synthétique est simulée et profilée avec différentes architectures, qui représentent différents partitionnements logiciel/matériel sur un ou deux processeurs. Cette méthode exa- mine ensuite l’ensemble des enregistrements générées par le profilage de ces simulations et en extrait les paramètres de performance présentés au tableau 7.6. Les détails de cette méthode sont présentés à l’annexe B.

On constate que les délais associés aux communications effectuées par les modules logiciels sont élevés. On propose à la section 10.2.5 des pistes de solution pour diminuer ces délais, mais l’optimisation du RTOS ou de l’API logicielle de SPACE déborde du cadre de cette thèse. En l’absence de telles optimisations et pour éviter que les temps d’exécution du RTOS et de l’API logicielle deviennent le facteur dominant de l’exploration architecturale réalisée au chapitre 8, on définit un facteur d’accélération a du RTOS et de l’API logicielle. Ainsi, si on effectue une estimation de performance avec un facteur d’accélération de a, alors les valeurs des paramètres de performance du RTOS et de l’API logicielle seront divisées par a par rapport aux valeurs présentées dans le tableau 7.6. L’ajout d’un tel facteur d’accélération se fait sans perte de généralité puisqu’il demeure possible d’utiliser directement les valeurs

Tableau 7.6 Param`etres de performance du RTOS µCOS II et de l’API logicielle

Nom Description Valeur

tctx D´elai de changement de contexte 489 cycles

tisr0 D´elai de base de l’ISR de r´eception d’un message 2600 cycles

tisr+ D´elai additionnel de cette ISR pour chaque 4 octets 798 cycles

tisrunblk Délai additionnel si l’ISR débloque la tâche destinataire 1023 cycles

tisrack D´elai de l’ISR de r´eception d’un acquittement 1885 cycles

tper0 Délai de base d’une communication avec un périphérique 272 cycles

tper+ D´elai additionnel pour chaque 4 octets 83 cycles

thw0 Délai de base d’une écriture à un module externe 618 cycles

thw+ D´elai additionnel de l’´ecriture pour chaque 4 octets 83 cycles

thwblk D´elai additionnel si cette ´ecriture est bloquante 494 cycles

thwackblk D´elai additionnel si cette ´ecriture bloque 930 cycles

tsw0 Délai de base d’écriture à un module du même processeur 2035 cycles

tsw+ D´elai additionnel de cette ´ecriture pour chaque 4 octets 679 cycles

tswunblk D´elai additionnel si elle d´ebloque le module destinataire 938 cycles

tswblk D´elai additionnel si l’´ecriture est bloquante 342 cycles

tswackblk D´elai additionnel si l’´ecriture bloque 466 cycles

trd0 D´elai de base d’une lecture d’un message 1487 cycles

trd+ D´elai additionnel pour chaque 4 octets 684 cycles

trdblk D´elai additionnel d’une lecture qui bloque 699 cycles

trdempty D´elai d’une lecture non-bloquante sur un canal vide 473 cycles

thwack D´elai d’un acquittement `a un module externe 276 cycles

tswack Délai d’un acquittement à un module du même processeur 677 cycles

du tableau 7.6 en sp´ecifiant a = 1.

Dans le document Profilage, caractérisation et partitionnement fonctionnel dans une plate-forme de conception de systèmes embarqués (Page 140-145)