L’execution et la sortie - Caractérisation de la performance temporelle et de la consommation

Nous allons maintenant aborder les diff´erentes parties qui sont fournies en sortie de l’outil d’estimation (l’exploration sera abord´ee dans la section suivante) comme le montre la figure 4.20. Comme nous l’avons vu

Figure 4.20: Graphique de la partie ex´ecution et traces de sorties.

précédemment, Waveperf est capable de générer du code exécutable d’un modèle d’application pour n’im- porte quel processeur utilisant POSIX. Nous combinons donc les estimations de performance et le profiling des tâches avec Waveperf afin d’être capable de simuler des tâches s’exécutant sur la plate-forme cible. Le but est de simuler le comportement dynamique de l’application, en d’autres termes les interactions entre les différentes tâches. Le code généré est exécuté sur l’ordinateur hôte utilisant Linux et la norme POSIX. Chaque tâche ayant un temps d’exécution calculé pour le processeur embarqué sur lequel elle doit s’exécuter, la simulation se comporte comme si l’application réelle s’exécutait sur la plate-forme réelle.

Les différents processeurs de l’ordinateur hôte sont en fait utilisés comme si ils faisaient partis des différentes unités de calcul (GPP, DSP) de la plate-forme embarquée. En particulier, le parallélisme de l’application est simulé de la même manière que sur la plate-forme cible.

La figure 4.21 représente sur la droite le modèle de l’application vidéo decodeur H.264. Les différentes tâches y sont représentées ainsi que leurs dépendances et les processeurs auxquels elles sont assignées. De plus, une tâche supplémentaire (periodic task) est ajoutée afin d’effectuer des tests de préemptions. Le graphique de gauche montre l’exécution de chaque tâche.

1234 5673893AB_C2DE DF3A6B DF3A6B FC67B FC67B 73C6B67 3167B 3167B B B B B B B B

Figure 4.21: Parallélisme des tâches et préemptions.

différents. On observe bien sur le graphique de gauche, que deux tâches sont capables de s’exécuter en par- allèle (par exemple : slice 1 et slice 2). De même, lorsque la tâche “Periodic task” préempte une tâche qui s’exécute sur son processeur (slice 2 ou filter 2), le temps d’exécution de cette dernière est augmenté par rapport à son temps d’exécution “normal”. On est donc bien capable d’exécuter des applications parallèles et d’assigner (statiquement dans un premier temps) des tâches à certains processeurs.

Les opérations liées à l’ordonnanceur, comme les préemptions et les priorités, sont exécutées par le système d’exploitation de la machine hôte (typiquement un PC). En effet, en utilisant Posix, les définitions des parties propriétés d’ordonnancement sont standards. Ainsi, lorsque les tâches sont prêtes à être exécutées, le système d’exploitation (Linux) va alors les ordonnancer dynamiquement suivant leurs priorités et leur affinité de processeurs.

FORECAST est capable de fournir plusieurs traces d’exécutions. Tout d’abord, comme nous l’avons déjà vu plusieurs fois, il est possible de tracer l’exécution des différentes tâches de l’application qui nous intéressent. Ceci permet de visualiser le comportement fonctionnel de l’application, et de s’assurer que ce fonctionnement est bien celui recherché.

Ensuite, il est aussi possible de tracer l’activité de chaque processeur. Ceci permet à la fois de visualiser la charge des différents processeurs, mais aussi d’évaluer le niveau de parallélisme de l’application. En effet, si il apparaˆıt que les processeurs sont rarement occupés ensemble, c’est que le parallélisme n’est pas satisfaisant et qu’il n’est peut être pas nécessaire d’avoir plusieurs processeurs.

D’autre part, FORECAST est aussi capable de tracer les accès aux différentes mémoires de la plate- forme. Étant donné que l’on connaˆıt le nombre d’accès effectué par chaque tâche, dès qu’une tâche est déclenchée, on trace le nombre d’accès mémoire pendant la durée de la tâche. Ceci peut être très utile pour évaluer les mémoires les plus utilisées, si les caches sont correctement dimensionnés, ou encore si il y a des pics d’accès mémoire.

La figure 4.22 montre un exemple de trace des accès mémoire obtenu pour l’application vidéo décodeur H.264 décodant les vidéos à 8 images par seconde sur une plate-forme ARM Cortex-A8. Le graphique permet de visualiser les accès pour chaque mémoire, et ainsi d’analyser que la mémoire la plus sollicitée est le cache

Figure 4.22: Graphique permettant de visualiser le nombre d’accès dans les différentes mémoires.

d’instructions de niveau un, puis le cache de données de niveau un. Viennent ensuite le cache de niveau deux, et enfin la mémoire principale (RAM) qui est très peu utilisée.

Ces traces sont aussi nécessaires afin d’effectuer des estimations de la consommation d’énergie. Comme on l’a vu dans la section 4.3.2, nous avons utilisé deux types de modèles de consommation : les estimations gros grain et les estimations à grain fin.

Pour les estimations haut niveau (gros grain), nous n’utilisons que la courbe des activités processeurs pour déterminer si le processeur est en activité ou si il ne fait rien. Ceci nous permet de calculer l’énergie dépensée par le système au bout d’un certain temps.

Pour les estimations grain fin, nous utilisons des modèles de consommation basés sur la consommation de fuite (nécessite le temps d’exécution) mais aussi la consommation d’un élément de base (par exemple un accès pour les mémoires ou l’exécution d’une instruction pour le processeur). Il est alors nécessaire d’utiliser des traces plus complexes que celles présentées précédemment.

Comme nous savons caractériser les accès aux différents éléments mémoire, il est alors possible de modéliser la consommation d’énergie de chaque mémoire. Il est aussi possible d’obtenir la consommation liée à l’exécution des instructions.

En conclusion, grâce à FORECAST, nous sommes donc capables d’obtenir un grand nombre d’informa- tions portant à la fois sur l’ordonnancement, les performances ou la consommation électrique.

Dans le document Caractérisation de la performance temporelle et de la consommation électrique de systèmes embarqués basés sur des plates-formes multiprocesseurs/coeurs et mettant en oeuvre du logiciel temps réel : FORECAST : perFORmance and Energy Consumption AnalysiS T (Page 77-80)