Comparaison à QEMU (projet COMCAS) - L’estimation appliquée à des plates-formes multi-proces

5.3 L’estimation appliqu´ee `a des plates-formes multi-processeurs

5.3.2 Comparaison `a QEMU (projet COMCAS)

Après avoir comparé les résultats de notre approche avec l’approche utilisée dans le projet COMCAS (QEMU + SystemC) pour les plates-formes mono-coeur, nous avons décidé de comparer les processeurs multi-coeurs. Pour cela, nous avons étudié les erreurs d’estimation en performance de l’application H.264. La figure 5.29 montre l’erreur d’estimation des deux approches pour différentes fréquences d’utilisation des processeurs. Dans un premier temps, une estimation est effectuée dans le cas où un seul coeur de la plate- forme est utilisé. Bien que l’erreur d’estimation de la plate-forme QEMU soit acceptable pour des fréquences de 300 et 600MHz (inférieur à 20%), l’erreur est très importante pour une fréquence de 1GHz (33%). On remarque quasiment le même comportement pour le cas où l’on utilise les deux coeurs. L’estimation est satisfaisante pour une fréquence de 600MHz mais dérive fortement pour les autres fréquences. En effet, lorsque l’on passe d’une fréquence de 300MHz à 1000MHz, le facteur multiplicateur est de 3.3 alors que la performance estimée n’est augmentée que 2 fois. Cela provient en partie du fait que les pénalités pour les accès mémoires (cache-miss) sont en temps et non en cycles processeur.

La figure 5.32 montre au contraire que nos estimations, basées sur des modèles gros grain, ont une erreur comprise entre 9 et 13%. Ces résultats montrent que notre approche permet de fournir des estimations respectant la limite qui avait été fixée au début de ces travaux. reste assez constante (entre 9 et 13%) et ne dépasse jamais la limite autorisée.

Figure 5.29: Comparaison de l’erreur d’estimation de la plate-forme QEMU et de notre approche haut niveau.

5.4 Conclusion

Pour conclure, les multiples comparaisons nous ont permis de valider notre méthodologie et les modèles utilisés. Pour l’estimation de la performance, l’erreur moyenne avoisine les 10% alors que l’erreur maximale est de 17% ce qui correspond à nos attentes. Six applications ont été testées ainsi que six plates-formes matérielles, ce qui permet de couvrir un large spectre de systèmes.

L’estimation de consommation d’énergie a posé plus de difficultés. En effet, le modèle fin grain ne nous a pas permis d’obtenir des résultats d’estimations respectant nos contraintes de précisions. Nous avons avancé l’hypothèse que des paramètres architecturaux significatifs manquaient à nos modèles. Une autre hypothèse serait que la calibration initiale est perfectible.

Le modèle gros grain a quant à lui montré de bon résultats. En effet, une erreur maximale de 19% et une erreur moyenne de 12% ont été observé pour les différentes applications testées.

Nous avons montré au cours de ces expérimentations que les modèles très fins sont souvent très compliqués à mettre en place et peuvent mener à des erreurs d’estimations importantes. D’un autre coté, les modèles haut niveau sont plus aisés et rapide à mettre en oeuvre et ont moins de chance que l’erreur maximale dérive. Par contre, l’erreur moyenne sera logiquement plus élevé qu’un bon modèle à grain fin.

Un avantage certain de FORECAST est sa rapidité de mise en oeuvre et d’exécution. En effet, le fait d’utiliser de la génération de code avec exécution sur un ordinateur hôte permet d’effectuer une simulation en 6 secondes environ quelque soit l’application et la plate-forme. Cette rapidité de simulation a été exploité pour l’exploration d’architecture qui n’aurait pas été possible si la durée d’une simulation avaient été de plusieurs minutes.

Dans les expérimentations présentées dans ce chapitre, les explorations auront demandé entre 1 et 3 minutes pour trouver une solution respectant les contraintes. Ceci n’aurait pas été possible avec des approches à base d’ISS par exemple du fait du temps de simulation important de ces approches.

Chapitre 6

Conclusion et perspectives

6.1 Bilan

La décision d’une architecture matérielle et logicielle lors du lancement d’un nouveau projet est une tâche qui peut s’avérer fastidieuse et complexe. Pour assister les architectes systèmes et logiciels dans les phases de conception, il existe aujourd’hui de nombreux outils. Dans certains d’entre eux, on commence `

a trouver des fonctionnalités permettant d’obtenir des estimations de performance et de consommation d’énergie. Malheureusement, comme nous l’avons vu, la plupart possèdent des inconvénients majeurs comme le temps de prise en main, le temps de développement des modèles, le temps de simulation, la précision des résultats, ou encore la richesse de composants déjà prédisponible. On note également que les estimations de performance et la consommation ne sont souvent pas réunis dans un seul outil. C’est dans ce contexte et au vu de ce constat que nous avons développé une méthodologie et des outils associés permettant d’évaluer différentes conceptions logicielles et matérielles.

L’approche qui a été proposée repose sur un langage de description haut-niveau (qui a été étendu), qui se veut simple d’utilisation permettant à la fois de décrire une application mais aussi une plate-forme matérielle. Ensuite, un flot d’estimations évalue le temps d’exécution de chaque tâche puis FORECAST effectue une exécution dynamique du modèle.

Grâce à la simulation et aux possibilités de l’ordonnanceur de la machine hôte (systèmes de préemptions, de priorités et de parallélismes), il est alors possible d’observer le comportement dynamique du système complet.

Les estimations sont basées sur des paramètres qu’il est facilement possible d’obtenir, que ce soit pour le matériel ou le logiciel. Par exemple, du coté logiciel il est nécessaire de fournir le nombre d’instructions ou d’accès mémoire, ce qui est faisable avec un outil de profiling, et du coté matériel les paramètres sont présents dans les datasheets constructeurs (fréquence, taille de pipeline, DMIPS...).

Grâce à l’utilisation du standard POSIX et de logiciels libres (Gnuplot, Valgrind), nous nous assurons une compatibilité et une ré-utilisabilité sur d’autres plates-formes. En effet, nous ne souhaitions pas utiliser de logiciel propriétaire qui nécessiterait des licences ou ne serait pas compatible d’un ordinateur à l’autre.

Nous avons été capables de valider le bon fonctionnement de la méthodologie grâce à différentes applications, dont nous avons comparé les estimations avec les valeurs réelles de performance. Les outils ont aussi été utilisés dans le cadre d’un projet d’étude interne à Thales Communications and Security. Enfin, nous avons comparé notre approche à deux projets de recherche COMCAS (projet Européen) et Open-PEOPLE (projet ANR).

l’erreur n’excède pas 20%), notre méthodologie fonctionne correctement. D’une part la modélisation se fait rapidement et simplement et l’exécution est rapide (environ 5 secondes). D’autre part, l’erreur d’estimation reste correcte dans tous les cas présentés avec une erreur moyenne autour de 10% et une erreur maximale de 17%. Pour le cas du multi-coeurs, des expérimentations plus poussées sont nécessaires afin de valider totalement les premiers résultats satisfaisants obtenus.

Par la suite, un explorateur a aussi été développé afin d’ajouter la possibilité d’effectuer automatiquement des itérations permettant de trouver le meilleur compromis pour un système logiciel/matériel. En effet, grâce `

a la spécification de contraintes (taux de charge des processeurs, temps maximum d’exécution de certaines tâches) l’explorateur va exécuter des itérations en essayant de trouver le meilleur compromis de répartition des tâches sur le système avec les fréquences d’exécution les plus faibles afin de consommer le moins d’énergie possible.

Il est de plus tout à fait possible de créer d’autres algorithmes d’exploration étant donné que notre simulateur ressort un grand nombre d’informations utiles (taux de charge des processeurs, nombre d’instructions et d’accès mémoire de chaque tâche, temps d’exécution de chaque tâche...).

Le coeur de FORECAST étant un générateur de code exécutable, il permet aussi de générer des bench- marks utilisables directement sur des plates-formes embarquées à partir de modèles haut niveau [84]. Cela permet de générer des applications de test fin d’évaluer différentes plates-formes facilement sans avoir à créer d’applications réelles. Il est aussi possible d’évaluer différentes architectures logicielles (parallélisme, priorité des tâches, affinité processeur) afin de déterminer la plus adaptée à la plate-forme.

Pour conclure, le choix d’utiliser un langage haut niveau afin de modéliser le système, couplé à de la génération de code exécutable s’avère un bon choix pour l’estimation de performance et consommation en phase amont d’un projet. Ceci facilite le choix des architectes tout en étant rapide à mettre en place grâce à la possibilité de créer des bibliothèques de composants logiciels et matériels.

Un des problèmes de la méthodologie réside dans le fait d’utiliser l’ordonnanceur présent sur la machine exécutant la simulation (ordonnanceur Linux étant souvent par priorité) ce qui nous empêche d’utiliser des ordonnanceurs exotiques. Cette limitation n’a cependant pas été gênante dans notre contexte car dans les produits qui ont été prospectés, la plupart utilisent un ordonnanceur par priorité.

De plus, nous utilisons les coeurs de la machine hôte afin de simuler le fonctionnement des coeurs de la plate-forme embarquée, ce qui limite le nombre de processeurs que l’on peut simuler. Mais les serveurs 8 ou 16 coeurs étant de plus en plus présent dans les entreprises/laboratoires et les plates-formes embarqués n’ayant souvent que 2 ou 4 coeurs, il reste encore de la marge avant d’atteindre les limites de l’approche. De plus, les cibles de cette thèse sont les plates-formes mono-coeur et multi-coeurs, et non pas les plates-formes many-coeurs ou GPU.

Des améliorations peuvent être proposées à la suite des travaux de la thèse, en particulier l’ajout de modèle pour des unités de calcul de type DSP et la consolidation des modèles de consommation d’énergie.

Dans le document Caractérisation de la performance temporelle et de la consommation électrique de systèmes embarqués basés sur des plates-formes multiprocesseurs/coeurs et mettant en oeuvre du logiciel temps réel : FORECAST : perFORmance and Energy Consumption AnalysiS T (Page 124-127)