Sources de défauts de cache

Changement de contexte

A B C D E F G H Dernier utilis´e (MRU) Plus ancien (LRU) A B C D Pr´eemption

A B C D Dernier utilisé (MRU) Plus ancien (LRU) C A B D Accès à C

A B C D Dernier utilisé (MRU) Plus ancien (LRU) F A B C Accès à F D est évincée

(a) Exécution en parallèle de travaux provo-quant une augmentation de la durée d’exé-cution et un dépassement d’échéance.

(b) Un simple décalage dans l’exécution des travaux permet d’éviter le dépassement d’échéance.

1. Cette problématique se retrouve aussi sur les processeurs disposant de Simultaneous Multithreading (SMT) sur le premier niveau de cache.

L’usage de cache(s) permet d’augmenter la vitesse d’exécution des programmes, or les

décisions d’ordonnancement peuvent avoir un impact sur l’utilisation des caches et donc

indirectement sur la vitesse d’exécution des programmes. Nous nous intéressons donc

main-tenant aux sources de défauts de cache, c’est-à-dire les circonstances qui peuvent provoquer

l’accès à des lignes non présentes dans le cache. Plus particulièrement, nous étudions ce

qui se passe lors d’une préemption et lors du partage d’un cache entre plusieurs

pro-grammes qui s’exécutent simultanément afin de mieux comprendre le comportement des

programmes vis-à-vis des caches. Dans le chapitre 6, un ensemble de modèles qui prennent

en compte ces comportements sont présentés.

2.4.1 Types de défauts de cache

Le modèle des trois C [HS89, HP12] propose une répartition des défauts de cache en trois

catégories :

Compulsory : l’accès à une information appartenant à un bloc mémoire accédé pour

la première fois provoque obligatoirement un défaut de cache, même si le cache a

une taille infinie. On appelle aussi ces défauts de cachecold misses.

2.4. Sources de défauts de cache 49

Capacity : les lignes qui sont éliminées du cache mais qui devront être rechargées

compteront comme défaut de type Capacity. Ce type de défaut de cache disparaît

avec un cache de taille infinie.

Conflict : dans le cas de caches directs ou associatifs par ensembles, ce sont les

défauts de cache liés au fait que plusieurs blocs partagent un même emplacement

dans le cache. Ce type de défaut de cache n’existe pas pour un cache entièrement

associatif.

La réduction du nombre de défauts de cache de typecompulsory peut se faire au niveau

du programme, de la phase de compilation, ou en augmentant la taille des blocs.

L’or-donnanceur ne pourra pas avoir un rôle dans leur réduction, mais ces défauts de cache

sont cependant intéressants pour quantifier le nombre de lignes de cache utilisées par un

programme.

Les défauts de cache de typecapacityetconflictaugmentent lorsque plusieurs programmes

doivent se partager un cache, que ce soit en s’exécutant en alternance, ou sur deux cœurs

différents avec un cache partagé. On désignera les défauts de cache qui surviennent suite

à une préemption par l’expression context switch misses [LGS

08]. Enfin, lorsque deux

programmes s’exécutent en parallèle et partagent un même cache, un phénomène decache

thrashing peut survenir. Ce phénomène désigne le fait que deux programmes vont

mutuel-lement exclure des lignes de cache appartenant à l’autre programme et perdre ainsi une

partie de l’avantage du l’usage d’un cache.

C’est l’ordonnanceur qui décide d’effectuer des préemptions et qui choisit les tâches qui

s’exécutent simultanément. Ainsi, un ordonnanceur peut prendre en compte la présence

des caches dans ses décisions afin d’améliorer les performances. Une politique

d’ordonnan-cement qui tient compte des caches est appelée une politiquecache-aware.

2.4.2 Préemption et « context switch misses »

Un changement de contexte nécessite du temps pour sauvegarder l’état du processus et

relancer l’exécution d’un autre. Cependant, ce coût direct est généralement bien inférieur

au surcoût lié aux défauts de cache causés par l’utilisation du cache par un autre

pro-gramme [MB91]. Fromm et Treuhaft font le même constat mais pondèrent leurs résultats

en notant que le nombre de défauts de cache engendrés par une préemption est cependant

faible en comparaison au nombre total de défauts de cache qu’un programme subit lors de

son exécution [FT96].

Des études montrent que l’impact des préemptions dépend fortement des programmes et

de la taille des caches. Par exemple, si deux programmes s’exécutent en alternance mais

que leur empreinte mémoire cumulée est inférieure à la taille du cache, il n’y aura pas

de défaut de cache de type capacity mais éventuellement quelques défauts de cache de

typeconflict, en fonction de l’associativité. En revanche, si les deux programmes tiennent

individuellement dans le cache, mais que leur empreinte totale dépasse la taille du cache,

alors les effets seront importants. Enfin, pour des programmes faisant déjà beaucoup de

défauts de cache, l’effet des préemptions sera insignifiant en comparaison [LDS07].

Lors d’une préemption, la durée d’exécution de la tâche préemptée peut augmenter suite

à la perturbation de l’état des caches. Ce délai supplémentaire est appelé Cache-Related

Preemption Delay (CRPD) et est illustré par la figure 2.10. La prise en compte des caches

effet délicat de déterminer à l’avance quelles seront les lignes de cache évincées suite à

une préemption. Ceci pose évidemment des difficultés pour prouver l’ordonnançabilité des

systèmes en prenant en compte les caches.

Figure 2.10 – Augmentation de la durée d’exécution du travail préempté suite à des

défauts de cache supplémentaires.

Liuet al.donnent une explication détaillée de ce qu’il se passe au niveau d’un cache LRU

suite à un changement de contexte [LS10]. La figure 2.11 montre à titre d’exemple l’état

d’un ensemble d’un cache LRU d’associativité 8 avant et après une préemption. En noir,

ce sont les lignes appartenant à un autre programme.

Figure 2.11 – État du cache à la reprise d’exécution, après une préemption.

Dans cet exemple, quatre lignes de cache ont été évincées. Cependant, ceci ne signifie

pas que le nombre de défauts de cache engendrés par cette perturbation est de quatre

(pour cet ensemble). Le nombre de défauts de cache supplémentaires provoqués par cette

préemption peut en réalité être inférieur ou supérieur.

En effet, les lignes qui ont été évincées du cache peuvent soit ne plus être utilisées dans

le futur, soit leur accès aurait de toute façon généré un défaut de cache (de type capacity

notamment). Un programme qui réutilise très peu ses lignes et qui provoque de nombreux

cold misses ne sera pas très sensible à une préemption. Liu et al. utilisent le terme de

replaced misses pour désigner les défauts de cache concernant les lignes qui ne sont plus

Figure^{2.12 – État du cache suite à l’accès à une ligne non évincée.}

Figure ^2.14