Prˆet de m´emoire transitoire - Intégration de systèmes hétérogènes en termes de niveaux de séc

Ce problème de confiance se pose aussi dans les systèmes basés sur les communication synchrone ou asynchrone ; d’autant plus qu’ils n’ont que des thread propres. En conséquence, les mécanismes de notifications sont courants, par exemple Mach [Loe92], send dans EROS [SFS96]). Notons qu’EROS semble avoir plus tard supprimé le send (ou ne l’utilise pas pour envoyer des notifications), ce qui demande une émulation plus compliquée [SSS04].

Autres ressources temporelles Il existe d’autre ressources temporelles que le temps CPU : le partage de l’accès au disque ou à la carte réseau est fait par ordonnancement. Mais le transfert de ces ressources temporelles est inutile en pratique, et n’est pas implémenté dans Anaxagoros. Nous allons maintenant étudier le transfert des ressources partagées spatialement, et en premier lieu de la mémoire.

3.4.2 Prˆet de m´emoire transitoire

3.4.2.1 Besoin de prˆet transitoire

Avec le transfert de temps CPU, il faut aussi transférer de la mémoire. En effet, à moins que la requête ne soit triviale, l’exécution de cette requête consomme une pile19_{. Comme l’exécution de la requête peut être préemptée dans le service, il}

peut y avoir plusieurs clients simultanément, et il faut une pile par client servi. Et à moins que le nombre de clients soit borné, la mémoire pour ces piles ne peut pas provenir d’une sous-pool statique dans le service ; ce serait l’application de la politique FCFS sur la mémoire du service, et entraˆınerait notamment des blocages incontrôlés. Le prêt de mémoire transitoire (i.e. intra-appel) est donc nécessaire pour que l’ordonnancement soit indépendant des domaines de protections. Le prêt de mémoire semi-permanent (i.e. inter-appel) est abordé en section 3.4.4.

3.4.2.2 Impl´ementation

Problème de la consommation d’espace d’adressage Transférer de la mémoire au service consiste à installer dans l’espace d’adressage du service un certain nombre de mappings. Le problème est que l’espace d’adressage du service est limité : si trop de threads prêtent de la mémoire au service, tout son espace d’adressage sera consommé, ce qui empêchera l’entrée de nouveaux threads. L’espace d’adressage d’un service est en fait une ressource limitée, et nous venons donc de décrire encore une utilisation de FCFS, sensible à un déni de ressource.

La solution naturelle à ce problème est de « prêter de l’espace d’adressage ». Nous implémentons cela grâce aux thread-local mappings, qui sont une partie de l’espace d’adressage propre au thread.

Implémentation du prêt transitoire Concrètement, tout espace d’adressage est divisé en deux parties : une partie propre au domaine, et une partie propre au

et même si la requête ne consomme pas de pile, il faut toujours pouvoir stocker les registres lorsqu’une préemption survient.

thread20

. À chaque fois qu’un thread change de domaine (i.e. appel de service), ou lors de toute décision d’ordonnancement, on change d’espace d’adressage. La Figure 3.9 présente cette implémentation.

Mappings du thread courant Mappings du domaine courant Ex´ecution A A A S B B B S B B A S A A A AS B BS B AS A t

Fig. 3.9 – Évolution de l’espace d’adressage de la tâche. La partie domaine de l’espace d’adressage change lors des appels de services, mais par la partie thread. Lorsque le thread change, l’espace d’adressage change pour accueillir les mappings du thread choisi et du domaine dans lequel est ce thread. Sur IA32, le mapping du noyau est présent dans tous les espaces d’adressages.

Ce mécanisme n’est pas lent. Sur x86, tout changement d’espace d’adressage nécessite un flush complet du TLB. Mais nous avons arrangé le code et les structures de données afin que la modification de l’espace d’adressage se fasse avant ce flush ; ainsi seule une écriture dans une table des pages est nécessaire pour ajouter un mapping. Notons cependant que sur d’autres types d’architectures, de meilleures solutions sont envisageables. En particulier, sur les architectures pour lesquelles la gestion du TLB est déléguée au système d’exploitation, ce mécanisme peut être facilement et efficacement implémenté.

Ce mécanisme a également un avantage en sécurité : il est impossible pour un thread d’accéder directement aux données d’un autre thread. Ainsi, pour qu’il y ait communication entre deux threads, il faut nécessairement passer par de la mémoire propre au service. Cela permet d’augmenter la garantie de non-interférence entre clients différents.

Notons que dans le cas de single-space operating systems, dans lequel les adresses virtuelles de toutes les tâches sont identiques, un mécanisme alternatif peut être envisageable, qui permette également au service de ne pas consommer d’espace d’adressage. Il suffirait de modifier le service pour qu’il puisse accéder à la mémoire du client. Il faut faire attention à ce que les droits d’accès ne fassent pas consommer de mémoire au service.

Problème du partage des mappings Le prêt de mémoire accorde au service le droit d’accéder à une partie de la mémoire allouée au client. Mais rien n’empêche le client d’accéder à cette mémoire par ailleurs, sans que le service puisse le savoir.

Les processeurs x86 requièrent également une troisième partie, propre au noyau, qu’on ne représente pas

3.4.2. Prˆet de m´emoire transitoire

Cela pose en particulier probl`eme pour la pile, puisque cela permet de modifier l’ex´ecution dans le service.

Pour la pile, nous avons résolu le problème de manière simple : la pile utilisée est l’UTCB, qui est toujours située à adresse fixe du thread-local mapping du thread courant, et ne peut pas être mappée à un autre endroit. Cela garantit que l’UTCB d’un thread ne peut être modifiée que par ce thread21

. Cette utilisation est similaire `

a la « pile noyau » dans les noyaux monolithiques.

Nous n’avons pas encore eu besoin d’implémenter une telle garantie pour d’autres mappings. Généralement, on pourra le faire en permettant au client de fournir au service la preuve que le mapping qu’il utilise est unique. Une garantie similaire est nécessaire pour le prêt semi-permanent (§ 3.4.4).

Un des avantages des thread-local mappings est qu’ils facilitent la preuve que le service ne fait pas communiquer deux clients : toute communication entre deux threads dans le service doit passer par un buffer intermédiaire. Cette preuve sera établie en montrant que deux threads n’accèdent que rarement aux même données, et que les données partagées ne permettent pas de communication.

Utilisation des thread-local mappings Pour le moment, le thread-local mapping fait 4ko d’UTCB utilisé comme pile, pour le passage des paramètres/multicall, pour la sauvegarde des registres lors de la préemption (et autres mécanismes de contrôle de la préemption présenté en section 4.2.3).

Les autres mappings correspondent chacun à une entrée dans la table des pages de premier niveau (donc à une plage de 4Mo chacun), et peuvent être installés tout simplement par la modification d’une entrée dans la table des pages du premier niveau. Ils permettent de passer de gros volumes de données. Notons que ces mappings peuvent être simultanément présents dans l’espace d’adressage du client : cela permet la copie directe de données du service dans l’espace d’adressage du client.

En rétrospective, il serait plus judicieux d’avoir un autre mapping de 4ko et un mapping de 4Mo. La transmission de données par tranche de 4ko est fréquente (les appels read et write UNIX fonctionnent ainsi), et ce mapping pourrait être installé dans la même table des pages que l’UTCB, réduisant le coût du TLB miss.

3.4.2.3 Extension au SMP

Extension naturelle L’extension naturelle au SMP est de r´eserver, dans chaque espace d’adressage, une partie de l’espace d’adressage pour le thread-local mapping pour chaque processeur. L’espace d’adressage est ainsi divis´e, pour M processeurs, en 2M + 1 parties.

Outre la consommation d’espace d’adressage, cette extension pose des problèmes de sécurité. Plus rien n’empêche, dans un espace d’adressage, un thread de pouvoir accéder aux thread-local mappings d’un autre thread. Et cela, même quand l’autre thread est parti ou détruit : en effet, même si on retire le mapping thread-local de l’espace d’adressage, il peut être resté dans le cache TLB des autres processeurs.

Un autre avantage, dans notre implémentation, est qu’il n’y a même pas besoin de modifier une entrée dans la table des pages lors d’un appel de service.

Cela demanderait de faire un TLB shootdown à chaque appel de service, et serait extrêmement coûteux en performances.

Même si on suppose faire confiance aux services, le même problème se retrouve pour des clients multithreads, ce qui leur permet de modifier la pile sur un autre processeur en train d’exécuter un service, par exemple.

Pour se protéger contre ce comportement, on peut penser utiliser le mécanisme de segmentation du Pentium, qui permet de restreindre l’accès à une plage d’adresses virtuelles. Malheureusement, ce mécanisme ne fait pas seulement de la protection, mais également de la translation d’adresses. Ce qui implique que les adresses utilisées par différents segments ne correspondent plus. Les compilateurs actuels ne gèrent pas les architectures segmentées, et rajouter une API pour les translation d’adresses entre segments ne serait pas commode et surprenant pour le programmeur.

Autres solutions Nous avons donc envisagé d’autres solutions. L’une d’elle con- sisterait à avoir un espace d’adressage par service par CPU (i.e., une table des pages de premier niveau différente pour chaque processeur ; le reste serait partagé). Ainsi, chaque processeur utiliserait la même plage d’adresses pour les thread-local mappings, mais ne pourraient plus accéder à celui des autres. Le principal problème de cette solution est le coût en mémoire occasionné. De plus, elle oblige chaque domaine `

a tenir compte du nombre de processeurs qui peuvent l’exécuter simultanément. Ce coût peut être éliminé en générant l’espace d’adressage à la volée au moment de l’appel. Concrètement, le noyau garderait une page des tables de premier niveau par CPU. Lorsqu’un thread invoque un service, les entrées nécessaires, peu nombreuses, sont copiées dans cette table des pages avant qu’elle soit utilisée. Cette technique permet d’éviter tout surcoût en mémoire, mais rajoute un surcoût en temps CPU à chaque invocation de service ou préemption de thread. Sur Pentium, il faut copier une entrée par tranche de 4Mo d’espace d’adressage. La majorité des services et programmes font moins de 4Mo, mais il y en a qui peuvent être relativement gros (systèmes de fichiers ou Linux paravirtualisé)22_.

Finalement, la meilleure solution est peut ˆetre une solution mixte entre les deux : suivant la taille de l’espace d’adressage, un domaine pourra choisir l’une ou l’autre des solutions.

Notons que ce problème est spécifique aux systèmes pour lesquels les tables des pages sont gérées en hardware, et ne se pose pas pour les architectures pour lesquelles le TLB est géré en logiciel. Dans ce dernier cas, chaque processeur maintient tout simplement dans son TLB, les thread-local mappings de son thread, et tous les processeurs partagent la même plage d’adresses virtuelles pour ces mappings.

Certains processeurs ARM ont également un mécanisme qui permet de rediriger une région de l’espace d’adressage vers un autre endroit [WTUH03], qui pourrait également être mise à profit.

On peut penser faire l’écriture de certaines entrées de manière paresseuse : l’entrée est installée lorsqu’un défaut de page se produit. Il n’est pas certain que cela améliore les performances, même pour les tâches non temps réel.

Dans le document Intégration de systèmes hétérogènes en termes de niveaux de sécurité (Page 120-124)