Le sch´ema de synchronisation use/destroy

5.2 Synchronisation dans les services

5.2.4 Le sch´ema de synchronisation use/destroy

5.2.3.3 Conclusion

Nous avons vu les trois sortes de verrou mis `a disposition des services dans Anaxagoros. Malheureusement, il n’y a pas de bonne solution universelle, chacune ayant ses avantages et inconv´enients :

• le rollforward lock consomme de la mémoire propre, et ne renvoie pas de résultat ; mais garantit la sérialisation des sections critiques ;

• le rollback lock consomme également de la mémoire propre, mais moins ; il peut renvoyer des résultats ; mais on ne peut pas toujours retourner en arrière dans l’exécution (communication avec matériel) ;

• le recoverable lock ne consomme quasiment pas de m´emoire propre, mais est souvent difficile `a utiliser.

Enfin, un dernier problème de synchronisation est le fait que nous n’avons pas encore de moyen de synchronisation inter-service, même si nous avons discuté de la possibilité d’en implémenter.

Une possibilit´e future serait d’examiner un verrou qui pourrait avoir certaines sections critiques en rollforward et certaines en rollback. Cela devrait couvrir quasiment tous les cas d’utilisation.

Une autre possibilité serait de fournir un environnement de programmation de plus haut niveau pour faciliter le travail du programmeur. Ce framework pourrait être fondé sur la génération automatique de drivers à partir des spécifications de l’OS et du matériel, comme le permet Termite [RCK+

09]. Cela permettrait de n’avoir à résoudre les problèmes de synchronisation que par classe de drivers, et que cela s’applique à tous les drivers de la classe.

La solution que nous avons choisi est de minimiser les besoins en synchronisation et de permettre au programmeur de comprendre finement ces besoins, afin qu’il utilise ces primitives judicieusement. Cette minimisation offre par ailleurs d’autres avantages, en terme de passage `a l’´echelle et de non-perturbation de l’ordonnancement.

5.2.4 Le sch´ema de synchronisation use/destroy

5.2.4.1 Pr´esentation

Problème Le problème que nous cherchons à résoudre survient dans tout système multithread où les ressources sont allouées dynamiquement. Plusieurs threads peuvent utiliser une ressource lorsqu’un autre décide de la détruire. Il est nécessaire d’utiliser un schéma de synchronisation pour s’assurer qu’un thread n’utilise pas une ressource détruite.

Ce schéma de synchronisation a des applications dans tout le système. C’est notamment grâce à lui que nous avons pu implémenter notre système de mémoire virtuelle de manière presque entièrement wait-free. Il est également utile pour implémenter la révocation des ressources en espace utilisateur.

Solution Notre solution à ce problème consiste à détruire la ressource en plusieurs phases, nommément :

1. empˆecher de nouveaux threads d’utiliser la ressource ;

2. attendre ou faire en sorte que les threads qui utilisent d´ej`a la ressource ne l’utilisent plus ;

3. nettoyer ou d´etruire la ressource ;

4. marquer la ressource comme r´eutilisable.

On note également que la destruction d’une ressource est un évènement assez peu fréquent comparé à son utilisation. Typiquement, une ressource est allouée/créée, utilisée plusieurs fois, avant d’être désallouée/détruite. En particulier, il n’y a pas de raison d’empêcher l’utilisation parallèle de la ressource ; il faut juste empêcher l’utilisation lorsque la destruction est entamée.

Si on se permet d’attendre pour pouvoir détruire la ressource, il faut toutefois que ce temps d’attente ne soit pas trop long, i.e. qu’il puisse être borné. Ceci est imposé par le principe de révocation immédiate (§ 3.1.2.2). Par ailleurs, si l’attente était infinie, il serait possible pour des threads de monopoliser une ressource sans possibilité de leur retirer, ce qui est une faille de sécurité évidente.

Théorie Plus généralement, ce schéma de synchronisation fournit une autre solution au respect d’invariants sous forme canonique P (a) ⇒ P′

(b) (voir § 4.1.3.2). Les threads « utilisateurs » doivent s’assurer que P′

(b) est vrai quand ils modifient a, tandis que le thread « destructeur » veut rendre P′

(b) faux. Dans l’exemple pr´ec´edent, P′

(b) est donc simplement “la ressource est prˆete”.

Concepts reliés Le schéma de synchronisation readers/writer est un concept proche du notre : tous deux permettent à un ensemble de threads de s’assurer d’une condition (respectivement, que la mémoire n’est pas réutilisée pour le use/destroy lock, que les données ne sont pas modifiées pour le reader/writer lock). Nous proposons d’ailleurs différentes implémentation du schéma use/destroy, qui peuvent être utilisées pour implémenter le schéma readers/writer de manière différente que le traditionnel readers/writer lock.

Le typestable memory management (TSM) de Greenwald [GC96] est également un concept rapproché de notre schéma de synchronisation. Cependant dans le cas des TSM, il n’y a pas de synchronisation explicite, mais seulement une assurance (par le temps) que les threads qui utilisent une structure ne sont pas en train d’accéder à de la mémoire libérée (ou réallouée à un autre usage). Ainsi il est impossible de réutiliser de la mémoire en train d’être accédée d’utilisation immédiatement comme dans notre implémentation.

5.2.4.2 Impl´ementations

Présentation Il y a plusieurs implémentations possibles de ce schéma. La première proposée utilise un verrou pour réaliser des exclusions mutuelles conformément au schéma décrit précédemment. En particulier :

5.2.4. Le sch´ema de synchronisation use/destroy • un thread qui veut d´etruire la structure est en exclusion mutuelle avec tous

les autres ;

• les threads qui veulent utiliser la structure ne sont pas en exclusion mutuelle. Ce sch´ema ressemble beaucoup au readers/writer lock, avec l’exception que les threads qui utilisent la structure peuvent la modifier. Comme il n’y a pas d’exclusion mutuelle entre les threads qui utilisent la structure, il faut soit utiliser un autre verrou, soit faire les modifications de mani`ere non-bloquante.

Implémentation théorique L’idée est la suivante. Chaque ressource possède un compteur d’utilisateurs (i.e. du nombre de threads qui utilisent la ressource), incrémenté de 1 quand un thread utilise la ressource, décrémenté de 1 quand il ne l’utilise plus.

Chaque ressource possède également un indicateur de destruction, un booléen qui dit si un thread veut détruire la ressource. Quand cet indicateur est à 1, alors aucun nouveau thread ne peut toucher la ressource. Le thread qui veut détruire la ressource n’a alors plus qu’à attendre que tous les threads qui utilisaient déjà la ressource partent, i.e. que le compteur d’utilisateurs passe à 0. L’implémentation théorique est présentée en Figure 5.2.4.2 (atomic indique des opérations à effectuer atomiquement). Différentes implémentations réelles sont données en annexes B.1 et C.2.2.2.

error_t use( resource_t r) { atomic{ if ( r->lock.destroyer) return EACCESS ; else r->lock.users ++ ; } ... // utilise ou modifie atomic{ r->lock.users -- ; } }

error_t destroy( resource_t r) { atomic{ if ( r->lock.destroyer) return ECONCURRENCY ; else r->lock.destroyer = 1 ; } while( r->lock.users != 0) ; ... // nettoie atomic{ r->lock.destroyer = 0} ; }

Fig. 5.2 – Impl´ementation th´eorique du use/destroy lock.

Notons l’usage de ECONCURRENCY, qui permet de détecter des accès concurrents en renvoyant un erreur au lieu d’attendre, comme expliqué section 5.2.1.1. EACCESS est retourné lorsqu’on tente d’utiliser une ressource en cours de destruction, ou détruite.

Le problème principal de cette implémentation théorique est l’attente pour le thread qui veut détruire la ressource, que tous les threads utilisateurs aient terminé d’utiliser la ressource. Il est en général rare de détruire une ressource en cours d’utilisation (c’est utilisé par exemple pour forcer la destruction d’un programme), donc le fait d’attendre un peu ne crée pas un overhead significatif ; mais une attente infinie occasionne une faille de sécurité. Nous voyons comment ce problème est traité dans différents cas d’utilisation.

Utilisation dans le noyau Dans le noyau, on peut demander au thread qui utilise la ressource de le faire dans une section non préemptible, et de ne pas l’utiliser pour très longtemps. Par exemple, lorsqu’un thread veut modifier une entrée dans la table des pages, il acquière un use/destroy lock sur la table des pages, modifie l’entrée de manière atomique, puis relâche le verrou. L’utilisation est extrêmement simple, l’overhead petit, et est l’une des raisons pour laquelle nous présageons d’excellentes performances pour notre système de gestion de la mémoire virtuelle (dont l’implémentation est décrite en annexe C).

Si on doit modifier plusieurs entrées dans la même table, on peut éviter l’overhead de prendre et relâcher le verrou d’utilisation : il suffit de vérifier directement si lock.destroyer == 1 sans relâcher le verrou. Si c’est le cas, cela signifie que la ressource est en instance de destruction, et on relâche le verrou. Cette technique de “polling” est souvent utilisable lorsque le thread doit accomplir une tâche longue et répétitive, et peut être couplée avec l’introduction des points de préemption explicite. Utilisation à travers le noyau Tant que l’utilisation de la ressource se fait dans le noyau, la technique précédente fonctionne : il suffit de vérifier si la ressource doit être détruite, aux moments où on fait des vérifications pour les points de préemption explicite. Mais il peut arriver qu’on utilise une ressource pendant un certain temps sans pouvoir faire cette vérification, lorsqu’on sort du noyau pour exécuter une application utilisateur.

Par exemple, si on veut utiliser un domaine, on va prendre un verrou d’utilisation sur ce domaine, puis poursuivre l’exécution de ce domaine en espace utilisateur. Simultanément, un thread (sur un autre CPU) veut détruire le domaine exécuté.

Si on ne fait rien, le thread qui veut détruire ce domaine exécuté va attendre pendant longtemps. Pour remédier à cela, ce thread va envoyer un IPI au processeur qui exécute le domaine, afin qu’il retourne dans le noyau et arrête d’utiliser le domaine plus tôt. Il faut faire cela avant d’attendre que tous les threads relâchent la section critique.

Ainsi, au « polling » de la section précédente, on substitue un mécanisme « d’in- terruption » pour prévenir les threads d’arrêter d’utiliser la ressource.

Au niveau de l’implémentation, il ne suffit plus maintenant de compter les processeurs qui utilisent la ressource, mais il faut pouvoir les identifier. Cela peut se faire en rempla¸cant le compteur thread.users par un bitfield, ou en indiquant pour chaque processeur quelles sont les ressources qu’il est en train d’utiliser. Le thread qui veut détruire la ressource envoie alors un IPI à tous ces CPUs entre le moment où il met son indicateur à 1 et celui où il attend que plus personne n’utilise le verrou. Les implémentations réelles sont présentées plus en détail en annexes B.1 et C.2.2.2.

Utilisation en espace utilisateur Notons que l’implémentation précédente retire le besoin d’exécuter le code dans une section non préemptible. Cela peut permettre d’utiliser le use/destroy lock en espace utilisateur.

Le fait d’avoir un upcall de reprise suffit pour implémenter le schéma use/destroy en monoprocesseur : il suffit de paramétrer cet upcall pour qu’il regarde si la ressource n’a pas été détruite avant de reprendre son exécution. L’exemple le plus important de

5.2.5. Conclusion

l’utilisation de cette méthode est lorsque nous vérifions que les dates de la capacité et de la ressource correspondent encore lors de la reprise d’exécution dans le service (§ 3.3.3.2).

En multiprocesseur, les IPIs sont nécessaires : si un thread détruit une ressource, il faut empêcher les autres threads de l’utiliser. Cela se fait comme dans le noyau, à la différence que l’appel système de la section 4.2.2 ne permet d’envoyer un IPI qu’aux threads qui partagent le même domaine.

5.2.4.3 Conclusion

Le use/destroy pattern est un schéma de synchronisation extrêmement intéressant. Il permet à différents CPU d’utiliser la même ressource sans aucune restriction sur le parallélisme, tout en permettant une révocation de la ressource en un temps borné (principe 3.1.2.2). Ces deux propriétés sont intéressantes à la fois pour les systèmes temps réel dur, mais aussi pour les systèmes best-effort.

Grâce à lui, notre système de mémoire virtuelle fait toutes ses opérations en parallèle, sans copie, en opérant directement sur les données, et sans boucle ; donc de manière wait-free, sauf pour les quelques attentes lorsqu’un thread veut forcer la récupération d’une page mémoire. Cela devrait le rendre extrêmement scalable pour la plupart des opérations. Cette implémentation pourrait être reprise par d’autres exokernels ou VMMs, dont les implémentations actuelles utilisent un certain nombre de verrous ; ou même dans la couche basse de noyaux monolithiques.

Enfin, cette technique est très importante pour l’implémentation du principe de révocation rapide (principe 3.1.2.2), puisque la révocation peut se faire en temps constant.

Travaux futurs L’implémentation du schéma use/destroy pattern ne peut implé- menter des ressources qui n’ont que deux états : invalide/inutilisable et valide/utilisable. Il serait intéressant (et a priori simple) d’étendre ce schéma pour gérer des états plus complexes, si nécessaire. C’est ce qui est fait avec les pages mémoires, dont l’automate des états est plus complexe (voir annexe C) ; il serait intéressant de voir comment généraliser cette approche.

5.2.5 Conclusion

Nous avons expliqué comment utiliser différentes primitives pour faire la synchronisation à l’intérieur des services. Ces primitives ne sont pas foncièrement difficiles à utiliser pour un programmeur habitué à la programmation système, mais demandent néanmoins une réflexion. C’est la raison pour laquelle nous recommandons de ne pas trop se soucier de l’implémentation des synchronisations dans un premier temps.

Mais avant de tenter de résoudre des problèmes de synchronisation, il vaut mieux les éviter ; i.e. ne pas synchroniser à moins que cela soit nécessaire. Les sections suivantes se penchent sur ces questions.

5.3 Minimisation des probl`emes de

Dans le document Intégration de systèmes hétérogènes en termes de niveaux de sécurité (Page 192-197)