Techniques usuelles de r´esolution - Intégration de systèmes hétérogènes en termes de niveaux d

3.6 Conclusion

4.1.2 Techniques usuelles de r´esolution

Nous analysons maintenant différentes techniques usuelles de résolution des problèmes de concurrence, et analysons si elles sont compatibles avec le principe d’indépendance des politiques d’allocation (§ 3.1.1).

4.1.2.1 Les m´ecanismes bloquants

Les techniques de résolution des problème de concurrence peuvent être cataloguées en deux : bloquantes ou non-bloquantes [Fra04]. Un mécanisme est bloquant lorsque

bloquant

l’arrêt d’un thread peut retarder ou indéfiniment empêcher l’exécution d’un autre ; non-bloquant lorsque ce n’est pas le cas4

. Les techniques bloquantes, les plus

non-bloquant

usitées, posent problème dans Anaxagoros car elles ne respectent pas le principe d’indépendance de l’ordonnancement. Mais c’est en les analysant en détail que nous trouvons les racines des problèmes que nous résolvons par la suite.

Section critique L’utilisation de section critique permet de r´epondre aux 4

section critique

problèmes du même coup. Il s’agit de synchroniser les différents threads afin qu’au plus un d’entre eux soit dans une certaine portion de code, qui est la section critique. Ainsi, cette portion de code s’exécute de manière séquentielle.

On utilise souvent une variable partagée pour synchroniser ces différents accès, appelé verrou, ou mutex lock (verrou d’exclusion mutuelle).

verrou

mutex lock _{Il y a plusieurs fa¸cons d’impl´ementer une section critique, chacune ayant ses}

avantages et ses d´efauts.

Spinlock La mani`ere la plus simple de cr´eer une section critique est le spinlock,

spinlock

Une exception courante est le cache des entrées de la table des pages (TLB) : le Pentium, par exemple, n’invalide pas les entrées automatiquement, ce qui requiert une synchronisation entre les processeurs, appelée TLB shootdown.

Notons que non-bloquant ´etait un synonyme de lock-free dans des papiers plus anciens, mais nous utilisons le vocabulaire actuel [Fra04, p. 9]

4.1.2. Techniques usuelles de r´esolution

ou verrou par attente active. Le thread qui rentre dans la section critique prend le verrou en modifiant la valeur du spinlock, et le libère à la fin de la section ; les autres bouclent en lisant la variable et attendant que le verrou se libère. Il y a quantité de possibilités d’implémentation de ce mécanisme, comme le « Bakery algorithm » de Lamport [Lam74] ou l’algorithme de Peterson [Pet81] ; les implémentations modernes utilisent des instructions processeurs comme Compare-and-swap qui permettent une implémentation simple et efficace.

Le problème principal des sections critiques par attente active est la préemption pendant la section critique. Les autres threads sont alors bloqués jusqu’à ce que le thread reprenne la main pour terminer cette section critique, donc pour un temps long, voire infini. De plus, comme les threads sont en attente active, le temps où ils sont bloqués est perdu.

Les deux approches classiques pour résoudre ce problème sont soit d’empêcher les préemptions, soit d’éviter de perdre le temps où le thread est bloqué en faisant autre chose (appel à l’ordonnanceur).

Empêchement des préemptions Une section de code pour laquelle on empêche

la préemption de survenir est appelée section non préemptible. Lorsque le code section non préemptible

exécuté pour la prise d’un spinlock et sa section critique sont exécutés à l’intérieur d’une section non préemptible, le thread qui exécute la section critique ne peut plus être préempté, et les autres threads ne seront donc bloqués que pour un temps borné (sous réserve qu’il n’y a pas de défaillance lors de l’exécution de la section critique). Plus généralement, une section non préemptible permet en un certain sens de transformer des algorithmes bloquants en algorithmes non-bloquants.

Notons qu’en monoprocesseur, une section non préemptible est toujours une section critique, puisque le thread est garanti d’être seul à utiliser le processeur. De plus, un spinlock est toujours inutile en monoprocesseur : lorsqu’un thread attend pour un spinlock, donc monopolise le processeur, le spinlock ne peut pas se libérer.

Il y a deux moyens pour empêcher les préemptions, a priori ou a posteriori. Masquage des interruptions On empêche les préemptions a priori en masquant les interruptions. Ce mécanisme a un overhead faible, mais demande de faire confiance au programme qui l’emploie puisque celui-ci peut bloquer le processeur indéfiniment5

. Dans Anaxagoros, cette technique est r´eserv´ee au (petit) noyau.

Sursis d’exécution L’autre moyen est a posteriori : si une préemption doit survenir, on l’enregistre mais on accorde au programme un délai supplémentaire. Cela peut être implémenté sous différentes formes : les exonoyaux [EKJO95, § 5.1.1] accordent un sursis de manière systématique. Psyche [MSLM91, § 3.2] utilise une notification d’une préemption imminente : le temps entre cette notification et la préemption peut être vu comme un sursis d’exécution. Symunix [ELS88, § 3.2] utilise

On pourrait ´eventuellement rajouter un timeout, mais cela est contraire `a notre refus de coder du temps en dur (§ 3.1.4.3).

une variable par thread permettant de signaler à l’ordonnanceur qu’il a besoin d’un sursis ; ce sursis est accordé lorsque cette variable est à 1.

Le problème qui se pose est celui de la durée du sursis d’exécution.

S’il est fini, on prend le risque que la section critique ne soit pas terminée quand le thread est réellement préempté. S’il est long, ce risque diminue, mais le temps de préemption augmente, ainsi que l’interférence avec les décisions d’ordonnancement, ce qui pose problème pour les programmes temps réel. De plus on ne respecte pas notre refus de coder du temps en dur (§ 3.1.4.3). S’il est infini, cela demande de la confiance comme pour le masquage des interruptions.

Dans Anaxagoros, tout le noyau s’exécute dans une section non préemptible, implémentée à l’aide d’un sursis d’exécution infini ; on fait confiance au code du noyau pour vérifier régulièrement qu’il n’y a pas eu préemption. Cette implémentation permet à la routine d’interruption de continuer à s’exécuter (e.g. pour compter le temps passé dans le noyau, ou implémenter un watchdog), et permet une implémentation efficace des points de préemption explicites6

(il suffit de v´erifier une variable).

Sleeplock Pour éviter de perdre du temps à attendre que la section critique soit libérée comme pour le spinlock, il est commun que les threads bloqués effectuent un appel à l’ordonnanceur (e.g. par l’appel système sleep(), d’où le nom de sleeplock).

sleeplock

En particulier, si le thread dans la section critique était préempté, l’ordonnanceur pourra ordonnancer ce thread là, et ainsi libérer le verrou.

Dans le cas général, l’utilisation de sleeplock perturbe l’ordonnancement de manière imprévisible et empêche l’ordonnancement déterministe. Cela va à l’encontre du principe d’indépendance des politiques (§3.1.1.1).

Cependant, certains systèmes permettent de “diriger” l’ordonnanceur afin qu’il ordonnance spécifiquement le thread qui détient le verrou, le temps qu’il le libère. Dans les systèmes par priorité, on appelle cela héritage de priorité (e.g. [SWH05]), mais ce système peut être implémenté de manière générale, comme l’ont montré Ford et Susarla[FS96]. Ainsi, l’attente pour le verrou est borné à la longueur de la section critique 7_{. Ce mécanisme semble donc acceptable pour des sections critiques}

courtes, et des verrous non r´ecursifs.

Mais même ainsi, il y a des désavantages : il y a perturbation de la décision d’ordonnancement ; lorsqu’un processus peut détenir de multiples lock, l’ordonnancement peut devenir incompréhensible (en plus de pouvoir souffrir de deadlocks) ; enfin l’overhead de ce mécanisme est haut : un appel à l’ordonnanceur pour commuter vers le thread qui détient la section critique, et un appel pour en revenir.

Dans Anaxagoros, nous avons décidé d’éviter ce mécanisme au maximum (il n’est actuellement pas utilisé, mais envisagé en section 4.5). Si nécessaire, nous l’implémenterons, et l’utiliseront en prenant soin de n’utiliser qu’un seul lock simul- tanément, et pour des sections critiques très courtes afin que la perturbation de l’ordonnancement ne soit pas remarquable.

[FHL+

99] utilise ´egalement des points de pr´eemption explicites.

4.1.2. Techniques usuelles de r´esolution

Autres problèmes des section critiques Les sections critiques ont également d’autres problèmes. Lorsqu’utilisées pour des sections de code longs, elles restreignent le parallélisme et perturbent l’exécution des threads bloqués. Il faut pour contrer cela utiliser des sections critiques courtes, ce qu’on appelle verrouillage à grain fin. Mais cela augmente l’overhead pour entrer et sortir de la section critique ; de plus la multiplication des verrous augmente le risque d’interblocage. Dans Anaxagoros, on limite toutes les sections critiques à des séquences d’instruction très courtes pour ne pas perturber l’exécution des autres tâches. De plus, on interdit la prise de plusieurs verrous simultanément pour empêcher les interblocages. Cela ne nous empêche pas d’être scalable.

Problème de contention et famine Le fait de bloquer en attendant l’exécu- tion de la fin de la section critique (quelque soit le mécanisme) génère des délais dans l’exécution et des possibilités de famine, que l’on peut analyser théoriquement. S’il y a M threads en compétition pour rentrer dans une section critique dont l’exécution dure au plus t, alors le temps d’attente maximal pour un thread pour rentrer dans la section critique est de (M − 1) ∗ t. Il y a possibilité de famine si un thread a besoin de moins de (M − 1) ∗ t pour être à nouveau en attente du verrou (on suppose que le thread qui obtient le verrou est choisi aléatoirement). Dans ce cas, certains threads peuvent ne jamais obtenir ce verrou. Pour éviter la famine, il faut minimiser le temps passé dans les sections critiques.

Notons que dans une section non préemptible ou pour un algorithme lock-free, il y a au plus “nombre de processeur” threads simultanément en train d’accéder au verrou, donc un nombre petit.

Autres mécanismes bloquants Il y a d’autres mécanismes bloquants, donc inutilisables dans les services d’Anaxagoros. On peut brièvement citer :

• le readers-writer lock, qui est simplement une version optimisée du mutex lock classique. Il permet à plusieurs lecteurs un accès concurrent, mais souffre des mêmes problèmes. On considérera donc ce verrou comme analogue au mutex lock ;

• les sémaphores [Dij68], qui déclenchent par nature un appel à l’ordonnanceur, ce qui est contraire à notre but d’indépendance de la politique d’ordonnancement (principe 3.1.1.1) ;

• les compteurs de version de Lamport[Lam77]. Ce mécanisme permet de synchroniser un écrivain et plusieurs lecteurs (les écrivains peuvent être synchronisés autrement). On utilise deux compteurs de versions v1 et v2, qui sont modifié

en début et en fin d’écriture ; le lecteur recommence à lire tant que v16= v2,

et recommence donc tant que l’écrivain est préempté. Il s’agit donc d’une synchronisation sans verrou, mais bloquante. Le problème est évité si l’écrivain ne peut pas être préempté vis à vis du lecteur (e.g. s’exécute dans une section non préemptible, ou est de plus haute priorité quand l’ordonnancement est à priorité fixe).

4.1.2.2 La programmation non-bloquante

La technique générale pour obtenir des algorithmes non-bloquants est d’agencer son code de fa¸con à ce qu’il soit fonctionnel quelque soient les entrelacements des différents threads.

Un exposé complet sur l’état de l’art des différentes techniques de programmation non-bloquante sortirait du cadre de cette thèse ; nous nous contenterons de pointer vers l’excellent état de l’art de Fraser [Fra04] et d’expliquer les raisons pour lesquelles ces techniques ne peuvent pas s’appliquer dans les services d’Anaxagoros. Concrètement, les problèmes qui se posent sont le fait de recommencer l’exécution, qui introduit une interférence dans l’exécution des tâches, et l’allocation dynamique de mémoire, qui peut permettre des dénis de ressource sur la mémoire.

Typologie Il existe trois cat´egories d’algorithmes non-bloquants :

• un algorithme wait-free garantit à tout moment que tous les threads présents finiront leur opération dans un temps maximum ;

• un algorithme lock-free garantit à tout moment qu’un thread parmi tous les threads présents finira son opération en un temps maximum (et pas simplement qu’il n’y a pas de lock) ;

• un algorithme obstruction-free garantit `a tout moment qu’un thread terminera son op´eration en un temps maximum, s’il est seul.

Les algorithmes lock-free et obstruction-free demandent des précautions pour un usage pour le temps réel, car le temps d’exécution des algorithmes doit être borné. Mais en monoprocesseur, l’emploi de ces primitives ne pose pas de problème pourvu que les threads soient ordonnancés pour un quantum de temps suffisamment long (supérieur à la durée d’exécution de l’algorithme), car un thread est toujours tout seul à s’exécuter.

En multiprocesseur, les algorithmes obstruction-free peuvent souffrir du problème du livelock, et ne jamais terminer. Il existe des solutions pour éviter ce problème, comme d’attendre pendant un temps probabiliste, mais nous ne souhaitons pas employer ces solutions pour des programmes temps réel critiques. Les algorithmes lock-free souffrent de la contention (§ 4.1.2.1) et éventuellement de famine. Ce problème n’est pas remarquable si on boucle sur des sections courtes et qu’on utilise ces primitives de manière “peu fréquente”, ce qui est généralement le cas donc ces algorithmes peuvent en général être employés.

En résumé, la programmation non-bloquante semble bien adaptée pour résoudre les problèmes de synchronisation dans les services d’Anaxagoros.

Problème de l’allocation mémoire Malheureusement, une bonne partie des algorithmes non-bloquants demande une allocation mémoire dynamique.

Beaucoup fonctionnent sur ce principe : « alloue de la mémoire, accessible seulement au thread, écrit les nouvelles valeurs dedans, et remplace atomiquement le pointeur sur ces valeurs ». Dans les services partagés, cela demande de l’allocation

4.1.2. Techniques usuelles de r´esolution

de mémoire propre par un client, et est donc un déni de ressource mémoire potentiel (le nombre de clients étant non borné). Entre autre algorithmes basés sur ce principe, on peut citer les constructions universelles de Herlihy [Her90, Her93], ou la STM de Fraser et Harris [Fra04].

L’autre utilisation de mémoire allouée dynamiquement vient des lecteurs si- multanés. Quand une nouvelle version est installée, il peut y avoir des threads qui lisent en parallèle l’ancienne version. Souvent, on ne récupère pas la mémoire tant qu’il en reste un lecteur, ce qui occasionne aussi une possibilité de déni de service. Entre autres algorithmes qui sont basés sur ce principe, il y a aussi les constructions universelles de Herlihy [Her90, Her93], et le mécanisme RCU utilisé dans le noyau Linux [BC05, p. 207]. Ce problème est plus difficile à résoudre, mais il existe également des solutions (par exemple en notifiant les lecteurs de ne plus utiliser la donnée, comme le fait notre schéma de synchronisation use/destroy 5.2.4).

Ces problèmes empêche la réutilisation directe de beaucoup d’algorithmes exis- tants, dès qu’ils demandent une allocation dynamique de la mémoire.

Problème spécifique aux systèmes d’exploitation Quand on écrit un service de système d’exploitation, on doit communiquer avec le matériel qui choisit ses structures de données (e.g. format des tables de pages). Souvent la programmation non-bloquante demande à réorganiser ses données afin de pouvoir faire une mise à jour atomique, mais ce n’est souvent pas possible. Entre autre, l’utilisation de ports IO (communication avec des instruction particulière) ou de buffers à des emplacement mémoires fixes restreignent la possibilité d’utiliser les algorithmes habituels.

Peu de systèmes d’exploitations ont été implémenté de manière non bloquante. Cache [GC96] et Synthesis [Mas92] utilisent tout deux l’instruction DCAS, qui était présente sur le processeur 68k mais ne l’est plus dans les processeurs actuels. OASIS est non-bloquant, mais la majorité des ressources sont allouées statiquement. Exception notables Il y a des exceptions notables, pour lesquels on peut faire de la programmation parallèle sans verrou ni allocation dynamique. Entre autres choses que nous avons utilisées, on trouve le “single-word protocol” de Herlihy [Her90], la lecture et écriture concurrente de Lamport [Lam90], et une modification de l’algorithme pour les listes de Harris [Har01] pour l’utiliser comme pile pour pouvoir faire de l’allocation FCFS. Enfin, avec un peu d’astuce on peut facilement trouver des algorithmes ad-hoc (e.g. annexe A.1.3).

4.1.2.3 Un chemin interm´ediaire

En résumé, les mécanismes usuels pour la synchronisation dans les programmes par- allèles demandent souvent à choisir entre plusieurs maux : les algorithmes bloquants posent des problèmes lorsqu’ils sont préemptés dans leur section critique, ce qui demande soit de faire confiance au service soit qu’ils puissent modifier l’ordonnancement. Ils restreignent aussi souvent inutilement le parallélisme. Les algorithmes non bloquants réclament souvent une allocation dynamique de mémoire, ce qui conduit très facilement à un déni de ressource mémoire.

A cause de ces problèmes, nous avons décidé d’explorer également un chemin intermédiaire : i.e. de se prémunir contre certains des problèmes liés à la programmation parallèle par le code, et des autres par l’emploi de primitives de synchronisation. Notre but est de fournir des mécanismes pour permettre des synchronisations qui ne demandent pas d’allocation dynamique, qui soient non-bloquantes, et qui permette au programmeur d’écrire facilement du code parallèle efficace.

Cette voie a été ouverte notamment par le mécanisme de revocable lock de Harris et Fraser [HF05] ; nous avons mené une recherche plus exhaustive sur cette voie intermédiaire.

Dans le document Intégration de systèmes hétérogènes en termes de niveaux de sécurité (Page 149-155)