Conclusion - Gestion dynamique des tâches dans les grappes, une approche à base de machines vir

(a) Concentration des tˆaches (b) Ordonnancement coop´eratif impli- cite (co-scheduling)

Figure_{2.4 – Exemples d’approches r´eduisant la fragmentation dans le gang scheduling.}

En réalité, la granularité proposée par le co-scheduling est plus fine et considère que l’inter-communication entre les processus n’est pas nécessairement uniforme. Il est donc possible de n’exécuter sur un même quantum que les processus les plus fortement liés. La désignation des processus fortement liés peut être faite par l’utilisateur lors de la description de sa tâche, ou réalisée à la volée par le gestionnaire de ressources en observant les différentes connexions réseaux entre les processus. La Figure 2.4(b) montre une telle exécution. Dans cet exemple, la fragmentation est réduite en exécutant une partie de la tâche 2 et de la partie 3 durant les quantum t1et t3.

Le changement de contexte global est une fonctionnalité critique dans les ordonnanceurs à partitionnement temporel. Il faut en effet assurer un temps de changement de contexte le plus court possible puisque durant celui-ci, aucune tâche n’est exécutée. Il faut également assurer que la durée d’un quantum est grande par rapport à la durée d’un changement de contexte afin que la grappe soit utilisée princi- palement pour l’exécution des tâches et non leur manipulation. Ce temps de changement de contexte est également critique si des applications utilisent des connexions réseaux. Si l’application est suspendue trop longtemps, alors la connexion réseau peut être fermée par les autres participants (dans le cas de l’expiration du délai maximal d’attente de réponse dans le protocole TCP par exemple). Synchroniser tous les changements de contexte des différents processeurs d’une grappe est coûteux et les stratégies de

gang scheduling souffrent de problèmes de passage à l’échelle. Le co-scheduling permet de réduire ce coˆut et d’améliorer le passage à l’échelle en ne réalisant le changement de contexte que sur un sous-ensemble de nœuds.

2.4 Conclusion

Nous avons réalisé dans ce chapitre un état de l’art relatif à la gestion des tâches dans les grappes de ser- veurs. Les travaux portant sur les modèles de tâches prennent en compte la flexibilité à la fois des tâches et du mode de partitionnement des ressources pour proposer différents contextes d’utilisations. Les modèles totalement rigides considèrent une allocation et une utilisation des ressources constante tandis que les modèles dynamiques permettent un partitionnement des ressources adapté à des tâches ayant des besoins variables. Ces différents modèles servent de base à différentes stratégies d’ordonnancement permettant l’exécution simultanée de plusieurs tâches grâce à un découpage spatial ou temporel des partitions. Un des objectifs des gestionnaires de ressources est de permettre un taux d’occupation maximale des ressources afin d’exécuter les tâches au plus tôt. Les approches les plus efficaces proposent une gestion des tâches à la volée où les ressources sont allouées selon le besoin réel des applications et la charge de la grappe et non selon une estimation, souvent peu précise, des utilisateurs. De plus, le partitionnement temporel permet de gérer les tâches avec un grain plus fin en exécutant les tâches de manière préemptible.

L’impl´ementation de strat´egies d’ordonnancement complexe tel que le gang scheduling ou le co-

scheduling est plus délicate que l’implémentation de stratégies `a base de partitionnement spatiale. Les stratégies à base de partitionnement temporelle repose en effet sur une gestion dynamique des tâches et nécessitent donc des mécanismes dédiés à la manipulation de celles-ci en temps réelles tels que la migration et la suspension sur disque. Proposer une implémentation générique de ces mécanismes avec un système d’exploitation standard et des processus est complexe [MDP+_{00] et tend à limiter l’utilisation} de tels algorithmes [ET05].

Nous discuterons plus en détail des limitations actuelles de ces approches dans le chapitre 5 et nous proposeront une solution consistant à embarquer les composants des tâches dans des machines virtuelles

systèmes. Le chapitre suivant présente un état de l’art relatif à la virtualisation et aux machines virtuelles systèmes.

Chapitre 3

Les machines virtuelles

Où nous présentons un état de l’art sur la virtualisation système. Nous discutons des besoins historiques qui ont motivé le principe de protection dans les systèmes d’exploitation puis l’iso- lation par la virtualisation système. Nous discutons également des différentes approches pour la virtualisation système et des mécanismes de migration, de suspension et de reprise d’activité qui permettent de manipuler les machines virtuelles.

Sommaire

3.1 Protection dans les systèmes d’exploitation . . . 20 3.2 Machine virtuelle applicative . . . 21 3.3 Machine virtuelle système . . . 21 3.4 Les approches pour la virtualisation système . . . 21 3.4.1 Virtualisation pure . . . 22 3.4.2 Para-virtualisation . . . 22 3.4.3 Virtualisation pure assistée . . . 23 3.4.4 Virtualisation du système d’exploitation . . . 23 3.5 Hyperviseur natif, hyperviseur applicatif . . . 24 3.6 Capture d’état et migration des machines virtuelles . . . 24 3.7 Conclusion . . . 26

L

’implémentation de stratégies d’ordonnancement complexes et dynamiques tel que le gang scheduling_{avec concentration des tˆ}_{aches nécessitent que leur support d’exécution mettent à disposition des} mécanismes permettant de capturer l’état d’une tâche sur disque ou en mémoire, de la migrer sur un autre hôte ou de modifier dynamiquement la taille de sa partition.

Historiquement, le support d’exécution est un système d’exploitation embarquant chaque composant d’une tâche dans un processus. La pagination et la segmentation de la mémoire ainsi que les niveaux de privilège des instructions processeurs fournissent une protection suffisante. Cependant, de par sa concep- tion, ce support implique que l’environnement d’exécution de la machine puisse exécuter l’application. Celle-ci peut cependant avoir été développée pour un système incompatible avec l’environnement de la machine (architecture matérielle, système d’exploitation, . . .). De plus, une application embarquée dans un processus est liée à des objets tiers comme des bibliothèques, des descripteurs de fichier ou des connexions réseau qu’il est difficile de manipuler directement.

Contrairement aux systèmes d’exploitation basés sur le partage contrôlé des ressources, la virtualisation système repose sur l’isolation. La virtualisation est apparue dans les années 60 comme une solution permettant à plusieurs développeurs de travailler simultanément sur une même machine en isolant chaque personne sur sa propre instance qui reprend trait pour trait le fonctionnement de la machine physique. Ainsi une erreur de manipulation dans une instance ne pourra pas compromettre les autres instances. Avec l’arrivée de machines personnelles à faible coût, l’intérêt de la virtualisation a baissé. Cette infra- structure a cependant retrouvée un intérêt au début des années 2000 afin de concentrer des applications

peu gourmandes en ressources et s’exécutant sur différents systèmes sur un nombre limité de machines afin de réduire les coûts de fonctionnement et d’entretien des machines.

Nous dressons dans ce chapitre un état de l’art concernant les machines virtuelles et plus spécialement les machines virtuelles système. Après une brève description de la protection dans les systèmes d’exploitation, nous décrivons les concepts de la virtualisation applicative puis les concepts de la virtualisation système tel qu’ils ont été définis par Popek et Goldberg [PG74]. Nous présentons ensuite les différentes approches de la virtualisation système : la virtualisation pure logicielle ou assisté par le matériel, la para-virtualisation utilisant des systèmes d’exploitation préparés et enfin la virtualisation des systèmes d’exploitation. Nous décrivons enfin les mécanismes de capture d’état et de migration pour les machines virtuelles.

3.1 Protection dans les syst`emes d’exploitation

Un des principes de base fournis par les systèmes d’exploitation est la protection. Cela consiste en un ensemble de mécanismes empêchant entre autre qu’une faute dans un programme ne puisse mettre d’autres programmes en faute. Les premiers systèmes ne proposaient pas de mécanismes pour limiter les espaces d’adressage par exemple et manipuler un pointeur sur sur une zone mémoire non-allouée dans une application pouvait faire échouer une autre application voir même le système entier. La protection de la mémoire est réalisée en partie par la segmentation [SS75] et la pagination. Ces approches bornent les plages mémoire accessibles à un processus afin d’empêcher les applications de manipuler la mémoire dont elles ne sont pas propriétaires. La protection est également présente au niveau des processeurs en limitant les instructions utilisables par une application. Chaque processeur met à la disposition des développeurs du système d’exploitation un jeu d’instructions appelé ISA. Certaines de ces instructions sont privilégiées et ne doivent être exécutables que par le système d’exploitation. Elles manipulent entre autre l’état du processeur et de la mémoire et une mauvaise utilisation de celles-ci peut compromettre le système. En 1972, le système Multics [SS72] propose d’une architecture disposant de huit niveaux de privilèges pour l’exécution des instructions processeur. Au niveau le plus bas, le mode superviseur, un noyau disposant de tous les privilèges exécute du code supposé sûr assurant les tâches les plus sensibles du système d’exploitation comme la gestion de la mémoire ou la communication avec les périphériques. Dans les niveaux plus élevés, tel que le niveau correspondant au mode moniteur, le code n’est pas considéré comme sûr et les applications disposent de privilèges réduits. Elles peuvent cependant utiliser la mémoire et les péri- phériques par le biais d’interfaces communiquant avec le noyau. Si une erreur se produit dans le mode moniteur, le fonctionnement de la machine n’est pas compromis et si une application souhaite exécuter des instructions réservées au mode superviseur, une exception liée à la sécurité est levée.

La plupart des systèmes actuels (UNIX, GNU/Linux, Windows) dérivent de Multics. Aujourd’hui les processeurs de type x86 proposent en mode protégé quatre niveaux d’exécution. Sous le noyau GNU/Li- nux, 2 niveaux sont réellement utilisés. Le niveau 0 (le mode superviseur) réservé au noyau et pouvant exécuter directement n’importe quelle instruction de l’ISA et le niveau 3 (mode moniteur) pour les applications des utilisateurs (voir Figure 3.1) et ne pouvant exécuter directement que des instructions non-privilégiées.

Dans le document Gestion dynamique des tâches dans les grappes, une approche à base de machines virtuelles (Page 30-34)