Notions de temps - REVUE DE LITT´ ERATURE

CHAPITRE 2 REVUE DE LITT´ ERATURE

2.7 Notions de temps

Cette section se propose d’introduire les concepts liés à la gestion du temps. Tel que nous l’avons mentionné précédemment, la mise à jour de l’horloge tombe sous la responsabilité du

système d’exploitation. Nous présentons d’abord comment l’horloge est mise à jour et main- tenue sous Linux ; nous introduisons ensuite une méthode existante pour la synchronisation de traces noyau de machines virtuelles.

2.7.1 Mesure et gestion du temps

Pour expliquer le mécanisme de mise à jour du temps sous Linux, nous commen¸cons par présenter comment le traceur LTTng assigne les estampilles de temps aux évènements qu’il enregistre. Celui-ci utilise les fonctions ktime_get() pour le tra¸cage en mode noyau, et clock_gettime() pour le tra¸cage en espace utilisateur. Ces deux fonctions utilisent les mêmes variables en arrière-plan pour donner le temps du système, d’autant plus qu’une version VDSO [42] de clock_gettime() [43] a été implémentée pour x86. Leurs modes de fonctionnement sont similaires, et peut être décortiqué en analysant le code source du noyau. Linux utilise une structure de type timespec pour maintenir le temps. Celle-ci contient deux champs, l’un pour les secondes et l’autre pour les nanosecondes, et est mise à jour à chaque interruption du system timer en l’incrémentant par le temps écoulé depuis la dernière mise à jour (donc depuis la dernière interruption livrée par le system timer ). Ce dernier représente une interruption matérielle livrée par un composant externe au CPU, dont le but est de four- nir des interruptions différées. Une composante APIC (Advanced Programmable Interrupt Controller) se situe à proximité de chaque CPU et elle se charge de livrer des interruptions au CPU auquel elle est assignée. Celui-ci utilise un registre dans lequel il précise le délai avant la prochaine interruption, ce qui permet d’activer périodiquement des interruptions. La fré- quence à laquelle ces interruptions sont livrées est définie dans Linux lors de la compilation du noyau par le paramètre de configuration CONFIG_HZ. Nous mentionnons que dans les systèmes plus anciens, un seul contrôleur avait cette tâche, le PIT (Programmable Interrupt Timer), dont les destinataires étaient l’ensemble des CPUs. Sur les systèmes d’exploitation tickless (voir CONFIG_NO_HZ), la fréquence de livraison des interruptions par le contrôleur APIC n’est pas régulière, et chaque interruption doit être spécifiée par le CPU. À des fins de réduction de consommation d’énergie, le CPU ne demande d’interruption au APIC que lorsqu’un pro- cessus lui est assigné par l’ordonnanceur. La livraison d’interruptions à un CPU inactif est généralement inutile. Ainsi, pour un CPU au repos, aucune interruption n’est livrée.

Lorsqu’une fonction de temps est appelée, ktime_get() et clock_gettime() retournent la valeur des secondes ajustée selon une interpolation sur les nanosecondes pour combler le temps écoulé depuis la dernière mise à jour.

2.7.2 Synchronisation des traces

Le plus grand obstacle à la corrélation des traces noyau des systèmes invités et hôte est la synchronisation de celles-ci. Notre analyse de préemption doit être effectuée sur l’union de plusieurs traces enregistrées en même temps sur des systèmes différents. Cependant, tel qu’expliqué dans la section précédente, le temps est mis à jour indépendamment dans les différents systèmes. Une certaine marge d’erreur existe toujours, et la combinaison des évène- ments de diverses traces en ordre chronologique ne résulte pas toujours en un flot d’exécution cohérent. Par exemple, un évènement dans une VM peut avoir une estampille de temps légè- rement supérieure à celle d’un évènement d’ordonnancement qui “enlève” cette VM du CPU, ce qui résulte en une analyse erronée. Tel que présenté par [44], le TSC peut être utilisé pour remédier à ce problème. Le TSC, ou TimeStamp Counter, est un registre spécifique à la famille x86 qui compte le nombre de cycles CPU depuis le démarrage de la machine, et peut ˆ

etre utilisé à des fins de mesure de temps à haute précision. Lorsqu’il est lu depuis un sys- tème virtualisé par assistance matérielle, la valeur du TSC est automatiquement décalée en matériel par le CPU par la valeur du champ TSC_OFFSET de la VMCS. En utilisant le traceur ftrace, les estampilles de temps attribuées à chacun des évènements enregistrés utilisent le TSC. En suivant les modifications du champ TSC_OFFSET, il est possible de ramener les évène- ments de la trace du système invité à la même ligne de temps que celle de l’hôte, en assurant une cohérence de la trace résultante. Cependant, cette approche présente des problèmes en terme de portabilité et de facilité d’utilisation. Tout d’abord, le registre TSC est spécifique aux architectures x86, ce qui rend son utilisation impossible sur d’autres architectures. En- suite, l’enregistrement de la trace doit commencer avant le démarrage de la machine virtuelle pour obtenir l’évènement initial de l’assignation du TSC_OFFSET. De plus, la perte poten- tielle d’évènements lors du tra¸cage rend cette méthode inefficace, à cause du risque de perdre un évènement de modification au TSC_OFFSET, il est donc aussi impossible d’interrompre le tra¸cage ce qui pourrait poser un problème sur des environnements de production.

Dans le document Surveillance de l'exécution et analyse de préemption entre machines virtuelles (Page 51-54)