Architecture et Système

(1)

Architecture et Syst `eme

Stefan Schwoon

Cours L3, 2020/2021, ENS Cachan

(2)

Vue abstraite d’un ordinateur

mémoire processeur

registres

adresse données instructions

assembleur

Ceci est la machine abstraite propos ´ee au programmeur.

Jusqu’aux ann ´ees 70/80 : r ´ealisation plus au moins directe de cette architecture.

Depuis : gestion de plus en plus complexe derri `ere les sc `enes (micro-architecture)

(3)

Gestion m ´emoire/processeur avanc ´ee

Besoins d’un syst `eme d’exploitation :

partage du processeur entre diff ´erents processus/utilisateurs protection et partage m ´emoire

gestion de privil `eges (mode noyau/mode utilisateur) Optimisations :

parall élisation (pour acc él érer le calcul) m émoire rapide (cache)

r éordonnancement d’instructions / prediction de branches r éduction la consommation énerg étique

(4)

Remarques :

Les d étails techniques varient pas mal entre les diff érents ordinateurs/syst èmes.

Quelques d ´etails de l’exposition suivante sont valables pour un processeur Intel i7 et les versions courantes de Linux, mais les principes sont applicables

`a tous les syst `emes courants.

(5)

M ´emoire virtuelle

mémoire réelle instructions

assembleur

adresse virtuelle

adresse réelle

données

traduction

processeur registres

Les adresses fournies par les instructions assembleur sont des adresses virtuelles.

Une unit é d édi ée (Memory management unit, MMU) les traduit vers des adresses physiques.

La traduction est telle qu’un processus n’a acc ès qu’ à la m émoire qui lui est propre (au moins, en th éorie. . . ).

(6)

Traduction m ´emoire virtuelle ↔ r ´eelle

Exemple : traduction sur un processeur Intel 64-bit Espace virtuel :

adressage avec 48 bits (donc th éroriquement 256 Tera) d écoup é en pages (bloc de m émoire contigu ë)

taille d’une page : 1 GB, 2 MB, 4KB, selon le cas une adresse se d ´ecoupe donc en:

– num ´ero de page (les bits les plus significatifs) – ´ecart/offset (les bits les moins significatifs)

(7)

Visualisation

Une m émoire virtuelle traduit donc le num éro d’une page virtuelle vers une page r éelle, en gardant l’ écart: _X

X X 7 X 5 X X X 3 4 X 6 1 2

page virtuelle

MEMOIRE

VIRTUELLE MEMOIRE

VIVE

cadre de page

0k-4k 4k-8k 8k-16k 16k-20k 20k-24k 24k-28k 28k-32k 32k-36k 36k-40k 40k-44k 44k-48k 48k-52k 52k-56k 56k-60k 60k-64k

0k-4k 4k-8k 8k-16k 16k-20k 20k-24k 24k-28k 32k-36k

(8)

Propri ´et ´es de la traduction:

partielle, injective

r éalis ée à l’aide d’un tableau de pages propre à chaque processus, cr é é et maintenu par le noyau

Un registre d ´edi ´e (CR3) contient le pointer vers le tableau du processus actuel.

Lorsque le syst `eme bascule entre deux processus, c’est ce registre qui change de valeur.

(9)

Remarques

Lors de l’ex écution du processus, les acc ès m émoire se font ind épendamment du noyau, le mat ériel s’en occupe.

Certains appel syst `eme (p.ex. malloc, brk) modifient le tableau de traduction.

Traitement d’un acc ès m émoire ill égal :

le processeur d ´eclenche une interruption ;

le syst `eme rattrape cette exception et envoye un signal (SIGSEV) au processus ;

le signal termine le processus (sauf s’il le rattrape).

(10)

D ´etails de la pagination

Traduction r éalis ée à l’aide d’un trie (tableau à plusieurs niveaux).

Une partie des pages r ´eelles (de taille 4 KB) est utilis ´ee pour stocker les tableaux.

4 KB contiennent 512 = 2⁹ adresses `a 64 bits.

Dans le tableau de premier niveau on utilise les 9 bits les plus significatifs pour obtenir l’adresse d’un bloc de niveau 2.

Apr `es 4 niveaux (4 × 9 = 36) on obtient l’adresse d’un bloc de 4 KB (4096 = 2¹²).

Les 16 bits non-utilis ´es stockent des informations sur les privil ´eges:

acc ès en écriture, page ex écutable, acc ès privil égi é (en mode noyau seulement), . . .

(11)

Organisation de la m ´emoire virtuelle

Sous Linux, un processus vit dans la moiti ´e basse de la m ´emoire virtuelle (bit 47 = 0).

La partie haute est reserv ´e au noyau.

Organisation en code, tas et pile:

CODE TAS PILE

cache 0..FF

PARTITION SWAP CODE

TAS PILE

RAM 0..777

777...FFF FFF7...FFFF

(12)

Gestion du tas

Une grande partie de l’espace virtuelle ne correspond à aucune page r éelle (et les acc ès à ces adresses d éclenchent une violation de segment).

Un processus peut ´elargir la taille de son tas avec brk.

malloc / free : Fonctions en mode utilisateur qui organisent le tas (font appel `a brk si n ´ecessaire).

Ces fonctions utilisent un partie du tas pour organiser les allocations.

Les bogues (d ébordement de m émoire) peuvent corrompre cette information, m énant à des effets secondaires non pr évisibles.

(13)

Translation lookaside buffer (TLB)

Avec le principe évoqu é pr éc édemment, chaque acc ès m émoire virtuel se traduit en cinq acc ès r éels → inefficace

Du coup, on m émorise les pages utilis ées le plus souvent dans le TLB (m émoire associative mais limit ée).

Attention, une m ême adresse virtuelle correspond à plusieurs adresses r éelles, en fonction du processus:

Certains processeurs r ´ecents offrent un r ´egistre stockant l’identifiant du processus actuel, pris en compte par le TLB.

Dans d’autres processuers, le TLB doit ˆetre invalid ´e quand on bascule vers un autre processus.

(14)

Les caches

registers

CPU L1

cache main IC

cacheL2 main

memory secondarymemory

Id ée: garder les donn ées utilis ées souvents dans une m émoire sp éciale rapide, mais de taille limit ée

Facteurs limitants : co ˆut, espace physique limit ´e

Cache `a plusieurs niveaux, les cache distants sont plus lents mais aussi plus grands

Transparent : Le programmeur acc ède à une adresse virtuelle, le contenu se trouve dans la m émoire principale ou dans l’un des caches.

(15)

DRAM vs SRAM

DRAM (dynamic random-access memory)

T C access

data

r éalisation compacte (p.ex. un seul transistor + capaciteur) interpr étation: capaciteur charg é = “1”

lecture d éstructive, fuite dans les capaciteurs → r écharge p ériodique compact mais lent, typiquement utilis é pour m émoire principale

(16)

DRAM vs SRAM

SRAM (static random-access memory)

p.ex. r ´ealisation par une bascule D

moins compact mais plus rapide, utilis é pour les caches p.ex. L1 = int égr é dans le CPU, L2 = dans un autre chip

Une adresse dans le cache L1 est fournie tr ´es rapidement (∼ 4 cycles).

Pour r écup érer une adresse dans la m émoire principale, il faut une centaine de cycles !

(17)

M ´emoire secondaire

(aussi appell ´ee va-et-vient, swap space)

zones de m émoire virtuelles stock ées (temporairement) sur disque dur m écanisme sp écial de pagination:

une page virtuelle peut être marqu ée comme “residant en m émoire virtuelle”

lors d’un acc ès à une telle page, le processeur d éclenche une interruption l’interruption est capt ée par le noyau qui lib ère une page m émoire r éelle pour y stocker la page virtuelle, puis change la table de pagination

le processeur r ésume son travail et d élivre le r ésultat transparent pour le processus, mais tr ès lent

(18)

R ´ealisation d’un cache

Grosso modo, le cache fonctionne comme une petite m émoire virtuelle : on d écoupe la m émoire en petites pages (appell ées cache line),

p.ex. 64 octets pour le L1 au i7

le cache stocke un nombre limit ´e de lignes

lors d’un acc ès m émoire, on teste si la ligne de cache est stock é au cache (*) si oui, on utilise le cache

sinon, on r écup ère la ligne depuis la m émoire principale et on vire une autre ligne du cache.

(*) test par m ´emoire associatif, similaire au TLB

(19)

R ´eordonnancement d’instructions

Un processeur se trouvent face à des instructions de dur ée variable : raisons inh érentes (instructions complexes vs simples)

d élais dus aux acc ès m émoire (et p ériph érique)

Pour acc él érer le calcul et mieux utiliser les r ésources, les processeurs font de nombreuses optimisations derri ère les sc ènes :

(d ´ecoupage d’instructions d’assembleur en micro-instructions)

r éordonnancement d’instructions consid ér ées comme ind épendantes (read before write dans l’Intel, voir l’Algorithme de Peterson)

repartition entre plusieurs unit és d’ex écution en parall èle

(20)

Ex ´ecution sp ´eculative

Supposons que le processeur doit ex ´ecuter un branchement conditionnel, alors que le r ´esultat de la condition n’est pas encore connue (p.ex. en raison des

acc `es m ´emoire),

Il peut donc commencer à ex écuter une branche (ou les deux) en attendant l’ évaluation de la condition. Le r ésultat de la mauvaise branche sera alors invalid ée.

Pour savoir quelle branche devrait être ex écut ée, le processeur poss ède une unit é pour la pr édiction des branches.

(21)

Failles Spectre et Meltdown

Failles d ´ecouvertes en 2017 / 2018 Principe de Spectre:

Un attaquant fournit un param `etre hors limite `a une fonction victime.

La fonction victime teste si le param `etre est bon et le rej `ete sinon.

Pourtant, la pr édiction de branche fait une ex écution sp éculative avec le mauvais param ètre.

Le mauvais param ètre fait acc èder la fonction à une valeur s écr ète.

En fonction de la valeur s écr ète la performance du cache sera diff érente.

→ la valeur s écr ète peut être d écouverte

(22)

Failles Spectre et Meltdown

Failles d ´ecouvertes en 2017 / 2018 Principe de Meltdown:

Le noyau garde toute la m émoire physique dans une partie de la m émoire virtuelle. Le descripteur de ces pages ne permet que des acc ès par le noyau.

Un attaquant y acc `ede quand m ˆeme.

Cette acc `es correspond `a plusieurs micro-instructions:

r écup érer le descripteur de pages, tester le r ésultat, obtenir la case m émoire ou rejeter l’acc ès, . . .

Effet de cache et d’ex écution sp éculative: on r écup ère la case m émoire sp éculativement.

L’effet dans le cache peut être m ésur é comme dans Spectre.

→ l’attaquant d ´ejoue la protection m ´emoire