Ev´ ´ enements et ordres partiels de d´ elivrance

4.3 Causalit´ e dans les syst` emes distribu´ es

4.3.1 Ev´ ´ enements et ordres partiels de d´ elivrance

Calcul r´eparti

Pour mieux comprendre la répartition, il est nécessaire d’avoir une modélisation la plus précise possible d’un système réparti. Les processus communiquant par messages constituent le modèle à la fois le plus ancien et le plus étudié des modèles de calcul réparti. Les diffusions de messages peuvent se faire via des canaux logiques de communication dont les propriétés peuvent varier comme nous l’avons montré dans la section précédente.

Lorsqu’on cherche à analyser le comportement d’un calcul réparti, il est intéressant d’en avoir une image graphique. La notion de chronogramme est un outil élémentaire et indispensable. Il permet d’abs- traire graphiquement une exécution répartie en ne considérant que les événements significatifs issus de chaque processus. Trois types d’événements sont distingués : les événements internes au processus, les ´

emissions de messages et les r´eceptions de message.

Le chronogramme de la figure 4.14 montre par exemple un év´enement interne i1, des envois de message point `a point (par exemple couple e1; r1), une diffusion (émission e2), la perte d’un message (´emission e),. . .

1_{Il est th´}_{eoriquement impossible de le mettre en œuvre en cas de d´}_{efaillance ou de communications sans garantie de}

Un calcul réparti peut être abstrait en terme des ensembles d’événements produits par chaque processus au cours d’une exécution particulière. C’est le point de vue événementiel. `A tout processus Pi peut donc être associé une suite finie ou non d’év´enements C_i totalement ordonnés dénotant des événements internes, des envois ou des r´eceptions de messages issus de P_i ayant eu lieu pour une exécution donnée. Globalement, un calcul réparti est représenté par une union de toutes ces suites :

C = N

1 Ci

Les événements issus de processus différents ne sont pas forcément ordonnés. Un ordre partiel les relie cependant, induit par les messages échangés. Un calcul réparti va donc être caractérisé par une ordre partiel fondé sur une relation dite de causalité. À titre d’exemple, la figure (4.15) montre une suite d’événements ayant lieu sur trois sites différents durant une exécution répartie comportant des échanges de messages entre les sites.

a1 a2 a3 a4 a5 b1 b2 b3 b4 A B C c2 c3 c1 m3 m4 c4 m5 m2 m1

Fig. 4.15 – Exemple de calcul r´eparti

Dans cette section, nous allons résumer des résultats classiques du concept de causalité dans les systèmes répartis. Étant donnés deux événements, une question importante est de savoir si ces deux ´

evénements sont causalement liés, en d’autres termes, s’ils sont liés par une relation de précédence appelée happened before [Lam78]. Cette relation capture la notion intuitive de cause-`a-effet et est une notion fondamentale lorsqu’on raisonne dans un calcul réparti a des fins de débogage, supervision, observation, communication et synchronisation.

Ordre causal. Syst`emes de datation.

La causalité définit une relation d’ordre partiel entre les événements d’un calcul réparti. Cette relation d’ordre partiel, notée≺, est la plus petite relation transitive satisfaisant les deux conditions suivantes : – Pour tout couple d’év´enements (e, e) issu d’un mˆeme processus, tel que e pr´ec`ede e dans la suite

associ´ee au processus, la relation e≺ e est vérifiée ;

– Lorsque deux processus ´echangent un message M , les ´ev´enements d’envoi e et de r´eception r sont li´es : e pr´ec`ede toujours r dans un temps global et e est la cause de r. En cons´equence, pour tout message M , on aura la relation e≺ r.

Dotée de cette relation de causalit´e, une union C = N₁ Ci peut représenter un calcul réparti si la relation≺ est acyclique. En effet, tout calcul réel implique que (C, ≺) est un ordre partiel strict.

L’idée gén´erale est que, si e≺ e, alors e est potentiellement la cons´equence de e. Un int´erêt de l’ordre causal tient au fait qu’il peut être implanté plus efficacement qu’un ordre total sur les événements et qu’il est néanmoins suffisant pour beaucoup d’applications.

Dans l’exemple de la figure (4.15), certains couples d’événements sont liés causalement, soit directe- ment, par exemple a1≺ c1, soit par transitivit´e de la relation causale, par exemple a1≺ b3. Par ailleurs, certains couples d’événements ne sont pas causalement li´es, par exemple a3et c1. On note par||, l’absence de causalité entre événements. Autrement dit :

e|| e ≡ ¬((e ≺ e)∨ (e≺ e))

Cette relation|| dénote une relation logique de parallélisme. Elle ne signifie pas que les deux événements se sont produits simultanément dans le temps global réel mais simplement qu’ils auraient pu sans en- freindre la causalité.

Systèmes de datation Les protocoles de communication qui assurent la délivrance des messages dans un certain ordre (par exemple FIFO ou causal) s’appuient sur des mécanismes de datation. En général, un mécanisme de datation doit respecter une règle fondamentale : être compatible avec la relation de causalité qui peut exister entre toute paire d’événements. Autrement dit :

∀ e, e _: _e_{≺ e} _{⇒ date(e) < date(e}₎ On peut distinguer deux approches :

– une approche « temps réel » consistant à dater les événements avec une horloge la plus précise possible. La difficulté est alors de disposer de cette horloge globale ;

– une approche« temps logique » consistant à dater les événements en respectant la causalité selon la règle énoncée.

Datation temps-réel Cette approche pose le problème de la disponibilité d’une horloge globale. En

effet, comme nous l’avons souligné, un système réparti ne dispose justement pas d’un référentiel global de temps. Chaque nœud possède une horloge locale plus ou moins précise et surtout non synchronisée a priori avec les horloges des autres nœuds. Or, une datation directe à l’aide de telles horloges ne convient donc pas car des anomalies causales peuvent être engendrées. Il suffit que l’horloge du nœud émetteur soit en avance sur celle du nœud récepteur pour obtenir un message dont la date de réception est antérieure `

a la date d’´emission.

Pour résoudre ce problème, des algorithmes de synchronisation d’horloges ont été con¸cus et implantés. Ils permettent de recaler les horloges des nœuds de fa¸con à ce que leur différence reste dans un intervalle borné connu. L’algorithme doit maintenir un invariant du type :

invariant M ax(hi : i = 1, N )− Min(hi : i = 1, N ) <

On obtient ainsi une pr´ecision qui garantira une datation correcte si tous les ´evénements causalement liés sont séparés par un délai supérieur à la précision de l’horloge globale ainsi implantée.

La datation temps réel nécessite un protocole de synchronisation d’horloges complexe et relativement coûteux. La disponibilité d’un émetteur unique (diffusion de tops par une horloge atomique par exemple) peut apporter une simplification dans la mise en œuvre et plus de précision. Cependant, la solution est alors centralisée par nature et donc moins tolérante aux défaillances : défaillance de l’émetteur, mais aussi défaillance locale des récepteurs.

Enfin, pour de nombreuses applications, seul le respect de la causalité est important. Il est même parfois souhaitable de savoir si deux événements sont causalement liés ou non. Une datation temps réel ordonne totalement tous les événements et ne permet donc pas de distinguer ceux qui sont indépendants (sans causalité) malgré leur précédence temporelle. Face à ces inconvénients, des solutions fondées sur un temps logique ont été étudiées.

Datation temps logique Deux solutions ont été proposées :

– Horloges scalaires - due à L. Lamport [Lam78], permet de dater les événements selon un ordre total. L’inconvénient éventuel de cette approche est donc de même nature que celui d’une datation temps réel : l’introduction d’un ordre arbitraire entre des événements indépendants.

– Horloges vectorielles - due à Fidge et Mattern [Fid91, MF89], permet de dater les événements selon un ordre partiel isomorphe à la relation de causalité. Ce mécanisme est plus précis mais plus coûteux à implanter et permet de distinguer (détecter) les événements indépendants. Toutefois, un tel mécanisme ne permet pas de décider de l’existence d’un événement compris entre deux ´

ev´enements causalement li´es.

Horloges scalaires Sur chaque site S_i est cré´e un compteur H_i à valeurs entières (horloge logique),

initialisé à 0, qui sert à dater les événements sur ce site. A chaque év´enement e arrivant sur S_i la valeur Hi est incrément´ee de 1 et la date de e, notée Hi(e), est par définition la nouvelle valeur de Hi. Pour garantir la préc´edence causale, tout message m émis par Si porte une estampille E(m) qui est sa date d’´emission, et le site Sj qui re¸coit m exécute : Hj := max(Hj, E(m)) + 1. La relation ainsi d´efinie n’est pas un ordre strict : en effet, des événements causalement indépendants, arrivant sur des sites différents peuvent avoir la même date. Pour obtenir un ordre strict, il suffit de définir un ordre arbitraire entre

les sites. Si e et e sont des év´enements arrivant respectivement sur les sites Si et Sj, on peut définir comme suit une relation d’ordre total strict, notée → : e → e si et seulement si Hi(e) < Hj(e) ou H_i(e) = H_j(e)∧ i < j. Un événement est maintenant daté par le couple (numéro de site, estampille).

Le chronogramme de la figure 4.16 montre l’évolution des horloges de chaque site et la surcharge des messages par la date d’émission de chaque message. On remarquera que les événements de réception ne sont pas datés. Ils ne sont l’occasion que d’un recalage de l’horloge du site de réception mais n’entraˆınent pas d’opération d’incrémentation.

a1 a2 a3 c1 c2 c3 <(A,2),m2> b3 b2 A B C (A,0) (B,0) (C,0) b1 (A,3) (A,2) (A,1) <(A,0), m1> a4 (B,3) (B,4) (B,5) (A,4) <(B,3),m3> <(B,4),m4> (C,5) (C,0) (C,1)

Fig. 4.16 – Horloges de Lamport

Les horloges de Lamport permettent un ordonnancement total des événements d’un calcul réparti en respectant la causalité qui peut exister entre ces événements. Néanmoins, l’ordre introduit entre des ´

evénements causalement indépendants (≡ logiquement simultanés) est arbitraire. Par exemple, la figure 4.16 montre que l’év´enement a3 a pour date (A, 2) et l’´ev´enement c2 a pour date (C, 1) : on a donc c2 qui préc`ede a₃ avec cette datation alors que dans le temps absolu c’est l’inverse qui s’est produit. Ceci n’est pas erroné puisque ces deux événements ne sont pas causalement liés.

Horloges vectorielles La relation d’ordre→ définie par les horloges de Lamport ne suffit pas pour

etablir une relation de causalité entre deux événements. On peut simplement dire que l’ordre total défini par la relation→ est compatible avec l’ordre partiel de précédence causale ≺. En effet, si e → e, ou bien e ≺ e ou bien e et e sont causalement indépendants. L’ordre total introduit ”efface” artificiellement l’indépendance causale. Il est néanmoins utile de pouvoir déterminer la dépendance ou l’indépendance causale entre deux événements.

Le mécanisme des horloges vectorielles [Fid91, MF89] a été introduit pour caractériser la dépendance causale. Soit n le nombre de sites. Sur chaque site Si, on définit une horloge vectorielle comme un vecteur Vi[1· · · n] initialisé à 0. Lorsqu’un événement se produit sur le site Si, on ex´ecute Vi[i] := Vi[i] + 1. Chaque message m porte comme estampille Vm l’horloge vectorielle Vi du site émetteur. A la réception d’un message (m, Vm), le site r´ecepteur, soit Si, ex´ecute : Vi[j] := max(Vi[j], Vm[j]) pour j = 1,· · · , n. Appelons passé d’un év´enement e l’ensemble constitué de e lui-mˆeme et des événements qui le précèdent causalement. Grâce à leur construction, les horloges vectorielles peuvent être interprétées comme suit : si un év´enement e est daté par le vecteur V_e, alors :

– Ve[j] = nombre d’´ev´enements du pass´e de e sur le site Sj; – _jVe[j] = nombre total d’´ev´enements du pass´e de e.

D´eﬁnissons une relation d’ordre partiel entre horloges vectorielles : 1. V ≤ W ⇔ ∀j, V [j] ≤ W [j]

2. V < W ⇔ V ≤ W ∧ V = W 3. V  W ⇔ ¬(V ≤ W ) ∧ ¬(V ≤ W )

La relation d’ordre partiel entre horloges vectorielles reflète la relation de précédence causale et peut ˆ

etre exprim´ee comme suit. Soit deux ´ev´enements e et e, dat´es respectivement par les vecteurs Veet Ve.

Alors :

1. e≺ e ⇔ Ve< Ve

2. e et e sont causalement ind´ependants⇔ Ve Ve

Pour résumer, on peut remarquer que les mécanismes de datation permettent : – l’ordonnancement correct de deux événements (horloges de Lamport ou vectorielles) – le non-ordonnancement des événements non liés (horloges vectorielles)

De plus, des mécanismes de datation plus complexes à base de matrices d’horloges ( [CDK94]) permettent la détection d’un message manquant (« detection gap »).

Dans le document Supervision de contenus multimédia : adaptation de contenu, politiques optimales de préchargement et coordination causale de flux (Page 106-110)