Interruptions de service

Disponibilité Panne 1 Panne 2

Figure 32. Notions de Time to Repair (TTR), Time to Failure (TTF) et Time between Failure (TBF)

Tableau 7. Causes d’interruptions de service

L’interruption de service est un phénomène impliquant l’indisponibilité du service qui

doit être pris en compte dans la construction d’architectures orientées service. Du fait de

la nature des objets communicants, le contexte de l’intelligence ambiante est un domaine

particulièrement propice aux interruptions. Cette section présente et classifie les

principales causes d'interruption. Elle explique également en quoi les solutions existantes

de traitement des interruptions ne sont pas adaptées à tous les cas de figure, en

présentant plus spécifiquement les limites des politiques les plus dynamiques suivies par

certains modèles à composants orientés service.

IV.1.1 Définitions

Une interruption de service correspond à une rupture dans la livraison continue d’un

service. Lorsqu’un système est interrompu, il passe d’un état disponible à indisponible.

Une interruption s’étale sur un intervalle de temps à durée variable, mais le terme

« interruption », qui étymologiquement signifie « rupture entre » (des périodes de

fonctionnement), présuppose que le système tend à reprendre son fonctionnement

normal au bout d’un certain temps.

Les notions d’interruption et de disponibilité sont étroitement liées au concept de sûreté

de fonctionnement (dependability). La sûreté d’un système désigne sa capacité à délivrer

un service. Plus la sûreté est élevée, plus les utilisateurs du système peuvent s’y fier. La

sûreté se définit par quatre critères : fiabilité, maintenabilité, disponibilité et sécurité

[Nelson1990, Avizienis2001].

Du point de vue de l’interruption, nous nous intéressons en particulier à la disponibilité

et la fiabilité qui se définissent ainsi :

“ La fiabilité correspond à la probabilité qu’un système soit fonctionnel sur un

intervalle de temps donné, dans des conditions données. La fiabilité réfère donc à

l’intervalle de temps pendant lequel le système s’exécute et réagit correctement sans

aucune interruption. La fiabilité concerne la continuité de service. ”

“ La disponibilité correspond à la probabilité qu’un système soit fonctionnel à un

instant donné. La disponibilité d’un système réfère non pas à un intervalle de temps,

mais à un instant précis, où le système s’exécute et réagit correctement. On dit aussi

qu’un système est disponible (respectivement, indisponible) à un instant donné s’il est

(respectivement, n’est pas) fonctionnel. ”

Le domaine de recherche sur les pannes définit les métriques suivantes (voir aussi

Figure 32 qui présente les notions suivantes sous forme de chronogramme) :

• MTTF (mean time to failure) : Temps moyen de fonctionnement entre pannes

qui est aussi la durée moyenne pendant laquelle le système peut-être considéré

comme fiable.

• MTTR (mean time to repair) : Temps moyen de réparation (qui représente la

durée moyenne d’une défaillance)

• MTBF (mean time between failure) : Temps moyen entre deux défaillances

(entre le début d’une défaillance et le début de la suivante).

On a donc la relation suivante :

MTTR

MTTF

MTBF = +

Ces métriques sont utilisées pour calculer la disponibilité D :

MTBF

MTTF

MTTR

MTTF

MTTF

D =

+

=

TTR TTF

TBF

Parfois, on parle également de haute disponibilité [Gray1991] ou de système hautement

disponible pour désigner un système s’exécutant sur de longues périodes en étant très

rarement interrompu. Un tel système définit sa disponibilité, c’est-à-dire le ratio du temps

de fonctionnement sur le temps d’interruption, par le nombre de 9 derrière la virgule. Par

exemple un système hautement disponible « à cinq neufs » garantira une disponibilité de

0.99999, ce qui équivaut à un temps d’indisponibilité de 25,9 secondes par mois.

Contrairement à la disponibilité, la fiabilité n’autorise aucune interruption pendant le

laps de temps où le système est dit fiable. Or un système peut-être hautement disponible,

mais parsemé d’interruptions très courtes et fréquentes. Cependant il ne pourra pas être

qualifié de « fiable ».

Nous considérerons donc qu’un service est interrompu lorsque son fournisseur devient

indisponible et que le service ne peut plus être rendu. La durée de l’interruption

correspond alors au temps d’indisponibilité du fournisseur. Ici le terme « fournisseur »

fait référence à un composant ou système fournissant un service.

IV.1.2 Causes d’interruption

Les causes d’interruption de service sont diverses. Et cette diversité est d’autant plus

flagrante dans applications décrites dans l’introduction de cette thèse. Si l’on reprend le

schéma de la Figure 2 présenté en introduction, plus l’informatique est diffuse, enfouie,

dématérialisée et distribuée, plus les risques d’interruption d’un composant (qui sont plus

nombreux et impliquent plus de points de panne) d’un système augmentent.

Le Tableau 7 ci-dessous propose une classification des causes possibles d’interruption

dans les applications orientées service. Il passe en revue les différentes causes

d’interruption d’un système et donc du service qu’il fournit. Afin de catégoriser les causes

d’interruption, nous les avons classées selon les critères suivants :

ie ^Batterie_déchargée