Ex´ ecution syst´ ematique - V´ erification des syst` emes distribu´ es 19

Chapitre 2 V´ erification des syst` emes distribu´ es 19

5.2 Ex´ ecution syst´ ematique

etiqueté. Il a, depuis 2004, été abandonné au profit du model checker Copper inclus dans le fra-mework ComFoRT [CISW05]. Celui-ci est essentiellement basé sur l’approche CEGAR présentée en section 4.2 tout comme le model checker F-Soft [ISG⁺05].

Enfin, le model checker SPIN [Hol04] implémente l’outil AX (Automaton eXtractor) [HHS01] qui permet de vérifier des propriétés LTL sur des systèmes distribués écrits en ANSI-C. Pour cela, il extrait un modèle avec un niveau d’abstraction défini par l’utilisateur, qui est ensuite vérifié à l’aide de SPIN. Celui-ci implémente la plupart des techniques de vérification de modèle abstrait.

Bien que cette approche soit de plus en plus précise, des difficultés subsistent pour construire un modèle complet et cohérent avec le programme réel. L’approche pour pallier cela est de vérifier, toujours par model checking, l’implémentation réelle du programme à travers son exécution systématique.

5.2 Ex´ecution syst´ematique

5.2.1 Principe

La vérification par exécution systématique construit et explore l’espace d’états du système `

a la volée, à travers son exécution réelle. Dans cette approche, l’exploration s’effectue pas à pas sur l’ensemble des exécutions possibles en exécutant simplement les processus ordonnancés.

L’avantage majeur de cette technique est que la phase de formalisation du système étudié est totalement abandonnée. Il n’est plus nécessaire de déterminer la sémantique du langage de programmation et les instructions pour définir la relation de transition. Chaque état correspond `

a l’état courant en mémoire du programme exécuté tandis que chaque transition correspond alors simplement à une action exécutée par un processus. Pour cela, le contrôle de l’exécution et son observation sont, par exemple, réalisés par l’interception des appels systèmes effectués par le système étudié. Dès lors, le model checker est capable de guider l’exécution du système `

a travers les différents scénarios possibles pour ainsi construire dynamiquement l’espace d’états et le vérifier de fa¸con exhaustive. Dans ce cas, le modèle, à proprement parler, est exploré en pratique mais reste toutefois inaccessible avant l’exploration.

De plus, en cas de non satisfaction de la propriété à vérifier, l’outil fournit un contre-exemple généré depuis l’exécution réelle du système. Il est ainsi possible de le reproduire, grâce notamment `

a l’utilisation de debuggers, et ainsi de trouver plus rapidement la faute à l’origine de l’erreur détectée. Cependant, contrairement au test classique (présenté en section 2), le model checker est ici capable d’explorer systématiquement l’ensemble des exécutions possibles pour un seul ´

5. Software model checking

5.2.2 Difficult´es

Cette approche pose toutefois deux difficultés majeures. Sachant que l’on travaille sur le programme réel, un état est composé de la mémoire complète des processus, c’est-à-dire la pile, le tas, les données globales ainsi que l’ensemble des informations sur l’état du réseau. Ceci est donc extrêmement grand si bien que la sauvegarde des états visités au cours de la vérification est difficilement réalisable en pratique.

C’est dans ce contexte que le model checker Verisoft [God05] a proposé pour la première fois une exploration sans conservation des états visités (Stateless search). Pour cela, il s’appuie sur le fait que chaque exécution est caractérisée par l’ordonnancement des processus exécutés. Il est ainsi possible de parcourir différentes exécutions en traitant simplement les différents ordonnancements possibles. L’algorithme correspondant consiste à parcourir itérativement en profondeur l’espace d’états jusqu’à une borne définie en termes de profondeur. Cette profondeur correspond au nombre de transitions exécutées durant l’exécution courante. Une fois toutes les exécutions de longueurs égales à la profondeur maximale explorées, la borne est incrémentée et le processus d’exploration et d’incrémentation de la borne est de nouveau réalisé jusqu’à détection d’une violation de propriété. Pour réaliser le changement de chemin et ainsi explorer une nouvelle exécution, l’état initial est sauvegardé au début de la vérification (il s’agit du seul état sauvegardé) et est donc restauré pour la réexécution depuis celui-ci. Cependant, en l’absence de sauvegarde des états visités, il est nécessaire d’adapter l’ensemble des techniques de réduction présentées précédemment. En complément de l’exploration sans sauvegarde des états, Godefroid et al. [FG05] ont également été les premiers à proposer la Réduction Dynamique par Ordre Partiel (DPOR) qui permet d’appliquer la réduction présentée en section 4.2, même sans la sauvegarde de l’ensemble des états.

De plus, les autres techniques de réduction étant essentiellement basées sur l’identification d’états identiques, cette détection devient extrêmement complexe dans le cas de programmes réels. Il est nécessaire d’accéder à l’ensemble des informations qui composent un état, ce qui peut se révéler plus ou moins facile selon le langage de programmation, mais il faut également parvenir `

a les analyser en un temps informel, c’est-à-dire sans influer sur le temps de vérification. L’une des approches les plus classiques pour pallier cela est d’utiliser une fonction de hachage pour la sauvegarde des états au lieu de stocker l’état complet. Non seulement cette technique permet de limiter la consommation mémoire mais elle rend également la comparaison plus efficace et donc la détection des états identiques plus rapide. Toutefois, le risque de collision des hash rend cette approche incertaine quand le nombre d’états augmente. De plus, la construction de ce hash est parfois impossible à réaliser sur la globalité de la mémoire, certaines informations n’étant pas directement accessibles et identifiables selon le langage de programmation du système étudié.

5.2.3 Outils existants

La vérification par model checking basée sur l’exécution réelle du programme constitue un axe majeur de recherche en vérification de programmes. Bien que plusieurs concepts issus du model checking puissent être appliqués facilement, cette approche nécessite de nouvelles techniques, tant pour la vérification en elle-même des propriétés que pour la gestion de l’explosion combinatoire de l’espace d’états.

Comme évoqué précédemment, Verisoft est un des précurseurs dans ce domaine. Il s’intéresse

en particulier aux programmes C et C++ impl´ementant des protocoles de communication et

CMC [MPC⁺02] permet également la vérification de propriétés de sûreté sur le même type de programmes mais en sauvegardant une représentation canonique des états visités (Stateful search) ce qui lui permet de détecter les états identiques et ainsi réduire l’espace d’états. Cette représentation lui permet alors de ne stocker que l’empreinte (le hash) des états au lieu de l’état complet et ainsi réduire la consommation mémoire. En 2007, l’un des créateurs de CMC a proposé le projet CHESS [MQ07] qui permet la vérification de programmes Windows multithreadés. Tout comme Verisoft et CMC, CHESS se base sur l’interception des appels systèmes pour l’exploration exhaustive de l’espace d’états. Cependant, il propose un nouveau concept essentiellement basé sur la présence de multithreading dans les programmes vérifiés : la définition d’une borne itérative liée au changement de contexte entre threads. L’idée est donc de définir une borne initiale puis de parcourir l’ensemble des exécutions ne dépassant pas cette borne en l’incrémentant de fa¸con itérative. Cette approche repose notamment sur le constat que de nombreuses erreurs se manifestent lors de longues exécutions mais avec peu de changements de contextes.

Depuis Verisoft, différents outils ont été développés permettant la vérification d’autres lan-gages de programmation. Java PathFinder (JPF) [VHB⁺03] est le model checker de référence pour la vérification de programmes Java. Il permet de vérifier des propriétés de sûreté sur du byte-code Java mais également des propriétés LTL grâce au traducteur LTL2JPF [NK10]. Pour cela, il modifie la machine virtuelle Java (JVM) permettant ainsi de rechercher systématiquement les différents ordonnancements possibles de programmes multithreadés. Cette exploration est réalisée avec sauvegarde des états visités, ce qui permet de réduire l’espace d’états à travers différentes techniques telles que la réduction par ordre partiel, la détection des symétries ou l’abstraction. De plus, cet outil utilise des heuristiques pour déterminer les différentes exécutions possibles ainsi que les techniques mises en œuvre dans l’exécution symbolique avec abstraction. Initialement, JPF permettait simplement d’extraire un modèle en PROMELA depuis le bytecode Java [Hav99] pour ensuite réaliser une vérification à l’aide de SPIN, tout comme Bandera [HD01]. MaceMC [KAJV07] se distingue des autres model checkers car il prend en entrée une des-cription en langage Mace du système distribué et réalise ensuite la vérification directement sur cette description ou sur une version compilée de celle-ci en C++. Il exploite le fait que les pro-grammes écrits en MACE sont structurés sous forme de systèmes de transitions à états pour réaliser l’exploration. Il permet de vérifier des propriétés de sûreté en combinant une recherche sans sauvegarde des états visités et une fonction de hachage, ainsi que des propriétés de vivacité exprimées en LTL sous la forme d’invariants (♦p, où p est une propriété sans quantificateur). Les propriétés de vivacité sont vérifiées grâce à une heuristique qui détermine les chemins qui peuvent violer la propriété. Lorsqu’un état dans lequel la propriété est fausse est détecté, l’ex-ploration est effectuée à partir de celui-ci en recherchant un état dans lequel la propriété devient vraie. Si aucun état correspondant n’est trouvé, alors l’exécution courante est considérée comme contre-exemple. Pour rendre plus efficace cette détection face à des espaces d’états très grands, une heuristique recherche les transitions critiques qui mènent le système vers un chemin dans le-quel la propriété sera violée de fa¸con permanente. Ensuite le parcours à partir de cette transition est réalisé de fa¸con aléatoire, ce qui rend l’approche imparfaite bien que de nombreuses erreurs ont pu être trouvées dans divers algorithmes grâce à celle-ci. Pour pallier l’explosion combina-toire, MACE implémente l’outil CrystalBall [YKKK09] qui permet à chaque processus de prédire les conséquences de ses actions pour ainsi détecter les erreurs avant même leur exécution. L’idée est donc de placer le model checker directement sur des états depuis lesquels une erreur est prédite et d’explorer le chemin qui en découle. Pour cela, chaque nœud du système exécute un algorithme d’exploration en continu depuis un état récemment sauvegardé et prédit donc les futures violations de la propriété spécifiée.

6. Limites des approches pr´esent´ees

distribués HPC écrits en MPI. Tout comme les outils précédents, celui-ci se base sur l’interception des appels réalisés par le système étudié, en particulier les appels MPI à travers l’interface PMPI. Grâce à un profiler interne, ISP réécrit les appels MPI en modifiant les paramètres ou les délais d’exécution des processus pour ainsi réaliser une exploration des différentes exécutions possibles. L’explosion combinatoire de l’espace d’états est gérée grâce à DPOR adaptée à la sémantique des appels MPI. Une version distribuée de l’outil est proposée avec DAMPI [VAG⁺10]. S’agissant de l’outil le plus proche en lien avec nos travaux, une présentation technique détaillée de celui-ci est réalisée au chapitre suivant.

6 Limites des approches pr´esent´ees

Program testing can be used to show the presence of bugs, but never to show their ab-sence ! (Dijkstra, 1970). Bien que l’objectif principal du test logiciel soit la détection d’erreurs, celui-ci ne garantit pas l’exhaustivité de la détection. Dès lors, celui-ci permet uniquement d’af-firmer que toutes les erreurs connues ont été détectées. Il est impossible de déterminer s’il existe des erreurs non détectées. Face à l’impossibilité de garantir une exhaustivité de vérification, le test logiciel ne permet pas d’établir qu’un système fonctionne correctement sous toutes les condi-tions mais éventuellement qu’il ne fonctionne pas dans certains cas. L’utilisation de techniques telles que la couverture de code aide toutefois à s’assurer qu’un ensemble adéquat des compor-tements possibles a été observé, mais ceci reste insuffisant, particulièrement dans le contexte des systèmes distribués avec des processus concurrents. Le test logiciel permettra d’évaluer le comportement du système pour différentes valeurs d’entrées mais il ne permet pas de vérifier toutes les exécutions possibles pour une seule valeur d’entrée.

De plus, il est nécessaire d’assurer la maintenance des tests face à un système qui évolue durant son développement. De même, les tests sont créés d’après les spécifications du système. Des spécifications incomplètes, ambiguës ou simplement modifiées au cours du développement peuvent alors mener à des tests inadéquats. Il n’est toutefois pas toujours évident d’établir un tel diagnostique, le développement du logiciel peut alors continuer jusqu’à un point critique pour la découverte de ce type de problème.

A l’opposé, la vérification formelle permet de gérer l’aspect exhaustif qui fait défaut au test logiciel. La vérification déductive, à travers la preuve de théorèmes, ainsi que le model checking classique, nécessite cependant une formalisation du système étudié afin de générer un modèle qui sera soumis à vérification. Cette contrainte pose alors deux difficultés majeures qui limitent l’utilisation de ces approches.

Tout d’abord, selon la complexité du système, sa taille et son langage de programmation, extraire un modèle du système est parfois impossible à réaliser correctement, même à l’aide d’outils automatiques. Dans le cas où un modèle a pu être extrait, celui-ci correspond à une abs-traction plus ou moins précise. Il est alors courant que le résultat obtenu soit une approximation du comportement du programme réel.

De plus, certains aspects du système étudié peuvent être particulièrement complexes à modéliser, même à l’aide d’une analyse statique sur le code source, certaines informations ne pouvant être connues que lors de l’exécution. Dès lors, il persiste l’incertitude que la vérification est faite sur un modèle du système et non sur l’implémentation réelle de ce dernier. L’éventuelle correction établie d’après cette vérification peut-elle alors être garantie également sur le système réel ? La seconde limite réside dans la nécessité de reconstruire un modèle après chaque modi-fication du système afin de garantir la cohérence entre les deux entités. Selon les modifications

réalisées, cette reconstruction peut concerner une petite partie du modèle ou son ensemble, ce qui peut être coûteux à mettre en œuvre régulièrement.

La vérification dynamique formelle, à travers l’exécution systématique du système réel, per-met de ne pas se souper-mettre à cette contrainte, en travaillant directement avec l’implémentation réelle du système. L’approche est particulièrement adaptée à l’étude des systèmes distribués car elle tient compte du non-déterminisme dans l’exécution de ces derniers mais elle permet ´

egalement de travailler sur des langages de programmation tels que le C/C++ ou Fortran, ma-joritairement présents dans le domaine mais souvent difficiles à modéliser. Cependant, travailler sur le programme réel, et non un modèle simplifié de celui-ci, implique de prendre en compte l’ensemble des informations qui le composent. Il est alors nécessaire de gérer leur sauvegarde mais ´

egalement leur analyse. Les outils existants mettant en œuvre cette approche prennent souvent le parti de limiter les informations sauvegardées au cours de l’exécution ce qui limite fortement le type de vérification pouvant être réalisée. Notamment dans le cas des programmes C/C++ ou Fortran, soit seules les propriétés de sûreté sous forme d’assertions peuvent être vérifiées, soit une catégorie spécifique de propriétés de vivacité exprimées sous forme d’invariants. La correc-tion des systèmes distribués basée sur ces vérifications s’en trouve alors fortement restreinte.

C’est dans ce contexte que nous présentons dans ce document des travaux qui mettent en œuvre de nouvelles techniques permettant d’étendre le type de vérifications réalisées à travers cette dernière approche.

Dans le document Vérification dynamique formelle de propriétés temporelles sur des applications distribuées réelles (Page 41-46)