Le slicing - Frama-C et PathCrawler - Classification de menaces d’erreurs par analyse statique,

Chapitre 3 Frama-C et PathCrawler

4.4 Le slicing

5 i n t i , len ; 60 //@ a s s e r t \ v a l i d ( s t r +0); 6 i f ( str [0] >=97 && str [0] <=122) 7 str [0] -=32; 8 i f ( str [0] < ’I ’ || str [0] > ’Z ’) 9 return; 10 i f ( strlen ( str ) != 12) 11 return; 12 len = strlen ( str ); 14 f o r ( i =1; i < len ; i ++){ 150 //@ a s s e r t \ v a l i d ( s t r+i ) ; 15 i f ( str [ i ] <48 || str [ i ] >57) 16 return ;}}

Figure 4.6 – Le programme de la figure 4.4 simplifié par rapport à l’alarme à la ligne 15

4.4 Le slicing

Le slicing [Wei81] est une technique de transformation de programmes qui permet d’ex- traire un sous-programme exécutable, appelé slice, à partir d’un programme plus grand. Une slice a le même comportement que le programme original par rapport au critère du slicing. Le slicing de Frama-C est basé sur l’analyse de dépendance qui comprend le calcul du graphe de dépendance de programme (PDG) [FOW87] montrant les relations de dépendance entre les instructions du programme, et une analyse de dépendance inter- procédurale permettant de traiter les appels de fonction. Le critère classique du slicing est une paire composée d’une instruction et d’un ensemble de variables du programme. Le slicing de Frama-C accepte d’autres critères de slicing, par exemple un ensemble d’instructions.

Notons ;, la fermeture réflexive et transitive de la relation de dépendance de données

ou de contrôle. En d’autres termes, l1 ; l2 si l1 = l2, ou si l’exécution de l2 dépend de

l’exécution de l1 (directement ou via des états intermédiaires). Cette relation n’est pas

sym´etrique : si l1 ;l2, cela n’implique pas que l2 ; l1. Par exemple pour les lignes 7 et

8 de la figure 4.3, nous avons 7 ; 8, mais nous n’avons pas 8 ; 7. Mais nous pouvons

avoir des d´ependances mutuelles l1 ; l2 et l2 ; l1 entre instructions. C’est le cas pour

les deux lignes 21 et 22 de la figure 4.3.

Nous désignons par labels(p) l’ensemble des étiquettes des instructions d’un programme p. Soit L un sous-ensemble de labels(p). Essentiellement, dans les techniques de slicing basé

sur les d´ependances (voir par exemple [RY88, Sec. 2.2] et [BBD+

10, d´efinition 4.6]), la

slice de p par rapport à L, notée slice(p, L) ou pL, est définie comme le sous-programme

de p contenant les instructions suivantes :

labels(pL) = { l ∈ labels(p) | ∃ l ′

∈ L, l ; l′

Pour un singleton L = {l}, la slice pL est également notée pl. Comme ; est réflexive,

L ⊆ labels(pL) et l ∈ labels(pl).

La slice d’un programme par rapport à une alarme a est définie comme étant la slice

par rapport à l’instruction mena¸cante la de a, et on écrit pa au lieu de pla. De même,

la slice d’un programme par rapport `a un ensemble d’alarmes A est d´efinie comme la

slice par rapport `a l’ensemble des instructions mena¸cantes de A, et on ´ecrit pA au lieu de

slice(p, {la| a ∈ A} ).

L’étape du slicing produit une ou plusieurs versions simplifiées de p, chacune d’elles contenant un sous-ensemble d’alarmes qui peuvent être déclenchées. Nous avons étudié et implémenté cinq utilisations du slicing qui correspondent aux cinq options présentes dans sante.

1. none : Le programme p est directement analys´e par analyse dynamique sans aucune simplification par le slicing.

2. all : Le slicing est appliqué une fois et le critère de simplification est l’ensemble de toutes les alarmes de p. Nous obtenons une version simplifiée contenant les mêmes menaces que le programme original p. Ensuite, l’analyse dynamique est appliquée à cette version simplifiée.

3. each : Soit n le nombre d’alarmes dans p. Le slicing est effectué n fois, une fois par rapport à chaque alarme ai, produisant n programmes simplifiés p1, p2, . . . , pn.

Ensuite, l’analyse dynamique est appel´ee n fois pour analyser les n programmes simplifi´es.

4. min : On s´electionne des sous-ensembles d’alarmes A1, A2, . . . , Ak de A tels que

A1 ∪ A2 ∪ . . . ∪ Ak = A avec k ≤ n. L’op´eration de slicing est effectu´ee k fois

pour A1, A2, . . . , Ak. Ainsi k programmes simplifiés pA1, pA2, . . . , pAk sont produits. Ensuite, l’analyse dynamique est appelée k fois pour analyser les k programmes ré- sultants pAi.

5. smart : Cette option applique l’option min itérativement en réduisant la taille des sous-ensembles quand c’est nécessaire.

Les trois premières options (none, all et each) sont les options de base. Elles sont présentées en détail dans la partie 4.6. min et smart sont des options plus avancées, qui se basent sur une analyse de dépendances entre les alarmes présentée en partie 4.7. Les options min et smart sont détaillées en partie 4.8.

Pour le programme en figure 4.4, le programme simplifié qui préserve toutes les alarmes est présenté dans la figure 4.5. Afin de faciliter la comparaison avec la version initiale,

4.4. Le slicing les parties rayées montrent le code enlevé par le slicing et les parties non rayées correspondent au code du programme simplifié. Un autre programme simplifié est donné par la figure 4.6. Il présente la version simplifiée par rapport à l’alarme à la ligne 15. On notera que le code restant a été légèrement simplifié par suppression des initialisations de i et de len et par suppression des valeurs retournées. On constate que la slice par rapport à une seule alarme est plus simple que celle relative à toutes les alarmes.

Certaines propriétés du slicing utilisent une sémantique à base des trajectoires finies

que nous pr´esentons bri`evement dans la partie 4.4.1, en s’inspirant de [BBD+_10].

4.4.1 S´emantique `a base de trajectoires

Un état est une fonction totale qui associe une valeur à chaque variable. Une valeur non définie est notée ⊥. La restriction d’un état à un ensemble de variables V , notée par s ↓ V , est définie par :

(s ↓ V )x =

(

s(x) si x ∈ V,

⊥ sinon.

Une s´equence non vide T = (l1, s1)(l2, s2) . . . (lk, sk) . . . de couples (instruction, ´etat)

est appelée trajectoire de p si, à partir d’un état d’entrée s1, le programme p exécute la sé-

quence d’instructions l1, l2, . . . , lk, . . . où li est l’étiquette de la i-ème instruction exécutée

et si est l’´etat avant l’ex´ecution de li. On dit aussi que T est la trajectoire du programme

p à partir de l’état d’entrée s1.

On dit que U est une trajectoire partielle de T si U est finie et T commence avec U. En d’autres termes, les trajectoires partielles de T sont les pr´efixes finis de T . Ils ont la forme suivante :

(l1, s1)(l2, s2) . . . (lm, sm), m ≥ 1.

Soit M ⊆ labels(p) un ensemble d’étiquettes de p. La restriction d’un élément de trajectoire (l, s) sur M est définie comme suit :

(l, s) ↓ M =

(

(l, s ↓ ref(l)) si l ∈ M,

ε sinon,

où ref(l) est l’ensemble des variables lues à l’instruction l et ε est la séquence vide.

Pour une trajectoire T = (l1, s1) . . . (lk, sk) . . ., la projection de T sur M est d´efinie

par :

Proj_M(T ) = (l1, s1) ↓ M . . . (lk, sk) ↓ M . . .

0 void e u r o c h e c k( char * str ){ 5 i n t i , len ; 60 //@ a s s e r t \ v a l i d ( s t r +0); 61 i f (0 >= length ( str )) 62 error (); 63 e l s e 6 i f ( str [0] >=97 && str [0] <=122) 7 str [0] -=32; 8 i f ( str [0] < ’I ’ || str [0] > ’Z ’) 9 return ; 10 i f ( strlen ( str ) != 12) 11 return ; 12 len = strlen ( str ); 14 f o r ( i =1; i < len ; i ++){ 150 //@ a s s e r t \ v a l i d ( s t r+i ) ; 151 i f ( i >= length ( str )) 152 error (); 153 e l s e 15 i f ( str [ i ] <48 || str [ i ] >57) 16 return ;}}

Figure 4.7 – Le programme simplifié par rapport à l’alarme à la ligne 15 auquel ont été ajoutées les branches d’erreurs

Proposition 4.4.1 (Propri´et´es du slicing)

Soit L un ensemble d’instructions dans p, pL la slice de p par rapport `a l’ensemble d’ins-

tructions L et s0 un ´etat d’entr´ee pour p. Soit T et T′ respectivement les trajectoires de p

et pL exécutées à partir de l’état d’entrée s0.

(a) labels(pL) est inclus dans labels(p).

(b) Si U est une trajectoire partielle de T , alors il existe une trajectoire partielle U′

de T′

telle que les projections de U et U′

sur L sont ´egales : ProjL(U) = ProjL(U

′

Dans le document Classification de menaces d’erreurs par analyse statique, simplification syntaxique et test structurel de programmes (Page 90-93)