Le langage de spécification - La machine virtuelle abstraite

Abstractions de la machine virtuelle

4.3 La machine virtuelle abstraite

4.4.1 Le langage de spécification

Le cœur de Jakarta est constitué par un langage de spécification (JSL pour Jakarta Specification Language) décrivant les machines virtuelles dans un style mathématique neutre. JSL est un langage à types polymorphes dont l’exécution est basée sur la réécriture de termes [4, 23]. Ce langage se veut relativement simple afin de faciliter au maximum le lien avec les assistants de preuves ou les langages de programmation.

Les expressions Les expressions du langages JSL sont des termes du pre-mier ordre construits `a partir de variables et de symboles de constantes.

Ces derniers sont ou bien des symboles de constructeur, introduits par une déclaration de type de données, ou bien des symboles introduits par une définition de fonction. JSL propose également une syntaxe concrète pour les enregistrements (record), cependant ceux-là sont traduits, comme le fait Coq, en un type inductif à un seul constructeur et n’apparaissent alors pas dans les expressions du langage.

De mani`ere formelle, les expressions sont d´efinies comme suit :

D´efinition 1 (Expressions) Soient C un ensemble de symboles de constructeurs, D un ensemble de symboles de fonctions et V un ensemble de variables, alors l’ensemble E des expressions JSL est donn´e par la syn-taxe suivante :

E::=V | C E | D~ E~

où il est requis que les arités des éléments de C et D soient respectées.

Les règles Les fonctions sont représentées en Jakarta par l’intermédiaire de règles de réécriture. Dans le cadre de l’abstraction et par rapport la représentation des langages fonctionnels avec filtrage de motifs, cela présente les avantages suivants :

– disposer directement de toutes les valeurs pouvant être prises par une fonction suivant les filtrages réalisés, pour être alors en mesure de travailler indépendamment sur chacune d’entre elles ;

– obtenir plus de souplesse dans le structure des fonctions manipulées autorisant ainsi par exemple l’écriture de fonctions non-déterministes.

Néanmoins, la traduction vers et depuis un langage à filtrage de motifs reste présente, en vue de la réutilisation des formalisations existantes.

Le lien avec le filtrage de motifs est rendu encore plus fort par les condi-tions de construction des règles de réécriture et la réutilisation de la notion de motif.

D´efinition 2 (Motifs) L’ensembleP des motifs est le sous-ensemble de E d´efini par la syntaxe :

P ::=V | C P~

o`u dans la seconde partie, les motifs doivent avoir un ensemble de variables disjointes.

Ces motifs sont réutilisés dans les membres droits des règles de réécriture,

a la mani`ere du filtrage.

Définition 3 (Règles de réécriture) Les règles de réécriture des fonc-tions du langage JSL sont de la forme :

l1 r1, . . . , lnrn⇒g→d o`u :

– r~_i ∈ P,~l_i,g,d∈ E, et g=f ~x (avec~x∈ V) sont deux `a deux distincts ; – var(lk)⊆var(g)∪var(r1)∪ . . . ∪var(rk−1)etvar(d)⊆var(g)∪var(~r_i);

– var(rk)∩var(g) =∅ etvar(rj)∩var(rk) =∅ sij6=k.

Ces contraintes rendent ainsi la liaison avec le filtrage de motifs ´evidente, par exemple, les r`egles suivantes :

lN il ⇒ (is empty l)→T rue l(Cons el tl) ⇒ (is empty l)→F alse

correspondent sous forme arborescente aux deux branches de la fonction ML suivante :

let is_empty l = match l with []→True | el::tl→False

Les types Par dessus le langage de spécification précédemment décrit, vient se greffer un système de types, clé de la conduite de la génération d’abstrac-tion.

Définition 4 (Types) Soient les ensembles V_T de variables de type, T_d de symboles de types de données, T_a de symboles de types abstraits et T_s de symboles de types synonymes, alors l’ensemble T des types JSL est donné par la syntaxe suivante :

T ::=V_T | T_d T^∗ | T_a T^∗ | T_s T^∗

où il est requis que les arités des éléments de T_d, T_a et T_s soient respectées.

Aux symboles de constructeurs ou de fonctions sont associés des schémas de types, c’est-à-dire des expressions closes de la forme :

∀α₁. . . α_m. σ₁→. . .→σ_n→τ o`u α₁, . . . ,α_m ∈ V_T et σ₁, . . . ,σ_n,τ ∈ T.

On notera alorsE_T l’ensemble des expressions de type, constitu´e de l’en-semble des types et des sch´emas de type.

Le type valu des valeurs de la machine virtuelle d´efensive s’´ecrit par exemple en Jakarta sous la forme :

data valu =

VPrim valu_prim | VRef valu_ref and

data valu_ref = VRef_null |

VRef_array type0 heap_idx |

VRef_instance cap_class_idx heap_idx | VRef_interface cap_interf_idx heap_idx.

De manière usuelle, le type des expressions est vérifié (par un vérificateur de type décrit dans [92]) relativement à un contexte qui associe un type à chaque variable. En raison des synonymes de type, la vérification de type est faite modulo la relation sur ces synonymes de type.

Les fonctions Il est maintenant possible de d´efinir les fonctions du langage JSL :

Définition 5 (Fonctions) Une fonction JSL f est définie par la donnée de son type f: T₁ →...→T_m →U et d’un ensemble de règles de réécriture l1 r1, . . . , lnrn⇒g→ddont le symbole de tête de g estf.

La fonction IF_ACMP_COND de la page 58 est traduite en Jakarta sous la forme suivante :

function iF_ACMP_COND :

opcmp→bytecode_idx→jcvm_state→returned_state :=

(stack_f state)→Nil

⇒(iF_ACMP_COND oper branch state)→ (abortCode State_error state);

(stack_f state)→(Cons h lf), (head (opstack h))→(Value v2),

(head (tail (opstack h)))→(Value v1), v1→(VPrim v)

⇒(iF_ACMP_COND oper branch state)→ (abortCode Type_error state);

(stack_f state)→(Cons h lf), (head (opstack h))→(Value v2),

(head (tail (opstack h)))→(Value v1), v1→(VRef vx),

v2→(VPrim v)

⇒(iF_ACMP_COND oper branch state)→ (abortCode Type_error state);

(stack_f state)→(Cons h lf), (head (opstack h))→(Value v2),

(head (tail (opstack h)))→(Value v1), v1→(VRef vx),

v2→(VRef vy)

⇒(iF_ACMP_COND oper branch state)→ (update_frame (res_pc2_nat

(res_acompare2 oper (vr2hi vx) (vr2hi vy)) branch h) state);

(stack_f state)→(Cons h lf), (head (opstack h))→(Value v2), (head (tail (opstack h)))→Error

⇒(iF_ACMP_COND oper branch state)→ (abortCode Opstack_error state);

(stack_f state)→(Cons h lf), (head (opstack h))→Error

⇒(iF_ACMP_COND oper branch state)→ (abortCode Opstack_error state) .

On y observe clairement les diff´erents chemins d’ex´ecution de la fonction.

Il est possible de définir un modèle d’exécution sur ces fonctions. En reprenant les notations de [20] :

Définition 6 (Modèle d’exécution) SoitR un ensemble de règles de r´

e-écriture. Une expression s se réécrit en t par R, que l’on note s→_R t, s’il existe une règle r deR

l₁r₁, . . . , l_nr_n⇒g→d

une positionp dans set une substitution θ des variables de R telles que – s|_p =θg et t=s[p←θd];

– pour 1≤i≤n, θli →^∗_Rθri;

où →^∗_R est la clôture réflexive et transitive de→_R.

On notera qu’aucune contrainte n’assure l’exhaustivité ou la confluence des règles de réécriture définissant une fonction. On se permet ainsi de définir dans le modèle JSL des fonctions partielles ou non-déterministes.

Dans le document Vérification formelle de la plate-forme Java Card (Page 90-94)