R`egles d’optimisation - Optimisation du filtrage par transformations de programmes

compliquée à obtenir à partir de l’arbre syntaxique abstrait puisque la dynamique du programme n’est pas représentée directement.

Pour pouvoir exprimer des conditions temporelles sur le graphe de flot de contrôle, il faut pouvoir associer à n’importe quel sous-terme (i.e. un sous-terme de l’arbre syntaxique abstrait) un sommet du graphe de flot de contrôle. Or nous avons construit les sommets du graphe de flot de contrôle à partir d’un sous-terme de l’arbre syntaxique abstrait et de la position de ce sous-terme. On définit donc une fonction getNode: PIL × P os → V qui permet à partir d’un sous-terme et d’une position dans l’arbre syntaxique abstrait de retrouver le premier sommet de ce sous-terme au niveau du graphe de flot de contrôle.

Lorsque le sous-terme t de l’arbre syntaxique abstrait est tel que t ∈ symbol ∪ htermi ∪ hexpri, on d´etermine l’instruction i ∈ hinstri englobante de ce sous-terme et on renvoie getNode(i, wi). Les r`egles de transformation de programmes sont de la forme :

term1→ term2IF getNode(term3, ω) |= temporalCond

avec term1, term2et term3des sous-termes de l’arbre syntaxique abstrait, ω une position dans l’arbre syntaxique abstrait et temporalCond une condition temporelle sur getNode(term3, ω) dans le graphe de flot de contrˆole.

4.5 R`egles d’optimisation

A partir de cette définition de règles de transformations, nous redéfinissons les optimisations du chapitre 3 ainsi que de nouvelles transformations pour les instructions letRef et letAssign.

4.5.1 Optimisation de l’instruction let

L’élimination de variable morte et la propagation de constante peuvent toujours être définies de manière statique. Parmi les optimisations précédentes du let, seul l’inlining et la fusion doivent être redéfinis pour tenir compte de la modification possible des variables contenues dans les termes.

Inlining

Notre précédente définition de l’inlining dans le chapitre 3 n’était valable que si le terme affecté à la variable ne changeait pas. Ce n’est plus le cas maintenant puisqu’il y a l’instruction letAssign. On doit donc définir une condition sur le graphe de flot de contrôle.

On définit les prédicats suivants qui seront utilisés dans les conditions temporelles :

– isModified prend un ensemble de variables et teste si l’une des variables est modifiée (par une instruction letAssign ) au sommet courant de la condition temporelle à laquelle il appartient, – isUsed teste si une variable est utilisée au sommet courant,

– isNode teste si un sommet correspond au sous-terme et à la position données en paramètre, – isAssigned teste si une variable est assignée au sommet courant.

ref@(let(var, term, instr)) → instr[var/term] IF getNode(ref, ω) |=

A(¬isModified(V ar(term)) U (isUsed(var) ∧ AX(A(¬isUsed(var) U isNode(f ree(var), ω))))) Cette condition temporelle teste au niveau du graphe de flot de contrôle si à partir du début du bloc let, on ne modifie pas les variables de term jusqu’à un sommet n. On obtient le début de formule suivant : getNode(ref, ω) |= A(¬isModified(V ar(term)) U . . . Ce sommet n correspond à une utilisation de var (d’où isUsed(var)) et comme on souhaite qu’il n’y ait qu’une seule utilisation de var, on doit vérifier qu’à partir de ce sommet il n’y a plus d’utilisation jusqu’à la fin du bloc let. Tous les successeurs du sommet n (noté AX) doivent vérifier que A(¬isUsed(var) U isNode(f ree(var), ω)).

32 Chapitre 4. Extension du langage et nouvelles optimisations Fusion

Comme précédemment, on ne pourra fusionner deux instructions let que si les variables du t ∈ htermi ne sont pas modifiées dans le bloc du premier let. On assure ainsi que les deux variables sont bien définies avec la même valeur.

ref@(let(var1, term1, instr1)); let(var2, term2, instr2) → let(var1, term1, instr1; instr2[var2/var1]) IF getNode(ref, ω) |= term1∼ term2∧ A(¬isModified(V ar(term)) U isNode(f ree(var1), ω)) Par exemple, dans l’instruction PIL suivante, on ne peut pas fusionner car x est modifi´ee dans le premier bloc :

letRef(x, a, let(y1, x, hostcode(y1); letAssign(x, b, nop)); let(y2, x, hostcode(y2)))

4.5.2 Optimisation de l’instruction if

Les optimisations de l’instruction if doivent aussi ˆetre adapt´ees pour tenir compte des modifications possibles de variables.

Fusion

Les variables contenues dans la condition ne doivent pas être modifiées dans le premier bloc conditionnel car sinon l’équivalence syntaxique ne suffira pas à assurer l’équivalence sémantique. La condition assure donc que le premier bloc conditionnel ne modifie pas les variables de la condition.

ref@(if(c1, sucInstr1, f ailInstr1); if(c2, sucInstr2, f ailInstr2)) → if(c1, sucInstr1; sucInstr2, f ailInstr1; f ailInstr2)

IF getNode(ref, ω) |= c1∼ c2 ∧ A(¬isModified(V ar(c2)) U isNode(endIf, ω.1))

ω.1 correspond à la position du premier fils (le plus à gauche) du nœud à la position ω dans l’arbre syntaxique abstrait. Comme le nœud à la position ω correspond à la séquence, son premier fils correspond au premier bloc conditionnel.

Entrelacement

La première règle d’entrelacement nécessite une condition similaire à celle de la fusion. Cette fois- ci, ce sont les variables de la deuxième condition qui ne doivent pas être modifiées par le premier bloc conditionnel afin que l’orthogonalité des conditions soit toujours vérifiée.

ref@(if(c1, sucInstr1, f ailInstr1); if(c2, sucInstr2, f ailInstr2)) → if(c1, sucInstr1; f ailInstr2, f ailInstr1; if(c2, sucInstr2, f ailinstr2)) IF getNode(ref, ω) |= c1⊥ c2 ∧ A(¬isModified(V ar(c2)) U isNode(endIf, ω.1))

Pour la deuxième règle d’entrelacement, la condition est la même d’autant plus que c’est la deuxième condition qui est évaluée dès le début.

ref@(if(c1, sucInstr1, f ailInstr1); if(c2, sucInstr2, f ailInstr2)) → if(c2, f ailInstr1; sucInstr2, if(c1, sucInstr1, f ailinstr1); f ailInstr2) IF getNode(ref, ω) |= c1⊥ c2 ∧ A(¬isModified(V ar(c2)) U isNode(endIf, ω.1)) Permutation

Pour la règle de permutation, la condition sur les variables de c2 doit toujours être vérifiée mais en plus les variables de c1 ne doivent pas être modifiées par le deuxième bloc car cette fois-ci les instructions sont inversées. Elles sont donc susceptibles d’annuler l’orthogonalité des deux conditions.

ref1@(if(c1, sucInstr1, nop)); ref2@(if(c2, sucInstr2, nop)) → if(c2, sucInstr2, nop); if(c1, sucInstr1, nop)

IF getNode(ref1, ω.1) |= c1 ⊥ c2 ∧ A(¬isModified(V ar(c2)) U isNode(endIf, ω.1)) ∧ getNode(ref2, ω.2) |= A(¬isModified(V ar(c1)) U isNode(endIf, ω.2))

4.5. R`egles d’optimisation 33

4.5.3 Optimisation de l’instruction letRef

Au lieu d’adapter les règles du let pour le letRef, il est préférable de le traiter au niveau des letAssign. Ainsi, lorsqu’il n’y a plus de letAssign associé à un letRef, on peut le transformer en let. L’élimination de variable morte est alors réalisée par la règle du let.

Cette solution a plusieurs avantages. Elle permet d’être plus fin dans l’optimisation en réalisant l’inlining et l’élimination de variable morte sur les letAssign et donc de traiter plus de cas. De plus, en transformant un letRef en let, elle permet de réutiliser les règles du let au lieu de les adapter. On minimise ainsi le nombre de règles de transformations de programmes.

En ce qui concerne la fusion de deux blocs letRef, la condition nécessite que la variable ne soit pas modifiée dans le premier bloc et ¸ca n’a donc pas d’intérêt. Cette fusion n’est pas intéressante dans le cadre d’équivalence syntaxique mais dans un cadre plus sémantique, par exemple, avec la gestion d’environnement, elle pourrait être définie.

Finalement, il ne reste plus qu’une r`egle pour le letRef : le remplacement d’un letRef par un let. Remplacement d’un letRef par un let

Si dans le bloc instr d’un letRef, il n’y a pas de modification de la variable alors on peut consid´erer ce letRef comme un let.

letRef(var, term, instr) → let(var, term, instr)

IF getNode(instr, ω) |= A(¬isAssigned(var) U isNode(f ree(var), ω))

Par exemple, l’instruction letRef(v, t, hostcode()) peut être réécrite en let(v, t, hostcode()). On peut alors appliquer la règle d’élimination de variable morte et ainsi obtenir hostcode().

4.5.4 Optimisation de l’instruction letAssign

Elimination de variable morte

On ´elimine les instructions letAssign pour lesquelles il n’y a pas d’utilisation de cette nouvelle valeur. La condition doit assurer que la variable n’est pas utilis´ee avant une nouvelle affectation ou la fin de bloc du letRef.

ref@(letAssign(var, term, instr)) → instr

IF getNode(ref, ω) |= A(¬isUsed(var) U (isAssigned(var) ∨ isNode(f ree(var), )))

Le pr´edicat isNode(f ree(var), ) teste si le nœud courant est un nœud dont le sous-terme est f ree(var) et la position quelconque. Cette condition est suffisante car un programme PIL correct n’autorise pas de red´efinition de variable.

Propagation de constante et Inlining

La définition de la propagation de constante et l’inlining est semblable à celle pour let sauf que la variable doit être remplacée par sa définition sur toute sa portée, c’est-à-dire jusqu’à une prochaine affectation ou jusqu’à la fin du letRef. En outre, pour l’inlining, les variables composant le terme ne doivent pas être modifiées entre l’affectation et l’utilisation pour assurer l’équivalence.

Remplacement d’un letAssign par un letRef

Si entre l’instruction letRef et letAssign, la variable n’est pas utilis´ee, on peut d´eplacer l’instruction letRefau niveau du letAssign, en rempla¸cant letAssign par letRef.

ref@(letRef(var, term1, x; ref Let@(letAssign(var, term2, instr)); y)) → x; letRef(var, term2, instr; y) IF getNode(ref, ω) |= A(¬isUsed(var) U isNode(ref Let, ωref Let))

34 Chapitre 4. Extension du langage et nouvelles optimisations Cette optimisation est intéressante car elle permet de calculer la valeur d’une variable le plus tard possible et donc d’éviter de réaliser des calculs coûteux et parfois inutiles.

Finalement, toutes ces règles forment un nouveau système d’optimisation. La même stratégie que dans le chapitre 3 peut être appliquée. On ajoute ces règles au premier opérateur repeat. Elles peuvent s’exécuter dans n’importe quel ordre comme les autres (opérateur |) tant que l’entrelacement est toujours réalisé à la fin. On remarquera qu’aucune optimisation sur les boucles n’a été définie car les boucles des programmes générés ne nécessitent aucune amélioration. Par exemple, elles ne contiennent pas d’invariant pouvant être extrait (optimisation très classique des boucles).

Dans cette partie, nous avons surtout porté notre attention sur la définition des règles et sur la formalisation de la relation entre le graphe de flot de contrôle et l’arbre syntaxique abstrait. Nous n’avons pas eu assez de temps pour prouver ces règles. En effet, les preuves sont plus techniques dans le sens où il faut définir correctement le lien entre les formules de logique temporelle et le programme PIL. Cependant, ces preuves peuvent être réalisées de la même manière que dans le chapitre 3.

Chapitre 5

Mise en œuvre et r´esultats

exp´erimentaux

5.1 Implantation des r`egles d’optimisation et de la strat´egie

L’implantation des règles est simplifiée par l’utilisation des primitives Tom. Elles s’implantent natu- rellement par un système de règles défini par l’instruction %match. La partie la plus intéressante de la mise en œuvre est l’implantation de la stratégie d’application.

5.1.1 Place de l’entrelacement

L’entrelacement doit être réalisé en fin d’optimisation afin de ne pas bloquer les fusions. L’implantation de cette contrainte est simplifiée par une propriété de Tom. En effet, comme Tom préserve l’ordre du filtrage par compilation, en pla¸cant la règle d’entrelacement à la fin du système on est assuré qu’elle sera exécutée après toute fusion.

5.1.2 Condition d’application de la permutation

La règle de permutation n’a d’intérêt que si une future fusion est possible. Il faut donc pouvoir exprimer au niveau de l’implantation cette condition d’application. La première solution consiste à utiliser un contexte. On ne définit pas simplement la séquence de deux blocs conditionnels, on se donne aussi un contexte dans lequel on filtre un bloc conditionnel susceptible de fusionner. Cependant, cette définition rend l’application de la règle quadratique en temps puisqu’elle correspond à du filtrage équationnel avec 3 listes à parcourir.

Une solution alternative plus efficace est de considérer un ordre total sur les conditions is fsym portant sur le même sous-terme. On ordonne alors les blocs conditionnels suivant cet ordre, il en découle que deux conditions identiques deviennent contiguës. De plus, comme deux conditions qui n’ont pas le même ordre sont incompatibles, on est assuré que leur permutation respecte la sémantique du programme PIL. L’application de la règle devient alors linéaire en temps et on permute bien les blocs susceptibles de fusionner.

5.1.3 Utilisation de la biblioth`eque Mutraveler

La bibliothèque Mutraveler basée sur les travaux de E. Visser [VeABT98] et de J. Visser [Vis01b] permet de définir une stratégie à partir d’opérateurs de base qui sont :

– l’op´erateur de r´ecursion : µ,

– la composition séquentielle : seq(s1, s2) (s2 seulement si s1 n’échoue pas), – le choix : choice(s1, s2) (si s1échoue, s2sinon s1),

– l’identit´e : id,

36 Chapitre 5. Mise en œuvre et résultats expérimentaux – l’échec : f ail,

– la stratégie All(s) (succès de All(s) si succès de s pour tous les fils du nœud courant),

– la stratégie One(s) son dual (succès de One(s) si succès de s pour au moins un fils du nœud courant), – l’application d’un système de règles R

Grâce à ces opérateurs, on peut par exemple définir la stratégie repeat qui consiste à répéter l’application d’une stratégie v jusqu’à ce ne soit plus possible :

repeat(s) = µx(choice(seq(v, x), id))

Une première stratégie de normalisation peut consister à répéter l’application s de nos règles jusqu’à obtenir l’identité et en traversant le terme en profondeur d’abord. On obtient la définition suivante :

innermost(s) = µx(seq(All(x), choice(seq(s, x), id)))

Ces opérateurs sont basés sur l’échec et l’implantation a été réalisée par des exceptions Java. Ce mécanisme est coûteux en temps.

Contrairement à l’exploration d’espace de recherche, dans le cas particulier de la normalisation on ne s’intéresse pas à l’échec d’une stratégie. Notre but étant de calculer des formes normales, on peut modéliser l’échec d’une règle par l’identité (une règle qui ne peut pas s’appliquer ne modifie pas le terme courant). On définit donc de nouveaux opérateurs basés sur l’identité :

– choiceId(s1, s2) (s2 si l’application de s1 est ´equivalente `a id sinon s1)

– oneId(s) qui échoue si pour tous les fils du nœud courant, l’application de s est équivalente à l’identité,

– seqId(s1, s2) (si s16= id, on applique ensuite s2)

Un exemple de strat´egie utilisant choiceId et oneId est onceBottomU pId d´efinie par onceBottomU pId(s) = µx(choiceId(oneId(M uV ar()), v)

Cette stratégie part de la feuille la plus à gauche du terme et remonte en essayant d’appliquer la stratégie v. Elle s’arrête dès que la stratégie v succède. La différence avec onceBottonUp est qu’ici, une stratégie qui renvoie l’identité échoue. Il n’y a pas besoin de gérer explicitement l’échec avec des exceptions. L’opérateur seqId nous permet de redéfinir notre stratégie innermost en une version plus efficace pour la normalisation :

innermostId(s) = µx(seq(All(x), seqId(s, x)))

Ce travail a contribué à identifier une faiblesse de la bibliothèque Mutraveler. Cela nous a amené à modéliser l’échec d’une autre fa¸con et à proposer une extension de Mutraveler qui améliore considéra- blement les performances lors d’un calcul de forme normale. Le temps d’optimisation d’une centaine de règles de filtrage syntaxique passe de 90 minutes à 3 minutes.

Toutes les règles définies dans le chapitre 3 ainsi que la stratégie ont été intégrées à la version officielle et diffusée de Tom. Les règles du chapitre 4 sont en cours d’implantation. En plus de la correction formelle des règles dans la section 3.3, on peut vérifier que l’implantation des règles est correcte grâce à la certification du code réalisée au sein de l’outil Tom. On ne vérifie alors pas les règles mais le code généré après optimisation. Pour plus de détails sur cette méthode de certification du filtrage, on peut lire [KMR05].

L’implantation des règles du chapitre 3 nous a permis d’évaluer le gain de performances sur des exemples caractéristiques et ainsi tester l’efficacité de l’optimiseur.

Dans le document Optimisation du filtrage par transformations de programmes (Page 34-39)