Langage consid´er´e - Intégration des collections topologiques et des transformations dans un l

Dans le chapitre présent nous nous concentrons donc sur le typage des collections topolo-giques hétérogènes et des transformations qui n’ont pas été étudiées auparavant. MGS intègre des caractéristiques ayant émergé récemment mais qui ont été déjà étudiées et que nous ne traiterons pas ici. Il s’agit notamment de la surcharge (voir par exemple [Fur02]), des enregis-trements extensibles [Rém93b, Oho95], des traits impératifs [Wri95, Gar04] ou des arguments optionnels [FG95]. Nous écartons aussi des notions plus anciennes comme les types algébriques et les produits pour privilégier la simplicité de la présentation. Enfin nous simplifions légèrement la syntaxe des transformations et nous montrons en fin de ce chapitre qu’on peut adapter le système présenté aux transformations de MGS.

VII.2.1 Syntaxe

Le langage est restreint au λ-calcul avec constantes et let auquel on ajoute les transforma-tions.

e ::= x | c | λx.e | e e | let x = e in e | {m/e ⇒ e; . . . ; m/e ⇒ e} m ::= µ, . . . , µ

µ ::= x | x : b | x : r | ∗ as x | b∗ as x | r∗ as x

Dans la grammaire ci-dessus, e est une expression, c est une constante (par exemple set:(), +ou ::) et m est un motif.

Motifs

Dans les motifs, un motif ´el´ementaire µ est :

– soit une variable, filtrant une valeur quelconque (x), une valeur d’un type atomique donn´e (x : b) ou une valeur qui est une collection et dont la topologie est donn´ee (x : r),

– soit une répétition nommée, filtrant un nombre quelconque de valeurs voisines successive-ment et qui sont :

– quelconques (∗ as x),

– d’un type atomique donn´e (b∗ as x)

126 Typage ensembliste

On note B l’ensemble des types atomiques dans lequel on peut choisir b, on prendra par exemple B = {int, bool, f loat, string}. On note R l’ensemble des topologies de base dans lequel on peut choisir r, on prendra ici R = {set, seq, bag, grid }. Remarquons que les topologies de base ne sont que des symboles.

Les gardes d’un motif sont réduites à une seule expression en fin de motif. Les conditions de type sont restreintes aux types atomiques et aux topologies de base mais on peut encoder d’autres tests (voir ci-dessous). La discussion en section VII.8.1 justifie le choix de se restreindre à ces tests.

L’identificateur x dans ∗ as x dénote la séquence des valeurs filtrées. Une séquence est en effet suffisante pour dénoter les éléments filtrés en partie droite d’une règle ou dans la garde d’un motif tout en garantissant que la transformation puisse être appliquée sur n’importe quelle topologie (un motif filtre un chemin, voir la section IV.3 dans le chapitre Filtrage). Les règles de transformation seront notées :

m/g ⇒ e

o`u m est la partie du motif non gard´ee, g est la garde du motif et e est l’expression rempla¸cante. Simplifications

Les simplifications de la syntaxe des transformations par rapport `a la syntaxe MGS concernent les points suivants :

Directions. Les directions dans les motifs peuvent ˆetre vues comme du sucre syntaxique au niveau du typage (au niveau du filtrage elles sont importantes). Exemple :

{ x |nord> y => y,x }

peut ˆetre vu comme un raccourci pour :

fun (c) -> ( { x,y / nord? (x,y,c) => [y,x] } c) o`u nord? est un pr´edicat de voisinage.

Tests de type. Un test de type de la forme x : [int]seq peut s’encoder de la mani`ere suivante dans notre langage :

let t = { x:int => true ; x => false } in let all int =

fun c -> fold (fun (x,y) -> x && y) (t x) true in { x:seq / all int x => ... }

ou plus simplement, si on dispose d’un pr´edicat testant si une valeur est d’un type atomique particulier1 :

let all int =

fun c -> fold (fun (x,y) -> is int(x) && y) (t x) true in { x:seq / all int x => ... }

Ce pr´edicat s’encode de la mani`ere suivante dans notre langage : let is int = fun x ->

let t = {x:int =>[true] ; x => [false]} in hd ( t (x::seq:()) )

Dans MGS on peut tester le type d’une valeur en dehors d’un motif comme dans l’exemple suivant : if x:int then e1 else e2.

Gardes. Les gardes sont rejetées à la fin du motif pour la simplicité des règles de typage. Nous donnons en fin de chapitre une version de la règle de typage des transformations qui prend en compte des gardes sur les sous-motifs.

Répétitions. La répétition arbitraire ∗ ne porte pas sur un sous-motif. Le motif ∗ as X dans notre langage restreint correspond au motif x* as X de MGS. On ne traite donc pas de motifs comme (x/x=0,y/y=1)* as Z. Un tel motif peut toutefois être encodé à l’aide de tests dans la garde.

Par ailleurs, dans les exemples que nous donnerons nous adopterons le sucre syntaxique suivant :

– les op´erateurs binaires seront ´ecrits en position infixe,

– on pourra écrire une séquence en énumérant ses éléments entre crochets au lieu d’utiliser le constructeur standard comme le montre l’exemple suivant : [1, 2, 3] pour 1 :: 2 :: 3 :: empty seq,

– on pourra omettre la garde d’un motif lorsque celle-ci est la constante true.

On appelle opérateurs les fonctions constantes données dans le langage. Parmi les constantes on trouvera les collections vides comme empty set ou empty seq, et les opérateurs manipulant des collections comme le constructeur2 générique :: ou les constructeurs spécifiques aux grilles comme nord ou est.

Une règle de la forme x ⇒ e est appelée une règle attrape-tout (le motif est non gardé et réduit à une variable).

Discussion 3 (Formes spéciales.) Le prédicat nord? dont nous parlons ci-dessus n’a de sens que sur des variables introduites par le motif. En effet, appliquer nord? à 1 et 2 par exemple n’a pas de sens car 1 et 2 peuvent apparaˆıtre plusieurs fois dans la collection.

Le langage MGS propose d’autres opérations qui n’ont de sens que sur des variables intro-duites par un motif. Vérifier que ces opérateurs ne sont utilisés qu’avec de telles variables est un problème simple qui peut éventuellement relever du typage mais que nous ne traiterons pas. Pour illustrer cette tâche, considérons la transformation { x => left(x) + x }. Ici x dénote à la fois une position et sa valeur. Ce problème apparaˆıt souvent dans les langages de programmation et n’est pas caractéristique de l’utilisation de collections ou de transformations [Str67, Str00].

VII.2.2 Topologies

Dans la section IV.5.2 une topologie est vue comme la donn´ee d’un ensemble de constructeurs et d’une substitution topologique.

D´efinition 2 L’ensemble des directions d’une topologie r est l’ensemble de toutes les directions pouvant apparaˆıtre dans une collection construite uniquement `a partir des constructeurs de r et de sa substitution topologique.

Dans ce chapitre nous supposerons que toutes les topologies considérées ont des ensembles de directions disjoints deux à deux.

VII.2.3 S´emantique d´enotationnelle

Nous donnons ici une sémantique au langage étudié afin de montrer par la suite la correction du typage que nous proposons.

Ici le mot constructeur n’est pas utilisé au sens algébrique mais désigne une fonction ajoutant un élément à une collection.

128 Typage ensembliste

Le langage s’évalue dans un domaine D que nous décrivons ici (voir [Mos90] pour une intro-duction aux domaines sémantiques). Pour chaque type atomique b de B il est donné un ensemble B_b de valeurs dites littérales (dont l’intersection deux à deux est vide). Pour chaque topologie r de R il est donné un ensemble C(D, r) de collections à valeurs dans D. On peut prendre simplement C(D, r) = Posr → D où Posr est l’ensemble des positions possibles pour une col-lection de topologie r. Pour r₁ 6= r2, l’intersection de C(D, r₁) et de C(D, r₂) est vide³. Le domaine D → D contient les fonctions continues totales de D dans D. Les transformations sont représentées dans D par des fonctions strictes de D → D. Les transformations sont continues si l’on suppose qu’elles sont déterministes. Elles le sont si l’on fixe la stratégie d’application des règles. Leur sémantique correspond à la description donnée en section IV.5.3, page 79. Notons que cette sémantique impose d’avoir une séquence comme partie droite des règles d’une trans-formation. En effet, les substitutions topologiques, qui sont les opérateurs substituant les valeurs filtrées par les valeurs rempla¸cantes, attendent une séquence de valeurs en argument. Ceci est naturel puisqu’un motif décrit un chemin, c’est à dire un parcours séquentiel de la partie filtrée. Enfin, D contient ⊥, qui dénote un calcul qui ne termine pas, ainsi que les deux valeurs wrong et shape. La valeur wrong correspond à une erreur de type à l’exécution, par exemple lorsqu’un entier est appliqué comme une fonction. La valeur shape peut être vue comme une exception levée lorsqu’une transformation est amenée à rompre une topologie (par exemple, lorsque le chemin filtré et la séquence rempla¸cante n’ont pas la même taille dans une collection newto-nienne ; c’est ΨN qui provoque la levée de l’exception). La définition formelle de D est donnée par l’équation ci-dessous :

D = {⊥, wrong, shape} ∪ ^[

b∈B

B_b∪ ^[

r∈R

C(D − {⊥}, r) ∪ (D → D)

Nous distinguons shape de wrong car les erreurs de types « classiques » seront détectées par notre système de types alors que les violations de topologie, d’une nature plus subtiles ne le seront pas (voir la section VII.10.2 à ce sujet). On note T l’ensemble des valeurs ne faisant pas intervenir wrong. Cet ensemble ne se réduit pas à D − {wrong} et est défini comme suit :

T = {⊥, shape} ∪ ^[

b∈B

B_b∪ ^[

r∈R

C(T − {⊥}, r) ∪ (T → T)

Un environnement est une fonction d’un ensemble d’identifiants vers l’ensemble des valeurs D. On note Eval (e, E) la s´emantique de l’expression e dans l’environnement E.

Dans le document Intégration des collections topologiques et des transformations dans un langage fonctionnel (Page 142-145)