4 Arbres de syntaxe abstraite

a compter les notes égales à i. Il suffit alors de lire les notes une par une et d’incrémenter le compteur correspondant. Une fois ce travail accompli, le tri est terminé : il y a T[0] notes

égales à 0, suivi de T[1] notes égales à 1, etc. Cet algorithme est manifestement linéaire et ne fait aucune comparaison ! Pourtant, il ne contredit pas notre résultat. Nous avons en effet utilisé implicitement une information supplémentaire : toutes les valeurs à trier appartiennent à l’intervalle [0,20]. Cet exemple montre qu’il faut bien réfléchir aux conditions particulières avant de choisir un algorithme.

Seconde remarque, on constate expérimentalement que l’algorithme de tri rapide (QuickSort), dont la complexité dans le pire des cas est en O(n²), est le plus efficace en pratique. Comment est-ce possible ? Tout simplement parce que notre résultat ne concerne que la complexité dans le pire des cas. Or QuickSort est un algorithme enO(nlogn) en moyenne.

4.1 Les expressions sont des arbres

Considérons une définition des expressions arithmétiques avec un œil neuf. Une expression arithmétique eest :

un entier,

ou bien une opératione₁ope₂, où e₁ ete₂ sont des expressions arithmétiques et opest un opérateur (+,-,*et/).

L’œil neuf ne voit pas cette définition comme celle de l’écriture usuelle (notation infixe) des expressions, et d’ailleurs il manque les parenthèses. Il voit une définition inductive, l’ensemble des expressions est solution de cette équation récursive :

E =Z∪(E,+, E)∪(E,-, E)∪(E,*, E)∪(E,/, E)

Cette définition inductive est une définition d’arbre, les expressions sont des feuilles qui contiennent un entier ou des nœuds internes à deux fils. Voir une expression comme un arbre évite toutes les ambigu¨ıtés de la notation infixe. Par exemple, les deux arbres de la figure 15 disent clairement quels sont les arguments des opérations + et * dans les deux cas. Alors qu’en notation infixe,

Fig. 15 – Deux arbres de syntaxe abstraite +

1 *

2 3

* +

1 2

pour bien se faire comprendre, il faut ´ecrire1+(2*3) et(1+2)*3.

Dès qu’un programme doit faire des choses un tant soit peu compliquées avec les expressions arithmétiques, il faut représenter ces expressions par des arbres de syntaxe abstraite. Le terme ((abstraite))se justifie par opposition à la syntaxe((concrète))qui est l’écriture des expressions, c’est-à-dire ici la notation infixe. La production des arbres de syntaxes abstraite à partir de la syntaxe concrète estl’analyse grammaticale(parsing), une question cruciale qui est étudiée dans le cours suivant INF 431.

4.2 Impl´ementation des arbres de syntaxe abstraite

Ecrivons une classe´ Exp des cellules d’arbre des expressions. Nous devons principalement distinguer cinq sortes de nœuds. Les entiers, qui sont des feuilles, et les quatre opérations, qui ont deux fils. La technique d’implémentation la plus simple est de réaliser tous ces nœuds par des objets d’une seule classe Exp qui ont tous les champs nécessaires, plus un champ tag qui indique la nature du nœud.¹Le champtagcontient un entier censé être l’une de cinq constantes conventionnelles.

class Exp {

final static int INT=0, ADD=1, SUB=2, MUL=3, DIV=4 ; int tag ;

// Utilis´e si tag == INT int asInt ;

// Utilis´es si tag ∈ {ADD, SUB, MUL, DIV}

Exp e1, e2 ;

Exp(int i) { tag = INT ; asInt = i ; } Exp(Exp e1, int op, Exp e2) {

tag = op ; this.e1 = e1 ; this.e2 = e2 ; }

}

Ainsi pour construire l’arbre de gauche de la figure 15, on ´ecrit : new Exp

(new Exp(1), ADD,

new Exp (new Exp(2), MUL, new Exp(3)))

C’est non seulement assez lourd, mais aussi source d’erreurs. On atteint ici la limite de ce qu’autorise la surcharge des constructeurs. Il est plus commode de d´efinir cinq m´ethodes statiques pour construire les divers nœuds.

static Exp mkInt(int i) { return new Exp (i) ; }

static Exp add(Exp e1, Exp e2) { return new Exp (e1, ADD, e2) ; } ..

static Exp div(Exp e1, Exp e2) { return new Exp (e1, DIV, e2) ; } Et l’expression d´ej`a vue, se construit par :

add(mkInt(1), mul(mkInt(2), mkInt(3))) Ce qui est plus concis, sinon plus clair.

Un exemple d’opération (( compliquée )) sur les expressions arithmétiques est le calcul de leur valeur. L’opération n’est compliquée que si nous essayons de l’effectuer directement sur les notations infixes, car sur un arbreExpc’est très facile.

1Une technique plus élégante à base d’héritage des objets est possible.

static int calc(Exp e) { switch (e.tag) {

case INT: return e.asInt ;

case ADD: return calc(e.e1) + calc(e.e2) ; case SUB: return calc(e.e1) - calc(e.e2) ; case MUL: return calc(e.e1) * calc(e.e2) ; case DIV: return calc(e.e1) / calc(e.e2) ; }

throw new Error ("calc : arbre Exp incorrect") ; }

L’instruction throw finale est nécessaire, car le compilateur n’a pas de moyen de savoir que le champtagcontient obligatoirement l’une des cinq constantes conventionnelles. En son absence, le programme est rejeté par le compilateur. Pour satisfaire le compilateur, on aurait aussi pu renvoyer une valeur ((bidon )) par return 0, mais c’est nettement moins conseillé. Une erreur est une erreur, en cas d’arbre incorrect, mieux vaut tout arrêter que de faire semblant de rien.

Dans cet exemple typique, il faut surtout remarquer le lien très fort entre la définition inductive de l’arbre et la structure récursive de la méthode. La programmation sur les arbres de syntaxe abstraite est naturellement récursive.

4.3 Traduction de la notation postfixe vers la notation infixe

Nous avons déjà traité cette question de fa¸con incomplète, en ne produisant que des notations infixes complètement parenthésées (exercice II.2). Nous pouvons maintenant faire mieux.

L’idée est d’abord d’interpréter la notation postfixe comme un arbre, puis d’afficher cet arbre, en tenant compte des règles usuelles qui permettent de ne pas mettre toutes les parenthèses.

Pour la première opération il ne faut se poser aucune question, nous reprenons le calcul des expressions données en notation postfixe (voir II.1.2), en construisant un arbre au lieu de calculer une valeur. Nous avons donc besoin d’une pile d’arbres, ce qui est facile avec la classe des piles de la bibliothèque (voir II.2.3).

static Exp postfixToExp(String [] arg) { Stack<Exp> stack = new Stack<Exp> () ; for (int k = 0 ; k < arg.length ; k++) {

Exp e1, e2 ;

String cmd = arg[k] ; i f (cmd.equals("+")) {

e2 = stack.pop() ; e1 = stack.pop() ; stack.push(add(e1,e2)) ;

} else i f (cmd.equals("-")) {

e2 = stack.pop() ; e1 = stack.pop() ; stack.push(sub(e1,e2)) ;

} else i f (cmd.equals("*")) {

e2 = stack.pop() ; e1 = stack.pop() ; stack.push(mul(e1,e2)) ;

} else i f (cmd.equals("/")) {

e2 = stack.pop() ; e1 = stack.pop() ; stack.push(div(e1,e2)) ;

} else {

stack.push(mkInt(Integer.parseInt(arg[k]))) ; }

}

return stack.pop() ; }

Examinons la question d’afficher un arbreExpsous forme infixe sans abuser des parenth`eses.

Tout d’abord, les parenthèses autour d’un entier ne sont jamais utiles. Ensuite, on distingue deux classes d’opérateurs, les additifs (+et-) et les multiplicatifs (*et/), les opérateurs d’une classe donnée ont le même comportement vis à vis du parenthésage. Il y a cinq positions possibles : au sommet de l’arbre, et à gauche ou à droite d’un opérateur additif ou multiplicatif. On examine ensuite l’éventuel parenthésage d’un opérateur.

L’application des opérateurs additifs doit être parenthésée quand elle apparaˆıt comme se-cond argument d’un opérateur additif (1-2+3s’interprète comme(1-2)+3, il faut donc pa-renthéser1-(2+3)), ou comme argument d’un opérateur multiplicatif (considérer(1+2)*3 et1*(2+3)).

L’application des opérateurs multiplicatifs doit être parenthésée à droite des opérateurs multiplicatifs (même raisonnement que pour les additifs).

Ceci nous conduit à regrouper les positions possible en trois classes (1) Sommet de l’arbre et à gauche des additifs : ne rien parenthéser.

(2) À droite des additifs et à gauche des multiplicatifs : ne parenthéser que les additifs.

(3) À droite des multiplicatifs : parenthéser tous les opérateurs.

On identifie les trois classes par 1, 2 et 3. On voit alors que les additifs sont à parenthéser pour les classes strictement supérieures à 1, et les multiplicatifs pour les classes strictement supérieures à 2. Ce qui conduit directement à la méthode suivante qui prend en dernier argument un entier lvlqui rend compte de la position de l’arbreeà afficher dans la sortie out.

static void expToInfix(PrintWriter out, Exp e, int lvl) { switch (e.tag) {

case INT:

out.print(e.asInt) ; return ; case ADD: case SUB:

i f (lvl > 1) out.print(’(’) ; expToInfix(out, e.e1, 1) ;

out.print(e.tag == ADD ? ’+’ : ’-’) ; expToInfix(out, e.e2, 2) ;

i f (lvl > 1) out.print(’)’) ; return ;

case MUL: case DIV:

i f (lvl > 2) out.print(’(’) ; expToInfix(out, e.e1, 2) ;

out.print(e.tag == MUL ? ’*’ : ’/’) ; expToInfix(out, e.e2, 3) ;

i f (lvl > 2) out.print(’)’) ; return ;

}

throw new Error ("expToInfix : arbre Exp incorrect") ; }

La méthode expToInfix mélange récursion et affichage. Cela ne pose pas de difficulté parti-culière : pour afficher une opération il faut d’abord afficher le premier argument (récursion) puis l’opérateur et enfin le second argument (récursion encore).

La sortie est unPrintWriterqui possède une méthodeprintexactement commeSystem.out mais est bien plus efficace (voir B.5.5.1). Le code utilise une particularité de l’instructionswitch: on peut grouper les cas (ici des additifs et des multiplicatifs). Pour afficher l’opérateur, on a re-cours à l’expression conditionnelle (voir B.7.2). Par exemple e.tag == ADD ? ’+’ : ’-’vaut

’+’sie.tagest égal àADDet’-’autrement — et ici((autrement))signifie nécessairement que e.tagest égal à SUB puisque nous sommes dans un cas regroupé du switchne concernant que ADD etSUB.

Voici finalement la m´ethode main de la classe Exp qui appelle l’affichage infixe sur l’arbre construit en lisant la notation postfixe

public static void main (String [] arg) {

PrintWriter out = new PrintWriter (System.out) ; Exp e = postfixToExp(arg) ;

expToInfix(out, e, 1) ;

out.println() ; out.flush() ; }

Les PrintWriter sont bufferis´es, il faut vider le tampon par out.flush() avant de finir, voir B.5.4. Reprenons l’exemple de la figure II.4.

% java Exp 6 3 2 - 1 + / 9 6 - ’*’

6/(3-2+1)*(9-6)

Ce qui est meilleur que l’affichage ((6/((3-2)+1))*(9-6)) de l’exercice II.2.

Dans le document Cours programmation et algorithmique – Cours et formation gratuit (Page 92-96)