Les op´erations ensemblistes - Expérience de programmation générique sur des structures non-séq

Les opérations ensemblistes sur les automates définies à la section 2.2.6 page 30 sont mises en œuvre grâce à des adaptateurs de curseur monodirectionnel unaires (le complémentaire dans Σ∗) ou binaires (intersection, union, différence, différence symétrique, concaténation). La figure 5.2 décrit les interactions de l’adaptateur unaire du complémentaire not_cursor et de l’adaptateur binaire d’intersection intersection_cursor avec les autres composants. Nous allons nous intéresser à l’intersection pour illustrer la démarche de création d’un tel curseur.

SoientA(Σ, Q, i, F,∆) etA^′(Σ, Q^′, i^′, F^′,∆^′) deux automates dont on veut calculer l’inter-section B(Σ, Q^′′, i^′′, F^′′,∆^′′) d´efinie par :

B= (Σ, Q×Q^′,(i, i^′), F ×F^′,∆^′′)

5.2. LES OP ´ERATIONS ENSEMBLISTES 79

Q×Q^′ et dont l’ensemble des transitions ∆^′′ est d´efini par la fonction de transition :

δ₁^′′((q, q^′), σ) = (δ₁(q, σ), δ₁^′(q^′, σ)).

Les états terminaux sont les couples dont les états sont tous deux terminaux dans les auto-mates de départ.

Soit xun curseur d’intersection évoluant sur l’automateB et encapsulant deux curseurs mo-nodirectionnels c1 et c2 respectivement sur A et A^′. D’après les définitions précédentes, x doit avoir le comportement suivant :

– L’état pointé par xest constitué d’une paire d’états des automates sous-jacents :

q^′′= (q, q^′).

State src() const {

return make_pair(c1.src(), c2.src()); }

– q^′′ est final siq etq^′ sont finaux : bool src_final() const {

return c1.src_final() && c2.src_final(); }

– forwardimplémente la fonction de transitionδ₁^′′. Une transition étiquetée parasortant de l’état q′′ est définie si et seulement si il en existe une étiquetée par la même lettre sortant des étatsq etq^′. Autrement dit,xpeut avancer sur une transition sic1etc2le peuvent :

bool forward(int a) {

return c1.forward(a) && c2.forward(a); }

– Une transition sortant deq^′′étiquetée par aest définie dansB si elle est définie pourq

etq′ :

bool exists(int a) const {

return c1.exists(a) && c2.exists(a); }

– L’état q′′ est un état puits si au moins un des deux étatsq etq′ est un état puits : bool sink() const {

return c1.sink() || c2.sink(); }

Cette interface concerne un modèle de curseur d’intersection simple. Elle est suffisante pour tester si un mot appartient àB. Le niveau de fonctionnalités supérieur qu’offre le curseur d’in-tersection monodirectionnel doit permettre de parcourir les transitions d’un état, δ₂((q, q^′)),

80 CHAPITRE 5. LES ADAPTATEURS

grˆace aux m´ethodes first_transitionetnext_transition.

D’après la sixième propriété des curseurs de la section 4.4.2 que nous généralisons à l’inter-section, les transitions sortant d’un état sont rangées en séquence dont la transition puits ((q, q^′), ǫ,0) matérialise la position de fin :

δ2((q, q^′)) = ((σ1,(p1, p^′₁)), ...,(σn,(pn, p^′_n)),(ǫ,0))

Ici 0 représente l’état puits de l’automate intersection, c’est-à-dire un couple d’états dont au moins une des deux composantes est nulle. 0 peut donc prendre les valeurs (q,0), (0, q^′) ou (0,0). On construit cette séquence en choisissant les transitions communes aux deux auto-mates :

(σ_i,(p_i, p^′_i))∈δ₂((q, q^′))⇔(σ_i, p_i)∈δ₂(q) et (σ_i, p^′_i)∈δ₂(q^′)

Comme tout adaptateur, le curseur réalisera l’intersection des deux séquences à la volée et de manière incrémentale en recherchant l’élément commun suivant l’élément courant lors de l’appel ànext_transition.

Pour des raisons d’efficacité, nous allons imposer que ces transitions soient triées selon l’ordre croissant des lettres les étiquetant :

pour 1≤i, j≤n, i < j⇔σ_i < σ_j

Cette contrainte supplémentaire nous permet d’écrire des méthodes first_transition et next_transitionde complexité linéaire. Plus exactement, au cours d’une itération complète de δ₂((q, q^′)) le nombre de transitions comparées est borné par la somme des cardinaux des contextes droits des deux états sources : |~c(q)|+|~c(q^′)|. Sans cette propriété, le temps de parcours de la séquence intersection est quadratique.

– La méthode privée ci-dessous factorise les parties communes de first_transition et next_transition. Son rôle consiste à trouver la transition suivante (σi+1,(pi+1, p^′_i₊₁)) commune aux deux curseursc1etc2positionnés sur (q, σi, pi) et (q^′, σi, p^′_i). Elle renvoie faux si (σ_i₊₁,(p_i₊₁, p′ i+1)) = (ǫ,0) : bool find_next() { while(1) { if (c1.letter() < c2.letter()) {

if (!c1.next_transition()) return false; }

else

if (c2.letter() < c1.letter()) {

if (!c2.next_transition()) return false; }

else // c1.letter() == c2.letter() return true;

}

return false; }

5.2. LES OP ÉRATIONS ENSEMBLISTES 81 – La méthode first_transition positionne le curseur x sur les deux premières

transi-tions communes des curseurs c1etc2 : bool first_transition() {

return c1.first_transition() && c2.first_transition() && find_next(); }

– Partant de l’´el´ement courant (σi,(pi, p′

i)), la méthode next_transition itère sur les deux séquences à la fois jusqu’à trouver la transition commune suivante (σi+1,(pi+1, p^′_i₊₁)) : bool next_transition() {

return c1.next_transition() && c2.next_transition() && find_next(); }

– Enfin, les m´ethodesforward etfind compl`etent l’interface : void forward() { c1.forward(); c2.forward(); } bool find(int a) {

return c1.find(a) && c2.find(a); }

Remarque Nous avons imposé le même alphabet Σ aux trois automates A, A′, B et ce dans un but de simplification de l’exposé. En fait, cette limitation n’en est pas vraiment une car il est possible de modifier les propriétés des alphabets de manière externe, soit en utilisant des adaptateurs de curseur filtrant les caractères en entrée ou en sortie de l’inter-face (voir la section 5.5.3 sur les automates isomorphes), soit en redéfinissant les relations d’ordre et d’équivalence sur les éléments de Σ. Évidemment, ces deux possibilités ne sont pas mutuellement exclusives. La seconde consiste à fournir à l’adaptateur de curseur deux nouveaux opérateurs de comparaisons au sein de ce qu’on appelle un trait [46]. Un trait est une classe centralisant les méthodes implémentant les opérations standards propres à un type particulier. Le trait standardchar_traitsfournit entre autres une méthode de comparaison eq (equal) renvoyant vrai si les deux caractères passés en argument peuvent être considérés comme égaux. La méthodelt(lower than) renvoie vrai si le premier argument est inférieur au deuxième. Le comportement par défaut consiste à utiliser les opérateurs==et<sur les carac-tères mais la possibilité est laissée à l’utilisateur de l’adapter selon ses besoins. Par exemple, le trait suivant rend la comparaison des caractères insensible à la casse («case-insensitive») :

struct insensitive_traits {

static bool eq(int x, int y) { return tolower(x) == tolower(y);

82 CHAPITRE 5. LES ADAPTATEURS

}

static bool lt(int x, int y) { return tolower(x) < tolower(y); }

};

La fonction C standard tolower convertit un caractère en son équivalent en minuscule si nécessaire induisant une équivalence entre a et A, b et B, etc. En munissant l’adaptateur d’intersection de ces opérateurs :

intersection_cursor<fcursor1, fcursor2, insensitive_traits> c;

on rend le calcul plus«lâche»à condition bien sûr que les comparaisons de lettres étiquetant les transitions passe par le trait. Voici le code réel de la méthode find_next introduite plus haut :

bool find_next() {

while(1) {

if (traits::lt(c1.letter(), c2.letter())) { if (!c1.next_transition()) return false; }

else

if (traits::lt(c2.letter(), c1.letter())) { if (!c2.next_transition()) return false; }

else // c1.letter() == c2.letter() return true;

}

return false; }

En lieu et place de l’opérateur <des appels à la méthode statiquelt sont effectués. Comme d’habitude, une utilisation usuelle d’un composant doit se traduire par du code simple à écrire et lisible, c’est pourquoi par défaut le type du trait utilisera le comportement standard de la classe char_traits<int> ce qui, dans ce cas précis, nous ramène à la précédente version de la fonction.

Le polymorphisme permet n’importe quelle combinaison de manière immédiate comme décrit à la figure 5.3 où l’adaptateur implémente la différence symétrique de deux automates

A1 etA2 définie par (A1 ∪A2)\(A1∩A2). L’utilisation d’un tel objet en particulier et des adaptateurs en général est décrite à la section 5.6 sur les algorithmes.

Dans le document Expérience de programmation générique sur des structures non-séquentielles : les automates (Page 79-84)