• Aucun résultat trouvé

Chapitre 4 Caract´ erisation de motifs graduels 91

4.5 Etape d’agr´ ´ egation

C1 = 8 Cn= 2Cn−1+ 2n  SN N1 = 6 SN Nn= SN Nn−1  Sn= SN Nn Cn

La combinaison F ern◦ Ouvntransforme le mot initial en une s´equence de + `a savoir dans le cas g´en´eral, en une s´equence de longueur Cn= 2Cn−1+2n et en un support Sn= SN Nn

2Cn−1+2n, qui est sup´erieur `a 0.66.

4.5 Etape d’agr´´ egation

La m´ethode d´ecrite dans les sections pr´ec´edentes pr´esente l’extraction d’une s´equence caract´eristique pour un chemin donn´e. Or, dans le cas g´en´eral, un motif graduel est v´erifi´e par plusieurs chemins complets, qui peuvent correspondre `a plusieurs s´equences caract´eristiques. Cette section d´ecrit l’op´erateur d’agr´egation propos´e pour combiner les r´esultats obtenus `a partir de ces chemins, puis discute des chemins `a prendre en compte.

4.5.1 Op´erateur propos´e

Principe

Un motif graduel peut ˆetre v´erifi´e par plusieurs chemins, chacun conduisant `a une s´equence caract´eristique. Par exemple, pour les donn´ees repr´esent´ees sur la figure 4.2, page 95, le motif « plus A, plus B » est v´erifi´e par deux chemins maximaux. La repr´esentation symbolique de ces derniers conduit aux mots v1 et v2 repr´esent´es sur la figure 4.9, qui chacun `a leur tour conduisent `a une s´equence caract´eristique, repr´esent´ee respectivement par Sv1 et Sv2. Dans ce cas simple, un accord ´elev´e entre les deux s´equences identifi´ees est observ´e, et la s´equence caract´eristique r´esultante, Sc, est leur intersection. En effet, dans le cadre de la caract´erisation consid´er´ee, seuls les ´el´ements les plus repr´esentatifs sont souhait´es, ce qui justifie une fonction d’agr´egation s´ev`ere.

Fonction d’agr´egation propos´ee

La fonction d’agr´egation, Agg, s’applique `a des mots d´efinis sur {+, −, ◦}, ayant la mˆeme longueur, ´egale `a la somme du nombre d’objets dans le jeu de donn´ees D et du nombre d’objets fictifs ajout´es. Elle s’applique successivement `a chaque ´el´ement du mot et fournit en sortie un mot d´efini sur {+, ∅}. Le symbole ∅ repr´esente les valeurs sur lesquelles le motif

4.5. ´Etape d’agr´egation v1 + - - + - + - ++++++ - +++ - + - + ◦ ◦ v2 + - + - - ++++++ - +++++ - ++ ◦ ◦ ◦ F ilt1(v1) - - - ++++++++++ - - - - ◦ ◦ Sv1 F ilt1(v2) - - - ++++++++++++ - - - ◦ ◦ ◦ Sv2 Agg ∅∅∅∅∅∅∅++++++++++∅∅∅∅∅∅ Sc

Figure 4.9 – Agr´egation des s´equences caract´eristiques obtenues pour plusieurs chemins.

n’est pas caract´eris´e. La fonction Agg propos´ee est sym´etrique et d´efinie comme suit, pour toutes les paires possibles de symboles :

Agg : {+, −, ◦}2 → {+, ∅} (s1, s2) 7→ s

s1 +++−− ◦

s2 + ◦ − ◦ − ◦ Agg(s1, s2) ++∅∅∅∅

Ainsi, les valeurs en dehors d’un chemin, not´ees ◦, sont neutres et n’ont pas d’influence sur les r´esultats ; les valeurs qui sont exclues du chemin sont associ´ees au symbole ∅, et sont donc exclues du r´esultat final. En effet, le symbole ∅ indique les objets transcrits en − ou en ◦, qui correspondent aux objets neutres ou non compatibles avec le motif consid´er´e. Seuls les sous-mots compos´es de symboles + sont donc conserv´es, car la majorit´e des symboles + de ces sous-mots correspondent aux objets compatibles transcrits en + lors du processus de transcription. Ces symboles + repr´esentent alors les valeurs sur lesquelles le motif est caract´eris´e. Ceci est compatible avec l’objectif de la caract´erisation : seuls les ´el´ements importants et repr´esentatifs doivent ˆetre pris en consid´eration.

Une fois la s´equence caract´eristique agr´eg´ee, l’intervalle d’int´erˆet de caract´erisation est identifi´e, d´efini par les valeurs num´eriques des caract`eres limites de la s´equence caract´ eris-tique : ce sont les valeurs minimale et maximale de l’attribut consid´er´e pour la s´equence de + identifi´ee.

4.5.2 Chemins consid´er´es

Les chemins consid´er´es pour la transcription et l’agr´egation sont les chemins maximaux valides, c’est-`a-dire les ´el´ements de Ls(M ). En effet, la prise en compte de tous les chemins complets L(M ) pourrait g´en´erer trop de contre-exemples, c’est-`a-dire de symboles − qui repr´esentent les objets non compatibles, et ainsi conduire `a un r´esultat vide. Ceci peut ˆetre expliqu´e par le fait que, dans le processus de transcription, lorsqu’un chemin est transform´e en repr´esentation symbolique, tous les objets qui ne lui appartiennent pas sont transcrits en

1 2 3 4 5 6 7 8

Figure 4.10 – Chemin maximal (•) et chemin complet (objets num´erot´es de 1 `a 8 ) pour le motif « plus A, plus B ».

v1 + − − + − + − + + + + − + + + + + − + − + ◦ ◦

v2 + − + − + − − − − − − − − − + + + − + + ◦ ◦ ◦

F ilt1(v1) − − − − − − − + + + + + + + + + + − − − − ◦ ◦ F ilt1(v2) − − − − − − − − − − − − − − + + + − − − ◦ ◦ ◦

Agg ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ ∅ + + + ∅ ∅ ∅ ∅ ∅ ∅

Figure 4.11 – Agr´egation des s´equences caract´eristiques obtenues pour un chemin maximal et le chemin complet repr´esent´es sur la figure 4.10.

−, mˆeme si ces objets appartiennent `a un autre chemin du motif consid´er´e. Ce ph´enom`ene est illustr´e sur l’exemple de la figure 4.10, qui repr´esente les mˆemes donn´ees que celles repr´esent´ees sur la figure 4.2 illustr´ee dans la section 4.5.1. On consid`ere v1le mot correspondant au chemin maximal D de cardinal 14 repr´esent´e avec • sur la figure 4.10 et v2 le mot correspondant au chemin complet valide de cardinal 8, repr´esent´e par les objets num´erot´es de 1 `a 8, extrait de l’exemple de la mˆeme figure.

En appliquant un filtre d’ordre 1 sur les deux mots, on obtient une s´equence de longueur 10 pour v1et une s´equence de longueur 3 pour v2. Comme, apr`es agr´egation, les objets transcrits en + dans le mot v1 sont transcrits en − dans v2, ils sont donc repr´esent´es par des ∅. Les r´esultats obtenus apr`es filtrage des deux mots et le r´esultat de l’agr´egation sont pr´esent´es dans le tableau 4.11.

Le r´esultat final est une s´equence caract´eristique de longueur inf´erieure `a celle obtenue avec le mot issu du chemin maximal. Cela signifie qu’une s´equence caract´eristique de longueur 10 aurait ´et´e identifi´ee si le chemin complet valide n’avait pas ´et´e consid´er´e.