• Aucun résultat trouvé

Th´eorie des sous-ensembles flous : quelques rappels

Dans le document Autour et alentours des motifs séquentiels (Page 31-34)

La th´eorie des sous-ensembles flous, introduite par [Zad65] autorise l’appartenance partielle `a une classe et la gradualit´e de passage d’une situation `a une autre. Cette th´eorie constitue une g´en´eralisation de la th´eorie ensembliste classique, des situations

4.2. TH ´EORIE DES SOUS-ENSEMBLES FLOUS : QUELQUES RAPPELS 31 interm´ediaires entre le tout et le rien ´etant admises. Un objet peut alors appartenir `a la fois `a un ensemble et `a son compl´ement.

Exemple 1 On consid`ere par exemple l’univers X des tailles possibles d’un individu. Un sous-ensemble flou A (e.g. Petit ou Grand) est d´efini par une fonction d’appar- tenance µA qui d´ecrit le degr´e avec lequel chaque ´el´ement x ∈ X appartient `a A, ce

degr´e ´etant compris entre 0 et 1. Par exemple, la figure 4.1 illustre une repr´esentation possible de ces sous-ensembles flous. Ainsi, un individu de 1m65 pourra `a la fois ˆetre grand et petit avec un degr´e de 0.7 pour le sous-ensemble flou Grand et 0.3 pour le sous-ensemble flou Petit.

Fig. 4.1:Repr´esentation des sous-ensembles flous Grand et Petit relatifs `a la taille d’un individu

Les op´erateurs en logique floue sont une g´en´eralisation des op´erateurs classiques. On consid`ere notamment la n´egation, l’intersection et l’union. L’op´erateur ⊤ ou t-norme (norme triangulaire) est l’op´erateur binaire d’intersection : µA∩B(x) = ⊤(µA(x), µB(x)).

L’op´erateur ⊥ ou t-conorme (conorme triangulaire) est l’op´erateur d’union : µA∪B(x) =

⊥(µA(x), µB(x)). Nous noterons⊤ (resp. ⊥) l’op´erateur ⊤ (resp. ⊤) g´en´eralis´e au cas

n-aire.

Il existe plusieurs op´erateurs de t-norme et de t-conorme (min/max, produit/somme probabiliste, ... ) ayant diverses propri´et´es. L’op´erateur min ´etant idempotent nous avons choisi d’utiliser le couple min et max, respectivement utilis´es pour la t-norme et la t-conorme.

Il existe de nombreuses possibilit´es pour repr´esenter les op´erateurs ⊤ et ⊥. Le ta- bleau propos´e figure 4.2 r´ecapitule plusieurs fonctions fr´equemment utilis´ees comme op´erateurs ⊤ et ⊥.

Appellation ⊤ ⊥ NON

Zadeh [Zad65] min(x, y) max(x, y) 1 − x

Probabiliste [DP80] xy x+ y − xy 1 − x

Lukasiewicz [Luk67] max(x + y − 1, 0) min(x + y, 1) 1 − x

Hamacher [Ham76] (β > 0) β+(1−β)(x+y−xy)xy x+y−xy−(1−β)xy1−(1−β)xy 1 − x

Weber [Web83] 8 < : x si y = 1 y si x = 1 0 sinon 8 < : x si y = 0 y si x = 0 1 sinon 1 − x

32 CHAPITRE 4. LES MOTIFS S ´EQUENTIELS FLOUS Nous savons que la cardinalit´e d’un ensemble non-flou est le nombre d’´el´ements qui appartiennent `a cet ensemble. Dans le cas d’un ensemble flou, le probl`eme de comptabiliser le nombre d’´el´ements qu’il contient revient en fait `a d´efinir quand un ´el´ement appartient ou non `a un ensemble flou. Dans le contexte des motifs s´equentiels diff´erentes m´ethodes peuvent ˆetre envisag´ees :

– Comptabiliser tous les ´el´ements pour lesquels le degr´e d’appartenance est non nul et que quelle que soit la quantit´e.

– Consid´erer les achats pour lesquels le degr´e d’appartenance d´epasse un certain seuil et quelle que soit la quantit´e, tous les ´el´ements sont ´equivalents. Ce comp- tage est appel´e comptage seuill´e.

– Consid´erer que tous les achats n’ont pas la mˆeme importance, selon leur degr´e d’appartenance. Il s’agit alors d’un Σ-comptage, i.e. en sommant les degr´es d’ap- partenance de chaque ´el´ement.

– Combiner les deux comptages pr´ec´edents, en consid´erant que tous les ´el´ements n’ont pas la mˆeme importance mais qu’ils ne sont assez significatifs pour ˆetre omptabilis´es si leur degr´e d’appartenance ne d´epasse pas un certain seuil. On r´ealise alors un Σ-comptage seuill´e.

Bien entendu, l’utilisation de chacun de ces comptages est fonction des objectifs du comptage et de sa signification. Nous verrons par la suite que dans notre contexte, cela aura de l’influence sur la d´efinition du support.

La figure 4.3 r´ecapitule l’ensemble des notations qui seront utilis´ees dans la suite de ce chapitre.

On utilisera les notations ⊤ et ⊥ respectivement pour la T-norme et la T-conorme n-aires, extension des op´erateurs binaires de T-norme et T-conorme ⊤ et ⊥.

On d´efinit ´egalement un op´erateur n-aire d’agr´egation ⊙, qui doit ˆetre commutatif (il ne faut pas que l’ordre des calculs influe sur le r´esultat) et monotone (si l’on associe dans une s´equence S1un itemset A avec un itemset B, et dans S2 A avec C, tels que

B ⊆ C, on souhaite que l’agr´egation dans les s´equences S1et S2 rende compte de cet

ordre).

Intuitivement, pour obtenir des motifs s´equentiels flous, il s’agit de partitioner les quantit´es de chaque item ou produit achet´e en plusieurs sous-ensembles flous puis d’utiliser ces sous-ensembles flous pour la recherche de s´equences fr´equentes.

4.3

Le point

La premi`ere proposition d’une approche de recherche de motifs s´equentiels flous a ´et´e r´ealis´ee par [HLW01]. Leur proposition est bas´ee sur un d´ecoupage en intervalles flous. Cependant, pour minimiser le nombre d’items flous manipul´es, ils ne conservent, pour chaque item, que le sous-ensemble flou de cardinal le plus ´elev´e pour toute la base (par Σ-comptage).

[CTCH01, HCTS03] ont adopt´e quant `a eux une approche tr`es th´eorique du probl`e- me sans algorithme ou impl´ementation. Leur proposition pr´esente un formalisme et des notations ambigus pour le calcul du support d’un itemset flou et donc d’une s´equence floue. Il est notamment difficile d’identifier les diff´erences dans le calcul du support des s´equences h(10) (20)i et h(10 20)i. Or ce point est fondamental dans un contexte de recherche de motifs s´equentiels puisque les dates associ´ees aux items interviennent lors de l’extraction des fr´equents.

Dans le document Autour et alentours des motifs séquentiels (Page 31-34)