• Aucun résultat trouvé

1.2 Motifs graduels

1.2.1 D´ efinitions et notations

evaluation.

1.2.1 D´efinitions et notations

Dans toute la section, on consid`ere un ensemble de donn´ees, not´e D, constitu´e de n objets d´ecrits par m attributs.

1.2. Motifs graduels Id. Vitesse V Distance D Freinage F

1 91 3400 1 2 95 2200 0 3 112 2000 2 4 104 1850 3 5 82 5000 2 6 95 1200 1 7 88 1850 5 8 98 1200 4

Tableau 1.3 – Exemple d’une base de donn´ees num´eriques

Cas de donn´ees num´eriques

D´efinition 1.8 (Item graduel). Un item graduel est d´efini comme un couple constitu´e d’un attribut et d’une variation, not´ee ∗ ∈ {≤, ≥}, qui repr´esente un op´erateur de comparaison : un item graduel A repr´esente le fait que les valeurs de l’attribut augmentent si ∗ = ≥ ou diminuent si ∗ = ≤.

Deux types de variations pour un item I sont distingu´es :

— une variation croissante de valeurs d’attributs, c’est-`a-dire que la valeur augmente d’un objet `a l’autre. Dans ce cas, l’item graduel est s´emantiquement identifi´e comme « plus I est ´elev´e » ou encore « plus I augmente ».

— une variation d´ecroissante de valeurs d’attributs, c’est-`a-dire que la valeur diminue d’un objet `a l’autre. Dans ce cas, l’item graduel est s´emantiquement identifi´e comme « moins I est ´elev´e », ou « plus I est faible », ou « moins I augmente », ou encore « plus I diminue »

Les items graduels « plus I est ´elev´e » et « moins I est ´elev´e » peuvent ˆetre not´es de diff´erentes mani`eres. Dans certains travaux comme par exemple les travaux de Dubois et al. (1995); Berzal et al. (2007) et Fiot et al. (2008), ils sont not´es I> et I< en utilisant les op´erateurs de comparaison stricts > et <, alors qu’ils sont not´es I et I en utilisant les op´erateurs de comparaison larges ≥ et ≤ dans d’autres travaux, comme par exemple les travaux de Di Jorio et al. (2008; 2009) et de Laurent et al. (2009). Dans cette th`ese, nous utilisons les op´erateurs de comparaison larges {≥, ≤}.

Ces principes peuvent ˆetre illustr´es par l’exemple de la base de donn´ees num´eriques pr´ e-sent´ee dans le tableau 5.4 qui d´ecrit n = 8 camions en mouvement selon m = 3 attributs : leur vitesse, leur distance `a un mur et la force de freinage.

Six items graduels peuvent ˆetre consid´er´es : V, V, D, D, F et F, repr´esentant respectivement (plus la vitesse est ´elev´ee), (moins la vitesse est ´elev´ee), (plus la distance est ´elev´ee), (moins la distance est ´elev´ee), (plus le freinage est fort) et (moins le freinage est fort). D´efinition 1.9 (Motif graduel). Un motif graduel, ou itemset graduel, not´e {(Ai, ∗i), i = 1...k} ou {A∗ii , i = 1...k}, est d´efini comme une combinaison de plusieurs items graduels et interpr´et´e s´emantiquement comme leur conjonction.

Par exemple M = VD est interpr´et´e comme « plus la vitesse est ´elev´ee et moins la distance est ´elev´ee ». Ceci impose une contrainte de variation de plusieurs attributs simulta-n´ement.

La longueur d’un motif graduel, not´ee k, est le nombre d’attributs qui y sont impliqu´es. D´efinition 1.10 (R`egle graduelle). Une r`egle graduelle, not´ee M1 → M2, est d´efinie comme une paire de motifs graduels (M1, M2) sur laquelle est impos´ee une relation de causalit´e ; M1

est appel´e l’ant´ec´edent ou pr´emisse, M2 le cons´equent.

Une r`egle graduelle ´etablit des relations de causalit´e entre les attributs et r´esume les tendances observ´ees dans l’ensemble des donn´ees. Notons que c’est cette causalit´e qui fait la diff´erence entre une r`egle et un motif.

A partir du tableau 5.4, nous pouvons extraire la r`egle D → F qui est lue comme « plus on est proche du mur alors plus on freine fort ».

Cas flou

La plupart des travaux existants sur les motifs graduels (H¨ullermeier 2001; 2002 ; Berzal et al., 2007 ; Di Jorio et al. 2008; 2009 ; Laurent et al., 2009) s’appliquent `a des donn´ees floues. Pour de telles donn´ees, les attributs sont associ´es `a des modalit´es floues et les donn´ees sont d´ecrites par leurs degr´es d’appartenance `a ces modalit´es. Ainsi, dans le cas de l’exemple des camions d´ecrit dans le tableau 5.4, on peut obtenir une base de donn´ees floues en consi-d´erant que la vitesse, la distance et le freinage sont associ´es `a des variables linguistiques ;la vitesse est associ´ee `a 3 modalit´es : lente, normale et ´elev´ee, la distance au mur `a 2 modalit´es : proche et loin, et le freinage `a 3 modalit´es : faible, normal et fort.

Les donn´ees sont ensuite d´ecrites par leur degr´e d’appartenance aux modalit´es comme : par exemple, la vitesse de l’objet 1 appartient avec un degr´e 0, 2 `a la modalit´e lente de l’attribut vitesse, avec un degr´e 0, 3 `a la modalit´e normale et avec un degr´e 0, 5 `a la modalit´e ´

elev´ee.

Il faut noter qu’on peut avoir plus de deux modalit´es de degr´es d’appartenance sup´erieurs `

a 0.

En notant V (o) la valeur num´erique de l’attribut « vitesse » d´ecrivant un objet o, m et M repr´esentent respectivement la valeur minimale et maximale d´ecrivant l’attribut « vitesse », on d´efinit formellement les deux fonctions d’appartenance aux modalit´es floues « ´elev´ee » et « lente » par les fonctions µ´elev´ee et µlente de la mani`ere suivante :

µ´elev´ee(o) =        0 si V (o) = m 1 si V (o) = M A(o) − m M − m si m < V (o) < M

1.2. Motifs graduels

Id. Vitesse Distance Freinage

lente normale ´elev´ee proche loin faible normal fort

1 0.2 0.3 0.5 0.4 0.6 0.6 0.4 0.2 2 0.2 0.2 0.6 0.5 0.5 0.2 0.7 0.1 3 0 0.1 0.9 0.7 0.3 0 0.6 0.4 4 0 0.2 0.8 0.8 0.2 0.1 0.3 0.6 5 0.1 0.7 0.3 0.3 0.7 0.3 0.3 0.4 6 0.2 0.3 0.5 0.9 0.1 0.5 0.3 0.2 7 0 0.6 0.4 0.8 0.2 0.1 0.1 0.8 8 0.1 0.2 0.7 0.9 0.1 0 0.3 0.7

Tableau 1.4 – Exemple de base de donn´ees floues

µfaible(o) =        0 si V (o) = M 1 si V (o) = m 1 −V (o) − m M − m si m < V (o) < M

Nous rappelons ci-dessous les d´efinitions d’item graduel, motif graduel et r`egle graduelle dans le cas de telles donn´ees floues (Di Jorio et al., 2009; Laurent et al., 2009; Bouchon-Meunier et al., 2010).

D´efinition 1.11 (Item graduel flou). Un item graduel flou est un triplet (X, A, ∗) constitu´e d’un attribut X, une de ses modalit´es A et une variation, not´ee ∗ ∈ {≥, ≤}.

Un item graduel flou peut ˆetre illustr´e par l’exemple (vitesse, lente, ≥). Il est interpr´et´e comme « plus la vitesse est lente », ou plus pr´ecis´ement « plus le degr´e d’appartenance de la vitesse `a lente est ´elev´ee ».

Il faut noter que les items graduels flous peuvent ˆetre repr´esent´es dans le mˆeme formalisme que les items graduels : il faut pour cela introduire un attribut pour chaque modalit´e floue, dont les valeurs sont les degr´es d’appartenance. On peut ainsi cr´eer, dans l’exemple pr´ec´edent, trois attributs vitesseLente, vitesseNormale et vitesseElev´ee dont les valeurs sont les degr´es d’appartenance. L’item graduel flou pr´ec´edent peut alors ˆetre ´ecrit vitesseLente.

Il est cependant important de souligner une diff´erence s´emantique entre les deux types d’items, que nous illustrons en consid´erant l’exemple de l’item graduel « plus la vitesse est ´elev´ee ». Dans le cas non flou il exprime une contrainte d’ordre sur tout l’univers des vitesses, d´efini par exemple sur [0, 120]. Dans le cas flou, « ´elev´ee » est associ´e `a une modalit´e floue, par exemple de noyau [110, 120] et de support [100, 120]. Le motif graduel flou s’applique aux degr´es d’appartenance, dans l’univers ]0, 1]. Il ne fait donc intervenir que les vitesses sup´ e-rieures `a 100, restreignant les donn´ees qui supportent le motif, et lui donne une interpr´etation plus locale.

Dans la suite du document, nous utilisons la notation A et A pour les deux cas de donn´ees num´eriques et de donn´ees floues. Pour tout o appartenant `a D, A(o) d´esigne la valeur

de l’attribut A pour l’objet o ou le degr´e d’appartenance de o `a l’attribut A qui repr´esente l’attribut flou et la modalit´e consid´er´ee dans le cas de donn´ees floues.

Les notations de motifs et r`egles graduels flous sont alors identiques `a celles des donn´ees num´eriques, bien que bas´ees sur les items graduels flous.

Il existe ´egalement une autre diff´erence th´eorique entre donn´ees num´eriques et donn´ees floues : pour un motif graduel flou M = A∗jj , j = 1...k, si tous les sens de variation sont iden-tiques, un degr´e d’appartenance au motif peut ˆetre d´efini comme M (o) = >j=1...k(Aj(o)) o`u > d´esigne une t-norme, puisque le motif est interpr´et´e comme une conjonction des items qu’il contient. Dans le cas de donn´ees num´eriques, l’agr´egation des valeurs de plusieurs attributs impliqu´es dans le motif graduel est potentiellement plus probl´ematique, et sa s´emantique doit ˆ

etre examin´ee en fonction des donn´ees consid´er´ees.

Il est important de noter que la gradualit´e indiqu´ee des r`egles d’association dans le cas flou (voir section 1.1.3) est particuli`ere et diff´erente de la gradualit´e indiqu´ee dans cette section. En effet, ici la gradualit´e exprime une tendance globale `a travers l’ensemble de donn´ees : elle s’applique `a un sous-ensemble d’objets de mani`ere transversale. Au contraire, l’interpr´etation de la gradualit´e d´ecrite dans la section 1.1.3 s’applique `a chaque objet individuellement : elle consid`ere qu’une pr´esence (floue) implique au sens flou une pr´esence (floue), et que chaque ob-jet a une contribution individuelle avec son propre degr´e d’appartenance. Une telle gradualit´e est interpr´et´ee par les diff´erentes lignes de l’ensemble de donn´ees.

Extensions s´equentielles

Certains travaux ´etendus des motifs graduels visent `a prendre en compte la notion de temporalit´e et l’ordre des ´ev´enements dans le but d’extraire des motifs graduels flous s´ equen-tiels (Fiot et al. 2008; 2009).

Rappelons qu’un motif s´equentiel, contrairement aux r`egles d’association, d´ecrit la fr´ e-quence de certains comportements successifs. Il est repr´esent´e par une liste de motifs ordonn´es. L’ordre est associ´e `a une mesure du temps et la gradualit´e peut ˆetre appliqu´ee `a deux niveaux : — au niveau des items, ce qui traduit une co-variation dans le mˆeme sens entre plusieurs items. Par exemple, consid´erons l’attribut « salaire », un tel motif peut ˆetre illustr´e par « le salaire augmente au cours du temps ».

— au niveau de la relation entre les motifs, ce qui introduit les notions de « puis rapi-dement », « apr`es une p´eriode de temps tr`es courte », etc. Ainsi, la connaissance de la forme « Quand la vitesse d’un moteur augmente fortement, apr`es une p´eriode de temps tr`es courte, la vitesse du camion augmente l´eg`erement pour une courte p´eriode » repr´esente un tel motif.