• Aucun résultat trouvé

Crit` eres de qualit´ e des motifs graduels flous renforc´ es

Chapitre 2 Renforcement par un nouvel attribut : nouveaux crit` eres et exten-

2.1.3 Crit` eres de qualit´ e des motifs graduels flous renforc´ es

Dans la suite du chapitre, on utilise les notations M1 pour le motif graduel `a enrichir et M2 pour le motif flou de la clause de renforcement.

Principe

Un motif graduel flou renforc´e M1; M2 doit ˆetre ´evalu´e en fonction de ses deux compo-santes : le motif graduel flou M1 et la clause de renforcement M2. La qualit´e de la premi`ere est mesur´ee par le support du motif M1 et celle de la seconde par les crit`eres propos´es par Bouchon-Meunier et al. (2010). Ces crit`eres sont introduits par analogie avec les crit`eres des r`egles d’association classiques A → B o`u A et B sont des motifs classiques, en utilisant

2.1. ´Etat de l’art : enrichissement propos´e pour des donn´ees floues la mise en correspondance suivante : A repr´esente le fait de v´erifier le motif graduel et B de v´erifier le renforcement. Ainsi n(AB) correspond au nombre d’objets qui poss`edent M2 et qui, de plus, peuvent ˆetre ordonn´es selon la contrainte d’ordre impos´ee par M1. Ces ob-jets v´erifiant la contrainte d’ordre impos´ee par M1 sont extraits par l’algorithme GRITE qui fournit l’ensemble des chemins complets maximaux L(M ) pour tout motif graduel M valide (voir section 1.3.3, page 41).

Pour un chemin maximal D ∈ L(M ), on note M2(D) = P

o∈D

M2(o) le cardinal flou de D selon M2.

Il est primordial de noter que les crit`eres de qualit´e propos´es pour ´evaluer la qualit´e des motifs graduels renforc´es sont appel´es support et confiance, mais ils sont diff´erents de ceux propos´es dans le cas classique. En effet, il n’y a pas d’effet de causalit´e dans les motifs graduels renforc´es : ce sont des motifs graduels classiques enrichis par une nouvelle information, il ne s’agit pas de r`egles.

Le crit`ere de confiance est donc un crit`ere suppl´ementaire ´evaluant la mˆeme chose que le support, c’est-`a-dire ´evaluant la qualit´e d’un motif et non pas d’une r`egle.

Support renforc´e

Comme dans le cas classique, les auteurs ont d´efini le support d’un motif renforc´e, SR, comme une ´evaluation de sa fr´equence. Ils ont utilis´e pour cela une approche sigma-comptage, pour mesurer le degr´e de pr´esence de M2 parmi les objets qui v´erifient le motif graduel M1. D´efinition 2.2 (Support renforc´e). Pour un motif graduel M1 et un motif graduel flou M2, le support renforc´e de M1; M2 est d´efini comme :

SR (M1; M2) = max D∈L∗ X o∈D M2(o) = max D∈L∗M2(D) (2.1)

Il faut noter que la d´efinition propos´ee n’est pas sym´etrique, en raison du rˆole sp´ecifique de M2. En outre, cette d´efinition ne tient pas compte d’une covariation des degr´es d’apparte-nance `a la clause de renforcement M2avec le motif graduel M1: elle utilise un sigma-comptage sur la pr´esence de M2.

Il faut ´egalement noter que cette mesure est anti-monotone par rapport `a la taille du motif flou M2. Ainsi, si on consid`ere deux motifs graduels renforc´es : Mr1 = M1; M2 et Mr2 = M1; M3 avec M2 ⊂ M3 alors SR(Mr1) ≥ SR(Mr2). En effet, Mr1 et Mr2 sont des motifs graduels renforc´es dont le motif graduel est le mˆeme, M1, ils ont donc le mˆeme ensemble de chemins maximaux L. En outre, ∀o ∈ D tel que D ∈ L, M2(o) ≥ M3(o). En effet, Les motifs sont interpr´et´es comme une conjonction des items qu’ils contiennent. Par cons´equent, en notant M = M3\ M2, M3 = M2 ∪ M , et ∀o, M3(o) = >(M2(o), M (o)) ≤ M2(o). Ainsi, ∀D ∈ L, M3(D) ≤ M2(D).

Cette propri´et´e est notamment utilis´ee dans l’algorithme d’extraction de motifs graduels renforc´es d´ecrit `a la fin de cette section, page 51.

Pour ´eviter de prendre en compte des objets qui ne repr´esentent pas assez M2, les auteurs ont propos´e d’utiliser un sigma-comptage `a seuil, le seuil ´etant d´efini par l’utilisateur.

La mesure de support propos´ee n’est pas normalis´ee. Habituellement cette mesure varie dans l’intervalle [0, 1], comme par exemple le support graduel. Cette absence de normalisation pose probl`eme, notamment pour montrer la validit´e accrue des motifs, qui est l’interpr´etation associ´ee au renforcement. En effet, la comparaison du support renforc´e et du support graduel n’est pas r´ealisable, puisque ces deux mesures varient sur des intervalles de valeurs diff´erents. Afin d’augmenter une certaine lisibilit´e des motifs renforc´es, nous proposons deux variantes de normalisation de cette mesure d’int´erˆet dans la section 2.2.2.

Confiance renforc´ee

Le second crit`ere propos´e ´evalue la force de l’effet de renforcement par rapport au motif non renforc´e M1 : la confiance renforc´ee consiste `a calculer le rapport entre le cardinal flou selon M2 et le cardinal de chaque chemin maximal v´erifiant la contrainte de classement individuellement, et de garder le rapport ayant la valeur maximale.

D´efinition 2.3 (Confiance renforc´ee). Elle est d´efinie formellement comme : CR (M1; M2) = max

D∈L∗

M2(D)

|D| (2.2)

Il faut noter que, comme le support renforc´e, et contrairement `a la mesure de confiance classique, la confiance renforc´ee est anti-monotone par rapport `a la taille du motif M2 (Bouchon-Meunier et al., 2010). Cette propri´et´e permet d’extraire directement les motifs graduels flous renforc´es avec une confiance ´elev´ee, sup´erieure `a un seuil d´efini par l’utilisateur, au lieu de filtrer a posteriori les motifs de faible confiance apr`es leur extraction : elle permet d’extraire efficacement les motifs graduels renforc´es d’int´erˆet.

La confiance renforc´ee, tout comme le support renforc´e, poss`ede la propri´et´e de dissym´etrie en raison du rˆole sp´ecifique de M2.

Lift renforc´e

Les mˆemes auteurs notent que d’autres crit`eres de qualit´e classiques peuvent ´egalement ˆ

etre ´etendus, comme la mesure du lift (Brin et al., 1997a) : la confiance renforc´ee et le support renforc´e sont sensibles `a la fr´equence de M2 (de la mˆeme mani`ere que le support classique et la confiance sont sensibles `a la fr´equence du cons´equent du motif), alors que le lift filtr´e ne l’est pas.

D´efinition 2.4 (Lift renforc´e). Il est d´efini formellement comme :

LR (M1; M2) = max D∈L∗ M2(D) |D| M2(D) |D| = max D∈L∗ M2(D) |D| × |D| M2(D) (2.3)

2.2. ´Etude compl´ementaire des motifs graduels flous renforc´es Dans le cas des r`egles d’association, le crit`ere de lift permet de rejeter des r`egles d’asso-ciation candidates telles que les attributs du cons´equent sont observ´es dans l’ensemble des donn´ees. De mˆeme, le but du lift filtr´e est de rejeter des clauses de renforcement bas´ees sur des modalit´es telles que ∀o, M2(o) = 1. Il compare le degr´e moyen d’appartenance `a M2 des don-n´ees satisfaisant la contrainte d’ordre au degr´e moyen d’appartenance `a M2 dans l’ensemble de donn´ees.