• Aucun résultat trouvé

III.3 INTEGRATIONDESASPECTSD’INTERACTIONHOMME-MACHINEDANSLEPROCESSUS ... 67 III.4 INTERPRETATIONETEVALUATIONDESCONNAISSANCESEXTRAITES ... 68 III.4.1 EVALUATION OBJECTIVE : UNE ANALYSE D’UN POINT DE VUE STATISTIQUE... 69 III.4.2 EVALUATION SEMANTIQUE : INTERPRETATION ET VISUALISATION DES RESULTATS ... 72 III.4.3 EVALUATION SUBJECTIVE : RECHERCHE DES TYPES SPECIFIQUES DE REGLES ... 82 III.5 BILAN ... 87

Au cours de ces dernières années, les efforts entrepris pour tenter de faire des progrès sur les processus d’extraction de règles d’association se sont concentrés sur l’amélioration de la performance algorithmique (notamment en termes de temps d’exécution et de mémoire utilisée) ; la phase de post-traitement du processus est souvent considérée comme avoir été particulièrement négligée (Wu et al., 2003).

Bien que l’extraction de règles d’association soit une technique de data mining largement utilisée, elle présente quelques difficultés : en particulier, un grand nombre de règles peuvent être créées, et toutes les règles découvertes peuvent ne pas être pertinentes pour supporter la prise de décision dans un domaine spécifique. Dans ce contexte, la phase de post-traitement devient nécessaire dans la procédure d’évaluation de l’utilité et de la fiabilité des résultats obtenus (Giudici, 2003), d’où l’importance d’une collaboration adéquate et d’un partage approprié de connaissances entre les différents experts potentiellement concernés.

Paula Andrea Potes Ruiz

64

Actuellement, l’interprétation et l’évaluation des résultats obtenus prennent donc de plus en plus d’importance dans les entreprises menant ce type d’action, afin de trouver des motifs ou des modèles potentiellement intéressants et utiles pour chaque problème spécifique. En effet, peu de systèmes de data mining développés dans les entreprises sont efficacement reliés avec les domaines d’application en tenant compte de leurs contraintes particulières (Pechenizkiy et al., 2005). Dans (Wu et al., 2003), les auteurs ont eux aussi souligné ce point : « we see many papers proposing incremental

refinements in association rules algorithms, but very few papers describing how the discovered association rules are used ».

C’est pour cette raison que nous nous concentrons dans ce chapitre sur l’analyse et l’évaluation des résultats obtenus plutôt que sur l’optimisation de l’efficacité des algorithmes d’extraction existants. Ce chapitre est dédié à la phase de post-traitement du processus d’ECD, liée à l’exploitation de la base de REx-ECD, et plus particulièrement de la base de règles extraites.

Par la suite, nous décrivons de manière progressive comment les règles découvertes peuvent être interprétées et évaluées par les utilisateurs. Plus particulièrement, nous proposons une approche conceptuelle structurée, pratique et interactive, afin d’interpréter, visualiser et filtrer les règles extraites, en suivant une méthodologie guidée qui vise à favoriser la collaboration entre experts de deux domaines différents : un expert d’extraction de connaissances (ou expert de data mining) et un expert métier, spécialiste du domaine d’application.

III.1 ROLE DE L’EXPERT DU DOMAINE DANS LE PROCESSUS D’ECD

En pratique, il est difficile de trouver un expert en extraction de connaissances (expert d’ECD) qui soit également un expert dans un domaine industriel considéré.

Les activités d’extraction de connaissances dans la démarche REx-ECD devraient donc être gérées par l’expert d’ECD mais centrées sur les besoins et les intérêts de l’utilisateur final, ici l’expert du domaine industriel. L’expert du domaine est pour nous la personne qui connaît le terrain et qui est responsable de la prise de décision dans l’entreprise. En revanche, l’expert d’ECD développe et améliore les techniques de data mining afin d’assurer une bonne alimentation en connaissances du système d’aide à la décision. De ce fait, une participation significative de l’expert du domaine industriel est suggérée dans le processus d’ECD.

Les connaissances de l’expert du domaine peuvent par exemple guider ou aider à la sélection des caractéristiques singulières et des modèles les plus significatifs, à la prise en compte des facteurs propres du domaine dans la modélisation, à la vérification des hypothèses du domaine, à la conception des mesures d’intérêt en incorporant des préoccupations propres de l’entreprise cible, et à l’évaluation des résultats issus du processus de data mining (Cao & Zhang, 2008).

Dans de nombreuses industries basées sur la connaissance, le manque de recherche sur les techniques d’ECD liées à des domaines d’application spécifiques a considérablement affecté l’utilité des activités de data mining (Pechenizkiy et al., 2008) (Wang & Wang, 2009), d’où notre intérêt pour la prise en compte des connaissances des experts du domaine, surtout lors de l’interprétation et de

l’évaluation des résultats obtenus, qui permettent la validation des éléments d’intérêt qui vont supporter la prise de décision dans l’entreprise.

Dans ce contexte d’évaluation, comment spécifier les caractéristiques intéressantes d’un modèle extrait ? Quatre notions peuvent aider à caractériser l’intérêt des modèles extraits (Marinica, 2010), notamment ici des règles d’association : la validité, la nouveauté, l’utilité et la compréhension par les utilisateurs. Les modèles extraits doivent en effet :

- valider l’ensemble des données analysées, et dans une certaine mesure de nouvelles données ; - apporter de nouvelles connaissances à l’utilisateur ;

- être utiles afin de supporter la prise de décision ; et - être facilement compréhensibles par cet utilisateur final.

Dans notre travail, nous nous concentrons plus particulièrement sur les deux dernières notions d’intérêt abordées, i.e. l’utilité et la compréhension par l’utilisateur expert du domaine des connaissances extraites. Ces notions sont associées au concept d’interactivité dans notre système REx-ECD, en insistant surtout sur le rôle indispensable des acteurs du domaine dans le processus (Ben Ayed et al., 2010) en vue d’adapter les techniques d’extraction de connaissances aux besoins industriels.

III.2 INTERACTION ET COOPERATION ENTRE L’EXPERT DU