Le processus d’extraction revisit´e

Dans le document Autour et alentours des motifs séquentiels (Page 107-115)

8.5 Perspectives

8.5.4 Le processus d’extraction revisit´e

La plupart des approches que nous avons d´efinies jusqu’`a pr´esent s’inscrivent dans le processus d’extraction traditionnel. A partir d’un ensemble de donn´ees, nous appli- quons des algorithmes d’extraction de motifs pour extraire de la connaissance. Mˆeme si l’op´erateur humain a un rˆole non n´egligeable dans ce processus (s´election des at- tributs et ´eventuellement des donn´ees, s´election de l’algorithme le plus appropri´e, ...), il faut reconnaˆıtre que l’humain en tant qu’expert n’intervient qu’en bout de chaˆıne pour ´evaluer si la connaissance extraite est d’une part juste par rapport au domaine et d’autre part utile pour une prise de d´ecision. L’un des probl`emes de ce processus est que d’une part il faut attendre longtemps pour obtenir de la connaissance (e.g., dans le cas des motifs s´equentiels, il est n´ecessaire de parcourir tout l’espace de recherche si la fonction d’anti monotonie ne permet pas d’´elaguer des candidats) et que d’autre part les connaissances extraites peuvent ˆetre en contradiction pour diverses raisons avec la connaissance du domaine. L’une de nos perspectives est justement d’int´egrer la connaissance du domaine plus tˆot dans le cœur du processus.

Consid´erons par exemple un expert, il est `a mˆeme de savoir d`es le d´epart quelles sont les contraintes qu’il souhaite avoir sur les r´esultats obtenus. Pour cela, il lui suffit, par exemple pour les motifs, de restreindre `a l’avance les motifs qu’il souhaite obtenir. Une approche triviale consiste bien sˆur `a extraire tous les motifs et `a ensuite appliquer une ´etape de post traitement pour donner `a l’expert les r´esultats d´esir´es. Cette approche est malheureusement peu efficace dans la mesure o`u il est indispensable d’attendre l’extraction de tous les motifs (et donc de g´en´erer des motifs inutiles) avant de pouvoir rechercher ceux qui sont int´eressants. L’autre difficult´e est qu’il est ´egalement difficile de savoir quel type de post traitement r´ealiser. Il devient donc indispensable d’int´egrer ces contraintes au plus tˆot dans les algorithmes de fouille. Au cours de nos travaux, nous avons d´ej`a analys´e certaines contraintes de type temporelles et avons prouv´e qu’une telle approche ´etait tr`es efficace. Il serait important de poursuivre ces travaux pour int´egrer d’autres types de contraintes sp´ecifi´ees par l’utilisateur. Consid´erons, `a pr´esent une connaissance du domaine d´ecrite sous la forme d’une ontologie. Par exemple, dans le cas d’un site Web, nous pouvons rattacher `a une URL les concepts associ´es dans l’ontologie et ainsi non seulement nous pouvons obtenir une connaissance plus riche (il ne s’agit plus de pages Web mais de concepts associ´es `a un ensemble de pages) mais nous pouvons ´elaguer des espaces de recherche qui sont en contradiction avec la connaissance du domaine.


