• Aucun résultat trouvé

7.1 Applications du problème d’extraction de modèles de processus partiels

7.1.3 Étude comportementale à partir de capteurs

Le process mining a récemment étendu ses applications, initialement tournées vers l’analyse de processus métier, à d’autres domaines allant de l’analyse logicielle [Leemans

and van der Aalst, 2015], à l’analyse de comportements humains [Leotta et al., 2015,Sztyler

et al., 2015,Tax et al., 2016a,Tax et al., 2016c]. Les applications de techniques de process

mining pour l’analyse de comportements humains sont majoritairement axées autour de la génération de modèle sans sémantique formelle [Leotta et al., 2015,Sztyler et al., 2015], les techniques utilisant des notations avec une sémantique formelle nécessitent une phase de pré-processing du log importante pour permettre l’extraction de modèles représentatifs

[Tax et al., 2016a,Tax et al., 2016c]. Dans cette étude de cas, nous nous concentrons sur

l’analyse de fragments de comportements humains en utilisant des contraintes permettant d’extraire des modèles avec une sémantique formelle sans avoir recours à une phase de pre-processing importante.

[Tapia et al., 2004] ont collecté des données issues de capteurs domotiques ins-

tallés dans deux maisons, dans l’optique d’analyser les activités de la vie quotidienne. (ADL [Katz, 1983]). Chaque trace contient une journée de données collectées, dans les- quels les events représentent le déclenchement d’un capteur, l’activité exécutée ayant le label du capteur déclenché. Sur les deux event logs collectés, M IT A et M IT B, notre étude porte sur M IT A. Ce log est composé de 72 activités distinctes et 16 traces d’une longueur moyenne de 173 events, la trace la plus petite et la trace la plus longue ayant respectivement 71 et 482 events. activity time Exhaust fan 04-04-2003 07 :23 :14 Kitchen drawer 3 04-04-2003 11 :07 :18 Kitchen drawer 3 04-04-2003 13 :48 :39 Kitchen drawer 3 04-04-2003 14 :52 :46 Kitchen drawer 3 04-04-2003 17 :49 :08 Kitchen drawer 3 04-04-2003 17 :49 :15 Kitchen drawer 3 04-04-2003 17 :52 :13

Tableau 7.1 – Les events exhaust fan et kitchen drawer 3 dans la trace du 4 avril 2003 extrait du log M IT A.

Chapitre 7

Toilet Flush: 61/79

Sink faucet - hot: 156/169 (1) Exhaust Fan: 28/34 Kitchen drawer 3: 98/110 (2) Freezer: 28/34 Bathroom cabinet 1 67/85 (3) (a) Kitchen Drawer 1: 12/14 Kitchen Drawer 2: 4/6 Kitchen Cabinet 1: 16/18 (1) Washing Machine: 24/48 Laundry Dryer24/41 (2) Medicine cabinet: 74/194

Sink faucet - cold: 98/127

(3)

(b)

Figure 7.3 – (a) Les trois LPMs les plus fréquents, et (b) les trois HU-LPMs avec le plus haut profit extraits en définissant des contraintes de temps.

Nous présentons dans la Figure 7.3a les 3 meilleurs LPMs extraits par la technique classique de LPM Discovery. Le premier LPM montre que sur 79 fois où la chasse d’eau a été tirée (toilet flushes), 61 sont suivies le même jour par de l’eau chaude s’écoulant du robinet de l’évier (sink faucet - hot ). Il montre aussi que sur les 169 fois où quelqu’un s’est servi de l’eau chaude depuis le robinet de l’évier, 156 étaient à la suite d’un tirage de chasse d’eau.

Le second LPM montre que sur les 34 déclenchements du ventilateur d’extraction (exhaust fan), 28 sont suivis d’un comportement répétitif lié à d’ouverture du 3e tiroir de

la cuisine (kitchen drawer 3 ). En moyenne, chaque déclenchement du ventilateur est suivi de 3,5 (98/28) ouvertures de tiroir le même jour.

Le troisième LPM montre que sur 34 ouvertures du congélateur (freezer ), 28 sont suivies de l’ouverture du premier meuble de la salle de bain (Bathroom cabinet 1 ).

Alors que le premier LPM semble avoir du sens, étant donné que les personnes se lavent habituellement les mains après être allées aux toilettes, les comportements décrits par les deux autres LPMs ne semblent pas avoir de corrélations logiques. Nous présentons dans le Tableau 7.1 les events exhaust fan et kitchen drawer 3 sur une même journée du log M IT A. Pris ensemble, ces events constituent un γ-segment rejouable dans le deuxième LPM. Cependant, l’intervalle de temps entre les events semble être assez important pour qu’il n’y ait aucune relation entre l’event exhaust fan à 07 :23 et l’event kitchen drawer 3 à 11 :07.

Nous avons soulevé dans la première partie de ce manuscrit le problème relatif aux events corrélés mais indépendants car trop espacés dans le temps. Nous pouvons pallier ce problème en définissant un intervalle de temps que deux events consécutifs doivent respecter ; et une fenêtre de temps maximum dans laquelle un γ-fragment doit apparaître. Nous présentons dans la Figure 7.3b les trois meilleurs HU-LPMs extraits en définissant une contrainte de profit exigeant un temps de 2 minutes entre l’exécution de deux activités, et une durée maximum d’exécution pour un γ-fragment de 5 minutes.

Le premier HU-LPMs montre que les events kitchen drawer 1 et kitchen drawer 2 sont presque toujours suivis de l’event kitchen cabinet 1 dans les 2 minutes. Lorsque nous

Section 7.1

regardons de plus près les γ-segments rejouables dans ce HU-LPM, nous constatons que ces events se produisent entre 17 :00 et 19 :00. Le HU-LPM semble décrire le comportement de quelqu’un faisant la cuisine, étant donné qu’il y a 16 γ-segments pour 16 traces (et donc 16 jours). Par conséquent, ce HU-LPM peut être utilisé comme un "détecteur" du comportement "faire la cuisine".

Le deuxième HU-LPM montre que la moitié des events relatifs à la machine à laver (washing machine) sont suivis dans les deux minutes d’events liés au sèche-linge (laundry dryer ). Cette moitié représente les fois où la machine à laver a été ouverte dans l’optique de mettre le linge dans le sèche-linge ; l’autre moitié pouvant être les fois où la machine a été ouverte dans le but d’y mettre du linge à laver.

Le troisième HU-LPM montre que l’ouverture de l’armoire à pharmacie (medecine ca- binet ) est suivie dans presque la moitié des cas par quelqu’un se servant de l’eau froide au robinet de l’évier (sink faucet - cold ), certains events medecine cabinet étant suivis d’une séquence d’events sing faucet - cold. Bien que les deuxième et troisième HU-LPMs décrivent des comportements routiniers, les trois HU-LPMs extraits montrent que la dé- finition de contraintes de temps permet d’extraire des fragments de comportements dont les events sont corrélés les uns aux autres.

L’extraction de LPM est un problème combinatoire qui dépend en partie du nombre d’activités dans le log. Par conséquent, procéder à l’extraction de LPMs à partir du log M IT A avec l’ensemble des 72 activités n’est pas possible. Dans [Tax et al., 2016d], une approche est proposée pour permettre l’extraction de LPMs à partir de ce type d’event log. Cette approche choisit de manière heuristique d’utiliser des sous-ensembles d’activités pour combiner les résultats a posteriori. En utilisant cette méthode, extraire l’ensemble des LPMs sans contrainte de temps prend 5 minutes sur une machine équipée d’un processeur Intel i7 2,4GHz et 16Go de RAM L’extraction des HU-LPMs sur cet event log prend moins d’une minute, sur une même machine ; montrant qu’en plus d’extraire des LPMs plus intéressants, la définition de contraintes et fonctions de profit permet aussi dans certains cas de réduire les temps d’exécution.