• Aucun résultat trouvé

Nous constatons à partir de notre revue de la littérature, que la plupart des ap- proches souffrent de problèmes d’annotation de données et de bruit. En effet, les événements sont généralement caractérisés par la quantité du bruit véhiculé, l’am- biguïté et l’incertitude. Dans les approches basées sur les événements, l’utilisation directe de ces événements nécessite la prise en compte de tous ces problèmes lors du processus de la reconnaissance d’activités. En outre, plusieurs approches ne prennent pas en considération les informations temporelles, ce qui limite le processus de la reconnaissance à des activités simples. À cet effet l’analyse des séquences est intro- duite comme une nouvelle variante afin de surmonter quelques problèmes comme le bruit et les aspects temporels des activités, et de permettre d’identifier des patrons significatifs de chaque activité. De plus, la détection des patrons significatifs dans les séquences permettra non seulement de reconnaître les activités, mais aussi de caracté- riser les comportements des personnes, ce qui constitue un grand pas vers l’étude du profil comportemental de la personne. Par conséquent, et vu les avantages de l’analyse des séquences, nous pensons que l’analyse des séquences est une excellente piste qui mérite d’être explorée dans le but de faire face aux problèmes que nous venons de citer.

1.6

Positionnement de notre travail par rapport

aux travaux existants

Dans cette thèse, et comparativement aux approches existantes, nous proposons une nouvelle approche à la fois pour la découverte et la reconnaissance des activités. Comme nous avons pu le constater à travers l’état de l’art, il existe peu de travaux qui traitent le problème de la découverte des activités. Dans ce contexte, l’approche que nous proposons définit un cadre théorique innovant qui tire ses bases à partir de deux fameuses approches de forage de données : 1) le forage de patrons fréquents, et 2) l’allocation Dirichlet latente (LDA). La combinaison de ces approches permet de découvrir les activités, de les reconnaître, et aussi d’exploiter les relations entre les patrons fréquents et les activités. Ces relations jouent un rôle très important dans le développement des algorithmes de prédiction en se basant sur l’observation

1.6. Positionnement de notre travail par rapport aux travaux existants

des patrons et tenant en compte les relations probabilistes qui lient les patrons aux activités.

En outre, nous avons aussi pu constater que les travaux existants ne sont pas dotés de modèles mathématiques d’activités qui vont servir dans le processus de la reconnaissance d’activités. L’apport de notre approche dans ce contexte est de construire les modèles d’activités de façon automatique. Ces modèles sont construits à l’aide du modèle LDA, et sont représentés sous forme de relations probabilistes entre les patrons fréquents et les activités auxquelles ils appartiennent. Contrairement aux approches existantes supervisées dans lesquelles les modèles d’activités sont construits en se basant sur des algorithmes de forage de données comme le modèle de Bayes naïf, SVM, arbre de décision, HMM, réseaux Bayésiens, etc, notre approche permet de construire les modèles d’activités de façon non supervisée et ne requiert pas la tâche d’annotation des données. Par conséquent, notre travail s’attaque à une problématique double dans laquelle deux problèmes importants sont résolus : 1) la découverte et la construction des modèles d’activités, et 2) la reconnaissance des activités.

Un autre apport important de notre approche est d’extraire les patrons significatifs pour chaque activité. En effet, chaque activité est caractérisée par un certain nombre de patrons. Cependant, ces patrons ne sont pas tous significatifs pour cette activité. Par conséquent, l’un des défis majeurs de notre approche est la découverte des patrons significatifs pour chaque activité. En fait, les patrons significatifs dans une activité possèdent des probabilités très élevées par rapport aux autres patrons. Le potentiel de découvrir ces patrons réside dans le fait que ces patrons peuvent être utilisés pour distinguer les activités, et ils peuvent aussi être considérés comme étant des attributs (features) dans un système de classification des activités. Cela constitue un problème nouveau qui n’a jamais été soulevé par les approches existantes basées sur l’analyse des séquences.

Chapitre 2

Découverte et reconnaissance des

activités par la combinaison des

patrons fréquents séquentiels et

l’allocation Dirichlet latente (LDA)

2.1

Introduction

À travers notre revue de la littérature, nous avons constaté que la vaste majorité des approches souffrent du problème d’annotation des données et du problème de bruit dans les données. L’objectif de ce chapitre est de proposer une approche permettant de découvrir et de reconnaître des activités en palliant aux limites rencontrées dans les approches existantes, en s’inspirant des algorithmes de forage de données textuelles.

Notre décision d’opter pour un modèle statistique non supervisé (LDA) combiné avec le principe de patrons fréquents est motivée par deux raisons principales :

1. le modèle LDA est un modèle non supervisé. Par conséquent, la découverte des

activités potentielles1 peut être effectuée sans le besoin des données annotées.

Cela constitue une contribution importante de notre travail.

1. Une activité potentielle est une activité découverte mais qui n’est pas encore validée comme activité réelle