• Aucun résultat trouvé

La première contribution de cette thèse est le développement d’une nouvelle méthode de découverte d’activité (AD). Cette approche est nécessaire, car la quatrième limitation rejetant l’étiquetage des données d’apprentissage présentées précédemment est incom-patible avec les méthodes de découverte déjà existantes.

Le principal avantage de la méthode développée est sa portabilité. En effet, elle est applicable dans tous les appartements équipés, quelleque soit la pathologie de l’habitant. Cette approche modélise chaque activité à surveiller par un automate à état prob-abiliste (PFA). La perte d’information liée au rejet du savoir des activités réalisées pendant la période d’apprentissage est compensée par l’ajout d’un savoir expert spéci-fique donnant la décomposition hiérarchique des activités en actions puis en événements capteurs.

Le modèle de chaque activité est généré en trois étapes:

1. La structure du modèle est automatiquement créée à partir de la décomposition experte;

2. La base de données d’apprentissage est analysée en faisant glisser une fenêtre d’observation composée d’un nombre fixe d’événements et des indicateurs de fréquences pertinentes sont calculés;

3. Les probabilités de nos modèles sont calculées en utilisant les indicateurs de fréquence calculés à l’étape 2.

Les modèles générés par cette découverte d’activités sont ensuite utilisés comment entrée pour la reconnaissance d’activité.

BIBLIOGRAPHY

Reconnaissance d’activité

La seconde contribution principale de cette thèse est le développement d’une nouvelle méthode de reconnaissance d’activité (AR). Cette approche consiste à détecter l’activité réalisée par un habitant surveillé pendant qu’il la réalise. Pour cela, le groupe {habitant + maison équipée} est considéré comme un générateur d’événements et les activités à reconnaître sont modélisées par des PFAs. Dans la littérature, il existe plusieurs façons de reconnaître quel PFA a le plus probablement généré une séquence si les différents PFAs comparés sont liés aux mêmes événements. Cependant, si ceux-ci ne partagent pas les mêmes événements, les méthodes sont inutilisables. Or, les modèles que nous avons découverts précédemment ne partagent pas les mêmes événements, car les activités ne sont pas systématiquement liées aux mêmes capteurs. C’est pourquoi la nouvelle méthode de reconnaissance d’activité présentée dans cette thèse est nécessaire.

Un point commun entre les méthodes existantes (Van Kasteren et al., 2008; Kel-lokumpu et al.,2005) et la nôtre est la définition et l’utilisation d’une distance. En effet, dans ces méthodes comme dans la nôtre, le calcul d’une distance est utilisé pour estimer quelle activité a le plus de chance d’être réalisée au vu des observations.

Dans le but d’améliorer les méthodes de reconnaissance existantes et de les adapter à notre cas, plusieurs opérations telles que l’utilisation de fonctions de projections et la création de langage doivent être considérées. La projection aide à supprimer le bruit lié à d’autres activités ou à des capteurs non pertinents en ne gardant que les événements utiles à la détection de chaque activité. La génération d’un langage nous permet de con-sidérer les événements observés comme une succession de plusieurs groupes d’événements plus ou moins indépendants.

Les distances existantes dans la littérature doivent être adaptées pour donner des résultats exploitables après les différentes projections et créations de langage. C’est pourquoi, dans cette thèse, une nouvelle distance : la vraisemblance normalisée, basée sur la définition de la perplexité usuellement utilisée pour calculer la distance entre un modèle et un langage. Le calcul de cette nouvelle distance posant des problèmes de complexité calculatoire, deux algorithmes ont été développés pour rendre ce calcul faisable dans un temps acceptable (moins d’une seconde).

Conclusion

Dans cette thèse, une approche globale pour découvrir et reconnaître les activités de tous les jours d’un habitant dans une maison équipée est proposée. Ainsi, une procé-dure pour modéliser les activités par des automates finis probabilistes est développée en utilisant l’enregistrement les événements générés par l’habitant pendant une période d’essai et la décomposition hiérarchique des activités à modéliser en actions liées aux différents événements de capteurs. Puis, une méthode de découverte d’activité basée sur une nouvelle distance appelée perplexité normalisée est présentée. De plus, il est prouvé que cette nouvelle distance peut être efficacement calculée sans aucune perte de performance en utilisant des algorithmes développés dans cette thèse.

Finalement, toutes ces méthodes sont appliquées sur un vrai appartement de test équipé.

Pour prolonger ces travaux, il pourrait être envisagé de traiter le cas de plusieurs habitants vivant dans une maison équipée. Cela est envisageable en relaxant l’hypothèse de n’utiliser que des capteurs binaires environnementaux (en utilisant des capteurs RFID par exemple).

BIBLIOGRAPHY

L’utilisation des modèles générés et des activités reconnues peut être envisagée afin de détecter de potentielles déviations d’habitudes de l’habitant pouvant être symptoma-tique de certaines pathologies.

Enfin, il peut être envisagé d’identifier automatiquement des activités non listées comme "à surveiller" par le corps médical afin d’améliorer notre reconnaissance d’activité. En effet, l’ajout automatique de ce genre d’activité non sensible peut faciliter la recon-naissance en évitant de potentiels faux positifs.

Appendix

A

Proofs

Notations

In order to prove Proposition 4.1, the following notation is defined: • ei ∈ΣAk;

• eeq∈ΣAk such as eeqT

ql,qm∈QAkEquql,qm(ei); • {eeq}ei is the set of all possible eeq associated to ei; • esup∈ΣAk such as esupT

ql,qm∈QAkGeqql,qm(ei) and esup/ T

ql,qm∈QAkEquql,qm(ei); • {esup}ei is the set of all possible esup associated to ei.

Thus, by definition it holds:

{eeq}ei+ {esup}ei = \

ql,qm∈QAk

Geqql,qm(ei).

Proposition 4.1 (Chapter 4, Page 89)

Let Ak =< QAk,ΣAk, δAk, IAk, FAk, PAk > be a PFA and Ar

k =< QAk,Σr

Ak, δr

Ak, IAk, FAk, Pr

Ak > be the reduced PFA obtained by the reduction procedure Ak → Ar k. Then ∀w ∈ Σ Ak of length |w| it holds: max u∈Σ|w|Ar k [P (u|Ak)] = max v∈Σ|w| Ak [P (v|Ak)].

Proof. In equation (4.26), only event ei with {esup}ei = ∅ are kept in the reduced PFA Ar

k. We prove that the rejection of events having {esup}ei 6= ∅ does not change the value of the maximum likelihood.

Let w = w 1...w

k...ei...w |w|−1w

|w| be a sequence of events and ei is one of the events in the sequence.

Let w = w 1...w

k...esup...w |w|−1w

|w| be a sequence of events that equals sequence w but for event ei, which is changed by esup∈ {esup}ei.

At this point, two case exist ∀q − l, q(m ∈ QAk: • P (ql, esup, qm) = P (ql, ei, qm) if esup∈ Equql,qm(ei) • P (ql, esup, qm) > P (ql, ei, qm) if esup∈ Equ/ ql,qm(ei)

Thus, for each path θ = (s0, w

1, s1...sj−1, ei, sj, ...w|w|, s|w|) generating w, it exists a path θ = (s0, w

Appendix A. Proofs

• if esup∈ Equsj−1,sj(ei) then I(s0) × |w| Y h=1 P(sh−1, wh, sh) = I(s0) × |w| Y h=1 P(sh−1, vh, sh) → P(θ|Ak) = P (θ|Ak)

• else if esup∈ Equ/ sj−1,sj(ei) then I(s0) × |w| Y h=1 P(sh−1, wh, sh) < I(s0) × |w| Y h=1 P(sh−1, vh, sh) → P(θ|Ak) < P (θ|Ak) Since esup/ T

ql,qm∈QAkEquql,qm(ei), the case esup ∈ Equ/ sj−1,sj(ei) occurs at least one time, thus: P(v|Ak) = X θ′∈ΘAk(v) P(θ|Ak) > P (w|Ak) = X θ∈ΘAk(w)P (θ|Ak) (A.1) Hence, equation (A.1) proves that, for all sequences w including an event ei with {esup}ei 6= ∅, it exists another sequence v having the same length with a greater likeli-hood. Therefore, event ei with {esup}ei 6= ∅ can be excluded for the maximum likelihood computation.

By the same way, we can prove that the likelihood does not change by changing an event ei by another event eeq ∈ {eeq}ei, then only one of them can be kept in Ar

k. Consequently, it holds max

u∈Σ|w|Ar

k

[P (u|Ak)] = max

v∈Σ|w| Ak

[P (v|Ak)] and the thesis is proved.

Proposition 4.2 (Chapter 4, Page 89)

Let Ak =< QAk,ΣAk, δAk, IAk, FAk, PAk > be a PFA and Ar

k =< QAk,Σr

Ak, δr

Ak, IAk, FAk, Pr

Ak > be the reduced PFA obtained by the reduction procedure Ak → Ar

k. Then the computational complexity of the maximum classical likelihood is the following:

CM = O2[card(QAk)−1]|w|

× card(QAk)2× |w| 

.

Proof. We recall that the following properties are direct consequences of equation (4.26): Property 1: If event ei is kept using equation (4.26), it exists a set of n1 origin and destination states Cn1

Ak = n(ql1, qm1)...(qlp, qmp)...(qln1, qmn1)o such that ∀ej ∈ ΣAk, ∀p ∈ [1, n1] it holds:

Ph(qlp, ei, qmp)i≥ P h(qlp, ej, qmp)i.

Furthermore, according to equation (3.9), ˜N(ei|ql → qm) and P (ql, ei, qm) do not depend on ql. Thus, Geqql,qm(ei) and Equql,qm(ei) depend only on ei and qm. It is possible to rewrite Property 1 as follow:

Property 2: If event ei is kept using equation (4.26), it exists a set of n2 destination states Dn2

Ak =n(qm1...qmp...qmn1

o

such that ∀ej ∈ΣAk, ∀ql∈ QAk, ∀p ∈[1, n2] it holds: P h(ql, ei, qmp)i≥ P h(ql, ej, qmp)i.

Moreover, for each possible set Dn2

Ak of destination states, only one event is kept by the equivalent events deletion performed by step 2 of the reduction procedure Ak→ Ar

k. Thus, the number of kept events NAk = card(Σr

Ak) is bounded by the number of possible sets Dn2

Ak that is necessary to evaluate.

For a PFA with m = card(QAk) states, sets composed with n2[1, m−1] destination states can be created. For each n2, it exists m −1

n !

different possible sets Dn2

Ak. Thus, we have: NAkm−1X i=1 m −1 i ! = 2m−11.

Thus, according to equation (4.22), the complexity of the maximum classical likeli-hood after the reduction procedure Ak → Ar

k is the following: CM = OcardAr

k)|w| × card(QAk)2× |w|. and thus:

CM = Ocard(2[card(QAk)−1]|w|× card(QAk)2× |w| 

. This proves Proposition 4.2.

Appendix

Documents relatifs