• Aucun résultat trouvé

4.5 Un aperçu de la classification d’activités dans les habitats intelligents avec des méthodes en ligne

4.5.4 Discussion

Afin de pouvoir réaliser une reconnaissance en ligne, des méthodes séquentielles (HMM, CRF, MLN) ont été utilisées en utilisant les données de manière causale (donc en ayant uniquement connaissance du passé). De plus, pour se mettre dans des conditions réalistes, nous avons utilisé la classe « Autre » (KR I S H N A Net al.,2014) et donc pris en compte les transitions entre activités. Cela différencie ces travaux de nombreux autres qui sont faits « hors lignes »(FL E U R Y, VA C H E Ret NO U R Y,2010)(NA Z E R F A R D et al.,2010; VE L I K,2014). Cela comprend aussi mes travaux de thèses,

pendant laquelle j’ai acquis l’ensemble des données HIS, et sur lesquels les SVMs donnaient de bien meilleurs résultats (la classe autre n’était pas prise en compte et les données ont été réindexées et retraitées en partie). En hors-ligne, il est également possible d’appliquer des prétraitements sur l’ensemble des données d’apprentissage, ce qui n’est pas le cas dans ces travaux.

FI G U R E4.5 – Précision vs. pourcentage de classe « Autre » dans l’ensemble des données pour CRF et RF sur la base de données HIS.

Les résultats montrent que les méthodes séquentielles (CRF, MLN, HMM) sont supérieures mais pas largement au- dessus des méthodes non séquentielles (SVM, RF), statistiquement parlant. Cela peut s’expliquer par deux raisons. La première est que la reconnaissance d’activités est fortement dépendante de la localisation de la personne. La présence de cette information seule dans la fenêtre permet une bonne reconnaissance dans les modèles basés sur des instances. En seconde raison, la manière dont nous avons réalisé les fenêtres temporelles (inspirée de mes travaux de thèse) permet de mettre un peu d’historique dans celle-ci. Par exemple, le temps passé par la personne dans une pièce s’accumule d’une fenêtre à une autre si la personne ne change pas de pièce.

Cependant, nous pouvons souligner qu’un modèle séquentiel est toujours classé en premier dans toutes les conditions (que ce soit CRF ou HMM). CRF est généralement le meilleur algorithme pour faire de l’apprentissage en ligne d’activités à partir de capteurs non visuels simples. Il avait déjà été montré que CRF donnait de bons résultats de classification (VA I Let al.,2007; T. v. KA S T E R E Net al.,2010) mais celui-ci n’avait jamais été confronté à des modèles non séquentiels. Les différences de performances entre CRF et HMM/MLN peuvent s’expliquer par leur nature discriminative ou générative. CRF est entrainé en maximisant la vraisemblance sur l’ensemble entier des données alors que HMM et MLN vont maximiser la vraisemblance par classe. CRF biaise donc son apprentissage vers les classes dominantes comme le font les modèles statistiques non séquentiels (SVM, RF). HMM et MLN au contraire vont modéliser indépendamment les classes et ceci explique pourquoi les performances sur certaines classes moins représentées sont meilleures dans ce cas.

Le fait de prendre en compte la classe « Autre » réduit les performances de quasiment tous les modèles. Cependant, les approches génératives sont les plus touchées. En effet, MLN et HMM montrent la plus forte diminution des performances du fait de leur incapacité à modéliser cette classe. De plus, dans notre cas, comme rappelé en introduction, cette classe « Autre » contient surtout des éléments de transitions et donc des éléments qui pourraient être dans les

différentes classes, d’où le fait qu’elle soit difficile à modéliser. Ces effets sont encore plus notables pour le HIS où les données de cette classe représentent 18% du corpus. Les SVMs par exemple ont du mal à trouver des exemples cohérents sans exclure d’autres exemples d’autres classes, mais trop similaires. Les CRFs eux arrivent à capturer des dépendances complexes dans le vecteur d’attribut pour faire une meilleure classification de cette classe.

Même si les deux ensembles de données considérés sont comparables et de même nature, ils n’ont ni été acquis avec les mêmes types de participants ni dans le même habitat. La plus grosse différence réside dans la quantité d’information disponible dans chacun des habitats. Le HIS est bien moins informatif (beaucoup moins de capteurs) que Sweet-home. Ceci explique pourquoi les modèles non séquentiels ont été meilleurs sur Sweet-Home en profitant de ces informations. Dans le HIS au contraire vu le faible nombre d’informations les modèles non séquentiels ont plus de mal que les modèles séquentiels à construire des classifieurs cohérents et performants. Pour le HIS, les modèles séquentiels ont bénéficié de l’historique dans le cas de HMM et de CRF et pour MLN il a bénéficié de sa forte expressivité.

Pour la classe particulière Téléphone, MLN a été capable de comprendre que lorsque quelqu’un parle beaucoup dans une pièce où il y a le téléphone, alors il est très probable qu’il/elle soit en train d’effectuer cette activité (en confirmant l’hypothèse d’une seule personne dans l’habitat et donc peu d’exemple avec beaucoup de paroles sans cette activité en cours). Malgré les relativement basses performances de MLN, ce modèle semble être un bon candidat pour représenter également des activités de la vie quotidienne avec des objets (iADL (LA W T O Net al.,1969)), car il est capable d’exprimer une relation sémantique complexe que les modèles purement probabilistes ne peuvent considérer.

Lorsque nous analysons les attributs retenus par la sélection, nous nous apercevons que les attributs les plus significatifs sont la localisation et le nombre de sons/paroles. Cela peut expliquer l’importance du son dans la décision prise au final pour la classification. Même si les activités étaient principalement localisées dans un nombre restreint de pièces pour chacune, afin de retirer toute ambiguïté le son était souvent utilisé. L’agitation totale, qui était dépendante également du nombre de sons, était très informative pour différencier par exemple repas et nettoyage. Dans ce cas, l’agitation produite par les capteurs de présences et les contacteurs de porte était similaire, le son était donc le moyen de différencier les activités. Idem pour lecture et téléphone toutes deux réalisées dans le bureau. De plus, dans le modèle MLN, le poids des règles portant sur des attributs de sons était en général élevé.