• Aucun résultat trouvé

Chapitre 3. Modélisation comportementale 85

3.2 État de l’art sur les modèles Bayésiennes non-paramétriques

3.2.1 Positionnement sur la modélisation comportementale

3.2.3 Extensions du Processus de Dirichlet . . . 92 3.3 Modèle MLC-HDP pour des trajectoires issues de séquences vidéo . . . . 97

3.3.1 Structure de données . . . 97 3.3.2 Clustering selon trois niveaux . . . 98 3.3.3 Signatures de trajectoires . . . 100 3.3.4 Critère d’arrêt . . . 102 3.4 Simulation Multi-Agents pour la validation de l’approche . . . 103 3.4.1 Pertinence du couple SMA / MLC-HDP . . . 103 3.4.2 Génération de la vérité terrain . . . 103 3.4.3 Étude préliminaire . . . 105 3.4.4 Étude approfondie . . . 110 3.5 Conclusion . . . 118

86 Chapitre 3. Modélisation comportementale

3.1 Introduction

Les travaux présentés dans les chapitres 1 et 2 ont permis de poser les bases pour la col-lecte en masse de trajectoires 3D à partir de scènes fortement encombrées. À présent, dans ce chapitre 3, nous étudions le problème de la modélisation comportementale d’un ensemble d’individus à partir de leurs trajectoires. Nous nous intéressons en particulier aux cas où les trajectoires sont de formes variées. Ici, l’aspect intéressant est la difficulté d’identifier des ten-dances ou de s’appuyer sur des hypothèses fortes pour établir un modèle de comportement. Nous avons été tout particulièrement confronté à ce problème dans le cadre de notre applica-tion apicole, qui est, rappelons le, le fil rouge de cette thèse. En fait, à partir des connaissances métiers apportées par les biologistes, nous avons rencontré des difficultés pour identifier des indices relatifs à la dynamique des abeilles en vol qui puissent nous être utile en termes de modélisation comportementale. Et c’est finalement cette difficulté qui a motivé les travaux présentés dans ce chapitre, soit une approche de modélisation ne nécessitant pas ou peu de connaissances métiers.

Problématique Nous posons alors la problématique suivante : "comment avec un minimum d’a priori, peut-on détecter et modéliser des comportements émergents à partir d’un ensemble structuré de trajectoires non contraintes". Cette problématique semble très large, mais derrière celle-ci se cache tout de même un cadre qui nécessite une structuration des données. Nous verrons par la suite que cette structure, bien que générique représente l’apport principal en termes de connaissance au sein de notre modèle de comportement.

Littérature Pour traiter cette problématique, nous nous orientons vers des approches Bayésiennes non-paramétriques, et en particulier vers des méthodes s’appuiyant sur les pro-cessus hiérarchiques de Dirichlet (en anglais HDP pour Hierachical Dirichlet Process). Depuis quelques années, malgré un contexte formel relativement complexe et des temps de calcul qui peuvent s’avérer importants, les modèles Bayésiens non-paramétriques connaissent un succès grandissant dans plusieurs domaines tels que la génétique [Beal 2006], la finance [ Grif-fin 2006], et bien sûr, la vision par ordinateur. Pour ne citer que quelques exemples, on peut mentionner des applications liées à l’analyse de mouvements [Fox 2007], à la catégorisation de scènes [Fei-Fei 2005], à la reconnaissance d’objets [Sudderth 2005] ou à la reconnaissance d’activités humaines [Niebles 2008].

Approche proposée Dans le cadre de ce chapitre, nous mettons en œuvre une extension particulière du HDP, ayant la particularité de regrouper les données simultanément selon plusieurs niveaux obéissant à une structure hiérarchique. Nous verrons comment cette méthode peut être adaptée à notre problème de modélisation comportementale à partir de données de trajectoires.

Aujourd’hui les biologistes s’intéressent à des problèmes comme la modélisation du com-portement d’essaims ou la modélisation de l’activité de colonies à partir de vidéos (e.g. [ Schae-fer 2012]). C’est d’ailleurs ce type d’applications qui a poussé la construction de notre chaîne de traitement et d’analyse de trajectoires. À notre connaissance, il n’existe pas à ce jour de vérité terrain faisant le lien entre trajectoires et comportements d’une colonie d’insectes. Pour palier ce manque, nous proposons, une méthode originale pour valider notre approche de modélisation comportementale. Celle-ci repose sur l’utilisation de Systèmes Multi-Agents

3.2. État de l’art sur les modèles Bayésiennes non-paramétriques 87 (SMA). Ces derniers permettent de définir des modèles de simulation de colonies d’insectes (e.g. fourmis, abeilles) capables à la fois de faire émerger des comportements et d’observer les trajectoires "non contraintes" associées à chacun des individus.

3.2 État de l’art sur les modèles Bayésiennes non-paramétriques

et la modélisation comportementale

3.2.1 Positionnement dans le domaine de la modélisation comportementale

Dans la littérature, on trouve un large panel de travaux traitant du problème de la modé-lisation de comportements à partir de vidéos. Le lecteur peut se référer à l’étude [Morris 2008] qui récapitule un bon nombre d’approches existantes. On distingue les deux catégories sui-vantes :

Approches s’intéressant aux trajectoires individuelles Celles-ci exploitent des don-nées de trajectoires obtenues à partir du suivi de cibles. Les trajectoires représentent de manière éparse l’essentiel de la dynamique de la vidéo. Les approches, s’appuyant sur les tra-jectoires, s’intéressent le plus souvent aux signatures invariantes et se focalisent principalement sur l’information spatiale locale. Pour ne citer que quelques exemples, dans [Stauffer 2000], les trajectoires sont regroupées en activités à partir, entre autres, des positions, vitesses et direc-tions. Suivant le même principe, dans [Wang 2006] est utilisée une distance de Hausdorff modi-fiée pour comparer les trajectoires entre elles. On retrouve dans d’autres travaux une méthode de découpage des trajectoires en primitives [Hongeng 2001,Feldman 2004]. Celles-ci sont sou-vent obtenues à l’aide d’un classifieur entrainé sur une base de données étiquetées. On trouve aussi des travaux qui proposent de modéliser les interactions entre les cibles, par exemple avec un Modèle de Markov Caché (ou HMM pour Hidden Markov Model) [Oliver 2000] ou des champs aléatoires de Markov (ou MRF pour Markov Random Field) [Khan 2005]. Dans [ In-tille 1999], un réseau bayésien est utilisé pour analyser les stratégies d’un jeu de football, mais le suivi de cibles automatisé n’ayant pas fonctionné, les trajectoires des joueurs ont été annotées à la main.

Approches s’appuyant sur l’estimation du mouvement Celles-ci exploitent des don-nées de mouvement telles que des vecteurs calculés par une méthode de flot optique. Ces vecteurs de mouvement représentent, pour chaque image de la vidéo, la dynamique de la scène dans son ensemble de manière dense. Ces approches sont plutôt utilisées sur des scènes encombrées pour lesquelles un suivi de cibles de manière individualisée n’est pas envisageable. Ces approches s’appuient sur l’évolution du mouvement et attribuent généralement plus d’im-portance à la dimension temporelle que spatiale pour la modélisation des comportements. Se pose alors le problème de savoir quand un comportement (ou une activité) commence et se termine. Ces problèmes sont abordés dans [Zelnik-Manor 2001] (modélisation et clustering de clips vidéo à l’aide d’un histogramme multirésolution), ou [Zhong 2004] (analyse de type sujets/documents sur de la vidéo). Mais il reste à résoudre le problème de la modélisation des activités se déroulant simultanément. En réponse, des travaux proposent de découper le concept d’activité en différentes actions [Rao 2002,Gorelick 2007].

Comme nous l’avons mentionné dans l’introduction, ces dernières années ont montré un intérêt grandissant pour les modèles Bayésiens non-paramétriques, notamment dans le

do-88 Chapitre 3. Modélisation comportementale maine de la modélisation d’activités ou de comportements. Les modèles Bayésiens hiérar-chiques fournissent d’ailleurs une solution attractive pour la modélisation à partir de données chaotiques. Le HDP originalement proposé dans [Teh 2006], est une approche Bayésienne non-paramétrique permettant de clusteriser un jeu de données à différentes échelles, tout en partageant l’information au travers d’une hiérarchie. Des approches similaires ont été lar-gement utilisées par la communauté document (e.g. LDA, pour Latent Dirichlet Allocation, dans le cadre de l’analyse de sujets/documents). Récemment, ces approches HDP ont montré leur efficacité pour regrouper des données de natures différentes. Concernant la modélisation d’activités à partir de vidéos, la majorité des travaux s’appuyant sur des modèles Bayésiens non-paramétriques, quelque soit la structure de données sous-jacente, utilise des données de mouvement issues du flot optique, où les vidéos sont scindées en entités temporelles (e.g. quelques secondes) [Kuettel 2010,Wang 2009,Hospedales 2009]. Il existe relativement peu de travaux reposant sur des modèles Bayésiens non-paramétriques à partir de données de trajec-toires. Dans le domaine médical, on peut citer [Wang 2011] qui modélise des tractographies (données proches des trajectoires) à l’aide d’un modèle de mélange de HDPs.

Dans la suite de l’état de l’art, nous nous intéresserons aux modèles Bayésiens non-paramétriques, et verrons notamment comment ces derniers peuvent être utilisés pour la modélisation de comportements à partir de trajectoires.