4.3 Gestion de données globales
5.1.1 Sciences comportementales
5.1.3 Contexte industriel . . . 115 5.1.4 Évaluation des besoins pour l’analyse comportementale. . . 116
5.2 Méthodes d’analyse comportementale . . . 117
5.2.1 Analyse de l’utilisation de l’espace . . . 118 5.2.2 Analyse des trajectoires . . . 125
5.3 Résultats . . . 129
5.3.1 Méthode d’évaluation . . . 129 5.3.2 Jeu de données . . . 130 5.3.3 Analyse de l’utilisation de l’espace . . . 131 5.3.4 Analyse des trajectoires . . . 139
Les méthodes d’analyse comportementale des personnes en mouvement sont fondées sur
l’utilisation de systèmes de suivi des personnes (cf. chapitre précédent), dans le contexte
académique et industriel. Dans ce chapitre, nous aborderons ces méthodes puis nous
présenterons nos méthodes basées principalement sur l’évaluation de l’utilisation de l’espace
et l’analyse des trajectoires des personnes en mouvements. Notre objectif est de développer
de nouvelles applications industrielles. Nous présentons les résultats issus de l’application de
méthodes originales proposées par d’autres auteurs et appliquées sur nos jeux de données ainsi
que des jeux de données externes de suivi des personnes.
5.1 Contexte de l’analyse comportementale
Cette section permet de donner une vision générale des sciences du comportement, de
présenter les travaux qui émergent de l’utilisation de caméras de profondeur et des besoins
industriels attendus par les objectifs de ce chapitre.
5.1.1 Sciences comportementales
Selon [Bov64],on peut définir le comportement comme l’ensemble des mouvements
observablesexécutés par un individu, ses interactions avec son environnement et ses congénères.
De plus, on divise cet ensemble en groupes de mouvements par rapport à la fonction qu’ils
accomplissent. Par exemple, « on parlera ainsi, de comportement alimentaire lorsqu’on voudra
parler de l’ensemble des mouvements impliqués dans la nutrition » qu’ils accomplissent. Par
exemple, « on parlera ainsi de comportement alimentaire lorsqu’on voudra parler de l’ensemble
des mouvements impliqués dans la nutrition » [Bov64]. On peut caractériser le mouvement
observé du comportement à partir detrois propriétés : le relationnel, la dynamique et la haute
dimensionnalité [GMPK
+14]. Le comportement est d’ordre relationnel entre un individu et « son
environnement et les autres individus ». Le comportement est dynamique s’il évolue au fil du
temps. Ces périodes de temps pendant lesquelles on étudie le comportement sont dénommées
séries chronologiques. Enfin, le comportement revêt une dimensionnalité élevée par le nombre de
variables que l’on peut utiliser pour le décrire et qui traduit sa complexité.
L’étude actuelle du comportement humain moderne s’appuie sur la systématisation des
données pour l’extraction de ces propriétés. Gomez-Marin souligne les trois axes principaux
à partir desquels ces données sont conceptualisées : le nombre de contraintes, le niveau de
description et la dimensionnalité des données.
• Dans le premier axe, lescontraintes imposées(CIs) dans l’expérience d’observation limitent
l’étendue du comportement de l’individu. La plage de validité de cet axe varie d’un scénario
trèscontrôlé(fortement restreint) à un scénarionon contrôlé(sans restrictions, c’est-à-dire
dans un environnement naturel).
• Dans le deuxième axe, le niveau de description (ND) fait référence à la nature des
données et à leur pertinence par rapport à l’expérience évaluée. Celui-ci dépend du niveau
d’abstraction des observations. A un niveau d’abstraction faible, on trouve habituellement
une grosse quantité de données pour décrire un comportement. Plus on remonte dans le
niveau d’abstraction, plus la quantité de données nécessaires va diminuer.
• Enfin, le troisième axe concerne la dimensionnalité des données (DD). Ceci signifie la
quantité d’informations et le détail d’une observation. Cet axe est relié à la propriété de
dimensionnalité élevée en ajoutant la précision et le volume de données pouvant être gérées
par les technologies actuelles.
L’étude du comportement entre dans le cadre des sciences comportementales. Selon
Gomez-Marin, il existe deux approches fortement différenciées : psychologique et éthologique. La
première approche utilise principalement des environnements contrôlés pour leurs études.
Elle se focalise sur les comportements appris pour analyser la relation entre un stimulus, les
actions et leurs conséquences. De la même façon, l’approche psychologique s’intéresse aux
principes généraux de l’apprentissage et de la motivation des individus [GMPK
+14]. Cette dernière
s’intéresse à l’analyse causale demouvements observables et objectivables pour des individus
dans leur environnement naturel (non contrôlés) [Amy06]. Du point de vue de Bovet [Bov64],
l’approchepsychologiqueest basée sur une étude subjective du comportement d’individus sans
prendre en compte les aspects biologiques ni éléments de leur environnement. Une variante
de cette approche est appelée le «behaviorisme », qui aborde l’étude du comportement d’une
manière objective. Cependant, cette approche est focalisée sur l’étude des situations strictement
contrôlées et l’adaptation du comportement (stimulus-réponse) des individus à ces situations (un
scénario restreintsi l’on se réfère aupremier axe cité ci-dessus). Contrairement à la psychologie,
l’éthologie (étant une branche de la biologie), est basée sur des observations du comportement en
utilisant une méthode scientifique et en répondant aux trois questions principales de la biologie
(causalité, survie et évolution) [Tin63] dans des situationsnon contrôlées(unscénario non restreint
évoqué dans le premier axe), par opposition au « behaviorisme ». L’approche de notre travail sera
plutôt inspirée de l’éthologie, considérant notre intérêt pour l’étude des personnes en mouvement
dans des espaces publics d’une manière non-intrusive.
Pour approfondir, l’éthologie décrit le comportement d’un groupe d’individus à travers
d’éthogrammes. Un éthogramme est un inventaire de mouvements communs à plusieurs
individus. La caractérisation précise des tous les éléments d’un mouvement corporel se heurte aux
difficultés suivantes : la vitesse des mouvements, la quantité des éléments du corps ou des objets
portés par l’individu qui bougent simultanément, les conditions de l’environnement, l’influence
de l’observateur sur le comportement de l’individu et la durée de l’observation [Bov64]. Il est très
intéressant de noter que dès 1964, Bovet a remarqué l’importance de l’utilisation des technologies
telles que les caméras de cinéma ou les enregistreurs de sons, comme outils auxiliaires pour
diminuer la complexité et résoudre les difficultés d’interprétation. C’est ici que notre solution peut
apporter des éléments pratiques et pertinents pour réaliser une étude du comportement humain,
parce que nous sommes capables de détecter des personnes, leur mouvement et de relever les
caractéristiques intrinsèques des personnes d’une manière automatique et systématique. Notre
capacité à traiter un grand volume de données, nous permet de déterminer le mouvement
commun d’un ensemble de personnes dans de grands espaces.
Dans le domaine des sciences comportementales, une des idées nouvelles proposées dans
[GMPK
+14] vise à concevoir une unification des approches de l’éthologie et de la psychologie.
Celle-ci est possible principalement pour deux raisons. D’abord, l’émergence de nouvelles
technologies pour la perception humaine a permis d’acquérir un grand nombre d’attributs
objectivables (avec une description plus riche pour décrire les mouvements d’un individu. En
second lieu, la capacité de sauvegarder et de traiter une grande quantité de données (big data)
permet d’effectuer de nouvelles études sur les mêmes données d’une expérience avec différents
types d’approches pour expliquer le comportement, en respectant les paradigmes de chacun.
Nous ajoutons à cette dernière la possibilité d’évolutivité de ces technologies par rapport à
l’augmentation de l’espace et le nombre de personnes observées, en induisant un plus grand
volume de données acquises simultanément.
De plus, Gomez-Marin et al. mettent en évidence la complexité d’établir une description
complète du comportement. Ce dernier doit être considéré dans un environnement et décrit
sémantiquement. C’est-à-dire qu’on doit bien définir les attendus (lieux et objectifs) de nos
expériences.
5.1.2 État de l’art
Cet état de l’art permet de faire le lien entre le contexte des sciences du comportement
et les travaux associés au suivi des personnes et leurs intentions par l’utilisation de systèmes
optiques 3D. Nous relevons les travaux qui ont créé un système complet, de la description et la
mise en œuvre de l’approche technologique, jusqu’à l’analyse comportementale. Les travaux de
la littérature concernée peuvent être classés en distinguant les domaines de la reconnaissance
des actions et celui de la modélisation du comportement microscopique du piéton [BK15]. De
plus, on trouve différents travaux, isolés, qui s’intéressent aux applications spécifiques comme le
comportement d’achat sur les étagères de supermarché ou le comportement des piétons dans les
transports publics.
Dans les travaux pour la reconnaissance des actions, on trouve [ASS16,DWB
+15]. Les auteurs
ont développé des approches que nous décrivons comme éthologiques, parce qu’ils essaient
de reconnaître des mouvements humains (la forme et la dynamique) pour identifier l’action
de la personne observée dans une série chronologique. Ces travaux utilisent l’évolution de
l’adaptation d’un squelette (formé par des articulations virtuelles du corps humain) sur les
personnes détectées, pour trouver une similarité avec les actions préalablement connues par
le système. Ces systèmes utilisent les traces des trajectoires de différentes articulations pour
reconnaître l’action exécutée par la personne observée. Cependant, ces travaux utilisent une
approche où la caméra, en position latérale, se focalise sur les actions des personnes mais pas sur
leur relation avec l’environnement. Ces travaux n’abordent pas leur problème du comportement
dans de grands espaces parce ce qu’ils ne disposent pas de multi-caméras.
Dans le même domaine de reconnaissance des actions, [MA13, MA16] étudient le
comportement d’achat des personnes dans un supermarché. Ce travail se focalise sur la relation
entre les clients et les produits dans les rayons du supermarché pour comprendre leur décision
d’achat. Au contraire de travaux de reconnaissance des actions décrites précédemment, les
auteurs utilisent une caméra en position zénithale pour détecter les personnes et suivre le
mouvement des bras en temps-réel d’une manière non intrusive. Dans cette approche, les
méthodes de traitement des images sont robustes mais utilisent beaucoup de ressources de
calcul pour détecter les personnes, estimer leur pose et suivre les différentes articulations des
bras. Cependant, ces auteurs, même s’ils visent l’objectif de reconnaissance d’une action d’achat
(attraper un objet sur une étagère), ne proposent pas de moyens pour analyser le comportement
ni de donner les pistes pour prouver un acte d’achat.
Selon [SBR14,BK15] la modélisation du comportement microscopique du piéton s’intéresse
au comportement individuel de chaque piéton. Par exemple, celui de piétons qui se déplacent vers
un but tout en s’évitant les uns des autres, ou celui de formation des groupes. Cette modélisation
s’intéresse également à la simulation et prédiction des mouvements de plusieurs piétons dans la
foule. Ces modèles servent à la simulation et la prédiction du mouvement de plusieurs piétons
à l’intérieur d’un espace donné [SBR12]. De plus, ces travaux sont fondés sur le modèle de force
sociale [HM95], en créant des variantes qui décrivent différentes forces dynamiques pour obtenir
un meilleur modèle de prédiction de mouvement. Par exemple, ces variantes du modèle de force
sociale sont : la répulsion circulaire [HM95], la répulsion elliptique [HJ09] et la combinaison
de forces de ralentissement et d’évasion [RMSB11]. De plus, les applications des modèles de
comportement microscopique de piétons se focalisent sur l’évaluation de l’accessibilité [HD04],
la sécurité des espaces pendant les situations d’urgence [SKK
+11] et la détection automatique de
comportement inhabituel [PMS04].
Parmi les travaux de la modélisation du comportement microscopique du piéton, on trouve
à Seer et al [SBR12, SBR14] qui étudient la cinétique du mouvement humain dans le couloir
d’une université pour construire un modèle de prédiction des mouvements des personnes. Cette
étude se focalise sur la relation du mouvement d’un individu par rapport à la foule. Pour ce faire,
les auteurs détectent des personnes dans un système composé de plusieurs caméras, générant
des trajectoires dans un système commun de coordonnées. Ensuite, ils utilisent ces trajectoires,
dans un processus de post-traitement, pour calibrer les paramètres du modèle de force sociale
de manière à reproduire les mouvements des individus dans deux situations simples : un couloir
permettant un transit libre et le même couloir présentant un obstacle. Ce modèle vise à simuler
le comportement des individus déambulant dans ces deux situations. La détermination des
trajectoires par leur méthode de suivi permet de sélectionner un groupe des trajectoires dites « de
calibration » et un groupe de trajectoires dites « de validation » pour évaluer la précision du modèle
de prédiction de mouvement. Ces travaux servent donc à améliorer les modèles de foules et à
comprendre leur comportement pour le design des espaces dédiés à accueillir des foules, comme
par exemple des stades.
Les travaux du laboratoire ATC [web16a]concernent le comportement des personnes à
l’intérieur d’un centre commercial. Ces travaux se basent sur la même approche technologique
pour suivre des personnes en utilisant un réseau de capteurs 3D en position zénithale [BKIM13,
GBMH15]. Cependant, on trouve deux voies de recherche : la première utilise un modèle de force
sociale pour prédire et simuler le comportement de personnes [ZBK14]. La deuxième s’intéresse à
l’utilisation de l’espace et à la segmentation de trajectoires [BK15]. Dans les travaux de [ZBK14], les
auteurs modélisent le comportement microscopique de la foule. A la différence du modèle de force
sociale [HM95], ce modèle prend en compte l’interaction sociale des individus en remplaçant
l’individu par des groupes de 3 personnes et en appliquant à ce groupe les forces décrites plus
haut. Les auteurs proposent d’analyser la formation de ces groupes selon la densité de la foule.
Ils proposent deux types de formation : l’une « côte à côte » à basse densité et une formation
« fermée » en V pour des densités plus élevées. De plus, pour valider leur modèle, les auteurs
ont dû utiliser deux « codeurs » (les personnes qui introduisent la vérité-terrain manuellement
en regardant la séquence vidéo) pour étiqueter la relation entre personnes, en ajoutant de la
complexité à l’utilisation de cette approche.
S’agissant de la deuxième ligne de recherche, c’est-à-dire l’utilisation de l’espace et la
segmentation de trajectoires, le travail de [BK15] est focalisé sur la collection de données (images
et trajectoires) sur une longue durée dans le même centre commercial que [ZBK14]. Le travail de
[BK15] est le seul qui utilise des capteurs 3D pour analyser le comportement macroscopique (à
l’échelle de plusieurs individus) de la foule. Pour ce faire, les auteurs présentent, sur une année,
différentes analyses statistiques sur plusieurs séries chronologiques dans les conditions suivantes :
le centre commercial a une surface de 900 m
2, l’enregistrement des données est réalisé un jour
particulier en semaine (mercredi) et un jour de week-end (dimanche). Les auteurs proposent donc
une analyse de trajectoires, de l’utilisation de l’espace et des changements des propriétés de la
foule (comme la densité et la vitesse des personnes) selon les heures de la journée et en fonction
des différentes périodes de l’année.
Dans les travaux de Kirchner et al. [KCCVZ15] et Virgona et al. [VKA15], les auteurs montrent
d’une part l’utilisation des technologies de perception humaine pour étudier l’influence d’une
signalisation (stimuli) sur le comportement humain dans le quotidien et d’autre part pour
améliorer le confort des passagers dans les transports en Australie. Leur système est capable
d’identifier les zones bondées sur le quai d’un métro et d’activer une signalisation intelligente
à distance pour proposer, en temps-réel, aux piétons un chemin moins congestionné. Ce travail
est un bon exemple d’une nouvelle technologie (de perception et de signalisation intelligente),
qui rapproche l’éthologie et la psychologie. D’un côté, les notions de l’éthologie pour étudier
l’individu dans son environnement naturel et le principe de non-intrusion par la méthode
d’observation (perception) sont respectées. D’un autre côté, il est possible d’évaluer l’aspect
psychologique de la réponse des personnes après un stimulus (signalisation intelligente) ou
encore l’impact de l’amélioration du confort des passagers et celle du service de transport.
Cependant, ce travail explore une problématique très spécifique au transport qui ne s’adapte pas
à nos besoins. De plus, celle-ci sert à observer des zones déjà identifiées comme pertinentes et
n’évalue pas le reste de l’espace pour avoir une compréhension globale de cet espace utilisé par
les personnes.
Dans le document
Système de caméras intelligentes pour l’étude en temps-réel de personnes en mouvement
(Page 128-132)