• Aucun résultat trouvé

L’analyse du comportement de la foule

B.3 Applications utilisant de la densité de la foule

B.3.2 L’analyse du comportement de la foule

Pour atteindre une meilleure performance dans l’analyse du comportement de la foule, nous considérons que les mesures de densité peuvent être une source d’information sur la répartition spatiale des personnes dans la scène. Ces informations sont utiles, notamment pour localiser et reconnaître les événements au sein de la foule telle que l’évacuation, la formation et la division de la foule. Par conséquent, dans notre approche, nous considérons simultanément ces deux mesures de la foule, à savoir l’apparence (densité) et le mouvement (vitesse et direction).

Les trajectoires définies dans (B.8) et qui sont utilisées dans une première étape pour estimer les cartes de densité, sont également employées dans une deuxième étape pour ex- traire des informations sur le mouvement de la foule. Dans cette étape, nous ne prenons en compte que les trajectoires à long terme, tandis que d’autres trajectoires à court terme sont filtrées. Aussi, nous limitons l’historique de chaque trajectoire 2D sur quelques images. Car dans le cas contraire, en considérant l’ensemble de la trajectoire, une augmentation de la vitesse ne sera pas détectée tôt. Aussi, la direction de mouvement peut être moins précise. Pour modéliser la foule, on code chaque attribut par 1D-histogramme: Nous quan-

tifions la densité localeCK enNd= 5 bins, l’orientation des vecteurs de mouvement θ en

Nθ = 8 bins. Quant à la vitesse elle est quantifiée en Ns = 5 classes: très lent, marche,

marche rapide, course et course rapide (nous corrigeons les effets de perspective pendant le calcul de la vitesse).

Après la modélisation des attributs par des histogrammes, leur application pour l’analyse du comportement de la foule est démontrée en deux étapes: d’abord, la variation dans le temps d’une mesure de la stabilité (en utilisant les histogrammes) est utilisée pour détecter les changements ou les événements anormaux, voir le paragraphe B.3.2.1. Ensuite, un vecteur des caractéristiques concaténant ces histogrammes est utilisé pour la reconnais- sance des événements, voir le paragraphe B.3.2.2.

B.3.2.1 Détection de changement dans la foule

Selon la méthode décrite plus haut, nous avons Hd(k), HΘ(k) et Hs(k) qui désignent,

respectivement, les histogrammes de densité, l’orientation et la vitesse. Si un changement intervient dans le comportement de la foule, cela générerait des changements entre les his- togrammes. Ainsi, nous comparons les histogrammes au cours du temps suivant la même

hi(k) comme la moyenne pondérée d’un vecteur de similarité Si(k):

σi(k) = ωTSi(k),

ω = Pn 1

j=1eλ∆tj

(e−λ∆t1, e−λ∆t2, ..., e−λ∆tn) (B.16)

λ représente la constante de décroissance, ∆tj = j∆t (∆t est une constante). Si(k)

est calculé en utilisant la métrique de corrélation entre chaque histogramme Hi(k) les

histogrammes de n images précédentes Hi(k − ∆t1), ..., et Hi(k − ∆tn).

Selon notre approche, un changement est détecté si la stabilité temporelle pour un at-

tribut est faible. Pour ce faire, nous comparons chaque stabilité temporelle σi(k), 1 ≤ i ≤ 3

avec un seuil adaptatif τi(k) calculé comme la moitié de la moyenne des σientre (k −∆t1)

et (k − ∆tn): τi(k) = 1 2n n X j=1 σi(k − ∆tj) (B.17)

B.3.2.2 Reconnaissance des événements dans la foule

Pour la reconnaissance, 6 événements sont testés, à savoir la marche, la course, l’évacuation, la dispersion locale, la formation et la division de la foule. Étant donné une image x, nous

visons à la classer dans l’un des événements v∗ ∈ V, qui maximise la probabilité condi-

tionnelle:

v∗ = arg max

v∈V P (v|x, θ

) (B.18)

où θ∗sont estimés lors de l’apprentissage. Ceci peut être réalisé par la classification SVM.

S’agissant du vecteur des caractéristiques, nous concaténons les 3 histogrammes Hd(k),

HΘ(k), et Hs(k) dans Hk. Pour la classification, on utilise le noyau Chi-Square:

K(Hi, Hj) = X I Hi(I) − Hj(I))2 Hi(I) + Hj(I) (B.19) B.3.2.3 Résultats expérimentaux

Pour détecter le changement au sein de la foule, nous testons notre approche sur la base UMN [1], qui a été largement utilisée pour distinguer les activités normales et celle qui sont anormales au sein de la foule. Pour l’évaluation quantitative, nous employons l’erreur relative moyenne [64], voir tableau B.5.

Comme le montre le tableau B.5, la comparaison de nos résultats de détection avec la vérité terrain montre des détections plus précises dans la plupart des vidéos. Le retard dans la détection de certaines images après l’événement s’explique par notre stratégie de détection selon laquelle un événement anormal est détecté uniquement si la stabilité dans le temps est inférieure au seuil dynamique. Un changement nécessite donc certain temps pour

seq. UMN nb. de frames vérité terrain nos résultats eF Video1 625 484 493 0.0144 Video2 828 665 669 0.0048 Video3 549 303 319 0.0291 Video4 685 563 582 0.0277 Video5 769 492 512 0.0260 Video6 579 450 466 0.0276 Video7 895 734 754 0.0223 Video8 667 454 471 0.0255 Video9 658 551 551 0 Video10 677 570 577 0.0103 Video11 807 717 722 0.0062

Table B.5: Comparaison de nos résultats de détection avec une vérité de terrain en utilisant l’erreur relative moyenne

être détecté, ce qui justifie ce retard. Par contre, cette stratégie est adéquate pour éviter les fausses alertes.

Pour évaluer la reconnaissance des événements, nous testons notre méthode avec la Section S3 de PETS. Cette base de données représente 6 classes d’événements au sein de la foule: marche, course, formation (fusion), division, évacuation et dispersion. Nous divisons aléatoirement cette base de données (75%) pour l’apprentissage et (25%) pour les tests. Ensuite, suivant la stratégie de un-contre-un, on obtient (99,54%) pour la précision de la classification. En outre, en s’appuyant sur la stratégie de un-contre-reste, nous calculons la précision de la classification sur l’ensemble des tests pour chaque classe séparément, voir le tableau B.6. Comme il est indiqué dans ce tableau, on obtient de bons résultats pour

Événements Marche Course Division Dispersion Evacuation Formation

précision (%) 99.41 99.21 100.00 99.87 99.80 99.54

Table B.6: Précision de la classification de méthode pour la reconnaissance des événements sur PETS. S3 suivant la stratégie de un-contre-reste

tous les événements de la foule, y compris la formation et la division de la foule, ce qui justifie la pertinence des attributs proposés.

En suivant quelques mesures de la foule (méthode non supervisée), nous sommes capa- bles aussi de surveiller ce qui se passe dans la scène afin de localiser l’événement et avoir une idée claire sur la densité de personnes participant à chaque événement. Figure B.11 illustre quelques exemples concrets sur la caractérisation avec PETS.

Dans la première ligne de cette figure, un exemple d’événement de formation de la foule est visualisé. Cet événement se caractérise par des personnes venant de directions différentes et qui se déplacent vers le même endroit (comme il est représenté dans la pre- mière colonne, indiquant la direction de vecteurs de mouvement). En outre, cet événement

a) vecteurs de mouvement (b) carte de densité (c) l’événement reconnu Figure B.11: Résultats de la caractérisation des événements de PETS: exemples de forma- tion de la foule et d’évacuation.

se distingue par une baisse du taux de la zone de mouvement dans le temps (égal à 40,72 % dans cette image). Dans la deuxième colonne, nous montrons la carte de densité qui per- met de localiser le lieu là où la foule est formée. On constate aussi que la zone de régions denses augmente dans le temps; elle atteint 6,10 % à cette image. Comme il est indiqué dans la troisième colonne, grâce à toutes ces caractéristiques, un événement de formation de la foule est reconnu et localisé.

Dans la deuxième ligne, on illustre un exemple d’évacuation. Comme on peut le voir dans la première colonne, cet événement se caractérise par la divergence des vecteurs de mouvement, car les individus s’éloignent les uns des autres dans des directions différentes. De plus, cet événement se caractérise par une augmentation soudaine de la vitesse: la moyenne de longueur des vecteurs de mouvement à cette image est égale à 12,48 pixels. L’évacuation se distingue également par une augmentation dans le rapport de la zone en mouvement (53,79 %) et une diminution dans le temps des zones denses (comme il est montré dans la deuxième colonne).

Documents relatifs