Les scènes qui ne sont pas relatives à une situation de détresse sont effacées.
Certains événements, conditions ou éléments de l’environnement peuvent augmenter
les difficultés de traitements et d’interprétation des situation, tels que :
— le changement brusque d’éclairage et de luminosité,
— la proximité des couleurs et des motifs ainsi que le manque de contrastes entre les
éléments du décor, et l’habillement du sujet d’intérêt induisant des phénomènes de
camouflage,
— la diversité des sources d’éclairage pouvant générer des ombres,
— la diversité des objets présents et dont certains sont susceptibles d’être déplacés.
Les modèles et méthodes mis en place par le LIRIS pour l’apprentissage de
l’arrière-plan, l’extraction de la silhouette et la détection des chutes sont décrits dans (Vacher et coll.,
2014a).
9.2 Expérimentation dans DOMUS
Une expérience a été menée dans une salle de la plateforme DOMUS du laboratoire LIG,
configurée pour ressembler à un petit salon standard (chaises, tapis, table basse,...), dans
le-quel est installé un systèmee-lioen face d’un canapé. Elle visait à la collecte d’un échantillon
significatif de données pour apprendre et tester les modèles utilisés dans le traitement vidéo,
et pour tester le système de traitement audio. Il était demandé aux sujets de jouer certains
scénarios choisis, définis lors d’une étude de terrain.
9.2.1 Élaboration des scénarios
Le laboratoire GRePS de Lyon, partenaire du projetCIRDO, a réalisé une étude de
ter-rain dans l’objectif d’analyser en profondeur les différents cas de chutes afin d’identifier les
poses clés (comportement, gestes et poses) et les différentes phrases prononcées lors d’une
chute (Bobillier-Chaumon et coll.,2012). A partir de méthodes d’entretien et d’observation,
le laboratoire GRePS a construit des scénarios de différentes chutes en décrivant d’une part
les conditions de la chute (caractéristiques de la personne, activité réalisée, lieu, moment,
causes et circonstances de l’incident...), et, d’autre part, les modalités de la chute : quels sont
les différents membres du corps mobilisés, la direction et l’amplitude de chaque
mouve-ment, la vélocité des mouvements, les réactions du sujet au sol, ainsi que les temps
d’ac-tion ou d’inacd’ac-tion. Des phrases ou mots d’alerte ont également été identifiés à différents
moments de la chute : « Aahhh, zuuut, qu’est-ce qu’il m’arrive ! Oh merde, merde... ». Un
exemple de script de chute est présenté figure 9.5.
La méthode desPersonasa ensuite permis au laboratoire GRePS de décrire finement la
réalisation et le déroulement des chutes, afin d’avoir une représentation claire et précise des
différentes chutes identifiées. Les différentes chutes ont été regroupées dans les 3 grandes
134 Chapitre 9. Expérimentation en situation réaliste jouée
F
IGURE9.5:Différentes phases d’une chute (Bouakaz et coll.,2014).
— tomber : s’affaler au sol, depuis une posture statique,
— glisser : déséquilibre du corps dans la continuité d’un déplacement,
— trébucher : perte de verticalité induite par un choc contre un obstacle.
Les résultats de cette étude de terrain ont ensuite permis de définir des scénarios
com-portant chacun un type de chute identifiée. Ceux-ci ont ensuite été joués dans le contexte
d’un expérimentation de typeliving lab. Cette expérimentation, réalisée auprès de 17 sujets,
est décrite en section 9.2, et a eu pour objectif de valider le système de détection de chutes.
9.2.2 Protocole expérimental
Chaque participant était introduit au contexte de la recherche et a été invité à signer un
formulaire de consentement. Il a ensuite été invité à jouer chacun des différents scénarios.
Cinq scénarios permettaient de jouer quatre types de chutes (identifiées deC1àC4) et une
situation où la personne est bloquée (identifiée parB), choisis parmi les 28 situations à risque
identifiées :
— C1: « trébucher contre un tapis »,
— C2: « glisser dans le salon »,
— C3: « tomber de son canapé »,
— C4: « tomber en arrière »,
— B: « rester bloqué, assis sur le canapé ».
Les scénarios complets sont donnés en annexe H.
La figure 9.4 montre un participant simulant une chute. Ces situations ont été choisies
parce qu’elles étaient représentatives des chutes à la maison et parce qu’elles pouvaient être
jouées en toute sécurité par les participants.
Deux autres scénarios (identifiésF1etF2), appelés « Vrais Négatifs » (VN), ont été ajoutés
9.2. Expérimentation dans DOMUS 135
Scénario Phrases
C1 Merde !
Qu’est-ce qu’il m’arrive ! Appelle quelqu’un e-lio !
C2 Oh la !
e-lio, appelle quelqu’un !
C3 Oh la !
Je saigne ! Je suis blessé !
e-lio appelle les secours !
C4 Aïe, j’ai mal !
e-lio, appelle ma fille !
B Ah !
Aïe, j’ai mal !
e-lio, appelle du secours ! Je ne peux pas me relever !
F1
-F2
-T
ABLE9.1:Phrases prévues pour chaque scénario de chute et de blocage du corpus Cirdo-Set.
— F1 : le premier VN consistait à essayer d’attraper une télécommande sur une table
basse lorsque la personne est assise sur le canapé (situation proche de celle dans
la-quelle la personne a une hanche bloquée),
— F2: le second VN consistait à ramasser rapidement un magazine posé sur le sol (proche
d’une situation de chute).
Pour les scénariosC1àC4et le scénariosB, les sujets devaient prononcer des phrases de
détresse et d’appels aux secours, présentées table 9.1. Les scénariosF1etF2ne comportaient
pas de phrases à prononcer. Les phrases choisies l’ont été en s’appuyant sur une étude du
GRePS qui a été présentée en section 9.2.1 et déjà utilisée lors de la constitution du corpus
AD80.
Avant de jouer une scène, l’expérimentateur précisait le contexte (lieu, moment de la
journée...), l’activité (ce que la personne était en train de faire et ce qu’elle allait faire avant
que l’incident ne se produise), ainsi que le geste et les mots à produire avant, pendant et
après la chute. Ensuite, la personne devait répéter plusieurs fois la scène avant de
commen-cer les enregistrements. Plusieurs prises pouvaient être effectuées si le sujet commettait des
erreurs, jusqu’à ce que le scénario soit interprété conformément au script.
9.2.3 Domus et matériel d’enregistrement
La pièce expérimentale de la plateforme DOMUS a été équipée de plusieurs caméras
et microphones, et dispose d’une salle technique adjacente (voir figure 9.6). Cette pièce a
été configurée de telle façon a ce que la personne assise sur le canapé puisse être en
visio-conférence avec un proche par l’intermédiaire d’e-lio.
En ce qui concerne l’analyse de l’audio, nous avons utilisé des microphones sans fil
Senn-heiser : un EW-300-G2 ME2 fixé au plafond de la pièce (« mic 1 » sur la figure 9.6), et un
SKM-136 Chapitre 9. Expérimentation en situation réaliste jouée carpet e−lio camera 2 camera 1 kinect
Entrance
Smart Room
Technical Room
mic 1 mic 3 mic 2F
IGURE9.6:Le local d’expérimentation et ses équipements.
réalisé sur la durée de chaque expérience par un ordinateur PC équipé du logiciel
Stream-HISet d’une carte National Instruments PCI-6220 à 8 canaux. Un haut-parleur dans la salle
de contrôle permettait aux expérimentateurs de suivre la progression de la scène. Le logiciel
CirdoXa été installé sur un ordinateur situé dans la salle d’expérimentation et connecté à
un microphone unidirectionnel à condensateur Sennheiser (« mic 3 »). Il était d’autre part
relié au systèmee-lioplacé à côté. En outre, l’acquisition audio était également faite par le
microphone d’un système Kinect.
Pour l’analyse vidéo, nous avons utilisé deux caméras de type webcam (Sony PSeye :
ac-quisition en 640x480 60Hz et connectées en USB 2.0) fixées sur le mur face au canapé ainsi
qu’une caméra à profondeur (Microsoft Kinect). La synchronisation et l’enregistrement des
flux vidéos ont été réalisés sur un ordinateur PC (processeur Intel i3 3,2 GHz, 4 Go Ram,
carte graphique NVidia GeForce GTS 450 512Mo). L’affichage des flux vidéos en temps réel
sur le pupitre de l’opérateur a permis la validation de chaque scène filmée du point de vue
du scénario établi et du jeu des acteurs.
9.2.4 Le corpus enregistré Cirdo-Set
Les participants ciblés étaient des personnes âgées qui étaient encore en mesure de jouer
chacun des scénarios élaborés à la section 9.2.1. Le recrutement d’une telle population
s’avé-rant difficile et étant donné que le but était surtout de recueillir des données réalistes en
Dans le document
Reconnaissance automatique de la parole de personnes âgées pour les services d'assistance à domicile
(Page 134-138)