5.2.1 Les corpus précurseurs au sein de l’équipe GETALP
5.2.1.1 Le corpus Anodin-Détresse
Le corpusAD(Anodin-Détresse) a été enregistré par l’équipe GEOD du CLIPS en 2004
lors du projet DESDHIS(Vacher et coll., 2006). Il est constitué de phrases courtes de type
appels de détresse et de type anodines (conversation courante). Un exemple de phrases
re-tenues est « Aidez-moi » pour un appel de détresse et « Il fait beau » pour une conversation
anodine.
5.2. Corpus AD80 61
Ce corpus de parole a été enregistré dans le but d’étudier un système d’analyse sonore
permettant notamment la détection de situations de détresse, utilisant la discrimination
entre son et parole (Vacher et coll.,2006) et la détection de mots-clé (Vacher et coll.,2008).
21 locuteurs (11 femmes et 10 hommes) âgés entre 22 et 64 ans ont été enregistrés, la
plu-part (16 locuteurs sur 21) ayant un âge inférieur à 30 ans. Les phrases prononcées, des
énon-cés courts (entre 1 et 3 secondes), sont les mêmes pour tous les locuteurs, soit 60 phrases de
détresse et 66 phrases anodines. Les enregistrements ont été effectués en studio au sein de
l’équipe GETALP à l’aide du logicielEMACOP(Vaufreydaz,1998).
Au final, 2646 phrases ont été prononcées, ce qui représente 55 minutes de parole.
L’en-semble des énoncés est présenté en annexe B.
5.2.1.2 Le corpus Voice-Age
Le corpusADest vite apparu trop limité car restreint à une frange jeune de la population,
alors que le domaine d’application visé concerne plus particulièrement des personnes âgées
vivant seules à domicile. C’est pourquoi il a paru nécessaire de disposer de paroles adaptées
prononcées par des personnes âgées.
Le corpusVA(Voice-Age) est constitué de l’assemblage de 2 corpus : le corpusCHUet le
corpusNormand.
Le corpusCHUa été enregistré auprès de personnes âgées par l’équipe GETALP (Aynaud,
2009) en 2009 dans le service de gérontologie de l’Hôpital Sud du CHU de Grenoble. Il a
consisté à faire lire à ces personnes des phrases courtes anodines et de détresse, similaires
ou identiques à celles du corpusAD, et des phrases inspirées de phrases de journaux et de
magazines du corpusBRAF100(Vaufreydaz et coll.,2000), de durée supérieure (jusqu’à 10
secondes) aux phrases AD. Les enregistrements ont été effectués à l’hôpital, à l’aide d’un
microphone relié à un PC portable par un pré-ampli, l’acquisition se faisant grâce au logiciel
EMACOP.
Les personnes capables de réaliser ces enregistrements étaient peu nombreuses, déjà
for-tement handicapées, et avait une courte période de disponibilité, ce qui explique le temps
important nécessaire pour ces enregistrements (4 demi-journées par locuteur, avec
seule-ment une demi-journée par semaine). Deux locuteurs (une femme et un homme) de 82 et
89 ans ont été enregistrés, pour un total de 2089 phrases lues (1 heure 48 minutes
d’enregis-trement).
En 2010, l’équipe GETALP a poursuivi ses travaux d’enregistrement de voix de personnes
âgées en réalisant l’acquisition d’un corpus appelé corpus Normand(Lefol,2010). Il a été
demandé aux personnes de lire les mêmes phrases que lors de l’enregistrement du corpus
CHU. Les enregistrements ont été effectués à domicile auprès de personnes âgées faisant
partie d’une même famille et habitant en Normandie. Le même type de matériel a été utilisé,
excepté le logiciel d’acquisitionEMACOPqui a été remplacé par le logicielAudacitysuite aux
problèmes évoqués en section 5.1.1.3.
62 Chapitre 5. Corpus
Du fait de la fatigabilité des personnes âgées et de la longueur de certaines phrases, toutes
les phrases n’ont pu être prononcées par l’ensemble des locuteurs : entre 407 et 1187 phrases
ont été prononcées par chaque locuteur, et les enregistrements, pour chaque locuteur, se
sont étalés sur plusieurs jours.
La liste complète des phrases se trouve en annexe D.
5.2.2 Nos enregistrements
5.2.2.1 Première étape
Toujours dans le cadre de nos travaux sur la détection de situations de détresse pour les
personnes âgées isolées à domicile, du fait du faible nombre de locuteurs âgés (7 locuteurs)
ayant été enregistrés lors des précédentes études évoquées ci-dessus, nous avons complété
le corpus de voix de personnes âgées avec des énoncés adaptés à la tâche.
Pour faciliter l’acquisition de notre corpus, sachant que les personnes âgées peuvent
ra-pidement se fatiguer, nous avions comme objectif que les sessions d’enregistrement soient
courtes (moins de 20 minutes). Nous avons choisi de leur faire lire des phrases en nombre
restreint, et courtes, cela permettant d’avoir le même nombre de phrases lues par chaque
locuteur. Nous avons donc exclu les phrases de magazines et de journaux utilisées dans le
corpus VA, du fait de leur longueur trop importante. Aussi, nous voulions que notre
nou-veau corpus de voix âgées puisse être comparé avec le corpusADde voix jeunes dans notre
évaluation des performances des systèmes de RAP. Nous avons donc repris les 126 énoncés
de détresse et anodins utilisés dans le corpusADenregistré en 2004 pour les faire lire aux
personnes âgées.
Ainsi, en 2012, nous avons réalisé une session d’enregistrements dans un centre de
ré-habilitation pour personnes âgées (SSR Les Cadières) et une EHPAD (Château de Labahou)
du sud-est de la France
1. Les personnes visées étaient des personnes âgées de plus de 65
ans, capable de lire et sans troubles cognitifs connus au moment de l’enregistrement. Les
enregistrements ont été effectués à partir d’un microphone positionné à environ 30 cm de
la bouche du locuteur et relié à un PC portable par un pré-ampli, l’acquisition étant réalisée
grâce au logicielGEOD(voir section 5.1.2).
29 locuteurs (21 femmes et 8 hommes) âgés de 62 à 94 ans ont ainsi été enregistrés en
2012, et ont lu au total 3611 phrases de détresse et anodines, pour une durée de 1 heure et 10
minutes. La liste des phrases prononcées est celle de l’annexe B.
5.2.2.2 Deuxième étape
Les phrases de détresse envisagées précédemment ont été choisiesa prioriet peuvent ne
pas correspondre à ce qu’une personne en difficulté prononce de manière spontanée.
C’est pourquoi, au début du projet CIRDO, une étude a été menée par le laboratoire
GRePS (Bobillier-Chaumon et coll., 2012) pour analyser les différents cas de chutes afin
5.2. Corpus AD80 63
d’identifier les poses-clés (comportement, gestes et poses) et les phrases caractéristiques des
situations à risque, qui pourront ensuite être utilisées pour construire le système. En effet,
à partir de méthodes d’entretien et d’observation, le laboratoire GRePS a construit des
scé-narios de différentes chutes. Dans chaque scénario sont décrites les conditions de la chute
(caractéristiques de la personne, activité réalisée, lieu, moment, causes et circonstances de
l’incident...), les modalités de la chute (quels sont les différents membres du corps mobilisés,
la direction et l’amplitude de chaque mouvement, la vélocité, ses réactions au sol, ainsi que
les temps d’action ou d’inaction), ainsi que les phrases prononcées.
Grâce à cette étape, de nouvelles phrases associées à une situation de détresse et des
phrases d’appels aux aidants ont été ajoutées à la liste des phrases existantes (de détresse
et anodine), et nous avons également ajouté des phrases anodines proches des phrases de
détresse (par exemple, « Le docteur a appelé. »). Les appels aux aidants (voir table 5.1) se
caractérisent par la présence d’un mot-clé représentant le nom du système, suivi de la
de-mande d’un appel à une personne donnée (ex : « e-lio appelle une infirmière »).
A partir de là, nous avons disposé d’une nouvelle liste de 178 phrases (126 précédentes +
52 nouvelles), et nous les avons utilisées pour continuer l’enregistrement du corpus, en
enre-gistrant cette fois-ci aussi bien des personnes âgées que des personnes jeunes afin d’obtenir
2 groupes distincts : le groupelocuteurs âgéset le groupelocuteurs jeunes.
31 locuteurs jeunes (17 femmes et 14 hommes) âgés de 18 à 59 ans ont ainsi été
enregis-trés en 2013, et ont lu au total 5518 phrases de détresse, d’appels aux aidants et anodines,
pour une durée de 1 heure 39 minutes.
De plus, 14 nouveaux locuteurs âgés (11 femmes et 3 hommes) ont été enregistrés dans
le centre de réhabilitation pour personnes âgées où nous étions déjà intervenus en 2012. Ils
étaient âgés de 68 à 90 ans. Ces personnes ont lu au total 2492 phrases, ce qui représente un
total de 1 heure 4 minutes d’enregistrement.
La liste complète des phrases se trouve en annexe C.
5.2.2.3 Le corpus résultant
L’ensemble de ces enregistrements a été intégré dans le corpusAD80, qui regroupe donc
le corpusADinitial de 2004 et des corpus réalisés en 2012 et 2013. Nous n’avons pas intégré
le corpusVAdans le corpusAD80du fait de la trop grande disparité des énoncés en terme
de quantité et de contenu par rapport aux énoncés du corpusAD80. Le corpusAD80a été
utilisé pour l’évaluation des systèmes de RAP (voir figure 5.2).
Le corpusAD80 est composé d’un total de 95 locuteurs (59 femmes et 36 hommes). Le
groupelocuteurs âgésest composé de 43 locuteurs (32 femmes et 11 hommes) âgés de 62 à
94 ans, qui ont lu au total 2663 phrases de détresse (52 minutes) et 434 phrases d’appels aux
aidants (16 minutes), et 3006 phrases anodines (1 heure et 6 minutes). Le groupelocuteurs
jeunesest composé de 52 locuteurs (27 femmes et 25 hommes) âgés de 18 à 64 ans, qui ont
lu au total 3306 phrases de détresse (56 minutes), 961 phrases d’appels aux aidants (26
mi-nutes), et 3897 phrases anodines (1 heure et 12 minutes). Un locuteur de 62 ans, bien qu’il
64 Chapitre 5. Corpus
Phrases de détresse Appels aux aidants Phrases anodines Aidez-moi ! e-lio appelle le SAMU ! Bonjour madame ! Au secours ! e-lio appelle les pompiers ! Ça va très bien. Je me sens mal ! e-lio appelle les secours ! Ce livre est intéressant. Je suis tombé ! e-lio appelle un docteur ! Il fait soleil.
Du secours s’il vous plaît ! e-lio appelle une ambulance ! J’ai ouvert la porte.
Je ne peux plus bouger ! e-lio appelle une infirmière ! Je dois prendre mon médicament ! Je ne suis pas bien ! e-lio appelle ma fille ! J’allume la lumière !
Je suis blessé ! e-lio appelle mon fils ! Je me suis endormi tout de suite ! Je ne peux pas me relever ! e-lio tu peux téléphoner au samu ? Le café est brûlant !
Ma jambe ne me porte plus ! e-lio il faut appeler les secours ! Où sont mes lunettes ?