• Aucun résultat trouvé

Positionnement par rapport à ces projets

Les projets Ger’Home et House_n ne prévoient pas d’interaction à l’initiative de l’utili-sateur, ils visent essentiellement à suivre les activités de la personne dans son environne-ment au moyen de capteurs et à faire un suivi des Activités de la Vie Quotidienne. Le projet House_n prévoit aussi la mise en place de systèmes aidant la personne à avoir un compor-tement sain (activité physique, nourriture) et permettant d’estimer son état de santé par des capteurs physiologiques.

Le projet Soprano a défini une ontologie et une architecture logicielle de service basée sur OSGi. Les projets Aging in Place, Companionable et Soprano accordent une grande im-portance à la détection des situations de détresse. De plus le projet Companionable a pour objectif la stimulation cognitive et la gestion de la thérapie des personnes. Il envisage pour ce faire de développer un système de dialogue avec le robot incluant une commande vo-cale, mais il n’y a pas eu à notre connaissance de publication de résultats à ce sujet. En ce qui concerne l’analyse sonore, ce projet prévoit aussi la détection de parole et de sons de la vie courante dans l’appartement comme éléments d’information du système de génération d’alarme.

Ces projets visent donc essentiellement la détection de situation de détresse, le suivi de l’état de santé et de la prise de médicaments, et la stimulation cognitive. Ils s’intéressent donc aux deux aspects Santé et Sécurité, mais sans aborder les deux autres aspects essentiels qui sont le Confort et la Communication avec l’entourage et avec l’extérieur. En effet, les Mai-sons Intelligentes tendent à être équipées de dispositifs dotés d’interfaces de plus en plus complexes et en conséquence d’autant plus difficiles à maîtriser par l’usager. Les personnes qui bénéficieraient le plus de ces nouvelles technologies sont les personnes en perte d’auto-nomie telles que les personnes atteintes de handicaps moteurs ou fragilisées par des patho-logies dues à l’âge (Alzheimer). Elles sont les moins aptes à utiliser des interfaces complexes, étant donné leur handicap ou leur manque de familiarité avec les nouvelles technologies. Il devient donc indispensable de prévoir une assistance facilitant la vie quotidienne et l’ac-cès à l’ensemble des systèmes dits « domotiques ». Les interfaces tactiles usuelles devront être complétées par des interfaces plus accessibles, ne sollicitant ni la vue, ni le mouvement, grâce notamment à un système réactif à la parole. Ces nouvelles interfaces trouveront éga-lement leur utilité lorsque la personne ne peut plus se déplacer ou se déplace difficiéga-lement.

J’aborderai donc plus précisément dans ce mémoire l’apport d’informations d’origine sonore en complément d’autres sources pour la commande vocale, la localisation et la re-connaissance d’activités, les 2 derniers points constituant une information sur le contexte nécessaire avant la prise de décision par le système automatique. L’analyse sonore et la

re-1.5. Positionnement par rapport à ces projets 29

connaissance de la parole dans un environnement réel présentent de nombreuses difficul-tés ; le chapitre 2 s’appuiera sur une expérience pendant laquelle des personnes ont joué un scénario dans un appartement pour mettre en évidence les défis scientifiques à relever dans ce domaine. Le chapitre 3 fera ensuite un état des lieux de l’utilisation de la commande vo-cale dans la Maison Intelligente et présentera une étude d’acceptabilité conduite auprès de personnes âgées, de leurs proches et de personnels médicaux.

CHAPITRE

2

Analyse d’informations sonores dans un bâtiment intelligent

L’analyse automatique des sons et de la parole concerne de nombreux domaines du fait de l’intérêt croissant porté aux systèmes de surveillance automatique. Les sons de la vie cou-rante sont générés par les gestes quotidiens (vaisselle, clefs, porte. . . ), ils sont désignés ha-bituellement par le mot « bruit ». Après avoir décrit très brièvement l’état de l’art dans ce domaine, nous exposerons les méthodes que nous avons conçues et mises en œuvre pour l’analyse sonore en temps réel. Ensuite, nous décrirons une expérience et nous en tirerons les conclusions. Le lecteur pourra trouver plus de détails en se reportant à (Vacher et al.,

2011) et aux autres articles de ma bibliographie personnelle listés en annexe (section 5 du curriculum vitae).

2.1 Analyse audio

L’analyse audio, et tout particulièrement la reconnaissance de la parole, est un domaine de recherche très ancien. De nombreuses méthodes, ainsi que des paramètres acoustiques très variés, ont été explorés et l’état de l’art des techniques est fortement relié à l’appren-tissage automatique de modèles probabilistes (réseaux de Markov cachés, réseaux neuro-naux. . . ). Les récents développements ont donné des résultats significatifs et ont permis à la reconnaissance automatique de la parole d’être une composante de beaucoup de produits industriels, mais il subsiste de nombreux défis à relever pour rendre cette fonctionnalité dis-ponible pour le bâtiment intelligent. L’analyse sonore peut être scindée en deux branches :

– la reconnaissance de la parole pour la commande vocale et le dialogue, et,

– la reconnaissance des sons pour identifier l’interaction de la personne avec son en-vironnement (par exemple la fermeture d’une porte) ou avec le fonctionnement d’un appareil (par exemple d’une machine à laver).

En ce qui concerne l’identification des sons, certains projets visent à déterminer l’état de santé de la personne vivant dans un bâtiment intelligent au travers de la reconnaissance d’activités ou de la détection de situations de détresse. L’analyse sonore a été utilisée pour quantifier l’usage de l’eau (hygiène et boisson) (Ibartz et al.,2008) mais elle reste peu utili-sée pour la détection de situations de détresse (Istrate et al.,2006). Malgré tout,Litvak et al.

(2008) ont utilisé des microphones et un accéléromètre pour détecter une chute dans un appartement, alors quePopescu et al.(2008) ont utilisé 2 microphones dans le même but. Hors du contexte de détection de situation de détresses, Chen et al.(2005) ont déterminé

32 Chapitre 2. Analyse d’informations sonores dans un bâtiment intelligent

différentes activités dans une salle de bain en utilisant des HMM sur des coefficients ceps-traux à fréquence mel (Mel-Frequency Cepstral Coefficients, MFCC).Cowling(2004) a utilisé la reconnaissance de sons non vocaux en combinaison avec leur direction d’origine pour un robot de surveillance autonome.

Les systèmes de Reconnaissance Automatique de la Parole (RAP), ou Automatic Speech Recognizer (ASR), ont atteint de bonnes performances lorsque le microphone est placé à proximité du locuteur. C’est par exemple le cas lorsqu’on utilise un casque audio, mais les performances se dégradent très vite lorsque le microphone est placé à plusieurs mètres, par exemple dans le plafond. Cela est dû à différents phénomènes comme la présence de bruit de fond et la réverbération. Ces problèmes doivent être pris en compte dans le contexte de l’assistance à domicile, certaines solutions seront présentées au chapitre 4.

2.2 Analyse audio en temps réel dans un habitat intelligent