• Aucun résultat trouvé

2. 2.1.1 Principes d’un capteur de profondeur

Il existe une très grande gamme de capteurs de profondeur. Ces capteurs peuvent être classés selon la technologie de création des cartes de profondeur en deux catégories :

— Motif de lumière structurée. La méthode de la lumière structurée a pris un intérêt important ces dernières années en raison de sa précision pour le calcul de distances. Son principe est le suivant : un projecteur de lumière structurée remplace l’une des caméras de la méthode de stéréo vision. Ce dernier émet certains pattern de lumière, notamment les motifs ponctuels, linéaires et codés vers les objets. La réflexion du motif est captée par la caméra. L’information de profondeur est calculée sur la base de la triangulation [48].

— Principe du temps de vol (Time Of Flight TOF). Pour les capteurs de profondeur basés sur le principe du TOF, une lumière proche infrarouge modulée est émise pour éclairer les objets. L’information de profondeur est obtenue en comparant le déphasage entre la lumière émise et celle réfléchie par l’objet observé [49].

Les capteurs de profondeurs présentent plusieurs avantages par rapport aux systèmes de vision classiques. Ils sont indépendants de la couleur des objets et de l’éclairage de la pièce, chose extrêmement importante pour notre projet. Il est extrêmement difficile de reconnaitre les personnes filmées et donc ils préservent leur anonymat. L’avantage d’un capteur de profondeur est qu’il permet d’obtenir directement une carte de profondeur alors que les systèmes de stéréo-vision classiques nécessitent un post-traitement fiable pour recouvrir une information de profondeur plus ou moins précise et dépendant du contenu des images. Cet accès direct à l’information 3D rend le traitement de la détection de la

2. 2. Types de capteurs

chute plus rapide. Dans la littérature, il existe une multitude de capteurs de profondeur. Pour notre étude, nous nous limitons au système de recueil de cartes de profondeur le plus répandu, et donc de plus bas coût, le système Kinect proposé par Microsoft dans le cadre de leur console de jeux. Dans la suite de ce chapitre, nous allons détailler les caractéristiques de ce système.

2. 2.1.2 La caméra Kinect

La caméra Kinect est un dispositif du suivi des mouvements humains qui a été déve-loppé pour la console Xbox 360 en novembre 2010 [50]. La première version est connue sous le nom de Kinect V1 (Figure 2.1.a). En 2014, Microsoft a développé une deuxième version V2 (Figure 2.1.b) qui améliore certaines caractéristiques matérielles et logicielles de sa première version [51].

Figure 2.1 – Les caméras KINECT V1 (a) et KINECT V2 (b).

Les caméras Kinect sont caractérisées selon plusieurs critères dont les plus importants sont :

— Capteurs : une caméra RGB qui fournit des images optiques classiques en couleurs (non utilisées dans notre cas), un système de capteur de profondeur et un réseau de micros à reconnaissance vocale. Concernant le capteur de profondeur, il existe une grande différence de conception entre le système utilisé par la caméra kinect V1 qui est constitué par un couple projecteur/caméra infra-rouge et celui de la caméra kinect V2 qui utilise une caméra Time Of Flight (TOF). Le recueil de l’information de profondeur par couple projecteur/caméra pour la caméra Kinect V1 explique la présence d’ombres de surface non détectées dans les images fournies (cf Figure 2.2).

Partie I, Chapitre 2 – Description du contexte général de la thèse

Figure 2.2 – Exemple d’images obtenues avec a) une Kinect V1 et b) une Kinect V2 [52]

horizontaux (h) sont de l’ordre de ( 57 (h), 43(v)) et (70 (h), 60 (v)) respecti-vement pour les versions V1 et V2.

— Portée du capteur : la portée des capteurs est de l’ordre de 0,8 m à 3,5 m et de 0,5 m à 4,5 m respectivement pour la version V1 et la version V2.

— Flux de données : la résolution des images couleur et de profondeur est égale à 640×480 pixels pour la version V1. Une amélioration significative dans la résolution de l’image RGB a été apportée à la version V2 (1920× 1080 pixels, mais nous n’utilisons pas ce capteur). Par contre pour l’image de profondeur, la résolution a été abaissée à 512×424 pixels. En ce qui concerne les systèmes audio, le réseau de la version V1 est composé de quatre microphones pour assurer une communication en direct. Celui-ci permet de traiter des signaux audio jusqu’à 16 bits à une fréquence d’échantillonnage de 16 kHz. Concernant la version V2, avec le même nombre de microphones, la fréquence d’échantillonnage atteint 48 kHz. Ce système d’audio permet de supprimer les échos et reconnaitre plusieurs langues.

— Moteur d’inclinaison : un support pivotant n’existe que sur la caméra Kinect V1 pour permettre le suivi de déplacement des personnes en inclinant automati-quement le capteur jusqu’à 27 en haut ou en bas.

2. 2.1.3 Les avantages des systèmes Kinect

De nombreux chercheurs font de Kinect leur premier choix de capteur de profondeur car elle s’avère être la première caméra qui combine tous les avantages suivants :

— Combinaison de plusieurs flux : la caméra Kinect combine plusieurs types d’in-formation RGB, de profondeur, squelette, infrarouge et audio dans un seul système

2. 2. Types de capteurs

Caractéristiques Description

Dimension 27.94 x 6.35 x 3.81 cm Résolution 640 (h) x 480 (v) pixels Champs de vision (FOV Field Of View) 57 (h) x 43 (v)

Moteur d’inclinaison Automatique jusqu’à 27

Fréquence 30 Hz

Prix 170$

Table 2.1 – Spécifications de Kinect V1

ce qui permet de l’utiliser dans plusieurs domaines. Les images de type RGB-D (couleur et profondeur) peuvent améliorer considérablement les performances des classifieurs d’objets.

— Dédiée pour les applications d’intérieur : la caméra Kinect a été créée pour le pilotage de jeux vidéos donc adaptée à une utilisation en intérieur. Elle peut être utilisée directement, sans adaptation au niveau des systèmes de détection des chutes dédiés aux hôpitaux et aux maisons de retraite.

— Sécurité : le laser infrarouge (IR) Kinect V1 est doté d’une lumière infrarouge de type 2 qui n’est pas dangereuse pour l’homme, contrairement à la plupart des scanners laser. Ces derniers fonctionnent avec un laser de type 1 qui est néfaste pour les yeux en absence de protection. Ainsi, Kinect garantit la sécurité de la personne.

— Facile à utiliser : tous les systèmes à bases de caméras sont des systèmes passifs ne nécessitant aucune interaction avec la personne âgée (contrairement aux systèmes portables).

— Faible coût : ce type de capteur est disponible partout dans le monde et il coûte une centaine d’euros, y compris l’adaptateur et le kit de développement logiciel. — Préserve l’anonymat : dans notre étude, seules les images de profondeur sont

utilisées. La personne suivie n’est pas reconnaissable sur de telles images de profon-deur. Ceci permet de mieux protéger son anonymat par comparaison aux images RGB classiques.

— Indépendant aux conditions d’éclairage : le capteur Kinect est capable d’ex-traire les cartes de profondeur dans les pièces sombres à l’aide de ces capteurs infrarouges. Il peut donc détecter les chutes même pendant la nuit.

— Fréquence élevée : il peut être utilisé pour les applications en temps réel grâce à la fréquence d’images (FPS à 30 Hz)

Partie I, Chapitre 2 – Description du contexte général de la thèse

Ces caractéristiques permettent à Kinect d’être utilisée pour la détection des mou-vements en 3D du corps entier, la reconnaissance faciale et la reconnaissance vocale. Ce qui la rend très utile dans diverses applications telles que : le suivi et la reconnaissance d’objets, le suivi du squelette humain et l’analyse de l’activité, l’analyse des gestes de la main, la localisation et la cartographie 3D simultanée, la détection des urgences comme les agressions, les chutes et autres [51].

2. 2.1.4 Comparaison de la caméra Kinect avec d’autres capteurs de

profon-deur

Nous avons comparé la caméra Kinect V1 avec d’autres capteurs de profondeur plus récents, détaillés dans la Table 2.2. Nous constatons que la version V1 semble offrir le meilleur compromis entre une résolution et une qualité correctes et un coût faible.

En revanche, il a été noté par les utilisateurs certaines caractéristiques négatives comme l’ombre sans signal due à la parallaxe entre l’émetteur et le récepteur infrarouge et aussi certains effets inhérents aux infrarouges comme une sensibilité aux bruits infra-rouges tels que le soleil et ses reflets, ainsi qu’à la présence d’objets absorbants, qui peut dégrader la qualité de l’image ou la précision de la mesure en profondeur.