Pré-traitement de l’image de profondeur - Reconnaissance de formes et suivi de mouvements en 4D

Dans cette section nous décrivons brièvement le système de suivi et les algorithmes de pré-traitement appliqués aux images de profondeur. Le système considéré dans ce chapitre, schématisé Figure 2.2.1, est composé d’un capteur 3D positionné à une hauteur d’environ 2.50 mètres en position quasi verticale et dirigé en direction du sol. Les individus sont situés en dessous de la caméra. La différence principale avec le système considéré dans [86] est que le capteur est placé beaucoup plus proche des têtes des personnes que l’on souhaite détecter.

FIGURE2.2.1 – Schéma représentant le système considéré.

Les images de profondeur acquises par les capteurs 3D contiennent des pixels indéterminés ne contenant aucune information de profondeur. L’orientation des surfaces des objets, leur composition et la lumière naturelle du soleil peuvent gêner la mesure de la distance. Nous avons vu au Chapitre 1 que tous les types de capteurs 3D sont concernés par ce problème.

L’algorithme sur lequel ce chapitre est basé analyse l’image de profondeur pour trouver les têtes des individus. Les zones indéterminées peuvent donc nuire considérablement à son bon fonctionne-ment. La première étape de la méthode consiste donc à donner une valeur de distance aux pixels indéterminés.

On distingue deux catégories de pixels indéterminés. La première concerne les pixels dont le contenu n’a pas pu être calculé pour les raisons décrites ci-dessus. La seconde inclus les pixels re-présentant des objets situés trop proches du capteur. Comme mentionné au Chapitre 1, les différents capteurs 3D ont des distances minimales et maximales de fonctionnement. Notre système utilise un capteur à lumière structurée de type Kinect ([60]) dont la distance minimale d’observation est d’en-viron d₀ = 500 mm. Par conséquent tous les objets situés à une distance inférieure à d0 ne seront pas visibles dans les données et on observera une tache noire sur l’image de profondeur. Une image provenant du système considéré contenant des pixels des deux catégories est donnée Figure 2.2.2. Sur cet exemple, les pixels représentant le bord du bras appartiennent à la première catégorie tandis que ceux de la tête font partie de la seconde. La cause de l’indétermination étant de nature différente, les deux classes de pixels seront traitées par des méthodes différentes.

36 2.2. PRÉ-TRAITEMENT DE L’IMAGE DE PROFONDEUR

FIGURE 2.2.2 – Image couleur et de profondeur provenant du système de suivi. Les pixels du bras appartiennent à la première catégorie de pixels indéterminés et ceux de la tête font partie de la seconde. Dans [86], les auteurs appliquent un algorithme simple pour donner une valeur aux pixels indéter-minés appartenant à la première catégorie. Les zones indéterminées sont reconstruites de l’extérieur vers l’intérieur, du bord de la zone en direction du centre et par bandes. Les pixels indéterminés dont au moins l’un des quatre voisins contient une distance peuvent être restaurés. La valeur de distance retenue est la profondeur moyenne des voisins. Un parcours de l’image complète aura pour effet de remplir une partie des pixels indéterminés. Plusieurs parcours successifs sont effectués pour finale-ment tous les supprimer. Cette approche est simple et son coût calculatoire est faible. Un exemple de résultat est donné Figure 2.2.3.

(a) (b)

FIGURE2.2.3 – En (a) l’image originale et en (b) l’image de résultat avec l’algorithme proposé dans [86]. Les zones indéterminées sont correctement reconstruites.

Du fait de la position basse du capteur, nous sommes confrontés à la seconde catégorie de pixels indéterminés, ce qui n’est pas le cas dans [86]. La tête d’une personne assez grande sera entièrement indéterminée et ne pourra par conséquent pas être détectée correctement. La méthode décrite dans le paragraphe précédent n’est alors plus suffisante. Le résultat obtenu sur une image où la tête est entiè-rement indéterminée est représenté Figure 2.2.4. On constate que les pixels appartenant à la tête n’ont pas été correctement ré-estimés. Les valeurs affectées à ces pixels sont trop élevées et correspondent aux profondeurs des objets adjacents. Les pixels valides situés autour de la tête sont dans cette confi-guration les épaules. Cette méthode n’est donc pas satisfaisante pour ce cas particulier et un autre algorithme doit être développé.

CHAPITRE 2. DÉTECTION ET SUIVI DE PERSONNES 37

(a) (b)

FIGURE2.2.4 – En (a) l’image originale et en (b) l’image de résultat avec l’algorithme proposé dans [86]. La tête n’est pas correctement reconstruite.

Le problème consiste à affecter des valeurs de distance cohérentes à des objets entièrement indé-terminés dans l’image. Ces objets étant assez proches du capteur, leurs tailles en pixels sur l’image sont importantes. Par conséquent, nous déterminons les zones représentant des objets trop proches par un algorithme de croissance de régions sur les pixels indéterminés. Une composante connexe de dimensions supérieure à lmin× hmin et composée d’au moins nmin pixels indéterminés est consi-dérée comme proche et sera traitée par l’algorithme suivant. Les pixels de la région sont remplis du bord vers le centre comme dans l’algorithme précédent. La première bande de pixels est affectée de la profondeur d₀qui correspond à la distance limite en dessous de laquelle la mesure ne peut plus être effectuée. Nous choisissons cette distance particulière car l’objet est supposé être proche du capteur à une distance inférieure à cette limite. L’image est ensuite reparcourue et les pixels appartenant à la bande suivante sont affectée de la valeur d₀− i ǫ, où i est l’indice de la bande courante et ǫ un pas en mm. Le paramètre ǫ, déterminé expérimentalement, contrôle la forme des objets reconstruits.

Cette méthode de restauration suppose que les objets à reconstruire sont de forme arrondie, ce qui est souvent le cas puisque nous nous intéressons à des individus. Dans le cas d’un bras levé par exemple, les pixels ajoutés donneront une forme allongée ne ressemblant pas à une tête. Un exemple de résultats est donné Figure 2.2.5. La tête a été reconstruite de manière acceptable puisque sa forme permettra sa détection lors des étapes suivantes de l’algorithme. La complexité de la méthode est faible.

(a) (b) (c)

FIGURE2.2.5 – En (a) l’image initiale, en (b) l’image de résultat avec la méthode proposée et en (c) le nuage de points 3D de la tête reconstruite.

Dans le document Reconnaissance de formes et suivi de mouvements en 4D temps-réel : Restauration de cartes de profondeur (Page 56-59)