Méthodes existantes - Localisation et caractérisation d'objets inconnus à partir d'informations

La plupart des outils de saisie qui utilisent la vision sont basés sur des méthodes pragmatiques permettant la segmentation de l'objet à saisir sur le fond. Bien souvent, le traitement de l'image est simplié par une série d'hypothèses. Et l'idée est couramment admise que les solutions de traitement

156 Détection de l'objet par une méthode de contours actifs

pour des scènes complexes viendront des recherches menées par les spécialistes en traitement de l'image.

Selon les hypothèses sur l'objet et la scène, plusieurs solutions ont ainsi été proposées pour extraire les contours d'un objet dans une image. Par exemple, si l'objet est de couleur relativement uniforme, ou bien si la couleur du fond est relativement uniforme, il est possible d'utiliser des techniques basées sur une segmentation des images par détection des régions d'une même couleur pour délimiter le contour de l'objet [Sanz 05, Tsui 08, Glover 08]. Une telle segmentation des objets est illustrée sur la gure 8.1 [Glover 08]. Dans cette étude, les objets présentés sont de couleur uniforme et distincte.

Fig. 8.1 Segmentation à partir de la couleur d'un objet et détection des contours associée. Les objets sont de couleurs uniformes et chaque objet a une couleur discriminante [Glover 08].

À l'inverse, si l'objet n'est pas uniforme mais texturé, il peut être supposé que la zone de l'image contenant la plus forte densité de contours contient l'objet [Becker 98]. Dans un premier temps, les contours sont détectés en utilisant une méthode robuste aux changements d'échelle et reposant sur les ondelettes [Mallat 99]. Les zones de plus forte densité de contours sont ensuite repérées et représentées par des régions d'intérêt, ou blob. Dans le projet Gripsee [Becker 98], le blob sélectionné est celui qui est pointé par la main de l'utilisateur (voir gure 8.2). Dans notre cas, le blob contenant l'objet serait celui qui contiendrait le clic.

Fig. 8.2 Comme dans le cadre de notre étude, l'objet est désigné par pointage. La segmentation repose sur l'hypothèse que l'objet se trouve à l'emplacement de la zone la plus texturée de l'image. À gauche l'image à traiter, au centre les contours détectés et à droite la détection du blob contenant l'objet.

Plutôt que d'imposer des hypothèses sur la texture des objets, [Li 08] propose une méthode de segmentation très prometteuse qui suppose que les objets présentent un axe de symétrie, conduisant ainsi à la détection des contours symétriques dans une image. Une telle approche permet de localiser

8.1 Méthodes existantes. 157

en temps réel la plupart des objets du quotidien, même s'ils sont transparents. La gure 8.3 présente quelques résultats de segmentation obtenus avec cet algorithme.

Fig. 8.3 Segmentation par recherche des symétries [Li 08].

Dans le cadre d'une approche multi-images, où plusieurs vues calibrées sont disponibles, il est possible de diérencier l'objet du fond en introduisant des informations sur la structure de la scène : calcul de carte de profondeur, détection de plans, construction de nuages de points denses, représentation volumique, etc. En parallèle de notre travail, une étude est menée actuellement au CEA pour segmenter l'objet à partir d'une fusion d'informations de disparité, obtenue grâce à un banc de stéréovision, et d'informations couleurs. L'idée est de segmenter l'image en régions de couleurs puis de fusionner les zones qui ont la même disparité (voir la gure 8.4). D'autres travaux se sont portés sur de la segmentation mixte, couleur et disparité, par exemple [Benlamri 04, Shibuya 08]. Dans [Benlamri 04], la distance est représentée par un ensemble de portions planes. Pour lever l'hypothèse d'une scène texturée, il est possible d'utiliser un capteur laser qui permet d'avoir une information de distance à l'obstacle, comme proposé dans [Shibuya 08].

Fig. 8.4 Segmentation reposant sur une carte de disparité et la détection de région d'une même couleur [LeCam 08].

Si la scène est texturée et si la caméra est en mouvement, une segmentation au sens du mouvement peut être employée [Odobez 95]. Les diérents objets composant la scène sont identiés en recherchant les zones qui ont un mouvement cohérent. Ces méthodes ont été utilisées dans le cadre de l'exploration de scène [Flandin 00]. Les objets sont placés sur un support plan et texturé, ils peuvent être identiés en détectant les points dont la trajectoire exclut l'appartenance au plan.

Les vues calibrées d'une scène peuvent être utilisées pour obtenir un nuage de points denses par mise en correspondance de points d'intérêt (voir paragraphe 4.3.1.1) [ElKhoury 07]. Les objets sont alors diérenciés du fond par segmentation de l'information 3D en s'intéressant à la structure d'un nuage de points ou bien en décomposant la scène en un ensemble de fonctions implicites, par exemple des super-ellipsoïdes [Whaite 97b, Whaite 97a].

Par ailleurs, si un ensemble de vues étalonnées est disponible, une représentation voxellique des objets peut être obtenue par des méthodes de voxel coloring ou space carving. Ces méthodes reposent sur la notion de photo-consistance des points d'une scène pour laquelle la direction d'illumination est constante, c'est-à-dire qu'un point de la surface d'un objet sera vu avec une même couleur quelle que soit la position de l'observateur. Ces méthodes ont été testées durant le stage de Master de Caroline Nadeau [Nadeau 08, Nadeau 09].

Dans le cadre de cette étude, nous proposerons une méthode basée sur les techniques de contours actifs [Kass 87, Terzopoulos 91] pour détecter le contour des objets qui présente le plus fort contraste.

158 Détection de l'objet par une méthode de contours actifs

Les contours actifs, ou modèles déformables, ont déjà été utilisés avec succès dans des travaux de saisie d'objets guidée par la vision [Blake 95] et de modélisation [Chung 96]. Ils présentent un moyen ecace d'obtenir un contour fermé et permettent le cas échéant le suivi dans une séquence d'images du contour détecté.

Un inconvénient de ces méthodes est qu'elles demandent une étape d'initialisation au cours de laquelle un contour approximatif de l'objet est déni. En particulier, lorsque l'objet est placé sur un fond texturé, ce contour initial doit être susamment proche du contour réel pour que l'algorithme converge. Dans le cadre de notre application, un unique clic est demandé à l'utilisateur. Une seconde section présentera quelques pistes de recherche qui pourraient mener à une initialisation du contour actif en un seul clic.

Dans le document Localisation et caractérisation d'objets inconnus à partir d'informations visuelles : vers une saisie intuitive pour les personnes en situation de handicap (Page 162-165)