Correspondance de structures irrégulières pour la segmentation et l’édition d’images

(1)

Correspondance de structures irr´ eguli` eres pour la segmentation et l’´ edition d’images

Stage de Master 2 (5-6 mois)

Laboratoire :

Laboratoire IMS, UMR 5218, Universit´e de Bordeaux, 351 cours de la lib´eration,

33400 Talence – France

Encadrants :

R´emi Giraud / IMS / Signal et Image (remi.giraud@ims-bordeaux.fr)

Description du sujet :

Contexte. La massification des données images traitées (HD, 3D, vidéos, etc.) représente un enjeu de taille pour les années à venir. Les processus de traitement classiques sont impactés par le nombre et la taille des images en constante augmentation, qui peuvent mener à des temps de calcul très élevés.

Dans ce contexte, les méthodes de réduction de résolution, type superpixels, ont été progressivement introduites ces dernières années, pour décomposer l’image en zones de couleurs homogènes tentant de respecter les contours des objets (voir Figure 1(a)). Le nombre d’éléments à traiter est alors con- sidérablement réduit, ce qui permet de diminuer le temps de calcul, tout en permettant potentiellement d’avoir un résultat à l’échelle superpixellique qui soit proche du résultat optimal à l’échelle pixellique.

Cependant, les régions à traiter sont à présent irrégulières, et ont des formes et des voisinages variables, ce qui limite beaucoup à l’heure actuelle l’utilisation de cette approche dans les pipelines standards de vision par ordinateur.

En effet, de nombreuses méthodes d’analyse et de traitement d’images sont basées sur la recherche de correspondances et utilisent des outils de comparaison basés sur des voisinages réguliers définis à l’échelle pixellique. Un pixel est généralement décrit par un patch, un voisinage carré qui va permettre de trouver des motifs similaires dans la zone de recherche. Cette zone est dite dite “non locale” et peut être définie dans la même image par exemple pour le débruitage [Buades et al., 2005] ou dans une ou plusieurs images d’exemples accompagnées de vérité terrain par exemple pour la segmentation automatique [Coupé et al., 2011]. Néanmoins, dans ces approches, il existe donc autant de patchs à traiter que de pixels dans les images, ce qui peut mener à d’importants temps de calcul.

Récemment, dans [Giraud et al., 2017a], une première extension du formalisme basé-patch aux structures irrégulières a été proposée. Un algorithme rapide de recherche semi-aléatoire basé sur PatchMatch [Barnes et al., 2009] a été introduit pour calculer des correspondances en termes de voisinage de superpixels. Dans un premier temps, la méthode a été appliquée à la segmentation et l’étiquetage depuis une bibliothèque d’images d’exemples (Figure 1(a)) et au transfert de couleurs rapide entre images [Giraud et al., 2017b] (Figure1(b)). Néanmoins, les outils de comparaison proposés sont loin d’être optimaux et peuvent toujours s’avérer coûteux en termes de complexité et de temps de calcul.

Fusion des étiquettes d'exemple Recherche non locale

de correspondances

...

bibliothèque d'images d'exemple

étiquetage du étiquetage ﬁnal décomposition en

image à traiter

superpixels superpixel

(a) (b)

Figure 1: Schéma de la méthode de segmentation et d’étiquetage automatique [Giraud et al., 2017a] (a) et résultat de transfert de couleurs [Giraud et al., 2017b] (b) par correspondance de voisinages de superpixels.

1

(2)

Objectifs du stage. Ce stage de recherche s’inscrit dans les thématiques actuelles de recherche en image (grandes bases de données, algorithmes rapides de correspondances, segmentation, classification, etc). Il a pour objectif de répondre aux limitations restantes des des outils de correspondance de structures irrégulières proposés dans [Giraud et al., 2017a] et d’étendre ces travaux à de nouvelles applications.

Une première étape consisterait à redéfinir la méthode de correspondance en cherchant à améliorer par exemple la complexité de la distance de comparaison entre deux structures irrégulières.

Chaque région est généralement décrite par un histogramme couleur des pixels qu’elle contient, ce qui entraˆıne la perte de l’information spatiale. Un autre objectif du stage serait d’adapter aux régions irrégulières des descripteurs plus avancés tels que [Lowe, 2004,Bay et al., 2006] qui ont su prouver leur efficacité pour la recherche de correspondance entre images.

Enfin, pour augmenter le potentiel de la méthode, un schéma multi-échelles pourra être con¸cu afin de mettre en correspondance des éléments de tailles différentes entre images, et ainsi pouvoir appliquer l’algorithme à des bases très hétérogènes.

Avec un algorithme rapide, robuste et générique, les possibilités d’applications sont nombreuses, et le stagiaire pourra être force de proposition. On pourra s’intéresser aux bases telles que PASCAL VOC [Everingham et al., 2012], sur des problématiques d’analyse comme la segmentation ou la classification d’images. La méthode de transfert de couleurs proposée dans [Giraud et al., 2017b] pourrait également ˆ

etre améliorée pour viser un transfert “sémantique” où l’on viendrait transférer les couleurs d’objets similaires dans une autre image.

Candidat Recherch´ e :

Candidat titulaire d’un Master 2 ou d’un diplôme d’ingénieur de grande école, spécialité Informa- tique / Image. Des connaissances et expériences solides en traitement de l’image et programmation (MATLAB/Python, C/C++) sont demandées. La maˆıtrise de l’anglais scientifique et des qualités rédactionnelles sont également attendues.

Contact. Pour candidater, envoyez un dossier avec CV, lettre de motivation, relevés de notes, ainsi que toute pièce susceptible de renforcer la candidature (lettre de recommandation, etc). Pour l’envoi des pièces demandées, ou pour toute question sur le sujet : remi.giraud@ims-bordeaux.fr

R´ ef´ erences :

[Barnes et al., 2009] Barnes, C., Shechtman, E., Finkelstein, A., and Goldman, D. B. (2009). PatchMatch: A randomized correspondence algorithm for structural image editing. ACM Trans. on Graphics (ToG), 28(3).

[Bay et al., 2006] Bay, H., Tuytelaars, T., and Van Gool, L. (2006). SURF: Speeded up robust features. In Proc. of European Conference on Computer Vision (ECCV), pages 404–417.

[Buades et al., 2005] Buades, A., Coll, B., and Morel, J.-M. (2005). A non-local algorithm for image denoising.

InProc. of IEEE Conf. on Computer Vision and Pattern Recognition (CVPR), volume 2, pages 60–65.

[Coupé et al., 2011] Coupé, ., Manjón, J. V., Fonov, V., Pruessner, J., Robles, M., and Collins, D. (2011). Patch- based segmentation using expert priors: Application to hippocampus and ventricle segmentation.NeuroImage (NIMG), 54(2):940–954.

[Everingham et al., 2012] Everingham, M., Van Gool, L., Williams, C. K. I., Winn, J., and Zisserman, A.

(2012). The PASCAL Visual Object Classes Challenge 2012 (VOC2012) Results.

[Giraud et al., 2017a] Giraud, R., Ta, V.-T., Bugeau, A., Coup´e, P., and Papadakis, N. (2017a). SuperPatch- Match: An algorithm for robust correspondences using superpixel patches. IEEE Trans. on Image Processing (TIP).

[Giraud et al., 2017b] Giraud, R., Ta, V.-T., and Papadakis, N. (2017b). Superpixel-based color transfer. In Proc. of IEEE International Conference on Image Processing (ICIP).

[Lowe, 2004] Lowe, D. G. (2004). Distinctive image features form scale-invariant keypoints. International Journal of Computer Vision (IJCV), 60(2):91–110.

2