• Aucun résultat trouvé

Analyse du comportement des super-pixels géométriques proposés

4.4 Introduction de l’approche de super-pixels géométriques

4.4.3 Analyse du comportement des super-pixels géométriques proposés

Nous commençons par une analyse de l’influence des choix des paramètres. Puis, nous éva- luons notre constructeur de super-pixels géométriques de deux façons différentes. Tout d’abord, globalement sur toute l’image où nous avons été capable de calculer les cartes de similarité et de planéité en étudiant la boîte englobante de l’enveloppe convexe formée par les points d’intérêt utilisés dans le calcul de l’homographie. Ensuite, de manière locale, en ciblant les zones d’intérêt pour lesquelles, notre approche fournit un résultat supérieur à celui fourni par SLICO. À partir

4.4. Introduction de l’approche de super-pixels géométriques 93

Figure 4.4 – Analyse du comportement des termes utilisés dans la distance d’agrégation pro- posée : Nous rappelons que plus la couleur du pixel est proche du vert, plus la distance est

petite. Nous visualisons les valeurs obtenues pour ds0, dc0 et dg dans deux cas où l’information

spatiale et colorimétrique ne sont pas suffisantes pour discriminer les deux surfaces adjacentes et la distance géométrique permet de distinguer les deux surfaces. Sur la première ligne : le germe se trouve sur le plan support (sol) alors que sur la deuxième, le germe appartient à une face de la boîte.

de maintenant, nous noterons l’approche que nous avons proposée GEOM.

Analyse des paramètres. Nous constructeur nécessite le choix de trois paramètres, à savoir, le nombre de super-pixels attendus, le paramètre de pondération λ et la valeur du seuil de similarité . Nous avons choisi de faire varier le nombre de super-pixels entre 50 et 600 car cela nous permet de couvrir un ensemble de valeurs suffisant pour étudier le comportement en fonction du choix pour ce paramètre. Lorsque le nombre de super-pixels diminue, les contours fournis par l’information géométrique sont conservés, la densité de super-pixels diminue et leur taille augmente.

La valeur du paramètre λ influence la pondération entre les deux termes DSLICOet dg. Lorsque

λ= 1 notre énergie correspond à l’approche SLICO, et dans le cas où λ = 0 seule l’information

géométrique est prise en compte. Ce dernier cas suppose que l’information géométrique extraite ne comporte pas d’erreur. Concrètement, il est important de conserver un certain équilibre entre les deux aspects.

La valeur de  détermine le seuil à partir duquel les pixels ayant une valeur de similarité inférieure à ce seuil sont considérés comme peu fiables et ne doivent pas être pris en compte dans le calcul de la distance. Ils sont alors affectés à la classe de rejet, où l’information n’est pas suffisante pour prendre une décision sur leur appartenance ou non à un plan donné de la scène. Si  = 0 cela revient à négliger l’information géométrique. Dans le cas où  est faible, nous considérons que l’information géométrique est peu fiable. Si  = 1, nous considérons que l’information géométrique est exacte et sans erreur, cela n’est valable que dans très peu de cas particulier, car il faudrait une mise en correspondance 2D ↔ 3D exacte et une similarité inter-image sans bruit et à très haute-résolution.

évaluations quantitative sont représentées dans la figure 4.5. Le choix de la valeur  se fait sur le taux de pixels bien classés (TP et FN) lors de l’estimation de la carte de planéité (dans les première étape de notre algorithme). La figure 4.5a représente ces deux taux en fonction d’. Nous choisissons pour la suite de l’évaluation  = 0.4, valeur pour laquelle nous obtenons le meilleur compromis en terme de résultats obtenus, c’est-à-dire un peu plus de 50% de pixels bien détectés et un peu moins de 50% d’erreur pour le taux de pixels étiquetés à tord sur les autres classes. Le choix de la valeur de λ s’effectue sur l’erreur de sous-segmentation lors de la construction des super-pixels. La figure 4.5b représente l’erreur de sous-segmentation en fonction du paramètre λ pour 50 et 600 super-pixels calculés avec  = 0.4. Pour 50 super-pixels, il y a une faible variation de valeur autour du minimum atteint, alors que pour 600 super-pixels un minimum global est atteint pour λ = 0.3. Dans les expérimentations qui suivent, nous avons donc choisi un compromis avec λ = 0.4.

(a) (b)

Figure 4.5 – Analyse du comportement de notre approche en fonction des paramètres  et λ : En (a) les taux des TP (true positive) et des FN (false negative) en fonction d’. En (b) erreur de sous-segmentation en fonction de λ lorsque  = 0.4 pour 50 et 600 super-pixels.

Analyse globale. Une comparaison visuelle des résultats entre SLICO et GEOM est donnée

dans la figure 4.6. Nous pouvons noter que les super-pixels obtenus par GEOM, comme attendu, adhérent plus précisément aux contours correspondant au changement de surfaces.

Une comparaison quantitative a également été réalisée afin d’évaluer la sur-segmentation à l’aide de l’erreur de sous-segmentation et de la valeur de rappel. Représentées sur les graphiques de la figure 4.7, ces mesures qui ont été détaillées dans la partie décrivant l’évaluation 2.8 montrent que le rappel est plus élevé avec GEOM et que l’erreur de sous-segmentation est plus faible avec GEOM également. Ainsi, nous obtenons de meilleures performances qu’avec les super- pixels de l’état de l’art SLICO. Nous pouvons noter que pour un nombre de super-pixels donné,

par exemple entre 100 et 200, l’erreur relative vaut entre 0,5−0,43

0,43 ' 0, 16 et

0,57−0,52

0,52 ' 0, 10,

4.4. Introduction de l’approche de super-pixels géométriques 95

Figure 4.6 – Comparaison visuelle de l’approche SLICO et de notre approche GEOM : Sur 4 images de notre corpus, nous visualisons les contours des super-pixels obtenus avec l’approche SLICO (en jaune) et notre approche GEOM (en rouge), pour 50, 100, 150 et 200 super-pixels.

L’amélioration est plus significative pour les sur-segmentations composées d’un faible nombre de super-pixels. Or, nous savons que la difficulté et l’enjeu des approches de sur-segmentation réside dans l’amélioration des performances pour un nombre de super-pixels raisonnable (une ou deux centaines maximum dans notre corpus, mais, cela dépend du type des scènes étudiées) afin de réduire la complexité algorithmique du processus global.

Analyse locale. Pour permettre une analyse plus approfondie du comportement de GEOM,

nous détaillons les résultats obtenus localement sur des zones contenant des contours entre deux surfaces ayant des orientations différentes et dont la texture est proche, voire similaire. La figure 4.8 présente les résultats obtenus. Pour cela nous utilisons deux mesures : le rappel, défini de la même manière que pour l’analyse globale, et la moyenne des distances des points de contours de la vérité terrain aux points de contours obtenus par la sur-segmentation proposée.

Cette moyenne, notée mdContours est définie par :

mdContours= 1 NVT X pi2VT di(pi) (4.7)

où di(pi) est la distance du pixel pi appartenant à la vérité terrain, notée VT, au contour le plus

(a) (b)

Figure 4.7 – Rappel et erreur de sous-segmentation obtenus pour SLICO et notre approche GEOM : Les courbes représentent (a) le rappel et (b) l’erreur de sous-segmentation. Plus de détail est donné dans le texte.

contour de la vérité terrain dans la zone analysée.

Ainsi, l’analyse locale montre que les super-pixels géométriques améliorent la qualité de la sur-segmentation obtenue, en particulier aux frontières entre deux surfaces de texture similaire mais d’orientations différentes. Dans la partie suivante, nous proposons d’utiliser cette sur- segmentation en super-pixels, GEOM, à la segmentation sémantique de scènes urbaines.

4.5 Méthode de segmentation de scènes urbaines utilisant les

Documents relatifs