Approche locale

1.5 Conclusion

Figure 2.6.Les descripteurs SIFT d’un POI

Figure 2.7.D´etermination de l’orientation principale d’un POI SURF

1.5 Conclusion

2.1.3 Approche locale

Les techniques de repr´esentation d’objets par une approche globale ou par r´

e-gions ont re¸cu une attention d´ecroissante dans la communaut´e scientifique depuis

l’avènement des approches locales et notamment des points d’intérêt (On notera

désormais POI les points d’intérêt). En effet, la représentation d’objet par un

ensemble de POI est devenue un outil performant pour r´epondre aux probl`emes

pos´es par les larges variations de formes et d’apparences, ainsi qu’aux probl`emes

d’occultations partielles. Ces derni`eres ann´ees, plusieurs travaux de recherches ont

été entrepris dans ce type de représentation, décrivant différentes méthodes de

d´etection et de caract´erisation locale [HS88, Low99, SM97, Low04, BTG06] par

POI.

Le principe de la caract´erisation locale d’une image se fonde sur l’identification

des POI, puis sur l’utilisation de descripteurs locaux qui, par opposition aux

des-cripteurs globaux, ne caract´erisent qu’une zone restreinte de l’image. Dans ce qui

suit, nous citons les principales méthodes proposées pour détecter et caractériser

les POI.

2.1.3.1 D´etection de POI

En littérature, il existe différentes définitions du terme point d’intérêt. D’autres

termes spécifiques sont souvent employés : coin, point stratégique, point

particu-lier, etc. De manière générale, il s’agit de points riches en termes d’informations

sélectionnées selon un critère précis, et qui peuvent mieux décrire un objet que

d’autres.

L’objectif de la d´etection de POI est de localiser les points les plus importants

de l’objet pr´esentant une forte variabilit´e dans le signal visuel. De nombreuses

approches ont été expérimentées, mais nous nous limitons à citer les plus

popu-laires. On distingue deux types de détecteurs : à échelle fixe etmultiéchelles. Le

terme multiéchelles est employé quand la réponse du détecteur est calculée avec

des tailles de fenêtre ou des résolutions d’images différentes.

Les d´etecteurs de Beaudet et Moravec [Mor77, Bea78] furent les premiers

algo-rithmes de d´etection de POI. L’op´erateur de Beaudet [Bea78] s’appuie sur

l’ex-traction des maximas locaux après le calcul de la dérivée seconde pour chaque

pixel de l’image. L’opérateur proposé car Moravec [Mor77] s’appuie, quant à lui,

sur une matrice d’auto-corr´elation d’une petite zone de l’image. Celle-ci va

quan-tifier les différences de niveau entre la zone considérée et la même zone translatée

2.1 Repr´esentation des obstacles routiers 63

dans quatre directions (pour plus de d´etails sur la m´ethode, voir [Kra08]). Si le

minimum d’une de ces quatre valeurs est sup´erieur `a un seuil, alors il s’agit d’un

point d’int´erˆet.

Les d´etecteurs de Beaudet et Moravec [Mor77, Bea78] furent les premiers

algo-rithmes de d´etection de POI. L’op´erateur de Beaudet [Bea78] s’appuie sur

l’ex-traction des maxima locaux après le calcul de la dérivée seconde pour chaque pixel

de l’image. L’opérateur proposé car Moravec [Mor77] s’appuie, quant à lui, sur une

matrice d’auto-corr´elation d’une petite zone de l’image. Celle ci va quantifier les

différences de niveau entre la zone considérée et la même zone translatée dans

quatre directions (pour plus de d´etails sur la m´ethode, voir [Kra08]). Si le

mini-mum d’une de ces quatre valeurs est sup´erieur `a un seuil, alors il s’agit d’un point

d’int´erˆet.

Harris et Stephen [HS88] ont identifié certaines limitations liées à la réponse de

ce détecteur. Ils en ont déduit un détecteur de coins très populaire : le détecteur

de Harris. Ce détecteur, simple à mettre en œuvre et rapide, a été le plus utilisé

dans les années 1990. Cependant, cet opérateur n’a pas été adapté aux

change-ments d’´echelle. Afin de faire face `a ces transformations, Mikolajczyk et Schmid

[MS04] ont proposé une représentation multiéchelles pour ce détecteur. Ainsi, les

POI détectés doivent également être des maxima dans l’espace-échelle du

lapla-cien. Considérons que les niveaux successifs d’échelles sont représentés par σ

, ces

points sont sélectionnés en appliquant l’équation suivante :

|LOG(x, σ

)|=σ

|L

(X, σ

) +L

(X, σ

)| (2.2)

L’´equation 2.4 mesure la r´eponse du filtre Laplacien de Gaussienne (LOG) pour

un pointX= (x, y). AvecL

, d´esigne le r´esultat de la convolution de l’image avec

la dérivée seconde par rapport à x. Ensuite l’échelle est évaluée en représentant

l’image comme une pyramide telle que chaque niveau correspond `a une ´echelle.

Concr`etement, la convolution par gaussienne revient `a lisser l’image afin de lutter

contre l’apparition de points fictifs. Les z´eros du laplacien caract´erisent les points

d’inflexions de l’intensité et déterminent, dans une certaine mesure, la présence de

coins ou de contours.

La représentation multiéchelles peut être déterminée en se reposant sur l’idée que

le laplacien peut ˆetre vu comme la diff´erence entre deux lissages gaussiens de tailles

différentes. Cette méthode, appelée DOG (Différence of Gaussians), constitue une

bonne alternative au LOG (Laplacian of Gaussian) pour acc´el´erer le calcul d’une

repr´esentation.

H(σ, X) = ^L

⁽^{X, σ}⁾ ^L

⁽^{X, σ}⁾