Descripteur de spatialisation d’image - Annotation d'images via leur contexte spatio-temporel e

entropiezones(tg) = − N X i=1 p(tgi) log (p(tgi)) (2.11) où :

– N représente le nombre de zones résultant de la division de la zone de capture de l’image-requête où le tag tg apparaît et

– p(tgi) représente la probabilité du tag tg d’apparaître dans la zone i.

Nous obtenons des valeurs élevées d’entropie pour les tags qui ont une répartition uniforme dans la zone de capture d’une image-requête et des valeurs faibles pour les

tags qui sont spécifiques à une zone précise. Par exemple, pour une image-requête iqde la Tour Eiffel, le tag Tour Eiffel est plus spécifique pour iqcar il apparaît dans sa proximité spatiale tandis que le tag Paris est plus général pour iqcar il apparaît simultanément dans différentes zones.

(b) entropietempsd’un tag tg

Nous définissons la spécificité temporelle d’un tag tg en se rapportant à une période de temps (l’année, par exemple) prtemps. Elle est basée sur l’équation suivante :

entropietemps(tg) = − N X i=1

p(tgi) log (p(tgi)) (2.12) Dans ce cas, N représente le nombre de dimensions temporelles (par exemple, le jour, la semaine. . . ) obtenues en divisant la période de temps prtempset p(tgi) la pro- babilité du tag tg d’apparaître dans la dimension temporelle i considérée.

Des valeurs élevées d’entropie sont obtenues pour les tags répartis uniformément dans le temps, alors que des valeurs faibles qualifient les tags spécifiques à une di- mension précise.

2.3 Descripteur de spatialisation d’image

Cette section définit le descripteur de spatialisation, l’hypothèse spatiale et les approches proposées pour modéliser et calculer la similarité spatiale (c.-à-d. proximité) entre deux images. En effet, les images qui se trouvent dans la proximité spatiale d’une image-requête sont classées par similarité décroissante.

2.3.1 Définition du descripteur de spatialisation

La position de localisation de la prise de vue d’une photo représente un facteur im- portant dans le processus d’annotation d’images de type paysage, et pas seulement. Cette

Modélisation des descripteurs de thématique, de spatialisation et de temporalité

position de localisation d’une image est traduite en termes de latitude, longitude et parfois altitude (par exemple, La Tour Eiffel a une latitude de48° 51029.600N et une longitude de2° 170 40.200E). Nous représentons dans la Figure II.2.4 une image de la Tour Eiffel que nous pouvons placer sur une carte à l’aide de ses coordonnées de localisation.

Figure II.2.4 – Placement de l’image de Tour Eiffel sur Google Maps, à l’aide de ses coordonnées de localisation.

2.3.2 Hypothèse de pertinence spatiale

Nous supposons qu’une étiquette est plus importante pour une image-requête à an- noter si elle est associée aux images situées à proximité de la localisation de cette image- requête. En effet, il est possible que deux photos prises dans des endroits proches soient descriptibles avec les mêmes mots. Par exemple, pour une photo-requête iq de la Tour

Eiffel, les étiquettes des photos prises autour d’elle (c.-à-d. zone délimitée par un cercle)

peuvent être plus pertinentes que les étiquettes des photos prises plus loin (c.-à.-d. zones délimitées par un rectangle et un hexagone) (voir la Figure II.2.5). En effet, les photos prises à une distance d1de l’image-requête de la Tour Eiffel peuvent être étiquetées par les

tags suivants : tour, Tour Eiffel, fer. . . Cependant, les photos prises à une distance d2 ou d3 sont plus susceptibles d’être étiquetées avec les tags suivants : Musée de quai

2.3. Descripteur de spatialisation d'image

Branly, musée, arts, jardin, Jardins du Trocadéro, fontaine. . . Un seuil τ de dis- tance maximale entre l’image-requête et la zone considérée proche est à fixer expérimen- talement.

Figure II.2.5 – Illustration de la distribution des photos sur une carte3_.

Les étiquettes d’images qui se trouvent à une distance maximale τ d’une image-requête iqpeuvent constituer des descripteurs pertinents pour iq.

Modélisation des descripteurs de thématique, de spatialisation et de temporalité

2.3.3 Similarité spatiale entre deux images

Nous définissons la similarité spatiale entre deux images iq et ir par la fonction

dist(iq, ir). Pour calculer cette fonction, nous représentons la proximité spatiale entre deux images en termes de latitude et de longitude en se basant sur une distance appelée dis-

tance à vol d’oiseau ou distance orthodromique4. Cette distance tient compte du fait que la surface de la Terre est courbe. Par contre, elle ignore le changement d’altitude à la surface du globe. Son utilité est montrée par des travaux de la littérature (Silva et Martins, 2011).

Définition. La distance orthodromique (dO) désigne la plus petite distance en kilo- mètre entre deux points sur une sphère5. Tenant compte du fait que la Terre est approxi- mativement une sphère, les deux points peuvent être deux coordonnées géographiques :

A(lat, long) et B(lat, long) où lat est la latitude et long est la longitude. La formule mathé-

matique de cette distance spatiale est donnée par l’équation 2.13.

dO(A, B) = arccos (sin(latA) ∗ sin(latB) + cos(latA) ∗ cos(latB) ∗ cos(longB− longA)) ∗ R (2.13) où R est le rayon de la sphère terrestre (R = 6 371).

Par rapport à notre objectif d’assignation des scores aux images, nous présentons dans la suite trois approches spatiales. En effet, elles calculent la similarité spatiale entre une image-requête iqet une image irqui se trouve dans la proximité de iq. Afin de calculer ces similarités nous nous appuyons sur la distance à vol d’oiseau et les fonctions présentées dans la section II.2.1.

1) Approche 1 : similarité classique

La distance spatiale (équation 2.13) entre deux coordonnées géographiques est conver- tie en similarité spatiale conformément à l’équation suivante :

distclassique(iq, ir) =

1 + dO(iq, ir) · 103

(2.14) Nous avons ajouté1 à la distance spatiale en mètres pour éviter la division par zéro lorsque les deux images iqet irsont prises au même endroit.

2) Approche 2 : fonctions Kernel

Une deuxième approche consiste à exprimer la distance spatiale entre deux images par une fonction de proximité. En se basant sur des travaux de la RI, nous proposons d’utili- ser comme fonctions de proximité les fonctions Kernel introduites dans la section II.2.1

3. Distribution d’images provenant de la plateforme Panoramio sur la carte Google Maps. 4. en anglais : Great-circle distance

Dans le document Annotation d'images via leur contexte spatio-temporel et les métadonnées du Web (Page 93-97)