• Aucun résultat trouvé

Efficacité du modèle par rapport à la littérature

2.2 Discussion et bilan

3.2.2 Efficacité du modèle par rapport à la littérature

L’objectif de nos expérimentations est d’évaluer l’efficacité de notre modèle d’an- notation d’images qui intègre les descripteurs de thématique, de spatialisation et de temporalité. Pour ce faire, nous avons confronté les résultats obtenus par notre modèle avec ceux obtenus par les deux baselines présentées dans la section III.3.1.3.

3.2. Résultats 0,44 0,46 0,48 0,50 0,52 0,54 0,56 M A P Gaussian Laplace 0,40 0,42 0,44 0 20 40 60 80 100 120 sigma

Figure III.3.2 – Sensibilité du paramètre σ des fonctions Kernel pour le descripteur temporel.

deux fonctions spatiales : la similarité classique spatiale et les fonctions Kernel (voir sec- tion II.2.3). De même, deux fonctions temporelles sont disponibles : la similarité classique temporelle et les fonctions Kernel (voir section II.2.4). Nous avons commencé par étudier l’impact de chaque fonction individuelle en terme de performance.

Le Tableau III.3.2 présente les performances de chaque fonction sur l’ensemble de 200 images-requêtes. Dans la partie supérieure du tableau sont affichés les résultats obtenus pour les similarités spatiales, tandis que dans la partie inférieure sont affichés les résultats obtenus pour les similarités temporelles. Selon les résultats, nous observons que la fonc- tion Kernel Laplace a permis une amélioration significative pour les deux descripteurs de spatialisation et de temporalité au niveau des résultats P@5, MAP et Rprec.

P@5 MAP Rprec

Fonctions spatiales

similarité spatiale classique 0,4158 0,4479 0,4404

Kernel Laplace 0,4305 0,4684 0,4624

Fonctions temporelles

similarité temporelle classique 0,4633 0,5151 0,5006

Kernel Laplace 0,4655 0,5343 0,5225

Tableau III.3.2 – Résultats obtenus pour les deux fonctions spatiales et les deux fonctions temporelles en utilisant la collection Flickr décrite dans la section III.3.1.1.

Le Tableau III.3.3 présente les résultats obtenus en comparant notre modèle d’anno- tation (GT-TRM) avec les deux baselines décrites dans la section III.3.1.3. La partie supé- rieure du tableau présente les résultats de la comparaison du modèle avec les deux ba-

Expérimentation 2 : ecacité du modèle probabiliste pour l'annotation d'images

chaque colonne sont indiquées en gras. Nous observons qu’aucune des baselines ne dé- passe les résultats obtenus par notre approche pour aucune des mesures. Comme la P@5 de notre approche est de 49 %, nous pouvons affirmer qu’en moyenne 2,45 parmi les 5 premières étiquettes sont des descriptions pertinentes d’une image-requête. De plus, le fait que notre modèle obtienne la plus grande valeur pour la MAP montre son efficacité et sa stabilité par rapport aux deux baselines. Nous remarquons également (Tableau III.3.3) que la baselineSM des travaux de Silva et Martins (2011) surpasse la baselineTF représen- tée par la mesure de tf classique utilisée dans plusieurs travaux d’annotation automatique d’images.

La partie inférieure du Tableau III.3.3 montre l’amélioration de notre modèle de clas- sement par rapport aux deux baselines. Le t-test de Student (1908) suggère que les amé- liorations obtenues sont statistiquement significatives avec une valeur de significativité

p < 0, 01. Dans le Tableau III.3.3, le symbole † indique la significativité des résultats du

modèle de classement par rapport à la première baseline (baselineTF ) et le symbole ∗ pour la deuxième baseline (baselineSM ).

Selon les résultats obtenus, nous observons que des améliorations (pour toutes les me- sures) plus importantes sont obtenues lorsqu’on compare le modèle d’annotation avec la

baselineTF (89 %). Ces résultats étaient prévisibles compte tenu la performance de la ba- selineSM par rapport à la baselineTF (38 %). Nous concluons que l’utilisation des descrip-

teurs spatial et temporel dans le processus d’annotation automatique d’images améliore les travaux de l’état de l’art.

P@5 MAP Rprec baselineTF 0,2610 0,3455 0,3011 baselineSM 0,3616 0,4142 0,3918 GT-TRM 0,4938 †* 0,5660 †* 0,5432 †* Amélioration baselineTF vs baselineSM 38,5 % 19,8 % 30,1 % baselineTF vs GT-TRM 89,2 % 63,8 % 80,4 % baselineSM vs GT-TRM 36,5 % 36,6 % 38,6 %

Tableau III.3.3 – Résultats obtenus pour notre modèle d’annotation (GT-TRM) par rapport à la littérature (les deux baselines décrites dans la section III.3.1.3). Une dague (†) et une étoile (*) indiquent une améliora- tion statistiquement significative par rapport à la première et deuxième

3.3. Bilan

3.3

Bilan

Dans cette section, nous avons proposé un cadre expérimental pour évaluer la qua- lité du modèle probabiliste d’annotation d’image présenté dans la partie II. Les résultats obtenus montrent que l’intégration des descripteurs de thématique, de spatialisation et de temporalité dans un modèle probabiliste permet de déterminer des termes perti- nents qui décrivent une image-requête. De plus, nous avons montré qu’il surpasse deux approches de la littérature. Dans la section suivante, nous évaluons l’approche que nous avons présentée dans la section II.4 pour enrichir la liste des tags fournie par ce modèle probabiliste avec d’autres termes pertinents issus du Web.

4

Expérimentation 3 : ecacité de

la proposition d'enrichissement

des tags en s'appuyant sur le Web

D

ANS CETTE SECTION, nous expérimentons l’approche présentée dans la section II.4. L’objectif de cette expérience est de répondre à la suivante question : l’utilisation

conjointe des données issues du Web et des plateformes de partage d’images conduit-elle à une annotation plus riche/diversifiée/pertinente que lors de l’utilisation unique des plate- formes de partage d’images ? À cet effet, en l’absence d’une collection d’évaluation stan-

dard adaptée pour ce type de travaux, nous avons proposé un cadre d’évaluation qui suit la démarche d’évaluation de TREC en lien avec des expérimentations du projet Cranfield dans les années 1967 (Cleverdon, 1967).

Dans la suite de cette section, nous présentons, dans un premier temps, notre proto- cole d’expérimentation. Puis, dans un deuxième temps, nous présentons et discutons les résultats obtenus.

4.1

Protocole d’expérimentation

Dans cette section, nous présentons les ressources expérimentales employées pour l’évaluation, la baseline utilisée afin de montrer la performance de l’approche proposée et les métriques employées.