Enjeux et problématique de la recherche multimédia structurée

Comme nous l’avons mentionn´e dans le chapitre 2, dans le cas de docu-

ments semi-structurés comme les documents XML, l’utilisateur peut exprimer sa requête soit par de simples mots-clés (requêtes orientées contenu), soit en ajoutant des contraintes de structure pour mieux raffiner les résultats (requêtes orientées contenu et structure). Ces deux types de requêtes sont valables aussi pour la recherche multimedia structurée. Nous les appelons respectivement

requêtes multimédia orientées contenu et requêtes multimédia orientées contenu et structure.

Deux différences existent entre les requêtes exprimées pour une recherche textuelle et les requêtes exprimées pour une recherche multimedia. La première est que d’autres informations peuvent être également fournies par l’utilisateur dans les requêtes multimédia orientées contenu et structure telles que des images exemples. La deuxième différence est que des contraintes multimédia doivent toujours être présentes dans les requêtes, c’est à dire que les éléments à renvoyer par le système doivent toujours avoir une spécificité multimedia : soit ils sont des éléments multimédia, soit ils sont contenus dans des éléments multimédia, soit ils contiennent des éléments multimédia.

Nous désignons par élément multimedia em l’élément contenant l’entité référant le contenu de l’objet multimedia (en l’occurrence le nom de fichier), et pouvant contenir aussi d’autres nœuds ayant des informations associées comme les nœuds de description (caption).

La figure 4.1 présente un exemple sur lequel nous considérons la requête

”ville de Toulouse”. Ici, l’élément multimedia est l’élément figure. Ce dernier est composé de deux autres éléments contenant des informations spécifiques à l’image : nom-image et caption.

En regardant cet élément multimedia figure, ses descendants et ses ancêtres, il est possible qu’un ancêtre (ou un descendant) tel que l’élément par soit plus

pertinent que l’´el´ement multimedia figure. Dans la terminologie INEX1_{, tous les}

éléments multimedia, leurs descendants et leurs ancêtres sont appelés fragments

multimedia F M (les éléments F M 1 à F M 8 sur la figure4.1sont des fragments multimedia ). Nous utilisons également cette terminologie dans ce mémoire.

La probl´ematique de la RMS est abord´ee alors selon deux axes :

– dans le cas où l’utilisateur désire des éléments multimédia, la problématique

1. Initiative for the Evaluation of XML Retrieval. http ://inex.is.informatik.uni-

ÓÔÕ Ö× ÕØÙ Ú Û ØÜ × ÝÔÞÚ Ö ß Ôà ÞÔàá Úâ ã ÜÙ äØÜÝ × Ôå Þ × Úå ß ÔàÞÔàá ÚâæÕÞ ç Ú á ä è ÞØäÚäØÜ × ÝÔÞÚ ÞØå à × Ý é Øê × Þ ÞÚ ç Ú ß Ôà ÞÔàá Ú Ú áÝëâ é Ú áÜÔìÝ ç Ø åá ß ÔàÞÔàá Úë em ÜØì ÜØì ç Ô äàÕÚåÝ á ÚäÝ × Ôå í × Ùà ìÚ FM 3 FM 2 FM 1 FM 4 FM 5 FM 6 FM 7 _{FM 8}

Figure _{4.1 – Exemple d’élément Multimédia/Fragment Multimédia}

est alors comment utiliser au mieux le contexte textuel et structurel pour évaluer des scores de pertinence pour les éléments multimédia.

– dans le cas o`u l’utilisateur d´esire un fragment multimedia pertinent, la

problématique est alors de calculer des scores de pertinence pour ces fragments multimédia et de déterminer celui qui est le plus spécifique et exhaustif à renvoyer à l’utilisateur.

Comme nous l’avons mentionné précédemment dans la section3.5.1du chapitre

3, de nombreuses approches ont utilis´e le contenu textuel et la structure pour

la recherche d’images dans le contexte du Web [106] [246] [114].

A notre connaissance, en ce qui concerne la recherche multimédia dans des documents structurés de type XML, les premiers travaux ont été effectués dans le contexte de la campagne d’évaluation INEX, et plus précisément dans la

tâche multimédia2 _{née en 2005.}

La plupart des travaux présentés dans ce chapitre ont donc été proposés dans ce cadre. Les requêtes traitées par les différents travaux sont généralement des requêtes textuelles, mais il est possible qu’elles soient accompagnées par des requêtes images.

Les travaux proposés dans le cadre de la RMS, peuvent être classés selon deux catégories :

– les approches de recherche d’information existantes (telles que des approches dans le cadre de recherche d’information structur´ee ou bien dans

le cadre de recherche d’images par le contenu) adaptées à la RMS ; – et les approches spécifiques à la RMS, qui sont proposées uniquement pour

trouver des éléments ou des fragments multimédia dans des documents XML.

Ces deux types d’approches sont pr´esent´es respectivement dans les sections4.3

et4.4.

4.3 Approches de recherche d’information exis-

tantes adapt´ees `a la RMS

Les techniques utilisées dans ce type d’approches ne sont pas nouvelles, elles s’appuient sur des techniques classiques utilisées pour la recherche d’information structurée ou la recherche d’images adaptées à la recherche d’images dans des documents semi-structurés. Dans ce qui suit, nous détaillons quelques unes entre elles.

4.3.1 Combinaison de la recherche d’images bas´ee contenu

et de la recherche XML classique pour la RMS

De nombreux travaux dans le cadre de RMS ont proposé de combiner des résultats obtenus par une recherche d’images basée sur le contenu et une recherche textuelle structurée. Ceci revient à combiner linéairement les scores ob-

tenus par les deux recherches. Parmi ces travaux, citons [265], [186], [130], [159].

La plupart des résultats montrent que la fusion des deux approches dégraderait les résultats par rapport à l’utilisation seule de la recherche basée-contexte. Les

auteurs dans [159] montrent ´egalement que les caract´eristiques de bas niveau

peuvent améliorer la recherche en filtrant ou réordonnant les résultats trouvés par une recherche contextuelle, mais pas pour faire une recherche entière.

4.3.2 Adaptation d’une recherche XML classique `a la

RMS via le filtrage des r´esultats

Une autre méthode proposée par l’équipe CWI/UTwente [272][290] consiste

à utiliser une recherche textuelle classique basée sur le modèle de langage et adaptée à la recherche structurée en utilisant des fonctionalités XQuery. Plus précisément, les auteurs ont étudié l’impact de la taille des éléments à renvoyer à l’utilisateur. Pour cela, ils ont utilisé plusieurs fa¸con pour introduire ce facteur dans le calcul de score de pertinence et ils ont varié la granularité des éléments

résultats : documents entiers, éléments de n’importe quel type, etc. Enfin, et afin de respecter la spécificité multimedia, les résultats obtenus sont filtrés en ne gardant que les fragments contenant au moins une image. Aucun traitement multimedia supplémentaire n’est effectué. Les meilleurs résultats retournés par cette méthode sont obtenus en ne renvoyant que des documents entiers.

D’une mani`ere identique, les auteurs dans [152] proposent une approche

basée sur un réseau inférentiel intégrant un modèle de langage appliqué aux éléments et non aux documents. Cette approche est appliquée dans le cadre multimédia en utilisant les requêtes multimédia orientées contenu et structure afin de renvoyer une partie du document composée d’image et de texte. L’évaluation de cette méthode avec une petite collection (Lonely Planet d’INEX

Multimedia 2005 ) a montré son intérêt, même si des expérimentations avec une

plus grosse collection (telle que la collection Wikipedia d’INEX, Tˆache Multi- media Fragment 2006-2007) seraient n´ecessaires.

Dans le document Approches de recherche multimédia dans des documents semi-structurés : utilisation du contexte textuel et structurel pour la sélection d'objets multimédia (Page 95-98)