Structure du manuscrit

Dans le document The DART-Europe E-theses Portal (Page 140-152)

• Finalement, nos r´esultats exp´erimentaux r´ealis´es sur STOIC-101 et des collections d’images RobotVision ’09 ont confirm´e la performance et l’efficacit´e de mod`ele de graphe visuel propos´e. La m´ethode de graphe surpasse le mod`ele de langue standard et les m´ethodes de machine `a vecteurs de support15 dans les deux ep´erimentations.

Les r´esultats de ces travaux ont ´et´e publi´es dans le Journal on Multimedia Tools and Applications (2011), le proceeding d’IEEE International Workshop on Content Based Multimedia Indexing (CBMI 2010), les actes d’ACM Conference on Research and Development in Information Retrieval (SIGIR 2010), les actes de Singaporean-French IPAL Symposium (SinFra 2009) et dans les actes d’ACM Conference on Information and Knowledge Management (CIKM 2007).

Notre participation `a la piste RobotVision de campagne d’´evaluation interna-tionale ImageCLEF 2009 a ´egalement conduit `a de bons r´esultats. Les m´ethodes techniques ont ´et´e report´e dans le rapport de Workshop d’ImageCLEF 2009 et dans un chapitre de Lecture Notes for Computer Science (LNCS) publi´e par Springer Science. Une liste compl`ete des publications est fournie en annexe A.

10.5 Structure du manuscrit

Nous d´ecrivons ici la structure de cette th`ese qui comporte six chapitres principaux:

Le Chapitre 2 introduit les travaux dans lit´erature sur l’indexation et de recherche d’images. Nous donnons un aperc¸u des proc´edures de traitement d’image telles que la d´ecomposition d’image (partition en blocs ou la segmenta-tion en r´egion ou d´etecsegmenta-tion des points int´erˆets), et l’extracsegmenta-tion de caract´eristiques visuelles (l’histogramme de couleur ou de forme et des caract´eristiques invariantes locales).

Un mod`ele d’indexation pr´eliminaire bas´e sur le mod`ele de sac-de-mot est

´egalement introduit. Nous d´ecrivons comment les concepts visuels sont construits

`a partir des caract´eristiques visuelles et sont quantifi´es avec le mod`ele vectoriel.

La technique de s´emantique latente utilis´ee avec le mod`ele sac-de-mot est

´egalement discut´ee. Notre objectif est de pr´esenter dans ce chapitre les ´etapes de base pour repr´esenter le contenu de l’image. Bas´e sur ces ´etapes, nous pr´esentons dans le chapitre 3 les diff´erentes m´ethodes d’apprentissage de concepts visuels introduit dans la litt´erature.

Le Chapitre 3 se concentre sur les diff´erentes techniques d’apprentissage automatique bas´ees sur la repr´esentation vectoriel num´erique d’une image. Nous investigons deux approches principales en recherche d’information : le mod`ele

15Support Vector Machine (SVM)

d’aprentissage g´en´eratif et le mod`ele d’aprentissage discriminatif. Les mod`eles g´en´eratifs comprennent deux m´ethodes principales : la m´ethode de Bayes et l’analyse s´emantique latente probabiliste (pLSA). Les mod`eles discriminatifs comprennent deux m´ethodes principales : la classification par k-NN et les machines `a vecteur de support (SVM). Nous mentionnons aussi dans ce chapitre comment la structure d’image est captur´ee pour s’int´egrer au mod`ele de graphes.

Le mod`ele de langue est ´egalement d´etaill´e dans ce chapitre.

Le Chapitre 4 donne un vue g´en´erale de notre approche. Le mod`ele propos´e comprend trois ´etapes principales:

L’´etape traitement d’images vise `a l’extraction `a partir d’image des r´egions et points d’int´erˆets. Il consiste ´egalement `a num´eriser les vecteurs caract´eristiques associ´es aux r´egions ou aux points d’int´erˆets situ´es dans l’image.

L’´etape mod´elisation de graphe consiste `a regrouper les caract´eristiques visuelles similaires en clusters en utilisant l’algorithme d’apprentissage non supervis´e. Les concepts visuels sont g´en´er´es pour chaque type de caract´eristique visuelle. Ensuite, les relations spatiales entre les concepts visuels sont extraites. Enfin, une image est repr´esent´ee par un graphe visuel compos´ee d’un ensemble de concepts visuels et un ensemble de relations spatiales.

L’´etape d’appariement de graphe r´ecup`ere des graphes pertinents `a une requˆete g´en´er´ee `a partir d’une nouvelle image. Inspir´e par le mod`ele de langue, nous ´etendons cette m´ethode pour faire correspondre le graphe requˆete avec les graphes dans la base de donn´ees. Les images sont ensuite class´ees par la valeur de probabilit´e associ´es a chaque graphe.

Le Chapitre 5 d´etaille le mod`ele de graphe visuel propos´e. Nous formalisons la d´efinition du mod`ele de graphe visuel et donnons deux exemples d’instances de ces graphes. Le mod`ele d’appariement prend en compte le mod`ele de graphe de requˆete et le mod`ele de graphe de documents comme entr´ee pour classer l’image en fonction de leur valeur probabiliste. Ici, le mod`ele d’appariement est une version ´etendue du mod`ele de langue pour les graphes visuels. Nous expliquons aussi comment nous transformons les probabilit´es dans le domaine des log-probabilit´es pour calculer la valeur de pertinence de l’image.

Le Chapitre 6 pr´esente la premi`ere application utilisant l’approche propos´ee:

syst`eme de reconnaissance de sc`ene. Nous proposons les mod`eles de graphe vi-suel adapt´es `a la collection d’images STOIC. Nous ´etudions l’impact des relations et de requˆetes multiples compos´ees de plusieurs images sur la performance de classification de sc`enes. Nous allons d´etaillons aussi diff´erentes m´ethodes pour

Structure du manuscrit

optimiser le param`etre de lissage, par exemple avec la technique de validation crois´ee ou avec une optimisation bas´ee sur la collection de test. La mise en œuvre du syst`eme de reconnaissance de sc`ene est ´egalement d´ecrite dans ce chapitre.

Chapitre 7 porte sur la deuxi`eme application du mod`ele de graphe vi-suel, nom´ee localisation d’un robot mobile. Les mod`eles de graphes visuels adapt´es `a cette collection d’images sont pr´esent´es. Nous fournirons les r´esultats exp´erimentaux avec les impacts des relations sur la qualit´e de classification. Nous donnons ´egalement une comparaison du mod`ele propos´e avec la m´ethode de noyau SVM. Ensuite, nous discutons la fac¸on dont l’ensemble de validation a

´et´e utilis´e pour choisir les caract´eristiques visuelles appropri´ees pour repr´esenter le contenu d’image. Les r´esultats officiels pr´esent´es au forum d’´evaluation d’ImageCLEF sont ´egalement discut´es.

Chapitre 8 conclut cette th`ese sur une discussion de nos contributions et

´egalement sur des perspective de travaux futurs.


