• Aucun résultat trouvé

de donn é é es d es d ’ ’ images images

N/A
N/A
Protected

Academic year: 2022

Partager "de donn é é es d es d ’ ’ images images"

Copied!
40
0
0

Texte intégral

(1)

recherche d

recherche d information dans une grande base information dans une grande base de donn

de donn é é es d es d images images

Travail de th

Travail de th è è se de Nguyen se de Nguyen - - Khang Khang PHAM PHAM pr pr é é sent sent é é par A Morin par A Morin

3 novembre 2010

3 novembre 2010- - GDR 13 GDR 13

Équipe

(2)

n Recherche d’images par le contenu

o Analyse factorielle des correspondances (AFC) pour l’indexation et la recherche d’images

p Accélération de recherche par la catégorisation q Calcul incrémental et parallèle de l’AFC

r Visualisation

(3)

Description du contenu visuel

∈ R

128

2. Descripteur SIFT (Scale-invariant

feature transform) [Lowe, 2004]

1. Détecteur des points d’intérêts Hessien-affine [Mikolajczyk &

Schmid, 2004]

(4)

Formation des mots visuels

R

128

R

128

SIFT

Mots visuels

Clustering

(par ex., k-means)

(5)

Description du contenu visuel

Tableau de contingence

Base d’images

L’élément x ij désigne :

– le nombre de SIFT de l’image i qui sont dans le mot visuel j

– le nombre de fois où le mot visuel j apparait dans l’image i

mot visuel j

x ij

image i

(6)

n Recherche d’images par le contenu

o Analyse factorielle des correspondances (AFC) pour l’indexation et la recherche d’images

– AFC

– Indexation et recherche d’images par l’AFC

p Accélération de recherche par la catégorisation q Calcul incrémentale et parallèle de l’AFC

r Visualisation

(7)

Analyse factorielle des correspondances

• L’AFC est une double analyse en composantes principales particulière (ACP)

– une ACP sur les lignes

– une ACP (duale) sur les colonnes

• Représentation simultanée des images et des mots visuels

dans un espace de dimension réduite

mot visuel j

image i

Tableau de contingence (M images et N mots visuels)

x ij

(8)

Analyse factorielle des correspondances

mot visuel j

image i

x ij

p

i

q

j

mot visuel j

image i

i ij

p

x ACP ACP

- Distance χ2 - Pondération par

p

i

α

z i

axe α

Tableau de profils-lignes Tableau de contingence

(M images et N mots visuels)

(9)

Analyse factorielle des correspondances

mot visuel j

image i

x ij

p

i

q

j

mot visuel j

image i

i ij

p

x ACP ACP

- Distance χ2

- Pondération par

p

i

mot visuel j

image i

ACP ACP

- Distance χ2

- Pondération par

q j

α

z i

axe α

α

w j

axe α

j ij

q x

Tableau de contingence (M images et N mots visuels)

(10)

Analyse factorielle des correspondances

(11)

Analyse factorielle des correspondances

Image avec tous les mots visuels

Les mots visuels qui caractérisent bien l’image

mots visuels images

(12)

Indicateurs de l’AFC

• Contribution de chacun des éléments à l’inertie d’un axe

– Les éléments ayant une forte contribution fixent la direction de l’axe.

• Qualité de représentation de chaque élément sur un axe

– cosinus carré

distance

2

masse inertie = ×

axe β

axe α masse

distance

i’

0 i

) (i' cos

α2

1 (i)

cos

α2

α

z

i

p

i

(13)

Indexation d’images par l’AFC

AFC AFC

) ,

cos(

) , (

similarité r i = z ( r ) z i

image i

mot visuel j

image i

axe α

α

z i

requête

x ij

r j z α (r )

requête

(14)

Résultats expérimentaux

• Bases d’images

– Caltech-4 (4090 images, 5 catégories)

– Caltech-101 (8709 images, 102 catégories)

– Nistér (10200 images, 2550 catégories)

• Vocabulaire visuel

– Détecteur Hessien-affine – Descripteur SIFT

– Notre implémentation de k- means sur GPU

– 5000 mots visuels

• Architecture

– Machine Intel Xeon bi- processeurs Quad core, 3.2 GHz, 8Go

– Carte graphique NVIDIA GeForce GTX 280, 1Go de mémoire

– Librairies: ATLAS,

LAPACK, CUBLAS, CUDA

(15)

Résultats expérimentaux

(16)

Résultats expérimentaux

Caltech-101

Nistér-Stewénius Caltech-4

Recherche

exhaustive

(17)

n Recherche d’images par le contenu

o Analyse factorielle des correspondances (AFC) pour l’indexation et la recherche d’images

p Accélération de recherche par la catégorisation

– Fichiers inversés basés sur les indicateurs de l’AFC – Recherche approximative basée sur les fichiers

inversés

q Calcul incrémentale et parallèle de l’AFC r Visualisation

s Conclusion et perspectives

(18)

images

• Utilisation des indicateurs de l’AFC pour

accélérer la recherche sans trop dégrader la qualité des résultats

– Réduire le nombre d’images à comparer avec la

requête

(19)

images

(20)

images

(21)

images

• Un axe factoriel Ù deux thèmes antagonistes

• Une image peut appartenir à plusieurs thèmes

• Détermination des thèmes:

– Contribution à l’inertie d’un axe

– Qualité de représentation sur un axe

(22)

Fichiers inversés

0 1

0

0 1

1

1

0

1 image 1

image 2

image 4 image 5

1

0 image 3 0

F

1+

F

1-

F

2+

F

2-

0

0 0

Détermination des thèmes

Fichiers inversés

Coordonnées des images dans l’espace factoriel

1

4 5

4

1

3

2 2

Thèmes

0 axe α

α

z i

1

image i

1

1

5

0

(23)

Recherche accélérée par fichiers inversés

• Filtrage des images non pertinentes

– Utiliser des fichiers inversés pour filtrer les images qui partagent peu de thèmes avec la requête

• Raffinement

– Effectuer une recherche séquentielle dans la liste

d’images candidates

(24)

Filtrage des images non pertinentes

1 5

n

o

p

1. Déterminer des thèmes et prendre les fichiers inversés correspondants

requête

2 3

5 1

4

0 1

2 2

1

freq(i)

freq(i) > seuil

0

1 0 1

Fichiers inversés

4 5

4

1 3

2 2

1

5 2. Fusionner les fichiers

inversés et calculer la fréquence des images, freq(i)

3. Rejeter les images ayant

une petite freq(i) pour

former la liste d’images

candidates

(25)

Résultats expérimentaux

• Recherche approximative à l’aide des fichiers inversés

– Méthode approximative 1:

• fichiers inversés basés sur la contribution – Méthode approximative 2:

• fichiers inversés basés sur la qualité de représentation

• Recherche exhaustive

(26)

Rapidité

Méthodes Gain d’accélération

min max moyen

Fichiers inversés basés sur

la contribution 2.7 17.3 6.9

Fichiers inversés basés sur

la qualité de représentation 3.2 13.8 6.6

(27)

Pertinence des résultats

(28)

n Recherche d’images par le contenu

o Analyse factorielle des correspondances (AFC) pour l’indexation et la recherche d’images

p Accélération de recherche par la catégorisation q Calcul incrémental et parallèle de l’AFC

– AFC incrémentale et parallèle – Parallélisation de la recherche

r Visualisation

s Conclusion et perspectives

(29)

AFC (revisitée)

• Décomposition en valeurs propres et vecteurs propres de la matrice

images

mots visuels

Σ

Σ

P Q

X

1

1 −

= X PXQ

A T

0

0

p

i

p

i

q

j

q

j

0

0

(30)

AFC incrémental et parallèle

1. Calcul incrémental par découper X en B blocs

X

T

p

i

1

i

q

X

[1]

1

X

[2]

X

[B]

X

X

T[1]

X

T[2]

X

T[B]

1

P Q

1

A =

X

[1]

Σ Σ

X P

X

C = T 1 q

X

[2]

X

[B]

2. Calcul parallèle sur GPU en utilisant CUBLAS

CUBLAS

(31)

AFC incrémental et parallèle

• Calcul parallèle

– Quand toute la base est disponible

• Traitement « pipe-line »

– Quand les images arrivent les unes après les autres

• Mise à jour facile

– Quand la base est modifiée C = C ± C

[mise à jour]

Affectation (bloc X[1] )

Affectation (bloc X[2] )

Affectation (bloc X[3] )

Calcul du C[1]

Calcul du C[2]

Calcul du C[3]

… …

temps

(32)

Résultats expérimentaux

• Base Nistér plongée dans un million d’images du site web FlickR

– 10.200 + 1.000.000 = 1.010.200 images

• Architecture identique

(33)

Résultats expérimentaux

Versions

Tems de calcul (secondes) Gain

d’accélération Construction de

la matrice A

Décomposition

de la matrice A Projection Total

CPU 3 136.42 63.6 315.10 3 515.12 -

1 GPU 257.91 63.6 35.57 357.08 9.84

2 GPU 130.46 63.6 18.21 212.27 16.56

1 heure (CPU)

3.5 minutes (2 GPU)

(34)

Parallélisation de l’étape de filtrage

• Filtrage des images non pertinentes

– Utiliser des fichiers

inversés pour filtrer les images qui partagent peu de thèmes avec la requête

• Raffinement

– Effectuer une

recherche séquentielle dans la liste d’images candidates

La plupart du temps est consacré à l’étape de filtrage

Temps de calcul de l’étape de filtrage et

l’étape de raffinement pour une base d’un

million d’images

(35)

Parallélisation de l’étape de filtrage

• Le calcul de la

fréquence des images, freq(i) se fait sur GPU en utilisant CUDA. CUDA

• Chaque thread GPU

calcule la fréquence de

8 images.

(36)

Résultats

• Méthode avec le filtrage parallèle sur GPU

– 10 fois plus rapide que la méthode sans parallélisation du filtrage

– 100 fois plus rapide que la méthode exhaustive

Méthodes P@3 Temps de

réponse (ms)

Gain

d’accélération

Exhaustive 0.623 860.88 -

Filtrage sur CPU 0.625 79.99 10.76

Filtrage sur GPU 0.625 7.53 114.33

(37)

• Extension de l’AFC

– Grand nombre d’images ET grand nombre de mots visuels

– AFC « supervisée », AFC locale

• Recherche d’images à l’aide de l’AFC – Construction de mots visuels

– Combinaisons des mots visuels et textuels – Intégration des relations spatiales

– Autres

• Bouclages de pertinences

• Requête multiple

• Répartition de la recherche

(38)

• Navigation

– AFC hiérarchique

– Combinaison de l’AFC et Analyse des concepts

formels

(39)

n Recherche d’images par le contenu

o Analyse factorielle des correspondances (AFC) pour l’indexation et la recherche d’images

p Accélération de recherche par la catégorisation q Calcul incrémental et parallèle de l’AFC

r Visualisation

– CAViz

(40)

Références

Documents relatifs

Plan focal image : le plan perpendiculaire ` a l’axe optique et passant par F’ est appel´e plan focal image... Image form´ee par une lentille convergente. 1) Objets et images r´eels

◮ Partitioner une image en régions homogènes (au sens des NdG, du mouvement, de la texture,

« Les signes iconiques ne possèdent pas les propriétés de l’objet représenté (...) ils reproduisent certaines conditions de la perception de l’objet mais après les

Ecrire une fonction ´ no_rouge(image) qui prend en entr´ ee une image image (qui a ´ et´ e charg´ e au pr´ ealable ` a l’aide de la fonction open) et qui supprime toute la

a) Une hypothèse située sur le graphique à la place de l’étoile serait, à l’indice d’une représentation monosémique : un taux de fréquence optimal pour un maximum de

J’ORDONNE LES IMAGES. J’ordonne les images J’ordonne

Autrement dit, si l'image n'est ni plus concrète, ni plus immédiate, ni moins logique que le discours, sa « lecture » ne saurait consister à la rapporter aux pro- cédures

La puissance des ordinateurs actuels rend maintenant possible le calcul explicite de telles transformations en 3D, leurs comparaisons quantitatives avec des retombées concrètes :