• Aucun résultat trouvé

Exemples de requêtes par l'exemple

4.2 Critère de décision non supervisé

4.3.5 Exemples de requêtes par l'exemple

Des résultats de requêtes par l'exemple sont présentés sur les Figure 4.5 à 4.16. Sur l'ensemble des résultats nous voyons que le nombre d'images retournées, rQ, varie de 0

(Figure 4.11) à plus de 100 (Figure 4.13 et 4.14). Certains résultats sur la base LCPD conduisent à des valeurs de rQ égales à plusieurs centaines, mais pour des raisons d'espace

et de lisibilité nous ne les montrons pas dans ce manuscrit.

Seuil automatique pour la recherche d'images selon l'OSC Algorithme 2 Calcul des distances EMD pour une requête avec seuil automatique

Calcul du seuil δQ :

δt ←initialisation

pour toutes les imagettes dans M faire k ← 1

tant que Pk

i=1min1≤j≤n{cij} < δt ET k ≤ n alors k ← k + 1

si k == n + 1 alors

calculer la distance EMD jusqu'à la résolution du problème linéaire mettre à jour δt si le quantile a été modié

n si n pour δQ ← δt

Calcul des distances EMD entre Q et les imagettes de B : pour toutes les imagettes dans B faire

k ← 1

tant que Pk

i=1min1≤j≤n{cij} < δQ ET k ≤ n alors k ← k + 1

si k == n + 1 alors

calculer la distance EMD jusqu'à la résolution du problème linéaire n si

n pour

aucune image similaire à la requête selon l'OSC. Cette situation peut apparaître sur toutes les bases indépendamment de leurs tailles. Inversement, une grande valeur de rQ

nous indique la présence d'une grande série d'images similaires dans la base. L'exemple du bas de la Figure4.13peut être vu comme une erreur de la méthode. Cette longue série de dessins au crayon a été faite sur le même papier. L'empreinte picturale du crayon est légère et couvre peu la surface du dessin. Le contraste faible de ces dessins et la couleur constante du fond fait qu'elles sont toutes très proches les unes des autres selon l'EMD. Le seuil n'est pas assez sévère par rapport à ces subtilités, et pour lui toutes ces ÷uvres sont eectivement très similaire comparativement au modèle de fond. Ce type d'erreur apparaît aussi dans la base LCPD. De nombreuses photographies en noir et blanc présentent en moyenne un contraste peu marqué.

La base MIXCA contient aussi de nombreux objets décoratifs hérités de la collection d'arts décoratifs du Musée des Beaux arts de Montréal : statues, chaises, cuillères, pièces de monnaies, boites à encens. . . Ces séries d'objets dont nous n'avions pas mesuré l'ampleur au moment de constituer la base MIXCA sont rapidement ressorties dans les résultats (par ex. Figure4.13en haut). De même pour la base CLIC, nous avons ainsi vu a posteriori la quantité assez grande de paysages répondant à l'OSC horizontale assez classique d'un ciel bleu et d'un sol vert. En dehors de la base LCPD, de telles séries sont peu fréquentes en peintures par exemple, même si il arrive souvent de trouver des séries de 10 à 20 peintures similaires.

Ceci illustre bien la capacité et l'utilité du seuil à pouvoir sonder le contenu d'une base trop grande pour pouvoir être explorer manuellement. Même si des bases comme ATCI ou IRHT peuvent être explorées manuellement en étant patient, il est très dicile d'envisager une telle tâche pour une base de taille supérieure à quelques milliers.

Nous voyons sur l'ensemble des résultats que la frontière entre images similaires et images diérentes indiquée par le seuil automatique n'est pas toujours parfaite. Au contraire, un utilisateur placerait souvent le seuil quelques rangs en avant ou en arrière selon les exemples. Ceci est souvent frappant lorsque nous visualisons des résultats à rQ faible où

nous avons rapidement une bonne vue d'ensemble des images retournées. Néanmoins nous voyons que le seuil donne généralement un bon ordre de grandeur et permet de savoir si il y a 0, 10, 50, 100 . . . ou beaucoup plus d'images semblables dans la base. Cette information est d'un intérêt certain pour interroger une base et connaître son contenu.

4.4 Conclusion

Nous avons proposé dans ce chapitre une approche a contrario pour répondre au pro- blème de mise en correspondance entre deux images selon l'OSC. Un important avantage de la méthode proposée est qu'elle xe automatiquement un seuil pour chaque requête et chaque base consultée. Tout d'abord, le critère devient plus sévère avec la taille de la base, ce qui peut-être primordial lorsqu'on interroge des bases très volumineuses. De plus, la base de bruit M utilise les marginales de la base consultée B. Par conséquent, le seuil s'adapte aussi à la fréquence d'apparition de ces couleurs dans la base. Si par exemple la base est constituée exclusivement d'enluminures rouges sur un fond blanc, le seuil sera très sensible au respect du rouge, si le rouge de la requête est assez particulier. Cet aspect peut être très utile dans le cadre de bases spécialisées. Le seul paramètre dont dépende cette méthode est le paramètre ε qui correspond au nombre de fausses alarmes lorsqu'on soumet une requête. Ce paramètre est plus intuitif à xer qu'une borne xe sur la mesure de similarité.

Enn nous avons vu dans les résultats généraux que ce seuil automatique donne ef- fectivement souvent une bonne idée de nombre d'image similaires à la requête dans la base. La délimitation précise qu'il créé entre images similaires et diérentes est souvent discutable. Quelques images déclarées comme diérentes peuvent sembler similaire selon l'OSC et selon l'utilisateur qui regarde les résultats. Inversement il arrive assez souvent que des images qui nous semblent diérentes sont déclarées similaires. Ces dernières sont néanmoins généralement placées dans les derniers résultats. Bien que le rang exact au delà duquel les images sont déclarés comme diérentes soit souvent imparfait, nous voyons que la méthode se trompe rarement sur l'ordre de grandeur du nombre d'images similaires à la requête contenu dans la base. Cet ordre de grandeur varie de 0 à plusieurs centaines selon les bases et les requêtes. Cette information est intéressante car elle nous renseigne sur le contenu de la base en fonction d'une requête.

Seuil automatique pour la recherche d'images selon l'OSC

Seuil automatique pour la recherche d'images selon l'OSC

Seuil automatique pour la recherche d'images selon l'OSC

Seuil automatique pour la recherche d'images selon l'OSC

Seuil automatique pour la recherche d'images selon l'OSC

Seuil automatique pour la recherche d'images selon l'OSC

Deuxième partie

Geométrie des lignes

Chapitre 5

Extraction des contours des traits

Fig. 5.1: Exemples d'÷uvres uniquement à base de traits. De gauche à droite, des dessins de Matisse, Ellsworth Kelly, et Picasso (Annexe A).

Nous nous intéressons dans cette partie aux images qui contiennent uniquement des traits monodimensionnels (Figure 5.1). Les images d'écritures manuscrites font partie de cette catégorie. En ce qui concerne les ÷uvres d'arts, on retrouve ce type d'image en particulier dans les dessins réels et par ordinateur, croquis, estampes . . . De ce fait, nous nous plaçons volontairement dans un cadre d'étude limité, mais cohérent avec la classi- cation du contenu proposée par [Willats, 1997] et utilisée par [Grabli, 2005] en synthèse de dessins à bases de lignes. Notre but est d'étudier l'impact pictural des primitives 1D dans les ÷uvres (Chapitre 6).

Nous présentons dans ce chapitre la méthode que nous utiliserons pour extraire les contours des traits dans les ÷uvres. Après un état de l'art des approches possibles pour extraire les contours d'une image (Section 5.1) et de deux applications connexes, nous présenterons une approche a contrario proposée par [Desolneux et al., 2001] pour extraire

les contours signicatifs (Section5.2). Cette approche donne des résultats satisfaisants sur des images générales, mais elle ne prend pas en compte les spécicités des images de traits et les contraintes qui y sont liées. C'est pourquoi nous proposons à la Section 5.3 une amélioration. Plusieurs expériences permettront à la Section 5.4 d'illustrer les propriétés de la méthode proposée.

5.1 Travaux connexes sur les méthodes d'extraction des