• Aucun résultat trouvé

3.3 Etude compar´ee des strat´egies de s´election de patches pour le texte et l’image . ´ 98

3.3.6 Exp´erimentations

Nous ´etudions deux strat´egies de s´election de patches locaux : l’´echantillonnage r´egulier et la d´etection de points d’int´erˆet.

Echantillonnage r´egulier

Pour les images, un ´echantillonnage complet (c’est-`a-dire pour chaque pixel) serait trop coˆuteux en temps de calcul. Aussi restreignons-nous cet ´echantillonnage `a une grille fixe.

3.3 ´Etude compar´ee des strat´egies de s´election de patches pour le texte et l’image 111

De cette fac¸on, nous garantissons que les patches s´electionn´es sont r´epartis de mani`ere uni-forme sur l’image. Ces patches sont des fenˆetres carr´ees de taille fixe centr´ees sur les positions d´etermin´ees par la grille. Les exp´eriences ont ´et´e men´ees avec des tailles w = 8, 16, 32 et 64 pixels. Les param`etres de la grille sont adapt´es automatiquement de fac¸on `a extraire environ 1 000 patches par image.

Pour le texte, nous appliquons une fenˆetre glissante de taille fixe sur le texte d´egrad´e. Les tests ont ´et´e r´ealis´es avec des fenˆetres de taille w = 2, 3, 4 et 5 caract`eres en consid´erant syst´ematiquement toutes les positions possibles. A chaque position, la chaˆıne de caract`eres apparaissant dans la fenˆetre est notre patch local. Reprenons l’exemple du document 12 799 (page 105). Le d´ebut de cette d´epˆeche sous forme d´egrad´ee est pr´esent´e sur la figure 3.21 avec quelques positions de la fenˆetre glissante et les patches extraits correspondants.

FIG. 3.21 – Reuters RCV1, ´echantillonnage r´egulier avec une fenˆetre de taille 3

Le vocabulaire pour chacun des tests est compos´e de tous les mots de taille fixe rencontr´es lors du parcours de l’ensemble des documents du corpus. Potentiellement, la taille du vocabu-laire pour une taille de fenˆetre donn´ee est donc ´egale `a36w. Toutefois, toutes les combinaisons de caract`eres n’apparaissent pas naturellement. Le tableau 3.6 indique les tailles de ces vocabu-laires ainsi que la proportion que cela repr ´esente par rapport au vocabulaire th ´eorique complet.

w Taille du vocabulaire 10 patches les plus fr´equents

2 1296 (100%) er, es, re, on, in, at, te, an, nt, ar

3 43 700 (93.66%) the, ing, ion, ent, and, ate, ter, for, est, day

4 666 418 (39.68%) said, tion, nthe, dthe, ment, atio, onth, ther, inth, rthe

5 4 607 713 (7.62%) ation, inthe, ofthe, saidt, llion, aidth, illio, tions,

tiona, idthe

TAB. 3.6 – Reuters RCV1, taille des vocabulaires pour l’´echantillonnage r´egulier

D´etection de points d’int´erˆet

Parmi les nombreux d´etecteurs de points d’int´erˆet disponibles, nous avons choisi de combi-ner les d´etecteurs SIFT [Low99] et Harris couleur [GMDP00]. En effet, ces deux d´etecteurs ne s’attachent pas aux mˆemes caract´eristiques visuelles saillantes (voir la figure 3.17). On extrait

500 points de chaque type par image. Comme pour les tests sur les grilles fixes, les signatures visuelles sont calcul´ees sur des fenˆetres carr´ees centr´ees sur les points d´etect´es. Nous ne tenons pas compte de l’´echelle ni de l’orientation ´eventuellement d´etect´ees. Les tests sont effectu´es avec les mˆemes tailles de fenˆetre que pr´ec´edemment. Le seul param`etre qui varie ici est donc la position des patches extraits.

Afin de pouvoir effectuer une comparaison, la d´etection de points d’int´erˆet doit ˆetre simul´ee pour le texte d´egrad´e d’une mani`ere similaire `a ce qui se passe pour les images. Cela soul`eve la question de savoir ce qui constitue une information textuelle utile. Quelle notion peut-on rapprocher d’une forte variation locale du signal ? Toute strat´egie de d´etection doit, comme pour les images, n´ecessairement ˆetre r´ep´etable. Ainsi la s´equence de caract`eres dans deux documents diff´erents doit ˆetre caract´eris´ee de mani`ere identique. Les d´etecteurs de points d’int´erˆet visuels se concentrent sur les zones `a forte variabilit´e du signal et ignorent les autres. Nous proposons donc un d´etecteur pour le texte d´egrad´e qui se focalise ´egalement sur certains types de patches et en exclut d’autres. Cela revient en fait `a consid´erer qu’un d´etecteur pour le texte n’est capable de rep´erer qu’un sous-ensemble pr´e-s´electionn´e du vocabulaire. Nous d´efinissons la couverture comme ´etant la proportion de l’ensemble des patches de la base qui se trouvent ˆetre pr´esents dans le vocabulaire, c’est-`a-dire qui sont promus au rang de mot. Deux approches ont ´et´e test´ees dans le cas de la fenˆetre glissante de taille 2 :

– S1 : en se basant sur la fr´equence d’apparition des mots dans la collection (DF), nous cr´eons 5 vocabulaires qui contiennent respectivement les 10, 20, 30, 40 et 50 patches les plus fr´equents.

– S2 : en se basant sur la fr´equence d’apparition inverse des mots dans la collection (IDF), nous conservons le nombre minimum de patches n´ecessaire pour obtenir une couverture de10% de la collection compl`ete.

S1 simule l’utilisation d’un petit nombre de mots tr`es fr´equents alors que S2 utilise un grand nombre de mots rares. Pour les images, nous avons extrait 1 000 points par image, ce qui

cor-respond environ `a 1% du nombre de pixels. Les images ´etant en dimension 2, la restriction de

l’information disponible `a 10% pour S2 permet d’ˆetre dans une approche comparable. Nous

r´esumons les statistiques des vocabulaires ainsi cr´e´es dans le tableau 3.7.

Strategie Taille Couverture

Vocabulaire W2 initial 1296 100.00% S1 - 10 10 15.37% S1 - 20 20 25.09% S1 - 30 30 32.48% S1 - 40 40 38.87% S1 - 50 50 44.44% S2 1008 10.00%

3.3 ´Etude compar´ee des strat´egies de s´election de patches pour le texte et l’image 113