2. Anteedentes 5
2.5. Problemas abiertos
Como sehavisto en larevisiónhistória tanto de latexturaomo del olor,ha existido una
tendenia adesarrollardesriptoresqueextraeninformaión relaionada dealguna manera on
la queutiliza elsistema visual humano,de ahí quemuhosestén inspirados enlos resultadosde
lapsiologíaexperimentalquesehahehoalrespeto.Loiertoesquetodavíano seharesuelto
el problema de omo representar las texturas en olor dado que existen grandes lagunas en el
onoimientodelosnivelesdeproesamientodelainformaiónenelsistema visualhumano.
Hastaahorasehandesarrolladopoosmétodosomputaionalesqueombinenlainformaión
propiamente textural y el olor, onstituyendo éste todavía un problema abierto. El heho que
estasaraterístiasposeandiferentespropiedades,mientraseloloresunapropiedaddeunpunto
delaimagenlatexturaesunapropiedaddeunaregión,quizásesunodelosmotivosporlosuales
todavíanoestálaroualeslamejormaneradefusionarambasaraterístias.
Conrespeto alasdiferentes maneras deombinar latextura yel olor, hasta ahorano hay
unenfoquedenitivoy algunosde losenfoquespresentaniertosproblemas: uandolafusiónde
ambasaraterístiasserealizaenelniveldelvetordearaterístias,onatenandolosdiferentes
vetores en un únio vetor, es neesario esalar de manera adeuada los valores del vetor de
araterístias y si los vetores a onatenar tienen diferente dimensión deben apliarse pesos a
ada uno. Por otro lado,si la fusiónse realizaala hora dealular la disimilitud,esto requiere
denir una medida de disimilitud para ada desriptor y esalar las medidas para que ambas
sean omparables. En lasapliaionesde lasiaiónestos problemasse pueden evitar pasando
elproblemaallasiador,siendolalasiaiónnalelresultadodeombinarlaslasiaiones
obtenidas on ada uno de los desriptores. En este aso el problema es denir el riterio del
lasiadornal.
Atualmente, en la mayoría de estudios entrados en el desarrollo de desriptores
omputa-ionalesparalaextraióndearaterístias,elobjetivoprinipalesobtenermejorasuantitativas
en las medidas utilizadas para evaluar las diferentes tareas (lasiaión, reuperaión de
imá-genes,segmentaión).Porello,labatallaestáentradaenlaobtenióndedesriptoresqueofrezan
mejores resultados uantitativos y que sean invariantes al mayor númerode aspetosposible (a
iluminaiónenlaesena).Atodoesto,elaspetoualitativo(relaionadoonlaperepión)ha
si-doelgranabandonado,seguramentemotivadoporlafaltadeproedimientosadeuados,sobretodo
uandoelnúmerodeimágenesaproesareselevado.
Porotrolado,mientrasenelámbitodelolorlosdesriptorespuedensertraduidosapalabras,
mediantelaténiadeColorNaming,aspetoquefailitalaompresióndelainformaiónobtenida
oneldesriptor,enelámbitodelastexturaslosdesriptoressuelenareerdeontenido
semán-tio y losvaloresde losvetores dearaterístias noson mapeados apalabras. Aunque existen
exepiones,eldesriptorPBC (Manjunathyols.,2000)uyovetordearaterístiastiene una
traduiónalostérminosregularidad,direionalidadyesala.
Enestetrabajoseabordanlosproblemasplanteadoseneldesarrollodedesriptoresdetexturas
enolor,dejandodeladolasorrientesinvestigadorasenvigorypartiendodelapsiología
experi-mental,onelobjetivodeobtenerdesriptorespereptualesquepermitanunamayoromprensión
delainformaiónqueestosextraendelaimagen,alavezqueombinanlainformaióntexturaly
deolor.
Representaión holístia de texturas
en olor
1
3.1. Introduión
Elmodeloomputaionalpararepresentarlatexturasenolorquesepresentaenestetrabajo
estáinspiradoenelmodelopereptualdeJulesz(1975)quesehaintroduidoenelapítuloanterior
(2.3.1). Así pues, eneste trabajo sepropone una implementaión de ladeniión original de los
Textons. Según Julesz y Bergen(1983) los atributos de los blobs (Textons) forman parte de las
araterístiasloalesutilizadas por elSVHparaperibirydisriminarlastexturas.Anivel
pre-atentivo,sonlasdifereniasenlosestadístiosdeprimerordenlasresponsablesdeladisriminaión
delastexturas.
Partiendodeestahipótesis,enesteapítuloseproponeunarepresentaióndetexturasenolor
basadaenelmodelopereptualdelostextonsuyadeniiónessimilaralaaproximaión
Bag-of-words (BoW),utilizadamayoritariamenteenapliaionesde ategorizaiónde esenasyobjetos.
Este modelo,deauerdoon lasegundaheurístiapropuestaporJulesz (apartado3.2),ignoralas
relaionesdeposiiónentreloselementosqueonstituyenlastexturas.
SeomienzaesteapítuloresumiendolaTeoríadelosTextons 2
endondesedeneesteonepto,
sepresentasuimplementaiónomputaionalysedetallalaonstruióndelmodeloholístiosobre
elque,atravésdediversosexperimentos,sedemuestrasuviabilidadomomodeloderepresentaión
generaldetexturasolor.
Utilizandoomo araterístiasde partidalosblobs pereptualesysus atributos,sehan
inves-tigadodiversas maneraspara representar estasaraterístiasy diferentesformas deonstruir el
voabulario.
1
ContenidoparialmentepubliadoenAlvarez,Salvatella,Vanrell,yOtazu(2010b).
2
Términoeninglésquealolargodeldoumentonosehatraduidoyporelloserefereniaenursiva.
3.2. Teoría de los textons
LateoríadelosTextonsfuedesarrolladaporJuleszyBergen(1983).Enéstasedenenlos
Tex-tonsomolasaraterístiasloalessobresalientesresponsablesdelaperepiónydisriminaión
pre-atentivadelastexturas,sonportantolasunidadesbásiasdelastexturas.
Lateoríaseplanteaenbasealasdossiguientesheurístias:
Heurístia 1:Textonsson:
- blobs alargados (elipses, segmentos de línea) on propiedades espeías (olor,
ori-entaión,anhuraylongitud).
- terminaiones(nalesdelínea).
- ruesdesegmentosdelínea.
Heurístia 2: Lavisión pre-atentivadirigea lavisión atentivahaia ellugar donde existen
difereniasen ladensidad (número)detextons, peroignoralasrelaionesde posiión entre
textons.
En estateoríasearmaqueenelsistemavisualhumanoladisriminaiónpre-atentivadelas
texturasestábasadaenlasdifereniasdetextons(araterístiasloales)oenladifereniaenlos
estadístiosdeprimerordendelostextons(araterístiasglobales).
Poos años más tarde Julesz (1986)revisa esta teoríaheurístia y armaque en la fase
pre-atentiva del proeso visual el sistema pre-onsiente sabe dónde se produen los gradientes de
textons(difereniasdetextonsodifereniasdesudensidad), peronotieneonoimientodeloque
sonlostextons.Esenelnivelonsiente,por tantoenlafaseatentiva,uandolosreonoe.
Una delasrítiasdeestateoríaesqueenelestudiosehan utilizadotexturassintétias muy
onretasyquepor tantoesunestudioparial.Seuestionasuapliabilidadatexturasnaturales
yaque éstas tienen una omplejidad on un orden de magnitud mayor. Además, no se propone
omoobtenerlostextons.
UnintentodeimplementaiónomputaionaldelostextonslallevaronaaboVoorheesyPoggio
(1988).Estosdetetabanblobsydenieronunestadístiodeprimerordenutilizandolosatributos
delosblobsparadeterminarlasfronterasentretexturas.MástardeLeungyMalik(2001);Varma
y Zisserman(2005) retoman estateoría y proponenun modelo holístio de representaión.Pero
estos últimos, al igual que Burghouts y Geusebroek (2009), parten de una deniión de textons
diferente. Consideran que lostextons son lasrespuestas de unbano de ltrosapliado sobre la
imagen.
Enestetrabajosepartedeladeniiónoriginaldelostextonsyseproponeunarepresentaión
pereptualde lastexturas olorbasada úniamente en losblobs de lasimágenes y sus atributos
3.3. Representaiones holístias y aproximaión BoW
Eltérminoholístioesusadoenlapsiologíaognitivaparadenirunadelasformasenquese
produeelaprendizaje,signiaunaonepiónbasadaenlaintegraióntotalfrenteaunonepto.
Expresa la ideade quetodas laspropiedadesde unsistema dadono pueden ser determinadas o
expliadasporlaspartesqueloomponenpor sísolas.El sistemaomountododeterminaómo
seomportanlaspartes.
La implementaión omputaional direta de los Textons ondue a un modelo estadístio
en donde lastexturas se representan por el número de ourrenias de losatributos de los blobs
pereptuales.RenningeryMalik(2004)fueronunosdelosprimerosenutilizareloneptoholístio
en elámbitodela visiónomputaionalpara identiar una manerade representarlastexturas.
El modeloestadístio propuestopor RenningeryMalik(2004)oinide on laaproximaión
bag-of-words (BoW) que reientemente ha sido apliada on éxito en apliaiones de ategorizaión
de objetos (Sivi y ols., 2005; G. Wang y ols., 2006). Este modelo también ha sido utilizado
en otras apliaiones,Leung y Malik (2001) y Burghouts yGeusebroek(2009) loemplean en el
reonoimiento demateriales, Siviy Zisserman(2003)en lareuperaióndeobjetos yVarma y
Zisserman(2005)para lasiartexturas.
La onstruión del modelo de representaión de la imagen en enfoques BoW y dentro del
ontextodelaategorizaióndeobjetosestáformadapor tresetapasprinipales:
1. Deteióndearaterístias.
2. Representaióndelasaraterístias.
3. Construióndelvoabulario.
Enlaprimeraetapaseobtienenlasregionesdelaimagenque sonsigniativas (pathes). En
lasegundaserepresentanlasaraterístiasdelasregioneson unvetornumérioparaobtener
asísudesriptor.Latereraetapaonsisteenlaonstruióndelvoabularioendondeserequiere
el usodeténiasde aprendizaje,esto es,apartirdeunsubonjunto de imágenesseenuentran
losvaloresdelasaraterístiasquesonrepresentativos.Losrepresentantessedenen omovisual
words( SiviyZisserman,2003)queonstituyenlosomponentesdelvoabulario.Elmétodomás
extendido para obtener los representantes es el algoritmode lustering K-means. Finalmente la
imagenesrepresentadaporelhistogramadelasvisualwords.Unaaraterístiaadestaardeeste
modeloesquenoimportadondeestánloalizadaslasaraterístiassinosufreuenia.
EnlarepresentaiónholístiaqueaquísepresentaseutilizalaaproximaiónBoWpara
repre-sentarlastexturasolor,endondelasaraterístiasutilizadassonlosatributos delosblobs
per-eptualesyelmodelodeonstruióndelvoabularioesmenosostoso.Elvoabularioseobtiene
realizandounauantiaióndelosatributosdelosblobspereptuales,portanto sinaprendizaje
previo.Laimagenesrepresentadaporlafuniónde distribuiónde probabilidadde lostérminos
o palabras visuales 3
del voabulario. Como se verá aontinuaión la representaión holístia es
3
simpleperoseajusta ala propuestadeJulesz yBergen(1983)endonde armanqueelsistema
visualpre-atentivoutilizaglobalmentesólolostextonsdelamaneramássimpleposible,ontando
sunúmero(densidad).
3.4. Desomposiión de la imagen en blobs
Las araterístiasutilizadas enesta aproximaiónBoW son losblobs de la imagen.En este
apartadosedetallaelproedimientoomputaionalpara obtenerlosblobsperibidosenuna
tex-turaolorademásdesusatributos.Denimosunblobomounaregiónonvexahomogéneaensu
ontrasteoolor.
3.4.1. Blobs pereptuales
Partiendo de laasunión que todos los blobs de las imágenes tienen forma Gaussiana, estos
puedenserisotrópios(formairular)ynoisotrópios(formaelipsoide).Losblobssearaterizan
porsuforma(anhura,altura, orientaión)yolor.
Paradetetarlosblobspereptualesyobtenerlosatributosquedenensuformasehautilizado
elproedimientodesarrolladopor SalvatellayVanrell(2007)paratexturasmonoromas.En éste
seusalarepresentaión delaimagenen elespaio-esala propuestopor Lindeberg (1994).En el
espaiomultiesala,laimagen
I
serepresentaapartirdeuna familia deimágenes ondiferentesnivelesdedetalle. Éstasseobtienenalonvoluionarlaimagenonunafunióndesuavizadoon
diferentesparámetros
σ
:L(x, y; σ) = I(x, y) ∗ G(x, y; σ)
(3.1)siendo
G(·; σ)
lafunióndesuavizadoGaussiana:G(x, y; σ) = 1
2πσ 2 exp{− x 2 + y 2
2σ 2 }.
(3.2)LosblobsdeunaimagenseobtienenapliandoeloperadordiferenialLaplaianodeuna
Gaus-siana (LoG) normalizado en un subonjunto de esalas. Este operador se dene de la siguiente
manera:
∇ 2 norm L(·; σ) = σ 2 ∇ 2 L(·; σ)
(3.3)siendoelonjuntodeesalasutilizado
σ = {1,284 n , n ∈ [1 . . . 11]}
.Paradesestimarlosblobs delaimagendebidosalruidoseimpone larestriión:
∇ 2 norm L(·; σ) ≥ η det
(3.4)donde
η det
vendrá determinadapor el nivel de ruido de la imageny supone el únioparámetroLautilizaióndeestebanodeltrospermiteobtenerlaesalaylaloalizaiónespaialdelos
blobs: losentros de losblobs
(x, y)
orrespondenala loalizaión delosmáximosde lafunión∇ 2 norm L(·; σ)
alolargodetodaslasesalas,mientrasquelaesaladelbloborrespondealaesalaenlaualsehaobtenidoelmáximo,quedenotaremosomo
s LoG
.Laorientaiónylasdimensionesdelosblobsseobtienenapliandoeloperadortensorestrutural
2D, éste esla matriz de momentos de segundo orden, sobre la imagen.Este operador evalúala
estruturade losnivelesde grisalrededordeada punto dela imageny sedene delasiguiente
manera:
µ L (·; t, s) = G(·; s) ∗ ((∇L)(·; t)(∇L)(·; t) T )
(3.5)siendo
∇L
elgradiente de laimagen evaluado parat = s LoG
(esala del blob) yG
una funióngaussianaon
s = γs LoG
queonstituyelaesaladeintegraióndeltensorestrutural.Típiamente elvalordeγ
es2.Apartirdelamatrizdemomentosseobtienelaorientaióndelblob(
θ
)delasiguientemanera:θ = arctan(v 2 /u 2 )
(3.6)siendo
(v 2 , u 2 )
lasoordenadasdelvetorpropiodemenorvalorpropiodelamatrizdemomentos.Respetoalasdimensiones delblob, laanhura(
w
)orrespondealaesalaenlaqueelltroseajustamejoraestadimensión,ylalongitud delblob(
l
)sealulaapartirdeλ 1
yλ 2
quesonlosvalorespropiosdelamatrizdemomentos enordendereiente:
w = s LoG
l = sqrt(λ 1 /λ 2 ) · w = sqrt(λ 1 /λ 2 ) · s LoG .
(3.7)
Por tantoapartirdelproedimientodesritosehanloalizadolosblobsenlaimagen,onsus
oordenadas
(x, y)
,ysehanobtenidolosatributosquedenensuforma:anho,largoyorientaión(w, l, θ)
.Parailustrarelresultadodeladeteióndeblobs,enlagura3.1semuestranalgunosejemplos
sobreimágenesmonoromas.Paraunamejorvisualizaióndelresultadoenimágenesdiferentesse
muestran losblobsonontrastepositivoylosblobs onontrastenegativo.
Respetoaladeteióndelaformadelosblobs,éstanoesexatayuandoestossonalargados
elerrorometidoesmayor.Enlagura3.1.(f)dondesemuestraunejemplodedeteióndeblobs
alargados se puede observar, en la imagende la dereha, que unblob alargado seompone por
variosblobsperoningunodeellosseajustaorretamentealaforma.Esteerroresprovoadopor
dosmotivos,elprimeroesdebidoalsuavizadoque provoalaGaussiana(euaión3.2) utilizada
paraestimarelanhodelblob(
w
),yelsegundoalahoradealularsusdimensionesoneltensor estrutural (euaión 3.5). El parámetro de éste (s
), que es la esala de integraión del tensorestrutural, para esalas grandes produe un exesivosuavizado de laimagen y esto provoa el
error en laestimaión de lalongitud del blob (
l
).La inexatitud en la deteiónde laforma de(a)imagenoriginal (b)Blobsdetetados
() imagenoriginal (d)Blobsdetetados
(e) imagenoriginal (f)Blobsdetetados
Figura 3.1: (a), () y (e) Imágenes monoromas. (b), (d) y (f) Blobs detetados, on ontraste
positivoalaizquierdayon ontrastenegativoaladereha.
losblobsvaaprovoarquelarepresentaiónquesederivenoseadel todoelalontenidodela
imagen.
Porotrolado,enlasmismasgurassepuedeobservarqueladeteióndeblobsgeneramultitud
de blob redundantes, es deir, blobs on formas similares que se solapan en el espaio
(x, y)
ysolamente algunos deellos orrespondenalosrealmente peribidos. Cadauno de lasformasque
apareen en las imágenes deberían estar englobadas por un únio blob, de esta manera sí que
seorresponderíana laperepiónhumana. Conel objetivode eliminar losblobs redundantes y
obtenersolamentelosrealmenteperibidossehadesarrolladounltradopereptualquesedesglosa
enlossiguientespasos:
1. Reonstruióndelosblobsdetetadosapartirdesuloalizaiónysusatributos.
2. Loalizaióndeblobssolapadosenelespaio.
energía (mayor valor de la funión
∇ 2 norm L(·; σ)
en la esalaσ
donde se ha detetado) yltrarelresto.
Elresultadodeesteltradosepuedeobservarenlagura3.2endondelosblobspereptuales
obtenidos ahoraseajustanenmayormedida alosblobsrealmenteperibidos.
(a)imagenoriginal (b)Blobspereptuales
()imagenoriginal (d)Blobspereptuales
(e)imagenoriginal (f)Blobspereptuales
Figura 3.2: (a), () y(e) Imágenes monoromas. (b),(d) y (f) Blobspereptuales,on ontraste
positivoalaizquierdayonontrastenegativoaladereha.
3.4.2. Blobs en olor
En una imagenolor losblobs peribidos pueden emergerdebido a: difereniasen la
intensi-dad (provoadas por lageometría de lasuperie, ej: rugosidad), diferenias de las propiedades
romátias (provoadas por la reetania)opor difereniasdeambaspropiedades.En la gura
3.3.(a)-() se muestran tres ejemplos de texturas olor en donde la perepión de la textura es
provoadapor diferentespropiedadesdelaesena.
Teniendo en uenta estas propiedades, para extender el onepto de blob pereptual en
tex-(a) (b) ()
Figura 3.3: (a) y () textura peribida por las diferenias de las omponentes romátias. (b)
texturaperibidaporlosambiosdelaintensidad.
romátiasde laintensidad. El espaiodeolores oponentes hasido élesogido por este motivo.
En lagura 3.4semuestra ladesomposiiónde lasimágenes de lagura3.3 enlosanales del
espaioRGByenlosanalesoponentes.En lagura3.4sedemuestraomolosblobsproduidos
porlaspropiedadesromátiasdelaimagen3.3.()noapareenenlalásiadesomposiiónRGB
mientrasqueenlosanalesoponentes sí.
Laomponenteintensidaddelespaiooponentehasidodenidadeauerdoonlaformulaión
expresada en el apartado 2.2.3 (
I = R + G + B
), y las dimensiones romátias rg y by en esta oasiónhansidonormalizadaspara haerlasindependientes delaintensidad.Éstas seobtienenapartirdelasiguientetransformaión:
donder,gybsonlasomponentesromátiasobtenidasnormalizandoporlaintensidad,estoes:
r = R/I g = G/I b = B/I
(3.9)
ydonde
R
,G
yB
sonrespetivamente lasomponentesrojo,verdeyazuldel espaioRGBdela imagenoriginal.Enestatransformaiónsehallainluida unaorreiónparaquelosvaloresrgybyesténenelrango[0..1℄aligualquelaomponente I.
Los blobs pereptuales de una imagen olor se obtienen apliando el operador diferenial
(euaión3.3) y elltrado pereptual sobre ada una delas omponentes del espaiode olores
oponentes.Este proedimientoademásdedetetarlosblobsdebidosaambiosenlaintensidadde
laimagen,también permitedetetar losblobsque presentanunbajo ontrasteenel anal
inten-sidadyquesedisriminanmejorenualquieradelosdosanalesromátios. Deestamanera,se
(a)
(b)
()
(d)
(e)
(f)
Figura3.4:Enlaslas(a)-()analesR,GyBrespetivamente.Enlaslas(d)-(f)analesespaio
oponente,I,RGyBYrespetivamenteparalasimágenesdelagura3.3.
3.4.3. Textons: atributos de los blobs
Los blobs pereptuales de una imagen searaterizan por medio de su loalizaión y de sus
atributosformayolor,enformamatriialestoseexpresadelasiguiente manera:
T loc = [ XY ] T sha = [ WLΘ ] T col = [ I RG BY ]
(3.10)
donde
T loc
ontiene la loalizaión de losentros de los blobs,T sha
ontiene los atributos quearaterizanlaformadelosblobs
w
,l
,θ
(anho,largoyorientaión)aluladosenlaseuaiones 3.6y3.7yT col
ontiene losatributosdeolor.Losomponentesdeadaunasonlassiguientes:X T = [x 1 . . . x n ] Y T = [y 1 . . . y n ]
W T = [w 1 . . . w n ] L T = [l 1 . . . l n ] Θ T = [θ 1 . . . θ n ] I T = [i 1 . . . i n ] RG T = [rg 1 . . . rg n ] BY T = [by 1 . . . by n ]
(3.11)
siendo
n
elnúmerodeblobspereptualesdetetadosyT
indialaversióntranspuestadelamatriz.Elatributodeolordelblob
j
-ésimo(i j , rg j , by j )
orrespondealaintensidadylaromatiidaddelblobrespetivamente.Esteatributoseestimaapartirdelosatributosolordetodoslospixels
que forman el blob, utilizando para ello el operador estadístio mediana. Esta estimaión en el
olor del blob no se ve afetada por los valores atípios (outliers) que pudieran apareer omo
onseueniadelainexatitudenladeteióndelaformadelosblobs.
La matriz formadapor lalistade blobsobtenidos en unaimagenademás de sus atributosse
denebajoeloneptodetextons,deauerdoon lateoríadeJulesz(1986),yseexpresaatravés
delamatriz:
T = [ T loc T sha T col ].
(3.12)Para ilustrar la desomposiión de una imagen en los blobs pereptuales obtenidos en ada
Para ilustrar la desomposiión de una imagen en los blobs pereptuales obtenidos en ada