• Aucun résultat trouvé

Problemas abiertos

Dans le document Autònoma de Barcelona (Page 45-0)

2. Anteedentes 5

2.5. Problemas abiertos

Como sehavisto en larevisiónhistória tanto de latexturaomo del olor,ha existido una

tendenia adesarrollardesriptoresqueextraeninformaión relaionada dealguna manera on

la queutiliza elsistema visual humano,de ahí quemuhosestén inspirados enlos resultadosde

lapsiologíaexperimentalquesehahehoalrespeto.Loiertoesquetodavíano seharesuelto

el problema de omo representar las texturas en olor dado que existen grandes lagunas en el

onoimientodelosnivelesdeproesamientodelainformaiónenelsistema visualhumano.

Hastaahorasehandesarrolladopoosmétodosomputaionalesqueombinenlainformaión

propiamente textural y el olor, onstituyendo éste todavía un problema abierto. El heho que

estasaraterístiasposeandiferentespropiedades,mientraseloloresunapropiedaddeunpunto

delaimagenlatexturaesunapropiedaddeunaregión,quizásesunodelosmotivosporlosuales

todavíanoestálaroualeslamejormaneradefusionarambasaraterístias.

Conrespeto alasdiferentes maneras deombinar latextura yel olor, hasta ahorano hay

unenfoquedenitivoy algunosde losenfoquespresentaniertosproblemas: uandolafusiónde

ambasaraterístiasserealizaenelniveldelvetordearaterístias,onatenandolosdiferentes

vetores en un únio vetor, es neesario esalar de manera adeuada los valores del vetor de

araterístias y si los vetores a onatenar tienen diferente dimensión deben apliarse pesos a

ada uno. Por otro lado,si la fusiónse realizaala hora dealular la disimilitud,esto requiere

denir una medida de disimilitud para ada desriptor y esalar las medidas para que ambas

sean omparables. En lasapliaionesde lasiaiónestos problemasse pueden evitar pasando

elproblemaallasiador,siendolalasiaiónnalelresultadodeombinarlaslasiaiones

obtenidas on ada uno de los desriptores. En este aso el problema es denir el riterio del

lasiadornal.

Atualmente, en la mayoría de estudios entrados en el desarrollo de desriptores

omputa-ionalesparalaextraióndearaterístias,elobjetivoprinipalesobtenermejorasuantitativas

en las medidas utilizadas para evaluar las diferentes tareas (lasiaión, reuperaión de

imá-genes,segmentaión).Porello,labatallaestáentradaenlaobtenióndedesriptoresqueofrezan

mejores resultados uantitativos y que sean invariantes al mayor númerode aspetosposible (a

iluminaiónenlaesena).Atodoesto,elaspetoualitativo(relaionadoonlaperepión)ha

si-doelgranabandonado,seguramentemotivadoporlafaltadeproedimientosadeuados,sobretodo

uandoelnúmerodeimágenesaproesareselevado.

Porotrolado,mientrasenelámbitodelolorlosdesriptorespuedensertraduidosapalabras,

mediantelaténiadeColorNaming,aspetoquefailitalaompresióndelainformaiónobtenida

oneldesriptor,enelámbitodelastexturaslosdesriptoressuelenareerdeontenido

semán-tio y losvaloresde losvetores dearaterístias noson mapeados apalabras. Aunque existen

exepiones,eldesriptorPBC (Manjunathyols.,2000)uyovetordearaterístiastiene una

traduiónalostérminosregularidad,direionalidadyesala.

Enestetrabajoseabordanlosproblemasplanteadoseneldesarrollodedesriptoresdetexturas

enolor,dejandodeladolasorrientesinvestigadorasenvigorypartiendodelapsiología

experi-mental,onelobjetivodeobtenerdesriptorespereptualesquepermitanunamayoromprensión

delainformaiónqueestosextraendelaimagen,alavezqueombinanlainformaióntexturaly

deolor.

Representaión holístia de texturas

en olor

1

3.1. Introduión

Elmodeloomputaionalpararepresentarlatexturasenolorquesepresentaenestetrabajo

estáinspiradoenelmodelopereptualdeJulesz(1975)quesehaintroduidoenelapítuloanterior

(2.3.1). Así pues, eneste trabajo sepropone una implementaión de ladeniión original de los

Textons. Según Julesz y Bergen(1983) los atributos de los blobs (Textons) forman parte de las

araterístiasloalesutilizadas por elSVHparaperibirydisriminarlastexturas.Anivel

pre-atentivo,sonlasdifereniasenlosestadístiosdeprimerordenlasresponsablesdeladisriminaión

delastexturas.

Partiendodeestahipótesis,enesteapítuloseproponeunarepresentaióndetexturasenolor

basadaenelmodelopereptualdelostextonsuyadeniiónessimilaralaaproximaión

Bag-of-words (BoW),utilizadamayoritariamenteenapliaionesde ategorizaiónde esenasyobjetos.

Este modelo,deauerdoon lasegundaheurístiapropuestaporJulesz (apartado3.2),ignoralas

relaionesdeposiiónentreloselementosqueonstituyenlastexturas.

SeomienzaesteapítuloresumiendolaTeoríadelosTextons 2

endondesedeneesteonepto,

sepresentasuimplementaiónomputaionalysedetallalaonstruióndelmodeloholístiosobre

elque,atravésdediversosexperimentos,sedemuestrasuviabilidadomomodeloderepresentaión

generaldetexturasolor.

Utilizandoomo araterístiasde partidalosblobs pereptualesysus atributos,sehan

inves-tigadodiversas maneraspara representar estasaraterístiasy diferentesformas deonstruir el

voabulario.

1

ContenidoparialmentepubliadoenAlvarez,Salvatella,Vanrell,yOtazu(2010b).

2

Términoeninglésquealolargodeldoumentonosehatraduidoyporelloserefereniaenursiva.

3.2. Teoría de los textons

LateoríadelosTextonsfuedesarrolladaporJuleszyBergen(1983).Enéstasedenenlos

Tex-tonsomolasaraterístiasloalessobresalientesresponsablesdelaperepiónydisriminaión

pre-atentivadelastexturas,sonportantolasunidadesbásiasdelastexturas.

Lateoríaseplanteaenbasealasdossiguientesheurístias:

Heurístia 1:Textonsson:

- blobs alargados (elipses, segmentos de línea) on propiedades espeías (olor,

ori-entaión,anhuraylongitud).

- terminaiones(nalesdelínea).

- ruesdesegmentosdelínea.

Heurístia 2: Lavisión pre-atentivadirigea lavisión atentivahaia ellugar donde existen

difereniasen ladensidad (número)detextons, peroignoralasrelaionesde posiión entre

textons.

En estateoríasearmaqueenelsistemavisualhumanoladisriminaiónpre-atentivadelas

texturasestábasadaenlasdifereniasdetextons(araterístiasloales)oenladifereniaenlos

estadístiosdeprimerordendelostextons(araterístiasglobales).

Poos años más tarde Julesz (1986)revisa esta teoríaheurístia y armaque en la fase

pre-atentiva del proeso visual el sistema pre-onsiente sabe dónde se produen los gradientes de

textons(difereniasdetextonsodifereniasdesudensidad), peronotieneonoimientodeloque

sonlostextons.Esenelnivelonsiente,por tantoenlafaseatentiva,uandolosreonoe.

Una delasrítiasdeestateoríaesqueenelestudiosehan utilizadotexturassintétias muy

onretasyquepor tantoesunestudioparial.Seuestionasuapliabilidadatexturasnaturales

yaque éstas tienen una omplejidad on un orden de magnitud mayor. Además, no se propone

omoobtenerlostextons.

UnintentodeimplementaiónomputaionaldelostextonslallevaronaaboVoorheesyPoggio

(1988).Estosdetetabanblobsydenieronunestadístiodeprimerordenutilizandolosatributos

delosblobsparadeterminarlasfronterasentretexturas.MástardeLeungyMalik(2001);Varma

y Zisserman(2005) retoman estateoría y proponenun modelo holístio de representaión.Pero

estos últimos, al igual que Burghouts y Geusebroek (2009), parten de una deniión de textons

diferente. Consideran que lostextons son lasrespuestas de unbano de ltrosapliado sobre la

imagen.

Enestetrabajosepartedeladeniiónoriginaldelostextonsyseproponeunarepresentaión

pereptualde lastexturas olorbasada úniamente en losblobs de lasimágenes y sus atributos

3.3. Representaiones holístias y aproximaión BoW

Eltérminoholístioesusadoenlapsiologíaognitivaparadenirunadelasformasenquese

produeelaprendizaje,signiaunaonepiónbasadaenlaintegraióntotalfrenteaunonepto.

Expresa la ideade quetodas laspropiedadesde unsistema dadono pueden ser determinadas o

expliadasporlaspartesqueloomponenpor sísolas.El sistemaomountododeterminaómo

seomportanlaspartes.

La implementaión omputaional direta de los Textons ondue a un modelo estadístio

en donde lastexturas se representan por el número de ourrenias de losatributos de los blobs

pereptuales.RenningeryMalik(2004)fueronunosdelosprimerosenutilizareloneptoholístio

en elámbitodela visiónomputaionalpara identiar una manerade representarlastexturas.

El modeloestadístio propuestopor RenningeryMalik(2004)oinide on laaproximaión

bag-of-words (BoW) que reientemente ha sido apliada on éxito en apliaiones de ategorizaión

de objetos (Sivi y ols., 2005; G. Wang y ols., 2006). Este modelo también ha sido utilizado

en otras apliaiones,Leung y Malik (2001) y Burghouts yGeusebroek(2009) loemplean en el

reonoimiento demateriales, Siviy Zisserman(2003)en lareuperaióndeobjetos yVarma y

Zisserman(2005)para lasiartexturas.

La onstruión del modelo de representaión de la imagen en enfoques BoW y dentro del

ontextodelaategorizaióndeobjetosestáformadapor tresetapasprinipales:

1. Deteióndearaterístias.

2. Representaióndelasaraterístias.

3. Construióndelvoabulario.

Enlaprimeraetapaseobtienenlasregionesdelaimagenque sonsigniativas (pathes). En

lasegundaserepresentanlasaraterístiasdelasregioneson unvetornumérioparaobtener

asísudesriptor.Latereraetapaonsisteenlaonstruióndelvoabularioendondeserequiere

el usodeténiasde aprendizaje,esto es,apartirdeunsubonjunto de imágenesseenuentran

losvaloresdelasaraterístiasquesonrepresentativos.Losrepresentantessedenen omovisual

words( SiviyZisserman,2003)queonstituyenlosomponentesdelvoabulario.Elmétodomás

extendido para obtener los representantes es el algoritmode lustering K-means. Finalmente la

imagenesrepresentadaporelhistogramadelasvisualwords.Unaaraterístiaadestaardeeste

modeloesquenoimportadondeestánloalizadaslasaraterístiassinosufreuenia.

EnlarepresentaiónholístiaqueaquísepresentaseutilizalaaproximaiónBoWpara

repre-sentarlastexturasolor,endondelasaraterístiasutilizadassonlosatributos delosblobs

per-eptualesyelmodelodeonstruióndelvoabularioesmenosostoso.Elvoabularioseobtiene

realizandounauantiaióndelosatributosdelosblobspereptuales,portanto sinaprendizaje

previo.Laimagenesrepresentadaporlafuniónde distribuiónde probabilidadde lostérminos

o palabras visuales 3

del voabulario. Como se verá aontinuaión la representaión holístia es

3

simpleperoseajusta ala propuestadeJulesz yBergen(1983)endonde armanqueelsistema

visualpre-atentivoutilizaglobalmentesólolostextonsdelamaneramássimpleposible,ontando

sunúmero(densidad).

3.4. Desomposiión de la imagen en blobs

Las araterístiasutilizadas enesta aproximaiónBoW son losblobs de la imagen.En este

apartadosedetallaelproedimientoomputaionalpara obtenerlosblobsperibidosenuna

tex-turaolorademásdesusatributos.Denimosunblobomounaregiónonvexahomogéneaensu

ontrasteoolor.

3.4.1. Blobs pereptuales

Partiendo de laasunión que todos los blobs de las imágenes tienen forma Gaussiana, estos

puedenserisotrópios(formairular)ynoisotrópios(formaelipsoide).Losblobssearaterizan

porsuforma(anhura,altura, orientaión)yolor.

Paradetetarlosblobspereptualesyobtenerlosatributosquedenensuformasehautilizado

elproedimientodesarrolladopor SalvatellayVanrell(2007)paratexturasmonoromas.En éste

seusalarepresentaión delaimagenen elespaio-esala propuestopor Lindeberg (1994).En el

espaiomultiesala,laimagen

I

serepresentaapartirdeuna familia deimágenes ondiferentes

nivelesdedetalle. Éstasseobtienenalonvoluionarlaimagenonunafunióndesuavizadoon

diferentesparámetros

σ

:

L(x, y; σ) = I(x, y) ∗ G(x, y; σ)

(3.1)

siendo

G(·; σ)

lafunióndesuavizadoGaussiana:

G(x, y; σ) = 1

2πσ 2 exp{− x 2 + y 2

2 }.

(3.2)

LosblobsdeunaimagenseobtienenapliandoeloperadordiferenialLaplaianodeuna

Gaus-siana (LoG) normalizado en un subonjunto de esalas. Este operador se dene de la siguiente

manera:

2 norm L(·; σ) = σ 22 L(·; σ)

(3.3)

siendoelonjuntodeesalasutilizado

σ = {1,284 n , n ∈ [1 . . . 11]}

.

Paradesestimarlosblobs delaimagendebidosalruidoseimpone larestriión:

2 norm L(·; σ) ≥ η det

(3.4)

donde

η det

vendrá determinadapor el nivel de ruido de la imageny supone el únioparámetro

Lautilizaióndeestebanodeltrospermiteobtenerlaesalaylaloalizaiónespaialdelos

blobs: losentros de losblobs

(x, y)

orrespondenala loalizaión delosmáximosde lafunión

2 norm L(·; σ)

alolargodetodaslasesalas,mientrasquelaesaladelbloborrespondealaesala

enlaualsehaobtenidoelmáximo,quedenotaremosomo

s LoG

.

Laorientaiónylasdimensionesdelosblobsseobtienenapliandoeloperadortensorestrutural

2D, éste esla matriz de momentos de segundo orden, sobre la imagen.Este operador evalúala

estruturade losnivelesde grisalrededordeada punto dela imageny sedene delasiguiente

manera:

µ L (·; t, s) = G(·; s) ∗ ((∇L)(·; t)(∇L)(·; t) T )

(3.5)

siendo

∇L

elgradiente de laimagen evaluado para

t = s LoG

(esala del blob) y

G

una funión

gaussianaon

s = γs LoG

queonstituyelaesaladeintegraióndeltensorestrutural.Típiamente elvalorde

γ

es2.

Apartirdelamatrizdemomentosseobtienelaorientaióndelblob(

θ

)delasiguientemanera:

θ = arctan(v 2 /u 2 )

(3.6)

siendo

(v 2 , u 2 )

lasoordenadasdelvetorpropiodemenorvalorpropiodelamatrizdemomentos.

Respetoalasdimensiones delblob, laanhura(

w

)orrespondealaesalaenlaqueelltro

seajustamejoraestadimensión,ylalongitud delblob(

l

)sealulaapartirde

λ 1

y

λ 2

queson

losvalorespropiosdelamatrizdemomentos enordendereiente:

w = s LoG

l = sqrt(λ 1 /λ 2 ) · w = sqrt(λ 1 /λ 2 ) · s LoG .

(3.7)

Por tantoapartirdelproedimientodesritosehanloalizadolosblobsenlaimagen,onsus

oordenadas

(x, y)

,ysehanobtenidolosatributosquedenensuforma:anho,largoyorientaión

(w, l, θ)

.

Parailustrarelresultadodeladeteióndeblobs,enlagura3.1semuestranalgunosejemplos

sobreimágenesmonoromas.Paraunamejorvisualizaióndelresultadoenimágenesdiferentesse

muestran losblobsonontrastepositivoylosblobs onontrastenegativo.

Respetoaladeteióndelaformadelosblobs,éstanoesexatayuandoestossonalargados

elerrorometidoesmayor.Enlagura3.1.(f)dondesemuestraunejemplodedeteióndeblobs

alargados se puede observar, en la imagende la dereha, que unblob alargado seompone por

variosblobsperoningunodeellosseajustaorretamentealaforma.Esteerroresprovoadopor

dosmotivos,elprimeroesdebidoalsuavizadoque provoalaGaussiana(euaión3.2) utilizada

paraestimarelanhodelblob(

w

),yelsegundoalahoradealularsusdimensionesoneltensor estrutural (euaión 3.5). El parámetro de éste (

s

), que es la esala de integraión del tensor

estrutural, para esalas grandes produe un exesivosuavizado de laimagen y esto provoa el

error en laestimaión de lalongitud del blob (

l

).La inexatitud en la deteiónde laforma de

(a)imagenoriginal (b)Blobsdetetados

() imagenoriginal (d)Blobsdetetados

(e) imagenoriginal (f)Blobsdetetados

Figura 3.1: (a), () y (e) Imágenes monoromas. (b), (d) y (f) Blobs detetados, on ontraste

positivoalaizquierdayon ontrastenegativoaladereha.

losblobsvaaprovoarquelarepresentaiónquesederivenoseadel todoelalontenidodela

imagen.

Porotrolado,enlasmismasgurassepuedeobservarqueladeteióndeblobsgeneramultitud

de blob redundantes, es deir, blobs on formas similares que se solapan en el espaio

(x, y)

y

solamente algunos deellos orrespondenalosrealmente peribidos. Cadauno de lasformasque

apareen en las imágenes deberían estar englobadas por un únio blob, de esta manera sí que

seorresponderíana laperepiónhumana. Conel objetivode eliminar losblobs redundantes y

obtenersolamentelosrealmenteperibidossehadesarrolladounltradopereptualquesedesglosa

enlossiguientespasos:

1. Reonstruióndelosblobsdetetadosapartirdesuloalizaiónysusatributos.

2. Loalizaióndeblobssolapadosenelespaio.

energía (mayor valor de la funión

2 norm L(·; σ)

en la esala

σ

donde se ha detetado) y

ltrarelresto.

Elresultadodeesteltradosepuedeobservarenlagura3.2endondelosblobspereptuales

obtenidos ahoraseajustanenmayormedida alosblobsrealmenteperibidos.

(a)imagenoriginal (b)Blobspereptuales

()imagenoriginal (d)Blobspereptuales

(e)imagenoriginal (f)Blobspereptuales

Figura 3.2: (a), () y(e) Imágenes monoromas. (b),(d) y (f) Blobspereptuales,on ontraste

positivoalaizquierdayonontrastenegativoaladereha.

3.4.2. Blobs en olor

En una imagenolor losblobs peribidos pueden emergerdebido a: difereniasen la

intensi-dad (provoadas por lageometría de lasuperie, ej: rugosidad), diferenias de las propiedades

romátias (provoadas por la reetania)opor difereniasdeambaspropiedades.En la gura

3.3.(a)-() se muestran tres ejemplos de texturas olor en donde la perepión de la textura es

provoadapor diferentespropiedadesdelaesena.

Teniendo en uenta estas propiedades, para extender el onepto de blob pereptual en

tex-(a) (b) ()

Figura 3.3: (a) y () textura peribida por las diferenias de las omponentes romátias. (b)

texturaperibidaporlosambiosdelaintensidad.

romátiasde laintensidad. El espaiodeolores oponentes hasido élesogido por este motivo.

En lagura 3.4semuestra ladesomposiiónde lasimágenes de lagura3.3 enlosanales del

espaioRGByenlosanalesoponentes.En lagura3.4sedemuestraomolosblobsproduidos

porlaspropiedadesromátiasdelaimagen3.3.()noapareenenlalásiadesomposiiónRGB

mientrasqueenlosanalesoponentes sí.

Laomponenteintensidaddelespaiooponentehasidodenidadeauerdoonlaformulaión

expresada en el apartado 2.2.3 (

I = R + G + B

), y las dimensiones romátias rg y by en esta oasiónhansidonormalizadaspara haerlasindependientes delaintensidad.Éstas seobtienena

partirdelasiguientetransformaión:

donder,gybsonlasomponentesromátiasobtenidasnormalizandoporlaintensidad,estoes:

r = R/I g = G/I b = B/I

(3.9)

ydonde

R

,

G

y

B

sonrespetivamente lasomponentesrojo,verdeyazuldel espaioRGBdela imagenoriginal.Enestatransformaiónsehallainluida unaorreiónparaquelosvaloresrgy

byesténenelrango[0..1℄aligualquelaomponente I.

Los blobs pereptuales de una imagen olor se obtienen apliando el operador diferenial

(euaión3.3) y elltrado pereptual sobre ada una delas omponentes del espaiode olores

oponentes.Este proedimientoademásdedetetarlosblobsdebidosaambiosenlaintensidadde

laimagen,también permitedetetar losblobsque presentanunbajo ontrasteenel anal

inten-sidadyquesedisriminanmejorenualquieradelosdosanalesromátios. Deestamanera,se

(a)

(b)

()

(d)

(e)

(f)

Figura3.4:Enlaslas(a)-()analesR,GyBrespetivamente.Enlaslas(d)-(f)analesespaio

oponente,I,RGyBYrespetivamenteparalasimágenesdelagura3.3.

3.4.3. Textons: atributos de los blobs

Los blobs pereptuales de una imagen searaterizan por medio de su loalizaión y de sus

atributosformayolor,enformamatriialestoseexpresadelasiguiente manera:

T loc = [ XY ] T sha = [ WLΘ ] T col = [ I RG BY ]

(3.10)

donde

T loc

ontiene la loalizaión de losentros de los blobs,

T sha

ontiene los atributos que

araterizanlaformadelosblobs

w

,

l

,

θ

(anho,largoyorientaión)aluladosenlaseuaiones 3.6y3.7y

T col

ontiene losatributosdeolor.Losomponentesdeadaunasonlassiguientes:

X T = [x 1 . . . x n ] Y T = [y 1 . . . y n ]

W T = [w 1 . . . w n ] L T = [l 1 . . . l n ] Θ T = [θ 1 . . . θ n ] I T = [i 1 . . . i n ] RG T = [rg 1 . . . rg n ] BY T = [by 1 . . . by n ]

(3.11)

siendo

n

elnúmerodeblobspereptualesdetetadosy

T

indialaversióntranspuestadelamatriz.

Elatributodeolordelblob

j

-ésimo

(i j , rg j , by j )

orrespondealaintensidadylaromatiidad

delblobrespetivamente.Esteatributoseestimaapartirdelosatributosolordetodoslospixels

que forman el blob, utilizando para ello el operador estadístio mediana. Esta estimaión en el

olor del blob no se ve afetada por los valores atípios (outliers) que pudieran apareer omo

onseueniadelainexatitudenladeteióndelaformadelosblobs.

La matriz formadapor lalistade blobsobtenidos en unaimagenademás de sus atributosse

denebajoeloneptodetextons,deauerdoon lateoríadeJulesz(1986),yseexpresaatravés

delamatriz:

T = [ T loc T sha T col ].

(3.12)

Para ilustrar la desomposiión de una imagen en los blobs pereptuales obtenidos en ada

Para ilustrar la desomposiión de una imagen en los blobs pereptuales obtenidos en ada

Dans le document Autònoma de Barcelona (Page 45-0)