Background - A numerical model for simulating sediment routing in shallow water flow

Como visto anteriormente, no processo de subtra¸c˜ao de fundo inicialmente ´e preciso

criar ou inicializar um modelo do plano de fundo. Isto pode ser realizado de m´ultiplas formas. A mais simples, consiste em definir manualmente uma imagem que representa

o plano de fundo contendo nenhum objeto de interesse. Porém, utilizar uma imagem estática nem sempre é a melhor op¸cão. Por exemplo, em locais onde pode ocorrer mu-

dan¸cas de luminosidade a segmenta¸cão irá falhar, pois a imagem de primeiro plano incluirá as regiões que sofreram altera¸cões de luminosidade. Em Lai e Yung (1998), o autor sugere

a inicializa¸cão e manuten¸cão do modelo do plano de fundo através da média aritmética (simples ou ponderada) dos pixels entre sucessivas imagens. Assim, considerando um

v´ıdeo V de comprimento N composto por I imagens definido por V = I1, ..., IN. Con-

siderando que as imagens possuem apenas um canal (escala de cinza), uma imagem Ii

pode ser representada por uma matriz de intensidade. Logo, o modelo do plano de fundo, representado por B, ´e dado por

B = 1 N N X i=1 Ii. (.)

Tipicamente a Equa¸cão . é utilizada para inicializar o modelo do plano de fundo, porém, durante sua atualiza¸cão é comum a implementa¸cão da Equa¸cão . em sua forma

recursiva como pode ser visto na Equa¸c˜ao ..

Bn= (1 − α)Bn−1+ αIn, (.)

onde Bn representa o modelo do plano de fundo no instante n dado por n ∈ [1, N ] e

α ∈ [0, 1] é a constante de aprendizado. A principal vantagem deste método é a manu-

ten¸c˜ao adaptativa do modelo do plano de fundo conforme mudan¸cas ocorrem na cena. Por´em, alguns autores como Bouwmans (2012) e Sigari et al. (2008) esclarecem que os

pixels classificados como primeiro plano acabam sendo computados na atualiza¸cão do modelo do plano de fundo. Sendo assim, é sugerido um método seletivo para solucionar

(a) Amostra de um v´ıdeo de entrada em escala de cinza.

(b) Modelo do plano de fundo ap´os 750 itera¸c˜oes com α = 0.01.

Figura 2.9: Exemplo de aprendizado adaptativo na cria¸c˜ao do modelo de plano de fundo.

este problema. No método seletivo, o modelo do plano de fundo sofre atualiza¸cão apenas nas regiões onde nenhum objeto em movimento foi detectado. Entretanto, considerando

um pixel com localiza¸cão definida por (x, y) em uma imagem I, também expresso por I(x, y), durante a manuten¸cão seletiva, o novo modelo do plano de fundo é dado por

Bn(x, y) =

 



(1 − α)Bn−1(x, y) + αIn(x, y) se o pixel (x, y) ∈ plano de fundo.

Bn−1(x, y) se o pixel (x, y) ∈ primeiro plano.

, (.)

sendo Bn(x, y) e In(x, y) o valor do pixel (x, y) nas imagens B e I no instante n dado

por n ∈ [1, N ] em que N ´e a quantidade total de quadros de um v´ıdeo V . Esta equa¸c˜ao ´

e aplicada em todos os pixels das imagens B e I.

Para verificar se um pixel pertence ou n˜ao ao plano de fundo, inicialmente pode-se utilizar a Equa¸c˜ao . nos primeiros quadros do v´ıdeo e, em seguida, determinar a imagem

de primeiro plano comparando o quadro atual com o modelo obtido do plano de fundo. Em geral, durante a compara¸cão é utilizado um limiar, definido por T , e o resultado é

uma imagem binária F representando o primeiro plano. Esta opera¸cão é definida por

Fn(x, y) =

  

1 se d(In(x, y), Bn−1(x, y)) > T

0 caso contr´ario

(a) Diferen¸ca absoluta entre o quadro de entrada e o modelo do plano de fundo.

(b) Máscara de primeiro plano após aplica¸cão de um limitar T = 0.1.

Figura 2.10: Determina¸c˜ao da m´ascara de primeiro plano.

onde a fun¸c˜ao d(I(x, y), B(x, y)) = |I(x, y) − B(x, y)| ´e a diferen¸ca absoluta entre dois pixels.

Se o pixel da imagem I possuir um valor não nulo na imagem de primeiro plano F , então o pixel é considerado como pixel do primeiro plano, caso contrário, é um pixel do

plano de fundo. A Equa¸cão . também pode ser considerada como uma fun¸cão degrau, porém Sigari et al. (2008) sugere a utiliza¸cão de uma fun¸cão de satura¸cão linear definida

por F sn(x, y) =     

1 se d(In(x, y), Bn−1(x, y)) > T s.

I(x, y) − B(x, y) T s

caso contr´ario

, (.)

onde T s ´e o limiar.

Entretanto o resultado da Equa¸c˜ao . consiste em uma imagem com valores reais

entre [0, 1]. Para determinar a imagem bin´aria de primeiro plano, Sigari et al. (2008) sugere a utiliza¸c˜ao de um filtro passa-baixa (LPF – low-pass filter ). Sendo assim, a imagem

de primeiro plano ´e definida como

Fn(x, y) =

  

1 se |LP F (F sn(x, y))| > T .

0 caso contr´ario

. (.)

plano devido a utiliza¸c˜ao de um filtro passa-baixa (SIGARI et al., 2008).

Os métodos apresentados até então se baseiam apenas no n´ıvel de intensidade dos pixels de uma imagem. Alguns autores, tais como Zhang e Xu (2006), Kristensen et al.

(2006), Jain et al. (2007), Yao e Odobez (2007), Jian et al. (2008), Baf et al. (2008a), Azab et al. (2010) e Bouwmans (2012) sugerem a utiliza¸c˜ao de caracter´ısticas extra´ıdas

do espa¸co de cor, textura e bordas da imagem. A seguir s˜ao brevemente apresentados alguns dos m´etodos comumente utilizados para extrair caracter´ısticas relativas a cor e

textura.

Caracter´ısticas de Cor .

A escolha do espa¸co de cor é um dos principais fatores para realizar uma segmenta¸cão eficiente. Uma compara¸cão entre espa¸co de cores pode ser encontrada em

Kristensen et al. (2006) e Kanprachar e Tangkawanit (2007). O espa¸co de cor RGB é comumente utilizado, porém Bouwmans (2012) não recomenda a escolha deste, pois as

três componentes do espa¸co de cor RGB são sens´ıveis a varia¸cões de luminosidade. Zhang e Xu (2006) sugerem a utiliza¸cão do espa¸co de cor Ohta que é uma transforma¸cão linear

do espa¸co de cor RGB. A Equa¸c˜ao . apresenta a rela¸c˜ao entre o espa¸co de cor RGB e Ohta.

O1 = (R + G + B)/3

O2 = (R − B)/2

O3 = (2G − R − B)/4

(.)

Posteriormente Baf et al. (2008a) obtiveram melhores resultados utilizando o espa¸co de cor YCrCb. Os autores utilizaram o canal Cr e Cb e desprezaram o canal Y por sua

sensibilidade a altera¸cões de luminosidade. A Equa¸cão . apresenta a rela¸cão entre o espa¸co de cor RGB e YCrCb.

Y = 0.25R + 0.504G + 0.098B + 16

Cr = 0.439R − 0.368G − 0.071B + 128

Cb = −0.148R − 0.291G + 0.439B + 128

Para realizar a segmenta¸c˜ao do primeiro plano utilizando informa¸c˜oes de cores, Zhang

e Xu (2006) sugerem uma fun¸c˜ao de medida de similaridade entre duas imagens. Dada uma imagem de entrada I e uma imagem B representando o plano de fundo, o grau de

similaridade entre os pixels ´e definido por:

Sk(x, y) =                Ik(x, y) Bk(x, y) se Ik(x, y) < Bk(x, y). 1 se Ik(x, y) = Bk(x, y). Bk(x, y) Ik(x, y) se Ik(x, y) > Bk(x, y). (.)

onde k ∈ 1, 2, 3 representa um dos canais da imagem. Nota-se que Sk(x, y) assume valores

entre 0 e 1.

Caracter´ısticas de Textura .

A segmenta¸c˜ao do primeiro plano tamb´em pode ser realizada pela textura. Zhang

e Xu (2006) e Baf et al. (2008a) sugerem a utiliza¸cão do método LBP (Local Binary Pattern) originalmente proposto por Ojala et al. (1996). Segundo os autores, o método

LBP possui um baixo custo computacional e robustez quanto a varia¸cão monotônica nos n´ıveis de cinza que ocorrem durante altera¸cões de luminosidade. O método LBP é

definido por: LBP (x, y) = N −1 X i=1 s(gi− g)2i (.)

onde g corresponde ao n´ıvel de cinza do pixel centrado em (x, y) em uma imagem I, gi o

n´ıvel de cinza do i-ésimo pixel vizinho e 2i representa o peso do i-ésimo pixel vizinho. A fun¸cão s é definida por:

s(gi− g) =

 



1 se gi− g ≥ 0.

0 caso contr´ario

(.)

Originalmente o m´etodo LBP considera uma vizinhan¸ca de 3 x 3. A Figura 2.11 apresenta

(a) Imagem original. (b) Imagem LBP.

Figura 2.11: Exemplo de uma imagem de entrada e a imagem LBP correspondente.

Dada duas texturas definidas por LI _{e L}B_{, sendo L}I _{a textura da imagem de entrada}

I e LB_{a textura do plano de fundo B, Zhang e Xu (2006) sugere que o grau de similaridade}

entre estas duas texturas pode ser calculado atrav´es da Equa¸c˜ao ..

Sk(x, y) =                LI k(x, y) LB k(x, y) se LI k(x, y) < LBk(x, y). 1 se LI k(x, y) = LBk(x, y). LB_k(x, y) LI k(x, y) se LI_k(x, y) > LB_k(x, y). (.)

onde LI_{(x, y) e L}B_{(x, y) s˜}_{ao obtidas ap´}_{os a aplica¸c˜}_{ao do m´}_{etodo LBP no pixel (x, y) da}

imagem de entrada e do plano de fundo. Nota-se que Sk(x, y) assume valores entre 0 e

1. Sk(x, y) assume valores pr´oximos de 1 quando LI(x, y) e LB(x, y) s˜ao muito similares.

O processo de subtra¸cão de fundo pode-se tornar mais robusto com a utiliza¸cão de caracter´ısticas de cor e textura. Zhang e Xu (2006) sugerem a fusão destas caracter´ısticas

utilizando uma abordagem fuzzy com o uso da Integral de Sugeno (SUGENO, 1974). Pos- teriormente Baf et al. (2008a) e Azab et al. (2010) obtiveram melhores resultados com o

uso da Integral de Choquet (CHOQUET, 1953).

Conforme apresentado inicialmente, uma grande quantidade de m´etodos de sub-

tra¸cão de fundo foram desenvolvidos ao longo dos anos. Neste trabalho alguns métodos foram agrupados em categorias. Cada categoria é descrita abaixo.

2.2.2.1 M´etodos Estat´ısticos .

Wren et al. (1997) propuseram que a série temporal de cada pixel de uma imagem pode ser modelada através de uma fun¸cão de densidade de probabilidade considerando

uma distribui¸cão gaussiana. Posteriormente Stauffer e Grimson (1999) esclarecem que apenas uma gaussiana é insuficiente para modelar a dinâmica do plano de fundo e sugere

a utiliza¸cão de uma mistura de gaussianas. Stauffer e Grimson (1999) citam que três a cinco gaussianas por pixel são suficientes para modelar a maior parte das cenas comu-

mente encontradas em ambientes externos. O n´umero de gaussianas tamb´em influencia no desempenho do algoritmo, principalmente em imagens multi-canais, tais como ima-

gens coloridas no formato RGB. Cada pixel em cada componente da imagem possuir´a uma mistura de gaussianas consumindo assim uma maior quantidade de mem´oria e po-

der computacional. Em seguida Elgammal et al. (2000) propõem a modelagem do plano de fundo de forma não-paramétrica. Posteriormente Zivkovic (2004) e Zivkovic e Heij-

den (2006) aperfei¸coaram o método proposto por Stauffer e Grimson (1999) adicionando suporte a deteçcão de sombras e sele¸cão adaptativa do número de gaussianas por pixel

aumentando assim a robustez e o desempenho do algoritmo.

2.2.2.2 M´etodos Fuzzy .

Recentemente, alguns autores têm introduzido conceitos fuzzy nas diferentes etapas do processo de subtra¸cão de fundo. Em Zhang e Xu (2006) os autores realizam a subtra¸cão

de fundo através do grau de similaridade entre caracter´ısticas de cor e textura da imagem de entrada e o modelo de plano de fundo utilizando a Integral de Sugeno (SUGENO, 1974). Posteriormente, Baf et al. (2008a) obtiveram melhores resultados utilizando a Integral de Choquet (CHOQUET, 1953). Em seguida, Azab et al. (2010) utilizaram a Integral de Choquet com caracter´ısticas de borda além de textura e cor. Sigari et al. (2008) propuseram uma fun¸cão fuzzy para a atualiza¸cão do modelo do plano de fundo e para

a extra¸c˜ao dos pixels de primeiro plano. Baf et al. (2008b) sugerem uma fun¸c˜ao fuzzy tipo-2 para lidar com as incertezas do modelo multi-gaussiano do plano de fundo. Em

aprimorar a detec¸c˜ao de objetos em movimento. Em Bouwmans (2012) o autor faz uma

revis˜ao completa sobre a abordagem fuzzy aplicada ao processo de subtra¸c˜ao de fundo.

2.2.2.3 M´etodos Neurais .

Basicamente a rede neural aprende como classificar cada pixel da imagem, deter- minando se um pixel pertence ao primeiro plano ou plano de fundo (BOUWMANS, 2011). Em Culibrk et al. (2007) os autores utilizam uma rede neural com 124 neurˆonios, o modelo do plano de fundo ´e aprendido pela rede neural enquanto um classificador baye-

siano identifica se um determinado pixel pertence ao primeiro plano ou plano de fundo. Em Maddalena e Petrosino (2008), os autores desenvolveram um algoritmo que realiza

a subtra¸c˜ao de fundo utilizando mapas auto-organiz´aveis (SOM - self-organizing map), ou mapas de Kohonen. Cada pixel da imagem possui um mapa neural bidimensional

formado por n x n vetores de peso. Posteriormente Maddalena e Petrosino (2010) aperfei¸coaram o trabalho anterior adicionando uma fun¸c˜ao fuzzy durante o aprendizado do

modelo de plano de fundo e uma análise de coerência espacial sobre a rede SOM de cada pixel apresentando resultados superiores ao método anterior.

Dans le document A numerical model for simulating sediment routing in shallow water flow (Page 19-22)