Como visto anteriormente, no processo de subtra¸c˜ao de fundo inicialmente ´e preciso
criar ou inicializar um modelo do plano de fundo. Isto pode ser realizado de m´ultiplas formas. A mais simples, consiste em definir manualmente uma imagem que representa
o plano de fundo contendo nenhum objeto de interesse. Por´em, utilizar uma imagem est´atica nem sempre ´e a melhor op¸c˜ao. Por exemplo, em locais onde pode ocorrer mu-
dan¸cas de luminosidade a segmenta¸c˜ao ir´a falhar, pois a imagem de primeiro plano incluir´a as regi˜oes que sofreram altera¸c˜oes de luminosidade. Em Lai e Yung (1998), o autor sugere
a inicializa¸c˜ao e manuten¸c˜ao do modelo do plano de fundo atrav´es da m´edia aritm´etica (simples ou ponderada) dos pixels entre sucessivas imagens. Assim, considerando um
v´ıdeo V de comprimento N composto por I imagens definido por V = I1, ..., IN. Con-
siderando que as imagens possuem apenas um canal (escala de cinza), uma imagem Ii
pode ser representada por uma matriz de intensidade. Logo, o modelo do plano de fundo, representado por B, ´e dado por
B = 1 N N X i=1 Ii. (.)
Tipicamente a Equa¸c˜ao . ´e utilizada para inicializar o modelo do plano de fundo, por´em, durante sua atualiza¸c˜ao ´e comum a implementa¸c˜ao da Equa¸c˜ao . em sua forma
recursiva como pode ser visto na Equa¸c˜ao ..
Bn= (1 − α)Bn−1+ αIn, (.)
onde Bn representa o modelo do plano de fundo no instante n dado por n ∈ [1, N ] e
α ∈ [0, 1] ´e a constante de aprendizado. A principal vantagem deste m´etodo ´e a manu-
ten¸c˜ao adaptativa do modelo do plano de fundo conforme mudan¸cas ocorrem na cena. Por´em, alguns autores como Bouwmans (2012) e Sigari et al. (2008) esclarecem que os
pixels classificados como primeiro plano acabam sendo computados na atualiza¸c˜ao do modelo do plano de fundo. Sendo assim, ´e sugerido um m´etodo seletivo para solucionar
(a) Amostra de um v´ıdeo de entrada em escala de cinza.
(b) Modelo do plano de fundo ap´os 750 itera¸c˜oes com α = 0.01.
Figura 2.9: Exemplo de aprendizado adaptativo na cria¸c˜ao do modelo de plano de fundo.
este problema. No m´etodo seletivo, o modelo do plano de fundo sofre atualiza¸c˜ao apenas nas regi˜oes onde nenhum objeto em movimento foi detectado. Entretanto, considerando
um pixel com localiza¸c˜ao definida por (x, y) em uma imagem I, tamb´em expresso por I(x, y), durante a manuten¸c˜ao seletiva, o novo modelo do plano de fundo ´e dado por
Bn(x, y) =
(1 − α)Bn−1(x, y) + αIn(x, y) se o pixel (x, y) ∈ plano de fundo.
Bn−1(x, y) se o pixel (x, y) ∈ primeiro plano.
, (.)
sendo Bn(x, y) e In(x, y) o valor do pixel (x, y) nas imagens B e I no instante n dado
por n ∈ [1, N ] em que N ´e a quantidade total de quadros de um v´ıdeo V . Esta equa¸c˜ao ´
e aplicada em todos os pixels das imagens B e I.
Para verificar se um pixel pertence ou n˜ao ao plano de fundo, inicialmente pode-se utilizar a Equa¸c˜ao . nos primeiros quadros do v´ıdeo e, em seguida, determinar a imagem
de primeiro plano comparando o quadro atual com o modelo obtido do plano de fundo. Em geral, durante a compara¸c˜ao ´e utilizado um limiar, definido por T , e o resultado ´e
uma imagem bin´aria F representando o primeiro plano. Esta opera¸c˜ao ´e definida por
Fn(x, y) =
1 se d(In(x, y), Bn−1(x, y)) > T
0 caso contr´ario
(a) Diferen¸ca absoluta entre o quadro de entrada e o modelo do plano de fundo.
(b) M´ascara de primeiro plano ap´os aplica¸c˜ao de um limitar T = 0.1.
Figura 2.10: Determina¸c˜ao da m´ascara de primeiro plano.
onde a fun¸c˜ao d(I(x, y), B(x, y)) = |I(x, y) − B(x, y)| ´e a diferen¸ca absoluta entre dois pixels.
Se o pixel da imagem I possuir um valor n˜ao nulo na imagem de primeiro plano F , ent˜ao o pixel ´e considerado como pixel do primeiro plano, caso contr´ario, ´e um pixel do
plano de fundo. A Equa¸c˜ao . tamb´em pode ser considerada como uma fun¸c˜ao degrau, por´em Sigari et al. (2008) sugere a utiliza¸c˜ao de uma fun¸c˜ao de satura¸c˜ao linear definida
por F sn(x, y) =
1 se d(In(x, y), Bn−1(x, y)) > T s.
I(x, y) − B(x, y) T s
caso contr´ario
, (.)
onde T s ´e o limiar.
Entretanto o resultado da Equa¸c˜ao . consiste em uma imagem com valores reais
entre [0, 1]. Para determinar a imagem bin´aria de primeiro plano, Sigari et al. (2008) su- gere a utiliza¸c˜ao de um filtro passa-baixa (LPF – low-pass filter ). Sendo assim, a imagem
de primeiro plano ´e definida como
Fn(x, y) =
1 se |LP F (F sn(x, y))| > T .
0 caso contr´ario
. (.)
plano devido a utiliza¸c˜ao de um filtro passa-baixa (SIGARI et al., 2008).
Os m´etodos apresentados at´e ent˜ao se baseiam apenas no n´ıvel de intensidade dos pixels de uma imagem. Alguns autores, tais como Zhang e Xu (2006), Kristensen et al.
(2006), Jain et al. (2007), Yao e Odobez (2007), Jian et al. (2008), Baf et al. (2008a), Azab et al. (2010) e Bouwmans (2012) sugerem a utiliza¸c˜ao de caracter´ısticas extra´ıdas
do espa¸co de cor, textura e bordas da imagem. A seguir s˜ao brevemente apresentados alguns dos m´etodos comumente utilizados para extrair caracter´ısticas relativas a cor e
textura.
Caracter´ısticas de Cor .
A escolha do espa¸co de cor ´e um dos principais fatores para realizar uma seg- menta¸c˜ao eficiente. Uma compara¸c˜ao entre espa¸co de cores pode ser encontrada em
Kristensen et al. (2006) e Kanprachar e Tangkawanit (2007). O espa¸co de cor RGB ´e comumente utilizado, por´em Bouwmans (2012) n˜ao recomenda a escolha deste, pois as
trˆes componentes do espa¸co de cor RGB s˜ao sens´ıveis a varia¸c˜oes de luminosidade. Zhang e Xu (2006) sugerem a utiliza¸c˜ao do espa¸co de cor Ohta que ´e uma transforma¸c˜ao linear
do espa¸co de cor RGB. A Equa¸c˜ao . apresenta a rela¸c˜ao entre o espa¸co de cor RGB e Ohta.
O1 = (R + G + B)/3
O2 = (R − B)/2
O3 = (2G − R − B)/4
(.)
Posteriormente Baf et al. (2008a) obtiveram melhores resultados utilizando o espa¸co de cor YCrCb. Os autores utilizaram o canal Cr e Cb e desprezaram o canal Y por sua
sensibilidade a altera¸c˜oes de luminosidade. A Equa¸c˜ao . apresenta a rela¸c˜ao entre o espa¸co de cor RGB e YCrCb.
Y = 0.25R + 0.504G + 0.098B + 16
Cr = 0.439R − 0.368G − 0.071B + 128
Cb = −0.148R − 0.291G + 0.439B + 128
Para realizar a segmenta¸c˜ao do primeiro plano utilizando informa¸c˜oes de cores, Zhang
e Xu (2006) sugerem uma fun¸c˜ao de medida de similaridade entre duas imagens. Dada uma imagem de entrada I e uma imagem B representando o plano de fundo, o grau de
similaridade entre os pixels ´e definido por:
Sk(x, y) = Ik(x, y) Bk(x, y) se Ik(x, y) < Bk(x, y). 1 se Ik(x, y) = Bk(x, y). Bk(x, y) Ik(x, y) se Ik(x, y) > Bk(x, y). (.)
onde k ∈ 1, 2, 3 representa um dos canais da imagem. Nota-se que Sk(x, y) assume valores
entre 0 e 1.
Caracter´ısticas de Textura .
A segmenta¸c˜ao do primeiro plano tamb´em pode ser realizada pela textura. Zhang
e Xu (2006) e Baf et al. (2008a) sugerem a utiliza¸c˜ao do m´etodo LBP (Local Binary Pattern) originalmente proposto por Ojala et al. (1996). Segundo os autores, o m´etodo
LBP possui um baixo custo computacional e robustez quanto a varia¸c˜ao monotˆonica nos n´ıveis de cinza que ocorrem durante altera¸c˜oes de luminosidade. O m´etodo LBP ´e
definido por: LBP (x, y) = N −1 X i=1 s(gi− g)2i (.)
onde g corresponde ao n´ıvel de cinza do pixel centrado em (x, y) em uma imagem I, gi o
n´ıvel de cinza do i-´esimo pixel vizinho e 2i representa o peso do i-´esimo pixel vizinho. A fun¸c˜ao s ´e definida por:
s(gi− g) =
1 se gi− g ≥ 0.
0 caso contr´ario
(.)
Originalmente o m´etodo LBP considera uma vizinhan¸ca de 3 x 3. A Figura 2.11 apresenta
(a) Imagem original. (b) Imagem LBP.
Figura 2.11: Exemplo de uma imagem de entrada e a imagem LBP correspondente.
Dada duas texturas definidas por LI e LB, sendo LI a textura da imagem de entrada
I e LBa textura do plano de fundo B, Zhang e Xu (2006) sugere que o grau de similaridade
entre estas duas texturas pode ser calculado atrav´es da Equa¸c˜ao ..
Sk(x, y) = LI k(x, y) LB k(x, y) se LI k(x, y) < LBk(x, y). 1 se LI k(x, y) = LBk(x, y). LBk(x, y) LI k(x, y) se LIk(x, y) > LBk(x, y). (.)
onde LI(x, y) e LB(x, y) s˜ao obtidas ap´os a aplica¸c˜ao do m´etodo LBP no pixel (x, y) da
imagem de entrada e do plano de fundo. Nota-se que Sk(x, y) assume valores entre 0 e
1. Sk(x, y) assume valores pr´oximos de 1 quando LI(x, y) e LB(x, y) s˜ao muito similares.
O processo de subtra¸c˜ao de fundo pode-se tornar mais robusto com a utiliza¸c˜ao de caracter´ısticas de cor e textura. Zhang e Xu (2006) sugerem a fus˜ao destas caracter´ısticas
utilizando uma abordagem fuzzy com o uso da Integral de Sugeno (SUGENO, 1974). Pos- teriormente Baf et al. (2008a) e Azab et al. (2010) obtiveram melhores resultados com o
uso da Integral de Choquet (CHOQUET, 1953).
Conforme apresentado inicialmente, uma grande quantidade de m´etodos de sub-
tra¸c˜ao de fundo foram desenvolvidos ao longo dos anos. Neste trabalho alguns m´etodos foram agrupados em categorias. Cada categoria ´e descrita abaixo.
2.2.2.1 M´etodos Estat´ısticos .
Wren et al. (1997) propuseram que a s´erie temporal de cada pixel de uma imagem pode ser modelada atrav´es de uma fun¸c˜ao de densidade de probabilidade considerando
uma distribui¸c˜ao gaussiana. Posteriormente Stauffer e Grimson (1999) esclarecem que apenas uma gaussiana ´e insuficiente para modelar a dinˆamica do plano de fundo e sugere
a utiliza¸c˜ao de uma mistura de gaussianas. Stauffer e Grimson (1999) citam que trˆes a cinco gaussianas por pixel s˜ao suficientes para modelar a maior parte das cenas comu-
mente encontradas em ambientes externos. O n´umero de gaussianas tamb´em influencia no desempenho do algoritmo, principalmente em imagens multi-canais, tais como ima-
gens coloridas no formato RGB. Cada pixel em cada componente da imagem possuir´a uma mistura de gaussianas consumindo assim uma maior quantidade de mem´oria e po-
der computacional. Em seguida Elgammal et al. (2000) prop˜oem a modelagem do plano de fundo de forma n˜ao-param´etrica. Posteriormente Zivkovic (2004) e Zivkovic e Heij-
den (2006) aperfei¸coaram o m´etodo proposto por Stauffer e Grimson (1999) adicionando suporte a detec¸c˜ao de sombras e sele¸c˜ao adaptativa do n´umero de gaussianas por pixel
aumentando assim a robustez e o desempenho do algoritmo.
2.2.2.2 M´etodos Fuzzy .
Recentemente, alguns autores tˆem introduzido conceitos fuzzy nas diferentes etapas do processo de subtra¸c˜ao de fundo. Em Zhang e Xu (2006) os autores realizam a subtra¸c˜ao
de fundo atrav´es do grau de similaridade entre caracter´ısticas de cor e textura da imagem de entrada e o modelo de plano de fundo utilizando a Integral de Sugeno (SUGENO, 1974). Posteriormente, Baf et al. (2008a) obtiveram melhores resultados utilizando a Integral de Choquet (CHOQUET, 1953). Em seguida, Azab et al. (2010) utilizaram a Integral de Choquet com caracter´ısticas de borda al´em de textura e cor. Sigari et al. (2008) propuseram uma fun¸c˜ao fuzzy para a atualiza¸c˜ao do modelo do plano de fundo e para
a extra¸c˜ao dos pixels de primeiro plano. Baf et al. (2008b) sugerem uma fun¸c˜ao fuzzy tipo-2 para lidar com as incertezas do modelo multi-gaussiano do plano de fundo. Em
aprimorar a detec¸c˜ao de objetos em movimento. Em Bouwmans (2012) o autor faz uma
revis˜ao completa sobre a abordagem fuzzy aplicada ao processo de subtra¸c˜ao de fundo.
2.2.2.3 M´etodos Neurais .
Basicamente a rede neural aprende como classificar cada pixel da imagem, deter- minando se um pixel pertence ao primeiro plano ou plano de fundo (BOUWMANS, 2011). Em Culibrk et al. (2007) os autores utilizam uma rede neural com 124 neurˆonios, o modelo do plano de fundo ´e aprendido pela rede neural enquanto um classificador baye-
siano identifica se um determinado pixel pertence ao primeiro plano ou plano de fundo. Em Maddalena e Petrosino (2008), os autores desenvolveram um algoritmo que realiza
a subtra¸c˜ao de fundo utilizando mapas auto-organiz´aveis (SOM - self-organizing map), ou mapas de Kohonen. Cada pixel da imagem possui um mapa neural bidimensional
formado por n x n vetores de peso. Posteriormente Maddalena e Petrosino (2010) aper- fei¸coaram o trabalho anterior adicionando uma fun¸c˜ao fuzzy durante o aprendizado do
modelo de plano de fundo e uma an´alise de coerˆencia espacial sobre a rede SOM de cada pixel apresentando resultados superiores ao m´etodo anterior.