• Aucun résultat trouvé

Como visto anteriormente, no processo de subtra¸c˜ao de fundo inicialmente ´e preciso

criar ou inicializar um modelo do plano de fundo. Isto pode ser realizado de m´ultiplas formas. A mais simples, consiste em definir manualmente uma imagem que representa

o plano de fundo contendo nenhum objeto de interesse. Por´em, utilizar uma imagem est´atica nem sempre ´e a melhor op¸c˜ao. Por exemplo, em locais onde pode ocorrer mu-

dan¸cas de luminosidade a segmenta¸c˜ao ir´a falhar, pois a imagem de primeiro plano incluir´a as regi˜oes que sofreram altera¸c˜oes de luminosidade. Em Lai e Yung (1998), o autor sugere

a inicializa¸c˜ao e manuten¸c˜ao do modelo do plano de fundo atrav´es da m´edia aritm´etica (simples ou ponderada) dos pixels entre sucessivas imagens. Assim, considerando um

v´ıdeo V de comprimento N composto por I imagens definido por V = I1, ..., IN. Con-

siderando que as imagens possuem apenas um canal (escala de cinza), uma imagem Ii

pode ser representada por uma matriz de intensidade. Logo, o modelo do plano de fundo, representado por B, ´e dado por

B = 1 N N X i=1 Ii. (.)

Tipicamente a Equa¸c˜ao . ´e utilizada para inicializar o modelo do plano de fundo, por´em, durante sua atualiza¸c˜ao ´e comum a implementa¸c˜ao da Equa¸c˜ao . em sua forma

recursiva como pode ser visto na Equa¸c˜ao ..

Bn= (1 − α)Bn−1+ αIn, (.)

onde Bn representa o modelo do plano de fundo no instante n dado por n ∈ [1, N ] e

α ∈ [0, 1] ´e a constante de aprendizado. A principal vantagem deste m´etodo ´e a manu-

ten¸c˜ao adaptativa do modelo do plano de fundo conforme mudan¸cas ocorrem na cena. Por´em, alguns autores como Bouwmans (2012) e Sigari et al. (2008) esclarecem que os

pixels classificados como primeiro plano acabam sendo computados na atualiza¸c˜ao do modelo do plano de fundo. Sendo assim, ´e sugerido um m´etodo seletivo para solucionar

(a) Amostra de um v´ıdeo de entrada em escala de cinza.

(b) Modelo do plano de fundo ap´os 750 itera¸c˜oes com α = 0.01.

Figura 2.9: Exemplo de aprendizado adaptativo na cria¸c˜ao do modelo de plano de fundo.

este problema. No m´etodo seletivo, o modelo do plano de fundo sofre atualiza¸c˜ao apenas nas regi˜oes onde nenhum objeto em movimento foi detectado. Entretanto, considerando

um pixel com localiza¸c˜ao definida por (x, y) em uma imagem I, tamb´em expresso por I(x, y), durante a manuten¸c˜ao seletiva, o novo modelo do plano de fundo ´e dado por

Bn(x, y) =

 

(1 − α)Bn−1(x, y) + αIn(x, y) se o pixel (x, y) ∈ plano de fundo.

Bn−1(x, y) se o pixel (x, y) ∈ primeiro plano.

, (.)

sendo Bn(x, y) e In(x, y) o valor do pixel (x, y) nas imagens B e I no instante n dado

por n ∈ [1, N ] em que N ´e a quantidade total de quadros de um v´ıdeo V . Esta equa¸c˜ao ´

e aplicada em todos os pixels das imagens B e I.

Para verificar se um pixel pertence ou n˜ao ao plano de fundo, inicialmente pode-se utilizar a Equa¸c˜ao . nos primeiros quadros do v´ıdeo e, em seguida, determinar a imagem

de primeiro plano comparando o quadro atual com o modelo obtido do plano de fundo. Em geral, durante a compara¸c˜ao ´e utilizado um limiar, definido por T , e o resultado ´e

uma imagem bin´aria F representando o primeiro plano. Esta opera¸c˜ao ´e definida por

Fn(x, y) =

  

1 se d(In(x, y), Bn−1(x, y)) > T

0 caso contr´ario

(a) Diferen¸ca absoluta entre o quadro de entrada e o modelo do plano de fundo.

(b) M´ascara de primeiro plano ap´os aplica¸c˜ao de um limitar T = 0.1.

Figura 2.10: Determina¸c˜ao da m´ascara de primeiro plano.

onde a fun¸c˜ao d(I(x, y), B(x, y)) = |I(x, y) − B(x, y)| ´e a diferen¸ca absoluta entre dois pixels.

Se o pixel da imagem I possuir um valor n˜ao nulo na imagem de primeiro plano F , ent˜ao o pixel ´e considerado como pixel do primeiro plano, caso contr´ario, ´e um pixel do

plano de fundo. A Equa¸c˜ao . tamb´em pode ser considerada como uma fun¸c˜ao degrau, por´em Sigari et al. (2008) sugere a utiliza¸c˜ao de uma fun¸c˜ao de satura¸c˜ao linear definida

por F sn(x, y) =     

1 se d(In(x, y), Bn−1(x, y)) > T s.

I(x, y) − B(x, y) T s

caso contr´ario

, (.)

onde T s ´e o limiar.

Entretanto o resultado da Equa¸c˜ao . consiste em uma imagem com valores reais

entre [0, 1]. Para determinar a imagem bin´aria de primeiro plano, Sigari et al. (2008) su- gere a utiliza¸c˜ao de um filtro passa-baixa (LPF – low-pass filter ). Sendo assim, a imagem

de primeiro plano ´e definida como

Fn(x, y) =

  

1 se |LP F (F sn(x, y))| > T .

0 caso contr´ario

. (.)

plano devido a utiliza¸c˜ao de um filtro passa-baixa (SIGARI et al., 2008).

Os m´etodos apresentados at´e ent˜ao se baseiam apenas no n´ıvel de intensidade dos pixels de uma imagem. Alguns autores, tais como Zhang e Xu (2006), Kristensen et al.

(2006), Jain et al. (2007), Yao e Odobez (2007), Jian et al. (2008), Baf et al. (2008a), Azab et al. (2010) e Bouwmans (2012) sugerem a utiliza¸c˜ao de caracter´ısticas extra´ıdas

do espa¸co de cor, textura e bordas da imagem. A seguir s˜ao brevemente apresentados alguns dos m´etodos comumente utilizados para extrair caracter´ısticas relativas a cor e

textura.

Caracter´ısticas de Cor .

A escolha do espa¸co de cor ´e um dos principais fatores para realizar uma seg- menta¸c˜ao eficiente. Uma compara¸c˜ao entre espa¸co de cores pode ser encontrada em

Kristensen et al. (2006) e Kanprachar e Tangkawanit (2007). O espa¸co de cor RGB ´e comumente utilizado, por´em Bouwmans (2012) n˜ao recomenda a escolha deste, pois as

trˆes componentes do espa¸co de cor RGB s˜ao sens´ıveis a varia¸c˜oes de luminosidade. Zhang e Xu (2006) sugerem a utiliza¸c˜ao do espa¸co de cor Ohta que ´e uma transforma¸c˜ao linear

do espa¸co de cor RGB. A Equa¸c˜ao . apresenta a rela¸c˜ao entre o espa¸co de cor RGB e Ohta.

O1 = (R + G + B)/3

O2 = (R − B)/2

O3 = (2G − R − B)/4

(.)

Posteriormente Baf et al. (2008a) obtiveram melhores resultados utilizando o espa¸co de cor YCrCb. Os autores utilizaram o canal Cr e Cb e desprezaram o canal Y por sua

sensibilidade a altera¸c˜oes de luminosidade. A Equa¸c˜ao . apresenta a rela¸c˜ao entre o espa¸co de cor RGB e YCrCb.

Y = 0.25R + 0.504G + 0.098B + 16

Cr = 0.439R − 0.368G − 0.071B + 128

Cb = −0.148R − 0.291G + 0.439B + 128

Para realizar a segmenta¸c˜ao do primeiro plano utilizando informa¸c˜oes de cores, Zhang

e Xu (2006) sugerem uma fun¸c˜ao de medida de similaridade entre duas imagens. Dada uma imagem de entrada I e uma imagem B representando o plano de fundo, o grau de

similaridade entre os pixels ´e definido por:

Sk(x, y) =                Ik(x, y) Bk(x, y) se Ik(x, y) < Bk(x, y). 1 se Ik(x, y) = Bk(x, y). Bk(x, y) Ik(x, y) se Ik(x, y) > Bk(x, y). (.)

onde k ∈ 1, 2, 3 representa um dos canais da imagem. Nota-se que Sk(x, y) assume valores

entre 0 e 1.

Caracter´ısticas de Textura .

A segmenta¸c˜ao do primeiro plano tamb´em pode ser realizada pela textura. Zhang

e Xu (2006) e Baf et al. (2008a) sugerem a utiliza¸c˜ao do m´etodo LBP (Local Binary Pattern) originalmente proposto por Ojala et al. (1996). Segundo os autores, o m´etodo

LBP possui um baixo custo computacional e robustez quanto a varia¸c˜ao monotˆonica nos n´ıveis de cinza que ocorrem durante altera¸c˜oes de luminosidade. O m´etodo LBP ´e

definido por: LBP (x, y) = N −1 X i=1 s(gi− g)2i (.)

onde g corresponde ao n´ıvel de cinza do pixel centrado em (x, y) em uma imagem I, gi o

n´ıvel de cinza do i-´esimo pixel vizinho e 2i representa o peso do i-´esimo pixel vizinho. A fun¸c˜ao s ´e definida por:

s(gi− g) =

 

1 se gi− g ≥ 0.

0 caso contr´ario

(.)

Originalmente o m´etodo LBP considera uma vizinhan¸ca de 3 x 3. A Figura 2.11 apresenta

(a) Imagem original. (b) Imagem LBP.

Figura 2.11: Exemplo de uma imagem de entrada e a imagem LBP correspondente.

Dada duas texturas definidas por LI e LB, sendo LI a textura da imagem de entrada

I e LBa textura do plano de fundo B, Zhang e Xu (2006) sugere que o grau de similaridade

entre estas duas texturas pode ser calculado atrav´es da Equa¸c˜ao ..

Sk(x, y) =                LI k(x, y) LB k(x, y) se LI k(x, y) < LBk(x, y). 1 se LI k(x, y) = LBk(x, y). LBk(x, y) LI k(x, y) se LIk(x, y) > LBk(x, y). (.)

onde LI(x, y) e LB(x, y) s˜ao obtidas ap´os a aplica¸c˜ao do m´etodo LBP no pixel (x, y) da

imagem de entrada e do plano de fundo. Nota-se que Sk(x, y) assume valores entre 0 e

1. Sk(x, y) assume valores pr´oximos de 1 quando LI(x, y) e LB(x, y) s˜ao muito similares.

O processo de subtra¸c˜ao de fundo pode-se tornar mais robusto com a utiliza¸c˜ao de caracter´ısticas de cor e textura. Zhang e Xu (2006) sugerem a fus˜ao destas caracter´ısticas

utilizando uma abordagem fuzzy com o uso da Integral de Sugeno (SUGENO, 1974). Pos- teriormente Baf et al. (2008a) e Azab et al. (2010) obtiveram melhores resultados com o

uso da Integral de Choquet (CHOQUET, 1953).

Conforme apresentado inicialmente, uma grande quantidade de m´etodos de sub-

tra¸c˜ao de fundo foram desenvolvidos ao longo dos anos. Neste trabalho alguns m´etodos foram agrupados em categorias. Cada categoria ´e descrita abaixo.

2.2.2.1 M´etodos Estat´ısticos .

Wren et al. (1997) propuseram que a s´erie temporal de cada pixel de uma imagem pode ser modelada atrav´es de uma fun¸c˜ao de densidade de probabilidade considerando

uma distribui¸c˜ao gaussiana. Posteriormente Stauffer e Grimson (1999) esclarecem que apenas uma gaussiana ´e insuficiente para modelar a dinˆamica do plano de fundo e sugere

a utiliza¸c˜ao de uma mistura de gaussianas. Stauffer e Grimson (1999) citam que trˆes a cinco gaussianas por pixel s˜ao suficientes para modelar a maior parte das cenas comu-

mente encontradas em ambientes externos. O n´umero de gaussianas tamb´em influencia no desempenho do algoritmo, principalmente em imagens multi-canais, tais como ima-

gens coloridas no formato RGB. Cada pixel em cada componente da imagem possuir´a uma mistura de gaussianas consumindo assim uma maior quantidade de mem´oria e po-

der computacional. Em seguida Elgammal et al. (2000) prop˜oem a modelagem do plano de fundo de forma n˜ao-param´etrica. Posteriormente Zivkovic (2004) e Zivkovic e Heij-

den (2006) aperfei¸coaram o m´etodo proposto por Stauffer e Grimson (1999) adicionando suporte a detec¸c˜ao de sombras e sele¸c˜ao adaptativa do n´umero de gaussianas por pixel

aumentando assim a robustez e o desempenho do algoritmo.

2.2.2.2 M´etodos Fuzzy .

Recentemente, alguns autores tˆem introduzido conceitos fuzzy nas diferentes etapas do processo de subtra¸c˜ao de fundo. Em Zhang e Xu (2006) os autores realizam a subtra¸c˜ao

de fundo atrav´es do grau de similaridade entre caracter´ısticas de cor e textura da imagem de entrada e o modelo de plano de fundo utilizando a Integral de Sugeno (SUGENO, 1974). Posteriormente, Baf et al. (2008a) obtiveram melhores resultados utilizando a Integral de Choquet (CHOQUET, 1953). Em seguida, Azab et al. (2010) utilizaram a Integral de Choquet com caracter´ısticas de borda al´em de textura e cor. Sigari et al. (2008) propuseram uma fun¸c˜ao fuzzy para a atualiza¸c˜ao do modelo do plano de fundo e para

a extra¸c˜ao dos pixels de primeiro plano. Baf et al. (2008b) sugerem uma fun¸c˜ao fuzzy tipo-2 para lidar com as incertezas do modelo multi-gaussiano do plano de fundo. Em

aprimorar a detec¸c˜ao de objetos em movimento. Em Bouwmans (2012) o autor faz uma

revis˜ao completa sobre a abordagem fuzzy aplicada ao processo de subtra¸c˜ao de fundo.

2.2.2.3 M´etodos Neurais .

Basicamente a rede neural aprende como classificar cada pixel da imagem, deter- minando se um pixel pertence ao primeiro plano ou plano de fundo (BOUWMANS, 2011). Em Culibrk et al. (2007) os autores utilizam uma rede neural com 124 neurˆonios, o modelo do plano de fundo ´e aprendido pela rede neural enquanto um classificador baye-

siano identifica se um determinado pixel pertence ao primeiro plano ou plano de fundo. Em Maddalena e Petrosino (2008), os autores desenvolveram um algoritmo que realiza

a subtra¸c˜ao de fundo utilizando mapas auto-organiz´aveis (SOM - self-organizing map), ou mapas de Kohonen. Cada pixel da imagem possui um mapa neural bidimensional

formado por n x n vetores de peso. Posteriormente Maddalena e Petrosino (2010) aper- fei¸coaram o trabalho anterior adicionando uma fun¸c˜ao fuzzy durante o aprendizado do

modelo de plano de fundo e uma an´alise de coerˆencia espacial sobre a rede SOM de cada pixel apresentando resultados superiores ao m´etodo anterior.