Na segmentação orientada a objetos é comum o uso de modelos de características que definam as propriedades dos objetos desejados. Pode-se visar separar os objetos um dos outros, ou separar apenas um objeto desejado do fundo da imagem.
Arbeláez et al. (2009) propuseram um algoritmo para converter qualquer resultado de detecção orientada a fronteiras em uma árvore de regiões hierárquicas. Em primeiro lugar, uma transformada de imagem chamada Transformada de Watershed Orientada (OWT -
Oriented Watershed Transform) é aplicada às fronteiras orientadas produzindo uma saída de segmentação orientada a regiões. Em seguida, as regiões da OTW são fundidas por um processo de agrupamento chamado M apa de Contornos Ultramétricos (UCM - Ultrametric
Contour Map) (AHARON et al., 2006) em uma segmentação hierárquica. Finalmente, as regiões codificadas pelo processo UCM possuem valores reais e podem ser limiarizadas em contornos dos objetos, cujos valores indicam a certeza de ser uma verdadeira borda de contorno. Contornos fechados são garantidos para qualquer valor de corte. A técnica de
segmentação hierárquica gPb-owt-ucm (ARBELÁELZ et al., 2009) é sugerida pela aplicação da OWT e do UCM à saída do detector de fronteiras gPb (M AIRE et al., 2008).
É comum nas técnicas orientadas a objetos utilizarem-se ferramentas baseadas em grafos, pois se pode definir uma função que representa as características do objeto modelado e do fundo, então se encontra o caminho no grafo que permite o corte ótimo, separando ambos.
O Normalized Cuts, proposto por Shi e M alik (2000), é uma técnica automática que tenta localizar e separar todos os objetos presentes em uma imagem natural usando um modelo de objeto baseado em cor e textura. O algoritmo trata a segmentação de imagens como um problema de particionamento de grafos e usa um critério global para segmentar o grafo, que mede tanto a dissimilaridade total entre os diferentes grupos, quanto a similaridade total dentro dos grupos. Neste contexto, dada uma matriz de afinidade cujas entradas codificam a semelhança entre pixels, define-se a matriz diagonal como a soma da relação entre as semelhanças de cada pixel para os demais da vizinhança e se calcula os autovetores generalizados desse sistema linear. Após esta etapa, o autovetor com o segundo menor autovalor é usado para bipartir o grafo. Então, a partição atual é analisada e caso deva ser subdividida, ela é recursivamente reparticionada. Como ponto negativo, essa abordagem muitas vezes quebra regiões uniformes onde os autovetores têm gradientes suaves.
O Multiscale Normalized Cuts, proposto por Cour et al. (2005), é uma variante do
Normalized Cuts que busca melhorar a qualidade da segmentação obtida. O fato da matriz de afinidade usada no Normalized Cuts ser esparsa, a fim de evitar um custo computacional proibitivo, limita uma implementação utilizando apenas afinidades locais dos pixels. Cour et
al. resolvem essa limitação calculando matrizes de afinidade esparsas em múltiplas escalas, definindo restrições entre as escalas, e derivando um novo conjunto de autovetores para esse sistema de multiescala restrito. Cour et al. demonstram que grandes grafos de imagem podem ser compactados usando múltiplas escalas e, assim, podem capturar estruturas na imagem em vizinhanças cada vez maiores. O algoritmo de segmentação processa simultaneamente as múltiplas escalas do grafo, impondo uma restrição entre as escalas para assegurar a comunicação e forçar a coerência entre as segmentações do Normalized Cuts aplicada a cada escala. Essa técnica também gera um resultado de segmentação automático.
Apesar das técnicas anteriores serem automáticas, geralmente, a segmentação orientada a objetos é usada em aplicações interativas, pois o usuário define qual o objeto que
deve ser segmentado. Contudo, técnicas automáticas podem ser usadas para escolher pontos da imagem (sementes) que pertencem aos objetos e então alimentá-los às técnicas interativas como se fossem os usuários. Nessa categoria dois algoritmos se destacam o Graph Cuts (BOYKOV; JOLLY, 2001), (BO YKOV; KOLM OGOROV, 2004), e o Tree Prunning (BERGO et al., 2007), (M IRANDA et al., 2006).
O Graph Cuts (BOYKOV; JOLLY, 2001), (BOYKOV; KOLMOGOROV, 2004), é um algoritmo de segmentação interativo que alcança bons resultados para segmentação de objetos, mesmo quando as distribuições de cores do objeto e do fundo são próximas. Não há restrição quanto à topologia das regiões, ou seja, as regiões de objeto e do fundo podem ser desconexas. Inicialmente, o usuário marca pontos na imagem que pertencem ao objeto e pontos que pertencem ao fundo, esses pontos (sementes) determinam as chamadas restrições “rígidas”, que não podem ser desobedecidas. Então, define-se uma função de custo que analisa simultaneamente as chamadas restrições “suaves” e que associa um custo à conexão de cada pixel da imagem às regiões do objeto ou do fundo, criando um grafo não direcionado. As restrições suaves incluem informações locais de borda e as informações regionais de similaridade que são usadas na função de custo para decidir se os pixels devem ou não ser anexados ao objeto ou ao fundo. O objetivo é determinar uma segmentação global ótima que obtenha a melhor relação entre bordas e propriedades regionais dentre todas as segmentações possíveis e que satisfaçam às restrições rígidas. Ou seja, deseja-se achar o caminho no grafo que separa os pixels em objeto e fundo, e que tenha o menor custo de corte associado, minimizando a função de custo. A segmentação global ótima pode ser refeita se novas sementes forem adicionadas ou removidas. Assim, o Graph Cuts provê uma solução global ótima para segmentação de imagens n-dimensionais se a função de custo for bem definida, pois imperfeições nas segmentações são diretamente relacionadas à função de custo.
Outro algoritmo interativo que pode ser usado por técnicas automáticas é o Tree
Prunning (BERGO et al., 2007), (M IRANDA et al., 2006). O algoritmo usa a Transformada Imagem-Floresta (IFT - Image Foresting Transform) (FALCÃO et al., 2004), que a partir das sementes escolhidas pelo usuário para marcar o objeto, gera um grafo contendo toda a imagem em formato de uma floresta, tendo os pontos escolhidos como raízes. A segmentação então passa a ser vista como um problema de identificação do caminho ótimo para poda das árvores da floresta. Na floresta, o objeto e fundo podem estar conectados por caminhos que atravessam as fronteiras do objeto, chamados de pixels de vazamento (leaking pixels), que são pontos de falha no contorno do objeto. Esses pixels apresentam ligações “fracas” com o
objeto, então são automaticamente identificados e suas subárvores são eliminadas, de modo que a floresta remanescente define o objeto. Um ponto interessante é que apenas algumas sementes dentro do objeto precisam ser marcadas, não é preciso marcar o fundo, o que facilita o uso da técnica por outras técnicas automáticas.
Widynski e M ignotte (2014) propõem um algoritmo de detecção de contornos que rastreia simultaneamente em duas escalas pequenos pedaços de bordas, chamados edgelets. A estrutura edgelet em multiescala incorpora as informações locais, usadas em um modelo Bayesiano recursivo que define um sistema de partículas. O modelo baseia-se em distribuições iniciais e de transição, as quais são aprendidas off-line usando um banco de dados de formas. O modelo também baseia-se em funções de verossimilhança que são aprendidas online e, portanto, são adaptáveis a cada imagem, integrando as informações de cor, gradiente, texturas e orientação. Em seguida, o modelo é estimado utilizando uma abordagem de M onte Carlo sequencial e o mapa final de detecção de contornos é obtido a partir da distribuição aproximada de trajetória das partículas edgelets.