Uma imagem de tamanho MxM, com resolução NxN pixels em uma face, possui um número 𝑁2 de possíveis atributos, que podem ser consideradas por um algoritmo de classifica- ção no momento de reconhecer uma face. Por exemplo, uma imagem com resolução de 128𝑥128 pixels teríamos um total de 16.384 atributos a serem utilizados, um valor que invia- biliza o uso de qualquer algoritmo de classificação para reconhecer uma face com base nestes atributos. Essa grande quantidade de características advém do fato que cada pixel pode repre- sentar uma informação de cor e luminosidade única na imagem. Cada pixel pode então ser con- siderado como um atributo especifico para definição da imagem e para reconhecer as diferenças entre elas. Assim, a explosão de características gera a alta dimensionalidade, pelo grande nú- mero de dimensionalidade, que torna-se um problema recorrente no uso e processamento de imagens (BELHUMEUR et al., 1997).
Diante da complexidade dos atributos e alta dimensionalidade a tarefa de extração de características possui um papel vital no processo de reconhecimento facial. Seu principal obje- tivo é de analisar as imagens faciais e encontrar os conjuntos de características que melhor definam e diferenciem as faces da base de imagens, reduzindo a dimensionalidade original des- sas para um novo espaço onde os atributos restantes e suas combinações sejam o suficientes para que algoritmos de classificação possam identificar estas faces, tornando a imagem padro- nizada.
Os algoritmos de extração de características operam com duas vertentes principais (GONZALES; WOODS, 2006). A primeira de ranquear as melhores características individuais que podem ser utilizadas no novo espaço de dimensionalidade reduzida (FAGERTUN, 2005). Na segunda, verificam combinações de características e a relevância dessas na separação de classes das faces da base, os atributos combinados têm prioridade de uso sobre aqueles que possuem apenas relevância com uso individual. Os atributos melhores ranqueados com as de- vidas prioridades formam o conjunto de características que serão utilizados no processo de re- conhecimento facial. Um exemplo de redução de dimensionalidade é apresentado na Figura 19, a esquerda uma distribuição de atributos que descrevem a imagem em um alto espaço dimensi- onal. As retas 1PC e 2PC mostram a combinação dos valores de dois atributos que melhor descrevem as imagens analisadas, esses são extraídos do conjunto original e formam um novo espaço de características do lado esquerdo da Figura 19, do plano N-dimensional para o plano 2D. Esse, configura uma dimensionalidade reduzida com atributos que representam a imagem e serão utilizados para o reconhecimento facial.
Uma das metodologias mais utilizadas na extração de características pelos algoritmos que executam essa tarefa é a exploração de covariância dos pixels da imagem, onde são gerados auto vetores, pois é a partir desses valores que melhor se definem as características relevantes da face. Os auto vetores descrevem a variância dos atributos considerados mais relevantes, sendo possível reduzir a operação de comparação de faces a avaliação dos auto vetores gerados (SILVA, 2015). Essa transformação é executada de forma linear, a qualidade de um auto vetor é dada pelos seus autovalores associados. Dentre os principais algoritmos que utilizam extração de características por meio de covariância de pixels temos: Eingenfaces; Fisherfaces e Local Binary Patterns. A Figura 20, ilustra a estratégia de covariância de pixels, os auto vetores sele- cionados representam os atributos mais relevantes para reconhecimento da face de entrada. Em
seguida, os auto vetores são combinados para aumentar a possibilidade de diferenciação das faces que serão comparadas, consequentemente aumentando também a taxa de acerto.
Figura 19 - Distribuição de cores por pixels de uma imagem e a representação de sua dimensionalidade de atributos.
Fonte: SaiGayatri Vadali (2018).
Os principais algoritmos de extração de características podem ser divididos em dois grupos. O primeiro grupo é dividido nos algoritmos que fazem análise da imagem e preservam sua estrutura global, ou seja, a distância entre os atributos em relação aos seus valores internos é mantida no novo espaço de dimensão reduzida. O segundo grupo é composto pelos algoritmos que preservam apenas a estrutura local da imagem. Nesses, após definir os atributos mais rele- vantes da face, apenas os valores de características com distâncias próximas são mantidos. Atri- butos separados por regiões diferentes não mantém os valores de correlação entre eles, que significa que estruturas globais deixam de existir e são mantidas apenas aquelas locais e próxi- mas.
Com a separação dos algoritmos em dois grupos mencionados anteriormente, ainda é possível dividi-los entre aqueles que utilizam funções lineares ou não lineares para extração de características e redução de dimensionalidade. Funções lineares efetuam transformações nos vetores de atributos através de operações simples, que deformam esses no espaço em relação a altura e rotação na busca por uma dimensionalidade maior. Já as funções não lineares efetuam operações complexas que deformam os dados e separam os mesmos para definir os atributos
mais relevantes. O Quadro 2, mostra os grupos e subgrupos de alguns dos mais utilizados algo- ritmos de extração de características. Dentre esses, o Fisher Linear Discriminant Analysis (FLDA), Principal Component Analysis (PCA) e Locality Preserving Projections (LPP) serão apresentados e seus detalhes de funcionamento serão discutidos na Seção 4.4.
Figura 20 - Geração do espaço de características.
Fonte: Adaptado de Teófilo Emídio de Campos (2000).
Quadro 2 - Algoritmos de extração de características
Preservação Técnica Algoritmo
Estrutura Global Linear Fisher Linear Discriminant Analysis Principal Component Analysis Não Linear Kernel Fisher Linear Discriminant Analysis
Estrutura Local Linear Locality Preserving Projections
Não Linear Isomap
Laplacian Eigenmap
Fonte: Rozario et al. (2014).