Présentation de la Fondation de la faune du Québec

No reconhecimento de padrões, um dos grandes desafios é a redução de dimensões de classes multivariadas (DUDA; HART; STORK, 2001). Conhecido também como a maldição da dimensionalidade (curse of dimensionality), este termo, introduzido por Bellman em 1961, refere-se aos problemas computacionais que ocorrem em análise de dados multivariados quando a dimensão do problema cresce. Ao observar caracter´ısticas de classes que se deseja classificar,

normalmente várias caracter´ısticas acabam se sobrepondo, dificultando o processo de separação e a respectiva classificação de elementos. Para melhorar a classificação, extraem-se novas caracter´ısticas não correlacionadas para aumentar a separabilidade destas classes. Os seres- humanos conseguem classificar facilmente trajetórias e grupos de uma, duas ou três dimensões, mas esta capacidade se degrada facilmente para ordens maiores que quatro. Para tanto faz- se necessário uma ferramenta que diminua significativamente o número de dimensões de um problema para algo manipulável.

O objetivo da Análise de Discriminante Linear (Linear Discriminant Analysis - LDA) é reduzir a dimensionalidade de um conjunto de dados multivariado, preservando o máximo poss´ıvel a informação discriminatória das classes (FISHER, 1936; MARTINEZ; KAK, 2001). O LDA, a partir de um espaço de dados multidimensional contendo C classes, rotaciona esse espaço determinando uma projeção com C − 1 dimensões. A projeção determinada será a que apresenta a melhor separabilidade entre as classes.

Um exemplo da análise de discriminante linear pode ser visto na figura 17, onde na figura 17(a) são apresentadas as classes de variáveis X1 e X2 com duas caracter´ısticas

mensuráveis pelos eixos D1 e D2. Como apresentado na figura 17(a), as projeções das classes

de variáveis nos eixos D1 e D2 se sobrepõem em ambos os eixos, não permitindo a separação

das duas classes através de um limiar de detecção. O LDA, com base na quantidade de classes (C = 2) e nas caracter´ısticas de cada classe, determinará uma nova projeção contendo C − 1 dimensões. O resultado do LDA para o exemplo apresentado será unidimensional, representado por um único eixo. O novo eixo determinado pelo LDA, DLDA, pode ser visto na figura 17(b)

como a reta inclinada para a esquerda ao lado do eixo D2. Verifica-se pela figura 17(b) que as

projeções das duas classes de variáveis sobre o eixo DLDAnão estão sobrepostas, permitindo a

separação total das classes através de um limiar de detecção.

Para o c´alculo do LDA, supondo dois conjuntos de dados X1 e X2representando duas

classes distintas de um universo de classes Xc onde c = 1, 2, ...,C. (Neste caso, C = 2). Cada

conjunto de dados possui n amostras, e cada amostra possui d−dimensões. O produto escalar de cada conjunto d−dimensional pela matriz de pesos w, como representado pela equação 27, gera um conjunto de dados Y transformado para um espaço amostral contendo C − 1 dimensões.

Y = wtX (27)

Para encontrar a matriz de pesos w, o primeiro passo é determinar a diferença das médias das classes do conjunto Xc, como apresentada pela equação 28.

(a) (b)

Figura 17: (a) Projeção das classes X1 e X2 sobre os eixos de variáveis D1 e D2. Observa-se

que as projeções estão sobrepostas não permitindo a separabilidade total das classes. (b) A análise de discriminante linear determina uma nova projeção DLDAonde as classes apresentam

a melhor separabilidade entre si.

mi=

1 n_i_x∈X

∑

x (28)

As médias das classes definidas pela equação 28 pode ser projetada também pela matriz w, como mostra a equação 29.

˜ mi= 1 n_i_y∈Y

∑

i y= 1 n_i_y∈Y

∑

i wtx= wtmi (29)

Onde ˜mi é a média do subconjunto projetado através da matriz w. Como o que se

deseja é a maior separabilidade entre as classes, leia-se a maior separabilidade entre as médias das classes, logo a equação 30 é a função objetivo.

J= | ˜m₁− ˜m₂| =wt(m1− m2)

(30)

Apesar de ser a função objetivo, a equação 30 não leva em consideração o desvio padrão de cada classe. Para isso adota-se a proposta de Fisher (DUDA; HART; STORK, 2001), que é normalizar a diferença das médias por uma medida de dispersão interna da classe (scatter). A dispersão interna de classe é apresentada pela equação 31.

s_i2=

_∑

y∈Yi

Assim, a dispersão total J(w) entre classes das amostras projetadas é igual a ˜s₁2+ ˜s₂2 e a maximização do critério de Fisher é apresentada pela equação 32.

J(w) =| ˜m1− ˜m2|

s₁2+ ˜s₂2 (32)

A maximização de J(.) por w conduz à maior separação entre as classes em questão. Esse cálculo é feito através das matrizes de dispersão Sie Sw, apresentadas pelas equações 33 e

34.

S_i=

_∑

x∈Di

(x − m_i) (x − m_i)t (33)

Sw= S1+ S2 (34)

Essas matrizes são projetadas pela multiplicação da matriz de pesos w como apresentado pela equação 35 e da mesma maneira as médias projetadas pela equação 36.

s12+ ˜s22= wtSww (35)

( ˜m1− ˜m2)2= wtSBw (36)

Substituindo as equações 35 e 36 na equação 32 obtém-se a equação 37.

J(w) = w t_S Bw wt_S ww (37) A equação 37 pode ser reescrita na forma apresentada pela equação 38.

S_Bw= λ Sww (38)

Onde a constante λ pode ser determinada através de autovalores e autovetores. A partir dos autovalores, seleciona-se o valor cujo argumento é máximo. O valor selecionado corresponde à coluna dos autovetores que serão multiplicados pelas caracter´ısticas das classes de entrada. Essa multiplicação corresponde à rotação da matriz de entrada para uma projeção onde é mantida a separação máxima entre as classes.

E importante salientar que a análise de discriminante linear e obtenção da matriz de pesos que permite rotacionar a matriz de caracter´ısticas reduzindo suas dimensões para uma projeção contendo C − 1 dimensões (onde C é o número de classes) ocorre em um único

passo, uma única vez. Como o LDA rotaciona o espaço multidimensional da matriz de caracter´ısticas para uma nova projeção com C − 1 dimensões, não há perda de informação. Todas as caracter´ısticas utilizadas para a geração da matriz de caracter´ısticas são reagrupadas de modo a maximizar a separação entre as C classes.

2.9 COMENT ´ARIOS

Foram apresentadas nesse cap´ıtulo os conhecimentos necess´arios para o entendimento do trabalho.

O próximo cap´ıtulo apresenta o estado da arte para a pesquisa sobre a transformada wavelet e a detecção de esp´ıculas.

3 ESTADO DA ARTE

Para este estudo, foi realizada uma análise de publicações dos últimos 20 anos buscando verificar o desenvolvimento no reconhecimento, detecção e classificação de esp´ıculas. O estudo foi feito em ordem cronológica a partir de 1994. Foi dada ênfase para trabalhos que utilizam a transformada wavelet seja para a extração de caracter´ısticas do sinal ou para o uso direto na classificação dos eventos.

Dans le document Rapport annuel (Page 7-10)