Introduction - The DART-Europe E-theses Portal

A.1 Introdu¸c˜ao

Algoritmos genéticos são ferramentas computacionais de busca e otimiza¸cão, inspirados nas teorias evolucionistas de Darwin [Dar95]. Baseando-se nessas teorias, onde somente os indiv´ıduos mais adaptáveis de uma espécie sobrevivem, os algoritmos genéticos tra- balham com um conjunto inicial de poss´ıveis solu¸cões para o problema (denominado de popula¸cão), de tal modo, que através de opera¸cões genéticas de muta¸cão e de cruzamento, possa desenvolver gera¸cões novas e, através da sele¸cão das melhores solu¸cões, convergir para a solu¸cão ótima. Para essa avalia¸cão dos melhores indiv´ıduos da popula¸cão, é necessário definir uma fun¸cão de aptidão que, para cada indiv´ıduo, informe o quão eficiente ele é para a solu¸cão que o algoritmo procura [ES03]. Cada indiv´ıduo de uma popula¸cão é representado por um cromossomo.

Diferentemente de um cromossomo biológico, nos algoritmos genéticos um cromossomo é um vetor de valores, que pode ser real, inteiro, binário, entre outros, que são representa¸cões das variáveis de interesse de um determinado problema. A forma mais comum de cromossomo encontrada na literatura (e a mais simples também) é a binária.

Inicialmente, após a defini¸cão do problema, é necessária a cria¸cão da representa¸cão de suas variáveis num cromossomo. Supondo que o problema fict´ıcio em questão possua duas variáveis de interesse, a Figura A.1 mostra uma poss´ıvel configura¸cão binária para essas duas variáveis e o cromossomo criado pela concatena¸cão dessas variáveis.

Figura A.1 Exemplo de configura¸c˜ao de um cromossomo de acordo com as vari´aveis.

O funcionamento é relativamente simples. Inicialmente é montada a popula¸cão inicial de cromossomos (conhecida como popula¸cão zero). Esses cromossomos são escolhidos aleatoriamente dentro do universo de solu¸cões do problema. Em seguida, essa popula¸cão ´

e avaliada pela fun¸cão de aptidão. Depois disso, os melhores cromossomos são selecionados para a fase de reprodu¸cão, onde os mais bem avaliados pela fun¸cão de aptidão têm mais chances de serem selecionados. Então, através dos operadores genéticos, são cri- ados cromossomos filhos com possibilidade de serem mais eficientes que os pais. Essas opera¸cões genéticas também servem para manter a popula¸cão diversificada. Uma grande

diversifica¸cão possibilita o alcan¸ce de um maior número de solu¸cões e a fuga de um m´ı- nimo local. Após todo esse processo, uma nova gera¸cão é obtida, comumente chamada de offspring [Mit97], dando in´ıcio ao mesmo processo novamente, at´e que algum critério de parada seja atendido.

Critérios normalmente usados são: número máximo de gera¸cões e número máximo de gera¸cões sem melhora da eficiência do cromossomo mais eficiente (ou da média de eficiência da popula¸cão). Uma vez terminada a execu¸cão, o algoritmo terá encontrado uma boa solu¸cão para o problema, não significando que será a melhor solu¸cão poss´ıvel.

A.2 Opera¸c˜oes Gen´eticas

As opera¸cões genéticas nos cromossomos são realizadas para a obten¸cão de filhos, com a inten¸cão de diversificar a popula¸cão de solu¸cões, mantendo as melhores solu¸cões encon- tradas até o momento e descartando as piores.

Os dois operadores genéticos mais comuns são a muta¸cão e o cruzamento [Mit97]. Na muta¸c˜ao, o cromossomo selecionado tem um de seus bits invertido com uma probabili- dade bem pequena. A Figura A.2 (a) ilustra esse conceito. No cruzamento, um par de cromossomos é selecionado e, então, dois filhos são produzidos com peda¸cos aleatoriamente escolhidos dos dois pais. Essa opera¸cão pode ser de ponto único, dois pontos ou uniforme. No cruzamento de ponto único, um único ponto de corte é selecionado aleatoriamente para fazer a divis˜ao dos cromossomos pais em duas cadeias de bits (Figura A.2 (b)). No cruzamento de dois pontos, dois pontos são selecionados, gerando trˆes cadeias de bits (Figura A.2 (c)). No uniforme, vários bits aleat´orios são escolhidos para o cruzamento, gerando uniformidade na escolha (Figura A.2 (d)).

(a) (b)

(c) (d)

Figura A.2 Operadores gen´eticos de: (a) muta¸c˜ao, (b) cruzamento de ponto ´unico, (c) cruza- mento de dois pontos e (d) cruzamento uniforme.

Todas essas opera¸cões possuem uma probabilidade de ocorrência em cada popula¸cão, que deve variar de problema para problema. Normalmente, a probabilidade de muta¸cão ´

e bem pequena em rela¸c˜ao `a probabilidade de cruzamento [ES03].

A.3 Fun¸cão de Aptidão e Sele¸cão de Cromossomos

A fun¸cão de aptidão define uma maneira de se classificar os cromossomos de acordo com sua eficiência para solucionar o problema. Uma das grandes vantagens de utiliza¸cão de algoritmos genéticos é sua fácil hibridiza¸cão com outras técnicas. A fun¸cão de aptidão ´

e que permite essa facilidade [ES03]. Por exemplo, pode-se utilizar uma rede neural artificial como fun¸cão de aptidão e usar o algoritmo genético para selecionar os melhores parâmetros para a rede. Se a tarefa do algoritmo genético é classifica¸cão, é comum que a fun¸cão de aptidão possa medir a precisão com a qual o cromossomo classifica os padrões. A fun¸cão de aptidão é bem particular ao problema que se deseja resolver.

A classifica¸cão da popula¸cão tem como objetivo possibilitar a sele¸cão dos melhores cromossomos para a produ¸cão de uma nova gera¸cão [Mit97]. Essa sele¸cão pode ser feita de várias maneiras, por exemplo, através da técnica da roleta ou do torneio. A técnica da roleta consiste em uma sele¸cão aleatória dos cromossomos. Porém com maior peso para os que tiverem maior resposta da fun¸cão de aptidão. Dessa forma, os cromossomos com maior peso tendem a serem selecionados mais de uma vez. A Figura A.3 (a) ilustra essa técnica de sele¸cão. Já a sele¸cão por torneio, escolhe aleatoriamente um par de cromossomos, nos quais o que apresentar maior resposta da fun¸cão de aptidão será selecionado, enquanto o outro será descartado. A desvantagem mais clara dessa técnica é que nunca o cromossomo com menor resposta da fun¸cão de aptidão será selecionado (e ele podem apresentar alguma caracter´ıstica que possa ser passada para os filhos e que irá ajudar na solu¸c˜ao do problema). A Figura A.3 (b) ilustra esse m´etodo.

(a) (b)

[AN07] A. Asuncion and D. J. Newman. UCI machine learning repository, 2007.

[AS10] S. Ali and M. Shah. Human action recognition in videos using kinematic features and multiple instance learning. Pattern Analysis and Machine Intel-

ligence, IEEE Transactions on, 32(2):288–303, feb. 2010.

[Bap00] R. B. Bapat. Linear Algebra and Linear Models (Universitext). Springer, 2nd edition, March 2000.

[Bel61] R. E. Bellman. Adaptive control processes - A guided tour. Princeton University Press, Princeton, New Jersey, U.S.A., 1961.

[Bis06] C. M. Bishop. Pattern Recognition and Machine Learning (Information Science

and Statistics). Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2006.

[C+07] K. J. Cios et al. Data Mining: A Knowledge Discovery Approach. Springer- Verlag New York, Inc., Secaucus, NJ, USA, 2007.

[Chu97] F. R. K. Chung. Spectral Graph Theory. Number 92 in Regional conference series in mathematics. American Mathematical Society, 1997.

[Dar95] C. Darwin. The Origin of Species. Gramercy, May 1995.

[dBL+07] B. de Brito Leite et al. A learning-based eye detector coupled with eye can- didate ﬁltering and pca features. In Computer Graphics and Image Process-

ing, 2007. SIBGRAPI 2007. XX Brazilian Symposium on, pages 187–194, 7-10

2007.

[DHS01] R. O. Duda, P. E. Hart, and D. G. Stork. Pattern Classiﬁcation (2nd Edition). Wiley-Interscience, 2 edition, 2001.

[DN09] K. Das and Z. Nenadic. An eﬃcient discriminant-based solution for small sample size problem. Pattern Recogn., 42(5):857–866, 2009.

[DZF07] Qian Du, Wei Zhu, and J. E. Fowler. Implementation of low-complexity principal component analysis for remotely sensed hyperspectral-image compression. pages 307–312, oct. 2007.

[ES03] A. E. Eiben and J. E. Smith. Introduction to Evolutionary Computing.

SpringerVerlag, 2003.

[Fis36] R. A. Fisher. The use of multiple measurements in taxonomic problems. Annals

Eugen., 7:179–188, 1936.

[Fod02] I. Fodor. A survey of dimension reduction techniques, 2002.

[FT74] J. H. Friedman and J. W. Tukey. A projection pursuit algorithm for exploratory data analysis. IEEE Trans. Comput., 23(9):881–890, 1974.

[Fuk90] K. Fukunaga. Introduction to Statistical Pattern Recognition. Academic Press, 2 edition, 1990.

[Har85] P. M. Hartigan. Algorithm as 217: Computation of the dip statistic to test for unimodality. Journal of the Royal Statistical Society. Series C (Applied

Statistics), 34(3):320–325, 1985.

[HH85] J. A. Hartigan and P. M. Hartigan. The dip test of unimodality. Annals of

Statistics, 13(1):70–84, 1985.

[HN03] Xiaofei He and Partha Niyogi. Locality preserving projections. In In Advances

in Neural Information Processing Systems 16, pages 585–591. MIT Press, 2003.

[ida09] Benchmark repository of the intelligent data analysis group. http://ida.ﬁrst.fhg.de/projects/bench/benchmarks.htm, June 2009.

[IKG09] M. T. Ibrahim, M. Kyan, and Ling Guan. On-line signature veriﬁcation using global features. In Electrical and Computer Engineering, 2009. CCECE ’09.

Canadian Conference on, pages 682–685, 2009.

[JDM00] A. K. Jain, R. P. W. Duin, and Jianchang Mao. Statistical pattern recognition: A review. IEEE Transactions on Pattern Analysis and Machine Intelligence, 22:4–37, 2000.

[JS87] M. C. Jones and R. Sibson. What is projection pursuit? Journal of the Royal

Statistical Society. Series A (General), 150(1):1–37, 1987.

[KO09] Nojun Kwak and Jiyong Oh. Feature extraction for one-class classiﬁcation problems: Enhancements to biased discriminant analysis. Pattern Recogn., 42(1):17–26, 2009.

[LPC08] Jun-Bao Li, Jeng-Shyang Pan, and Shu-Chuan Chu. Kernel class-wise locality preserving projection. Information Sciences, 178(7):1825–1835, 2008.

[MBN02] L. C. Molina, L. Belanche, and A. Nebot. Feature selection algorithms: a survey and experimental evaluation. pages 306–313, 2002.

[MBV99] M. J. Martin-Bautista and M. A. Vila. A survey of genetic feature selection in mining issues. volume 2, page 1321 Vol. 2, 1999.

[Mec10] Ferenc Mechler. Hartigan’s dip statistic. http://www.nicprice.net/diptest/, July 2010.

[Mel07] C. A. B. Mello. An algorithm for foreground-background separation in low qual- ity patrimonial document images. In CIARP’07: Proceedings of the Congress

on pattern recognition 12th Iberoamerican conference on Progress in pattern recognition, image analysis and applications, pages 911–920, Berlin, Heidel-

berg, 2007. Springer-Verlag.

[Mey00] Carl D. Meyer, editor. Matrix analysis and applied linear algebra. Society for Industrial and Applied Mathematics, Philadelphia, PA, USA, 2000.

[Mit97] T. M. Mitchell. Machine Learning. McGraw-Hill, New York, 1997.

[MZ05] A. M. Mart´ınez and M. Zhu. Where are linear feature extraction methods applicable? IEEE Transaction on Pattern Analysis and Machine Intelligence, 27(12):1934–1944, 2005.

[NFN06] E. Naz, U. Farooq, and T. Naz. Analysis of principal component analysis- based and ﬁsher discriminant analysis-based face recognition algorithms. In

Emerging Technologies, 2006. ICET ’06. International Conference on, pages

121–127, 13-14 2006.

[NS92] G. P. Nason and R. Sibson. Measuring multimodality. Statistics and Comput-

ing, 2(3):153–160, September 1992.

[NYS03] Y. Nara, Jianming Yang, and Y. Suematsu. Face recognition using improved principal component analysis. pages 77–82, oct. 2003.

[O+06] A. L. I. Oliveira et al. Optical digit recognition for images of handwritten historical documents. In Neural Networks, 2006. SBRN ’06. Ninth Brazilian

Symposium on, pages 166–171, 23-27 2006.

[P+10] J. F. Pereira et al. Modular image principal component analysis for handwritten digits recognition (accepted). Rio de Janeiro, Brazil, 2010. IEEE Interna- tional Conference on Systems, Signals and Image Processing (IWSSIP).

[PCR09] J. F. Pereira, G. D. C. Cavalcanti, and Tsang Ing Ren. Modular image principal component analysis for face recognition. pages 2481–2486, june 2009.

[Q+09] Lin Qi et al. Recognizing human emotional state based on the 2d-frft and ﬂda. In Image and Signal Processing, 2009. CISP ’09. 2nd International Congress

on, pages 1–4, oct. 2009.

[RN03] S. J. Russell and P. Norvig. Artiﬁcial Intelligence: A Modern Approach. Pear- son Education, 2003.

[Saw96] G. Sawitzki. The excess mass approach and the analysis of multi-modality. In

Proc. 18th Annual Conference of the GfKl, pages 203–211. Springer, 1996.

[Sil81] B. W. Silverman. Using kernel density estimates to investigate multimodality.

Journal of the Royal Statistical Society, 43(1):97–99, 1981. Series B (Method-

ological).

[SR07] Masashi Sugiyama and S. Roweis. Dimensionality reduction of multimodal labeled data by local ﬁsher discriminant analysis. Journal of Machine Learning

Research, 8:1027–1061, 2007.

[TC07] F. S. Tsai and Kap Luk Chan. Dimensionality reduction techniques for data exploration. pages 1–5, dec. 2007.

[vdH+04] F. van der Heijden et al. Classiﬁcation, Parameter Estimation and State Es-

timation: An Engineering Approach Using MATLAB. John Wiley ∼ Sons,

2004.

[YD09] Wen-Hui Yang and Dao-Qing Dai. Two-dimensional maximum margin fea- ture extraction for face recognition. Systems, Man, and Cybernetics, Part B:

Cybernetics, IEEE Transactions on, 39(4):1002–1012, aug. 2009.

[ZYK06] Haitao Zhao, Pong Chi Yuen, and J. T. Kwok. A novel incremental principal component analysis and its application for face recognition. Systems, Man,

and Cybernetics, Part B: Cybernetics, IEEE Transactions on, 36(4):873–886,

Dans le document The DART-Europe E-theses Portal (Page 171-176)