A escolha da melhor estrutura de um comitê para resolver um problema de classifi- cação específico é um desafio que já foi abordado por vários autores (Albukhanajer et al.,
2017; Feitosa and Canuto, 2018; Feurer et al., 2015; Kordík et al.,2018; Kotthoff et al.,
2017;Wistuba et al., 2017; Zhang et al.,2018). Este problema tem sido tratado como um problema de meta-aprendizagem (Kordík et al., 2018; Nascimento et al., 2014), seleção automática de aprendizado de máquina (auto-ML) (Feurer et al., 2015; Kotthoff et al.,
2017; Wistuba et al., 2017) ou um problema de otimização (Albukhanajer et al., 2017;
Feitosa and Canuto, 2018; Zhang et al., 2018). Nas proximas sub-seções, serão descritos os trabalhos de duas destas vertentes.
3.2.1
Meta-aprendizado
Um número considerável de pesquisas de meta-aprendizado foi dedicado à área de recomendação de algoritmos (Jankowski et al., 2013). Nesse caso especial de meta- aprendizado, o aspecto de interesse é a relação entre as características dos dados e o
Capítulo 3. Trabalhos relacionados 21
desempenho do algoritmos, com o objetivo final de prever um algoritmo ou um conjunto de algoritmos que sejam mais adequados para a solução de um problema específico. Portanto, a técnica de meta-aprendizado pode ser útil para fornecer uma recomendação ao usuário final ou selecionar e/ou ponderar automaticamente os algoritmos mais promissores para a solução para este problema. No trabalho deRice (1976), o autor apresentou pela primeira vez um modelo abstrato de meta-aprendizado. Os autores Rendell and Cho
(1990) desenvolveram regras com base em metarecursos simples, determinando apenas se um determinado algoritmo deve ser usado para uma instância de problema ou não. Essa abordagem foi posteriormente estendida usando mais recursos e um classificador tipo árvore de decisão baseado no projeto StatLog (King et al., 1995).
Os autoresBrazdil et al.(2003) apresentaram uma nova estratégia para recomendar algoritmos usando o algoritmo k-NN para identificar os conjuntos de dados históricos mais semelhantes. (Kalousis et al.,2004) tentaram encontrar funções que mapeiam conjuntos de dados para o desempenho dos algoritmos. Bernando-Mansilla e Ho (Bernadó-Mansilla and Ho, 2005) utilizaram as medidas de complexidade do problema para caracterizar os conjuntos de dados e analisaram a relação entre essas medidas e o desempenho dos algoritmos de classificação. Ali e Smith (Ali and Smith, 2006) também propuseram uma abordagem de seleção de classificadores baseada em regras, que foi baseada nos estudos de Smith et al. (Smith et al., 2001) (Smith et al.,2002), Vanschoren (Vanschoren,2010), Gomes et al. (Gomes et al.,2012) e Miranda et al. (Miranda et al.,2012) apontaram que não apenas os algoritmos em si, mas diferentes configurações de parâmetros que naturalmente permitem que o desempenho do mesmo algoritmo varie em diferentes conjuntos de dados.
Como trabalhos mais recentes, podemos citar o trabalho dos autores:Parmezan et al.
(2012), que realizaram um estudo para a construção do modelo de recomendação simbólica do melhor algoritmo de seleção de recursos;Wang et al. (2013), que propôs um método
lazy para a recomendação de algoritmos de seleção de recursos; Shilbayeh and Vadera
(2014), que desenvolveu uma estrutura de meta-aprendizado capaz de aprender sobre quais algoritmos de seleção de recursos funcionam melhor para um determinado conjunto de dados;Reif et al. (2014), que usou cinco categorias diferentes de metacaracterísticas de ponta para caracterizar conjuntos de dados e construiu um modelo de regressão diferente para conectar conjuntos de dados a cada algoritmo candidato; Filchenkov and Pendryak
(2015), que introduziu uma nova abordagem para a engenharia de metacaracterísticas, e finalmente, Zabashta et al. (2016) que desenvolveu um método que, para cada lista de classificadores, indicava qual algoritmo de agregação seria o mais indicado para determinado conjunto de dados.
Capítulo 3. Trabalhos relacionados 22
et al.(2013), onde a autora faz a investigação dos melhores parâmetros de configuração da arquitetura de comitês de classificadores via meta-aprendizagem aplicados a problemas diversos. Neste trabalho, o conceito de meta-aprendizagem é aplicado na escolha de três parâmetros específicos de um comitê (classificador base, técnicas de construção e tamanho do comitê). No trabalho de Nascimento et al. (2014), o autor investiga o uso do meta- aprendizado para selecão de dois parâmetros importantes no projeto de comitês, que são: a melhor arquitetura (bagging , boosting ou multi-boosting), e os componentes de um comitê.
3.2.2
Otimização
No que diz respeito a investigação de técnicas de otimização para a escolha automá- tica dos componentes de um comitê, temos vários trabalhos na literatura. Como exemplo, no trabalho de Langdon et al. (2002), os autores apresentam diferentes métodos para seleção de componentes, realizando conjuntamente as etapas de geração e seleção (poda). Já os autores Langdon et al. (2002), utilizaram redes neurais e árvores de decisão em seus experimentos, mas aplicaram algortimos genéticos (Koza, 1992) para desenvolverem uma regra de combinação dos classificadores indivíduais. No trabalho deNascimento and Coelho
(2009a), os autores fazem uma nova proposta de um algoritmo evolutivo para Bagging com componentes heterogêneos. Foram utilizados 10 diferentes tipos de componentes (RBF, J48, SMO, Naïve Bayes, IBk, REP Tree, Decision Stump, OneR, PART e árvore de decisão) a serem escolhidos mediante a aplicação de algoritmos genéticos.
No trabalho de Nascimento and Coelho (2009b), os autores apresentam um novo algoritmo evolutivo para Boosting. No trabalho de (Nascimento et al., 2011), os autores utilizam algoritmos genéticos para definirem um comitê que combina componentes hete- rogêneos e seleção de características em um único modelo conceitual. Já no trabalho de
Feitosa and Canuto(2018), é apresentado um estudo exploratório de várias técnicas de otimização, mono e multi-objetivo, no projeto de comitês, e como resultado, afirmam que a escolha da técnica de otimização é uma seleção dependente do objetivo e nenhuma técnica em particular será a melhor recomendação para todos os casos mono e multi-objetivo.