• Aucun résultat trouvé

MOTOROLA LINEAR/INTERFACE ICs DEVICE DATA 2·119

Dans le document I Power Supply Circuits (Page 142-145)

Grande parte dos algoritmos de mineração de dados assume que um exemplo é gerado de acordo com uma distribuição de probabilidade estacionária. Em FCDs, em contrapartida, umFCDpossui uma distribuição não estacionária, ou seja, os conceitos não são estáticos mas mudam ao longo do tempo. Com isso, dois fenômenos podem ocorrer: Mudança de Conceito e Evolução de Conceito(GAMA,2010;FARIA et al.,2016a).

Na literatura, podemos encontrar várias definições de Mudança de Conceito:

• Dries e Rückert(2009): Mudança de Conceito é um importante problema em aprendizado de máquina e pode ser definido como uma mudança significativa na distribuição dos dados;

• Elwell e Polikar(2011): Mudança de Conceito refere-se a uma mudança nas definições das classes (conceitos) ao longo do tempo e, portanto, uma mudança na distribuição a partir da qual os dados são gerados;

Capítulo 4. Detecção de Novidade em FCDs 53

• Farid et al. (2013): todo exemplo Xt é gerado a partir uma distribuição Dt. Se para

quaisquer dois exemplos X1 e X2, com marcadores de tempo t1 e t2, D1 6= D2, então

ocorre uma Mudança de Conceito;

• Souza et al. (2015a): um conceito pode ser definido como um conjunto de exemplos geradas pela mesma função subjacente. Quando essa função muda por alguma razão, ocorre o fenômeno da Mudança de Conceito.

De acordo com (TSYMBAL,2004), um grande desafio ao se tratar Mudança de Conceito é distinguir entre uma mudança real e um ruído. Alguns exemplos de Mudança de Conceito são: mudanças no padrão de uma doença, mudanças de temperatura, mudanças no perfil de compras de um cliente ao longo dos anos, etc (FARIA et al.,2016a).

SegundoGama et al. (2013), duas abordagens são usadas para adaptar o modelo de decisão com o objetivo de tratar Mudanças de Conceito: Blind e Informed. A primeira atualiza o modelo em intervalos regulares de tempo sem verificar se realmente houve mudanças. Geralmente o modelo é atualizado através dos últimos exemplos rotulados. A segunda modifica o modelo de decisão no momento em que uma Mudança de Conceito é detectada.

Em FCDs, nem sempre o número de classes é previamente definido, uma vez que nem todas as classes são conhecidas na fase de treinamento e exemplos de novas classes podem aparecer ao longo do tempo (FARIA et al., 2016a). Assim, os modelos devem estar aptos a reconhecer essas novas classes assim que elas aparecerem no fluxo (ABDALLAH et al.,

2016). Esse fenômeno é chamado de Evolução de Conceito e pode ocorrer em problemas como detecção de intrusão em redes de computadores (SPINOSA et al.,2008), filtro de spam (HAYAT; HASHEMI,2010) e classificação de texto (LI; CROFT,2006).

Na área de Reconhecimento de Padrões, um cenário semelhante à Evolução de Conceito é estudado. Este recebe o nome de Reconhecimento em Cenário Aberto, do inglês Open-Set Recognition, no qual não é necessário, ou não é conhecido, o conjunto completo das possíveis classes do problema. Isso torna indispensável o uso de modelos que sejam capazes de lidar com um vasto número de classes que ainda não foram vistas na fase de treinamento (SCHEIRER et al.,2013;SCHEIRER et al.,2014;JAIN et al.,2014). Nesse cenário, quando os exemplos de teste não pertencem a nenhuma classe conhecida, o classificador deve rejeitá-los adequadamente, classificando-os como desconhecidos (JÚNIOR et al.,2016). Uma abordagem comum para o tratamento parcial desse problema depende do uso de esquemas de classificação baseados em limiar (PHILLIPS et al.,2011). Basicamente, esses métodos verificam se um score corres- pondente é maior ou igual a um limiar previamente definido. Outra abordagem que também é bastante utilizada (SCHEIRER et al.,2013;COSTA et al.,2012;COSTA et al.,2014) baseia-se na modificação do motor de classificação ou função objetivo das SVMs. Como exemplos de aplicações nesse cenário temos: atribuição de imagem a uma determinada câmera para identificar a autenticidade de uma imagem sob investigação (COSTA et al.,2012;COSTA et al.,2014);

Capítulo 4. Detecção de Novidade em FCDs 54

detecção de impressão digital falsa em biometria (RATTANI et al., 2015); identificação de faces (JUNIOR; SCHWARTZ,2014), etc.

Apesar de tratar problemas semelhantes ao de Evolução de Conceito, os modelos de Reconhecimento em Cenário Aberto não são dinâmicos, uma característica fundamental para algoritmos de mineração em FCDs. No entanto,Bendale e Boult(2015) apresentam outro tipo de problema denominado Reconhecimento em Mundo Aberto (Open World Recognition), cuja ideia é fazer com que o sistema rotule explicitamente as novas entradas como desconhecidas. Essas novas entradas desconhecidas devem ser então coletadas e rotuladas (por um especialista humano, por exemplo). Quando há um número suficiente de exemplos desconhecidos para o aprendizado de novas classes, o sistema deve atualizar o classificador, tornando cada uma dessas novas classes conhecidas para o sistema. Para isso, os autores estendem o algoritmo Nearest Class Mean(MENSINK et al.,2013;RISTIN et al.,2014) para o Nearest Non-Outlier (BENDALE; BOULT,2015).

O trabalho deBendale e Boult(2015), apesar de ser viável para alguns casos, utiliza uma abordagem que mantém fixo o limiar de detecção de novas classes à medida que o problema evolui. SegundoRosa et al.(2016), isso entra em conflito com a definição de Reconhecimento em Mundo Aberto, no qual a estrutura do problema é progressivamente revelada à medida que mais dados são observados e os parâmetros tendem a sofrer mudanças ao longo do tempo. Com isso, eles mostram que é necessário usar limiares dinâmicos que mudam à medida que novos exemplos e novas classes chegam, ao invés de estimá-los a partir de um conjunto inicial e fechado de classes, como feito até agora (MENSINK et al., 2013; RISTIN et al., 2014; BENDALE; BOULT,2015).

Os trabalhos citados anteriormente são fundamentais para este projeto, principalmente aqueles que fazem uso de mecanismo deDN, habilidade de reconhecer se uma entrada difere significativamente das anteriores (PERNER,2009). Esse mecanismo, em conjunto com o Apren- dizado Online-Offline, facilita a detecção de Mudanças de Conceito e serve como base para o desenvolvimento de algoritmos que tratam o problema da Evolução de Conceito. Alguns deste algoritmos serão apresentados na Seção4.3.

Dans le document I Power Supply Circuits (Page 142-145)

Documents relatifs