SIP – Sistema Integrado de Processos
Menu: TCCs de Engenharia de Controle e Automação

Título: APRENDIZADO INCREMENTAL ONLINE A PARTIR DE FLUXOS DE DADOS MÉDICOS FBEM E ECM

Título alternativo: INCREMENTAL LEARNING ONLINE FROM MEDICAL DATA STREAMS FBEM AND ECM

Autoria de: Karolina Cardoso Faria

Orientação de: Daniel Furtado Leite

Presidente da banca: Silvia Costa Ferreira

Primeiro membro da banca: Daniel Furtado Leite

Segundo membro da banca: Rafael Henrico de Sousa

Terceiro membro da banca: Tatiane Carvalho Alvarenga

Palavras-chaves: Fluxo de Dados, Modelos Incrementais Online, Clusterização Fuzzy, FBeM, ECM

Data da defesa: 17/07/2020

Semestre letivo da defesa: 2020-1

Data da versão final: 09/08/2020

Data da publicação: 09/08/2020

Referência: Faria, K. C. APRENDIZADO INCREMENTAL ONLINE A PARTIR DE FLUXOS DE DADOS MÉDICOS FBEM E ECM. 2020. 69 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação Bacharelado)-Universidade Federal de Lavras, Lavras, 2020.

Resumo: No contexto de computação e automação atual, os dados são gerados em grandes volumes e precisam ser processados em tempo real no sentido de que a essência da informação seja capturada e mantida em modelos. A produção de fluxos de dados ocorre por meio de sensores, aplicativos, GPS, câmeras, satélites, usuários de redes sociais e de vários ambientes virtuais. O principal desafio de se trabalhar com fluxo de dados inclui manter modelos classificadores, preditores ou controladores atualizados à medida que os dados são gerados. Há limites de tempo e memória a serem atendidos por algoritmos de aprendizado de máquina online. Além disso, fluxos de dados estão sujeitos a mudanças graduais e abruptas de conceito, ou seja, possuem comportamento imprevisível. Algoritmos de aprendizado voltados para esses fluxos devem ser capazes de perceber variações e modificar parâmetros e estrutura de modelos. O presente trabalho aplica dois algoritmos e modelos incrementais online, evolving Clustering Method (ECM) e Fuzzy-Set-Based evolving Modeling (FBeM) para a classificação de fluxos de dados no contexto médico. Consideramos bases de dados benchmark como Câncer de Mama, Doença do Coração, e Telemonitoramento da Doença de Parkinson. Apesar das bases de dados serem estáticas, e serem inteiramente disponibilizadas, consideramos que as amostras são disponibilizadas sequencialmente, e que suas classes são desconhecidas. Os algoritmos ECM e FBeM atuam, portanto, em modo não-supervisionado. Eles criam, e adaptam em tempo real, modelos que mapeiam variáveis mensuráveis em uma classe. Os modelos gerados são comparados em termos de compactação (número de clusters e somatório das áreas de cobertura), acurácia e através de índices de validação como XieBeni e Partition Coefficient.

Abstract: In the current computing and automation context, large volumes of data a have been produced. The data should be processed in real time in the sense that the essence of the information must be captured and maintained in models. The production of data streams occurs through sensors, mobile apps, GPS, cameras, satellites, users of social networks and other virtual environments. The main challenge of dealing with data streamsincludes keeping classifiers, predictors and controllers updated as the data is being generated. There are time and memory constraints to be met by online machine learning algorithms. In addition, streams are subject to gradual and abrupt concept change, that is, they may behave unpredictably. Learning algorithms to handle data streams must be able to change the parameters and structure of models. In this work are apply two incremental methods, namely, evolving Clustering Method (ECM) and Fuzzy-Set-Based evolving Modeling (FBeM) for the classification of medical data. We considered benchmark databases such as Breast Cancer, Heart Disease, and Parkinsons Disease Telemonitoring. Although the datasets are static, and are entirely available, we consider that the samples are available sequentially, and that their classes are unknown. The ECM and FBeM algorithms therefore operate in an unsupervised mode. They create, and update models in real time to map measurable variables into a class. The generated models are compared in terms of compactness (number of clusters and covered area), accuracy and in terms of the validation indexes Xie-Beni and Partition Coefficient.

URI: sip.prg.ufla.br/publico/trabalhos_conclusao_curso/acessar_tcc_por_curso/
engenharia_de_controle_e_automacao/20201201410837

URI alternaviva: repositorio.ufla.br/handle/1/44998

Curso: G022 - ENGENHARIA DE CONTROLE E AUTOMAÇÃO (BACHARELADO)

Nome da editora: Universidade Federal de Lavras

Sigla da editora: UFLA

País da editora: Brasil

Gênero textual: Trabalho de Conclusão de Curso

Nome da língua do conteúdo: Português

Código da língua do conteúdo: por

Licença de acesso: Acesso aberto

Nome da licença: Licença do Repositório Institucional da Universidade Federal de Lavras

URI da licença: repositorio.ufla.br

Termos da licença: Acesso aos termos da licença em repositorio.ufla.br

Detentores dos direitos autorais: Karolina Cardoso Faria e Universidade Federal de Lavras

Baixar arquivo