O Departamento de Computação do Centro de Ciências Tecnológicas da Universidade Estadual do Maranhão (CCT/UEMA) está celebrando um marco importante na área de aprendizagem de máquina. O professor Antonio Fernando Lavareda Jacob Junior, em colaboração com outros pesquisadores, teve seu artigo publicado na revista Plos One, um periódico classificado como A1 no Qualis e com um Fator de Impacto de 3.7.
O artigo “EvoImp: Imputação Múltipla de Dados de Classificação Multirótulo com um Algoritmo Genético” é fruto de anos de pesquisa e está diretamente vinculado à tese de doutorado do Professor Jacob Junior, intitulada “Algoritmos Genéticos para Imputação Múltipla de Dados na Classificação Multirrótulo”. A tese foi orientada pelo professor doutor Ewaldo Santana da Uema e co-orientada pelo professor doutor Fábio Lobato, da Universidade Federal do Oeste do Pará.
A Classificação Multi-Rótulo (MLC) é um tipo de tarefa de aprendizado de máquina em que uma instância de dados pode ser associada a múltiplas classes simultaneamente. Ao contrário da classificação tradicional, onde uma instância é atribuída a apenas uma classe, a classificação multi-rótulo permite a associação de várias etiquetas ou rótulos a uma única instância. A MLC difere da Classificação de Rótulo Único ao permitir que uma instância seja associada a múltiplas classes, como no caso da classificação de filmes, que podem ser categorizados como “drama” e “biografia” simultaneamente.
Assim, a pesquisa “EvoImp: Imputação Múltipla de Dados de Classificação Multirótulo com um Algoritmo Genético” aborda um problema crucial na análise de dados: a falta de dados. Esse problema é especialmente desafiador na MLC, onde apenas algumas técnicas têm explorado eficazmente dados faltantes. Para lidar com esse desafio, o professor Jacob Junior propôs um novo método de imputação múltipla de dados, adaptado ao cenário de classificação multi-rótulo, preenchendo esta patente lacuna na literatura. O método, denominado EvoImp, é baseado em um algoritmo genético multi-objetivo que busca otimizar os valores a serem imputados.
A eficácia do EvoImp foi extensivamente avaliada e os resultados demonstraram consistentemente que o EvoImp superou estratégias de imputação presentes no estado da prática. Esses resultados promissores confirmam que o EvoImp representa uma solução viável e robusta para o tratamento de dados perdidos na aprendizagem multi-rótulo. O impacto dessa pesquisa não apenas contribui significativamente para o avanço do conhecimento científico, mas também oferece soluções práticas para uma variedade de aplicações da vida real que dependem da análise de dados. “Afim de aumentar a visibilidade do trabalho, uma das contribuições teve como foco a replicabilidade do estudo. Nesse caso, todos os produtos gerados (códigos, bases de dados) estão disponíveis nas plataformas mais utilizadas pela comunidade científica”.
O professor Fábio Lobato, coorientador de Jacob, expressou sua satisfação com os resultados e destacou a importância de continuarem a explorar novas abordagens e técnicas para enfrentar os desafios em constante evolução no campo da aprendizagem de máquina.
“O EvoImp se mostrou bastante competitivo e agora iremos trabalhar para traduzi-lo para a linguagem de programação Python de modo a possibilitar a incorporação do EvoImp em bibliotecas de aprendizado de máquina, facilitando seu pleno uso pela comunidade e, consequentemente, ampliando o impacto do estudo. Este é apenas um dos resultados da tese. Há outros conhecimentos construídos no processo de doutoramento dele que estamos trabalhando para publicação. Durante a sua defesa, os membros da banca também contribuíram com sugestões que certamente renderão outros frutos. Particularmente, estou muito feliz com os resultados alcançados até agora. As perspectivas são promissoras”, destacou Lobato.
Aprendizagem de Máquina
A aprendizagem de máquina, também conhecida como machine learning, em inglês, é uma abordagem para analisar dados que automatiza a criação de modelos analíticos. Pertencente ao campo da inteligência artificial, essa abordagem parte da premissa de que sistemas têm a capacidade de aprender com dados, reconhecer padrões e tomar decisões com pouca intervenção humana.
O aprendizado de máquina não é uma tecnologia isolada; ele utiliza softwares, como os de mineração de dados e análise avançada, para processar grandes quantidades de dados e gerar valor aos negócios.
Leia a matéria completa na REVISTA UEMA (Clique aqui)