Avaliação da influência de métodos de redução de dimensionalidade no desempenho de modelos de classificação

Título: Avaliação da influência de métodos de redução de dimensionalidade no desempenho de modelos de classificação

Autores: Mirelli de Castro Cesário, Leonardo Lourenço de Souza, Matheus Costa Pereira, Juliana Helena Daroz Gaudêncio, Matheus Brendon Francisco & Anderson

Resumo: Este estudo investiga o impacto da seleção de variáveis e da redução de dimensionalidade no desempenho de modelos de classificação, por meio da aplicação da análise de componentes principais e da análise fatorial. Foram avaliadas seis bases de dados com diferentes características, comparando o desempenho dos modelos de machine learning nos distintos conjuntos e analisando o impacto do uso do Grid Search . Os resultados mostraram que as duas técnicas adotadas permitiram reduzir significativamente a dimensionalidade, com desempenho muito próximo ao obtido com as bases completas. A análise do tempo de processamento evidenciou o custo computacional envolvido, especialmente em modelos mais complexos, como o Light Gradient Boosting Machine. Conclui-se que a combinação entre redução de dimensionalidade, seleção de variáveis e otimização de hiperparâmetros contribui significativamente para a escolha do modelo mais adequado ao problema.

Palavras-chave: machine learning; classification; dimensionality reduction; principal component analysis; factor analysis; computational cost.

Páginas: 8

Código DOI: 10.21528/CBIC2025-1178489

Artigo em PDF: CBIC_2025_paper1178489.pdf

Arquivo BibTeX:
CBIC_2025_1178489.bib