Título: Aprendizado Semi -Supervisionado e Ativo para Detecção de Fraudes Contábeis
Autores: Sérgio Henrique de Carvalho Pedroso, Wilian Soares Lacerda
Resumo: Este trabalho investiga o uso de aprendizado semi-supervisionado e aprendizado ativo na detecção de fraudes contábeis em dados extraídos do ERP de uma empresa do setor logístico. Partindo de um conjunto reduzido de registros rotulados por denúncias internas e de um grande volume de transações não rotuladas, foram comparadas as estratégias Active Learning, Pseudo-Labeling e Label Propagationem modelos como Regressão Logística, MLP, XGBoost e CatBoost. Os experimentos mostraram que o Active Learningcom modelos deárvores obteve desempenho superior (F1 at é 0,87 e PR-AUC 0,94), com evolução consistente ao longo das iterações, enquanto o Label Propagation teve resultados intermediários e o Pseudo-Labeling apresentou degradação devido à propagação de rótulos incorretos. Conclui-se que a combinação de Active Learning com modelos robustos representa uma solução eficaz para apoiar auditorias internas em cenários de escassez de rótulos, oferecendo maior precisão e escalabilidade nos processos de governança corporativa.
Palavras-chave: Semi-Supervised Learning; Audit; Active Learning; Fraud Detection; Anomalies.
Páginas: 8
Código DOI: 10.21528/CBIC2025-1175646
Artigo em PDF: CBIC_2025_paper1175646.pdf
Arquivo BibTeX:
CBIC_2025_1175646.bib
