Aprendizado Semi -Supervisionado e Ativo para Detecção de Fraudes Contábeis

Título: Aprendizado Semi -Supervisionado e Ativo para Detecção de Fraudes Contábeis

Autores: Sérgio Henrique de Carvalho Pedroso, Wilian Soares Lacerda

Resumo: Este trabalho investiga o uso de aprendizado semi-supervisionado e aprendizado ativo na detecção de fraudes contábeis em dados extraídos do ERP de uma empresa do setor logístico. Partindo de um conjunto reduzido de registros rotulados por denúncias internas e de um grande volume de transações não rotuladas, foram comparadas as estratégias Active Learning, Pseudo-Labeling e Label Propagationem modelos como Regressão Logística, MLP, XGBoost e CatBoost. Os experimentos mostraram que o Active Learningcom modelos deárvores obteve desempenho superior (F1 at é 0,87 e PR-AUC 0,94), com evolução consistente ao longo das iterações, enquanto o Label Propagation teve resultados intermediários e o Pseudo-Labeling apresentou degradação devido à propagação de rótulos incorretos. Conclui-se que a combinação de Active Learning com modelos robustos representa uma solução eficaz para apoiar auditorias internas em cenários de escassez de rótulos, oferecendo maior precisão e escalabilidade nos processos de governança corporativa.

Palavras-chave: Semi-Supervised Learning; Audit; Active Learning; Fraud Detection; Anomalies.

Páginas: 8

Código DOI: 10.21528/CBIC2025-1175646

Artigo em PDF: CBIC_2025_paper1175646.pdf

Arquivo BibTeX:
CBIC_2025_1175646.bib