Compressão Consciente por Poda Seguida de Quantização Iterativa em Redes Convolucionais: Um Estudo no CIFAR -10

Título: Compressão Consciente por Poda Seguida de Quantização Iterativa em Redes Convolucionais: Um Estudo no CIFAR -10

Autores: Vítor Yeso Fidelis Freitas, Sérgio N. Silva & Marcelo A. C. Fernandes

Resumo: Este trabalho investiga a aplicação da compressão consciente por poda seguida de quantização iterativa em redes convolucionais, com foco na tarefa de classificação de imagens no conjunto de dados CIFAR-10. A técnica emprega poda adaptativa baseada em estatísticas por camada, seguida de quantização dinâmica aplicada durante o treinamento. O objetivo é reduzir o tamanho do modelo e sua complexidade computacional, mantendo desempenho preditivo competitivo. Os resultados obtidos demonstram que a técnica é capaz de manter acurácia superior a 84% com menos de 9% da densidade do modelo original e alcançar esparsidade de até 94,55%, com perda inferior a 4,2 pontos percentuais na acurácia. A métrica de Pontuação de Eficiência revelou que a combinação de quantização de 4 bits e poda intensa oferece o melhor equilíbrio entre compressão e desempenho, validando a aplicabilidade da abordagem em cenários com restrições de recursos.

Palavras-chave: Pruning; quantization; conscious compression; deep learning; CIFAR-10; convolutional networks.

Páginas: 7

Código DOI: 10.21528/CBIC2025-1191711

Artigo em PDF: CBIC_2025_paper1191711.pdf

Arquivo BibTeX:
CBIC_2025_1191711.bib