Título: Estimativa de Pose 2D com Atenção: Um Estudo Comparativo de Mecanismos de Atenção em ResNet -50
Autores: Marlon Nanael Leitão Malheiros, Adriana Rosa Garcez Castro
Resumo: A estimação de pose humana 2D é uma tarefa fundamental em Visão Computacional, onde as Redes Neurais Convolucionais (CNNs) têm alcançado resultados notáveis. Mecanismos de atenção podem aprimorar o desempenho dessas redes ao permitir o foco seletivo em características mais relevantes. Este trabalho investiga o impacto da integração de quatro tipos de mecanismos de atenção – Atenção Coordenada, Self-Attention (Auto-Atenção), Atenção de Contexto Global e o Convolutional Block Attention Module (CBAM), juntamente de uma versão modificada deste – em uma arquitetura ResNet-50 para a estimação de pose humana 2D. Os modelos foram treinados e avaliados no conjunto de dados MS COCO, utilizando a métrica Average Precision (AP). Os resultados demonstram que a incorporação do CBAM modificado alcançou o melhor desempenho dentre os modelos avaliados, com 67.8% AP, representando um ganho de 1.6 pontos percentuais sobre o modelo base (66.2% AP) e com um custo computacional adicional mínimo. A Atenção Coordenada também apresentou melhora significativa (67.7% AP). A análise sugere que mecanismos de atenção com ênfase na captura de informações espaciais são alternativas promissoras para esta tarefa.
Palavras-chave: 2D Human Pose Estimation; Attention Mechanisms; Convolutional Neural Networks; CBAM; MS COCO.
Páginas: 8
Código DOI: 10.21528/CBIC2025-1175723
Artigo em PDF: CBIC_2025_paper1175723.pdf
Arquivo BibTeX:
CBIC_2025_1175723.bib
