Estimativa de Pose 2D com Atenção: Um Estudo Comparativo de Mecanismos de Atenção em ResNet -50

Título: Estimativa de Pose 2D com Atenção: Um Estudo Comparativo de Mecanismos de Atenção em ResNet -50

Autores: Marlon Nanael Leitão Malheiros, Adriana Rosa Garcez Castro

Resumo: A estimação de pose humana 2D é uma tarefa fundamental em Visão Computacional, onde as Redes Neurais Convolucionais (CNNs) têm alcançado resultados notáveis. Mecanismos de atenção podem aprimorar o desempenho dessas redes ao permitir o foco seletivo em características mais relevantes. Este trabalho investiga o impacto da integração de quatro tipos de mecanismos de atenção – Atenção Coordenada, Self-Attention (Auto-Atenção), Atenção de Contexto Global e o Convolutional Block Attention Module (CBAM), juntamente de uma versão modificada deste – em uma arquitetura ResNet-50 para a estimação de pose humana 2D. Os modelos foram treinados e avaliados no conjunto de dados MS COCO, utilizando a métrica Average Precision (AP). Os resultados demonstram que a incorporação do CBAM modificado alcançou o melhor desempenho dentre os modelos avaliados, com 67.8% AP, representando um ganho de 1.6 pontos percentuais sobre o modelo base (66.2% AP) e com um custo computacional adicional mínimo. A Atenção Coordenada também apresentou melhora significativa (67.7% AP). A análise sugere que mecanismos de atenção com ênfase na captura de informações espaciais são alternativas promissoras para esta tarefa.

Palavras-chave: 2D Human Pose Estimation; Attention Mechanisms; Convolutional Neural Networks; CBAM; MS COCO.

Páginas: 8

Código DOI: 10.21528/CBIC2025-1175723

Artigo em PDF: CBIC_2025_paper1175723.pdf

Arquivo BibTeX:
CBIC_2025_1175723.bib