Machine Learning na predição de Diabetes: uma abordagem explicável

Título: Machine Learning na predição de Diabetes: uma abordagem explicável

Autores: Débora Fernandes Costa, Ana Kelly N. Costa, Fernanda Rocha Fernandes, Náthalee Cavalcanti de Almeida Lima & Gabriel Barros Caldas e Sá

Resumo: O Diabetes mellitus é uma condição metabólica crônica associada a níveis elevados de glicose no sangue. Quando não diagnosticada precocemente, pode ocasionar complicações graves. Técnicas de Machine Learning (ML), têm se mostrado eficazes na análise de grandes volumes de dados clínicos, promovendo a detecção precoce de doenças e o suporte à decisão médica. Este trabalho tem como objetivo desenvolver e avaliar modelos preditivos de ML para o diagnóstico de diabetes, com foco na explicabilidade dos resultados. Utilizou-se um conjunto de dados clínicos com aproximadamente 100 mil registros e nove atributos. Após o pré-processamento e análise exploratória, cinco algoritmos foram aplicados: Random Forest, Regressão Logística, KNN, SVC e MLP. As métricas utilizadas incluíram acurácia, precisão, recall, F1-score e AUC-ROC, com avaliação separada das classes de pacientes com e sem diabetes. A técnica SHAP foi utilizada para promover a explicabilidade dos modelos, identificando o nível de glicose e hemoglobina glicada como variáveis mais influentes nas decisões do modelo. Os resultados demonstram que modelos clássicos de ML, mesmo com arquiteturas simples, podem ser eficazes na predição do diabetes, especialmente quando combinados com técnicas de explicabilidade, reforçando sua utilidade clínica. O estudo contribui para o avanço de sistemas preditivos mais confiáveis e alinhados à prática clínica, promovendo suporte à decisão médica baseado em evidências.

Palavras-chave: Diabetes; Machine Learning; Prediction; SHAP; Explainability.

Páginas: 8

Código DOI: 10.21528/CBIC2025-1163557

Artigo em PDF: CBIC_2025_paper1163557.pdf

Arquivo BibTeX:
CBIC_2025_1163557.bib