Título: Modelagem preditiva da malária em crianças de Uganda com árvores de decisão interpretáveis, balanceamento de dados e agrupamento
Autores: Cleiane Gonçalves Oliveira, Marcos Flávio Silveira Vasconcelos D’angelo, João Batista Mendes, Marcelo Perin Baldo & Hasheem Mannan
Resumo: A malária permanece como um dos principais desafios de saúde pública em países africanos, como Uganda. Este estudo propõe e analisa diferentes abordagens de aprendizagem de máquina para a predição de malária em crianças menores de cinco anos, utilizando dados sociodemográficos do Uganda Malaria Indicator Survey 2018-2019. Foram aplicados modelos de árvores de decisão com diferentes profundidades, avaliando-se também o impacto de técnicas de balanceamento de dados (undersampling e oversampling). Além disso, propõe-se uma nova abordagem que combina agrupamento de indivíduos por similaridade com a aplicação de árvores de decisão específicas para cada grupo. Os resultados mostram que técnicas de balanceamento melhoram o desempenho na detecção de casos positivos, especialmente com árvores mais rasas, e que o agrupamento possibilita a identificação de perfis distintos da população. Conclui-se que dados sociodemográficos tem potencial de contribuição na predição de malária, e que a interpretabilidade e o balanceamento dos modelos são aspectos essenciais para aplicações em saúde pública.
Palavras-chave: Malaria; machine learning; sociodemographic data.
Páginas: 7
Código DOI: 10.21528/CBIC2025-1175363
Artigo em PDF: CBIC_2025_paper1175363.pdf
Arquivo BibTeX:
CBIC_2025_1175363.bib
