Previsão de preços de Commodities: Um case real de Machine Learning aplicado ao mercado de farelo de soja na região de Campinas

Título: Previsão de preços de Commodities: Um case real de Machine Learning aplicado ao mercado de farelo de soja na região de Campinas

Autores: Sérgio Domingos Simão, João Paulo Assis Bonifácio, Thelma Sáfadi, Geraldo Magela da Cruz Pereira & Izabela Regina Cardoso de Oliveira

Resumo: Este estudo tem como objetivo aplicar e avaliar modelos de Machine Learning (ML) para compreender a dinâmica dos preços diários do farelo de soja na região de Campinas, São Paulo, com foco na previsão do preço por tonelada. A previsão de preços desse insumo é fundamental para a cadeia produtiva da pecuária, uma vez que o farelo de soja é amplamente utilizado na formulação de rações e seus preços impactam diretamente os custos de produção animal. Os dados utilizados foram obtidos por meio da plataforma Broadcast, cobrindo o período de janeiro de 2007 a dezembro de 2024, totalizando 4.398 observações. A análise preditiva foi conduzida com o uso do software R, empregando as bibliotecas tidyverse e tidymodels, que possibilitam um fluxo estruturado e reprodutível para manipulação de dados, engenharia de variáveis, treinamento e validação de modelos. Como variáveis explicativas, foram utilizados o tempo (como índice) e um parâmetro de defasagem baseado em componentes autorregressivos de primeira ordem (AR-1), visando capturar a dependência temporal presente na série. Foram ajustados e comparados diferentes algoritmos de ML, com destaque para os modelos de regressão por máquinas de vetores de suporte (SVM), redes neurais e árvores de decisão (Random Forest). O desempenho dos modelos foi avaliado com base em métricas de erro, como o Erro Médio Absoluto (MAE), a Raiz do Erro Quadrático Médio (RMSE), o Erro Percentual Absoluto Médio (MAPE) e o Coeficiente de Determinação (R²). Entre os modelos testados, o SVM com kernel linear apresentou o melhor desempenho, destacando-se pela capacidade de generalização e pela baixa magnitude dos erros preditivos e baixo tempo computacional (25,4 segundos). Os resultados demonstram o potencial do uso de técnicas de ML para antecipar oscilações no preço do farelo de soja em nível regional, contribuindo para decisões mais assertivas por parte de produtores, indústrias e agentes de mercado.

Palavras-chave: Application; models; automation; dashboards.

Páginas: 8

Código DOI: 10.21528/CBIC2025-1187388

Artigo em PDF: CBIC_2025_paper1187388.pdf

Arquivo BibTeX:
CBIC_2025_1187388.bib