Publication
Hierarchical time series Forecasting with Deep Learning in Retail
dc.contributor.advisor | Ramos, Patrícia Alexandra Gregório | |
dc.contributor.advisor | Oliveira, José Manuel Soares | |
dc.contributor.author | Gomes, José Carlos Guedes | |
dc.date.accessioned | 2025-02-28T09:29:28Z | |
dc.date.available | 2025-02-28T09:29:28Z | |
dc.date.issued | 2024-11-27 | |
dc.date.submitted | 2025-02-28 | |
dc.description.abstract | Esta dissertação investiga a aplicação de modelos de deep learning para melhorar as metodologias de previsão hierárquica na indústria retalhista. Os métodos de previsão tradicionais muitas vezes falham na captura das complexas interdependências e estruturas hierárquicas presentes nas operações de retalho, levando a previsões subótimas e alocação ineficiente de recursos. Este estudo procura superar estas limitações, aproveitando a capacidade dos modelos de deep learning, como as redes MultiLayer Peceptron (MLP) e as arquiteturas baseadas em Transformer, para identificar padrões e dependências não lineares nos dados. O estudo centra-se no desenho e implementação de um sistema de previsão hierárquico capaz de prever com precisão a procura a vários níveis, desde produtos individuais até vendas agregadas em lojas e mercados. Ao integrar modelos de deep learning num quadro hierárquico, o estudo visa melhorar a precisão e eficiência das previsões em domínios críticos do retalho, como o planeamento da procura, a previsão de vendas e a gestão de inventário. O quadro proposto é concebido para ser adaptável e escalável, capaz de acomodar mudanças na estrutura organizacional, carteiras de produtos e dinâmica de mercado, garantindo a sua relevância e eficácia em diversos contextos empresariais. Este trabalho utiliza o conjunto de dados da competição M5, publicamente disponível, um benchmark para avaliar metodologias de previsão que envolve a geração de estimativas pontuais e intervalos probabilísticos para dados de séries temporais hierárquicas da Walmart. Este conjunto de dados consiste em dados de vendas diárias para 3.049 produtos em dez lojas em três estados dos EUA num período de 1.969 dias. Devido a restrições computacionais, o estudo utiliza uma versão reduzida do conjunto de dados com 1.288 séries temporais, preservando as características principais do conjunto de dados. A dissertação utiliza uma combinação de estruturas hierárquicas e agrupadas para representar com precisão as dependências dentro do conjunto de dados M5. Vários métodos de reconciliação, incluindo a agregação ascendente e a reconciliação MinTrace, são utilizados para alinhar as previsões de diferentes níveis e garantir a coerência ao longo da hierarquia. É realizada uma extensa otimização de hiperparâmetros utilizando a biblioteca Optuna para melhorar a precisão preditiva de modelos como o Vanilla Transformer, TFT, Informer, PatchTST, Autoformer, MLP, NBEATS e NHITS. A dissertação avalia tanto as previsões pontuais como as probabilísticas para capturar a incerteza nas previsões de vendas futuras. O Erro Médio Absoluto Escalado (MASE) é utilizado como métrica primária para as previsões pontuais, e o Continuous Ranked Probability Score (CRPS) é utilizado para as previsões probabilísticas. Os resultados demonstram que os modelos de deep learning, particularmente as arquitecturas baseadas em Transformer, melhoram significativamente a precisão da previsão em comparação com métodos tradicionais como ARIMA e ETS, especialmente quando combinados com técnicas de reconciliação avançadas. O estudo destaca a eficácia da abordagem de reconciliação MinTrace, particularmente com variações ponderadas, no equilíbrio entre a precisão da previsão e a consistência hierárquica. Em conclusão, a dissertação fornece uma solução de previsão robusta e escalável para a indústria retalhista. A integração de modelos de deep learning com metodologias de previsão hierárquica permite às empresas tomar decisões baseadas em dados em todos os níveis da organização, levando a uma melhor alocação de recursos, maior eficiência operacional e, em última análise, melhores resultados empresariais. | por |
dc.description.abstract | This dissertation investigates the application of deep learning models to enhance hierarchical forecasting methodologies in the retail industry. Traditional forecasting methods often fail to capture the complex interdependencies and hierarchical structures prevalent in retail operations, leading to suboptimal predictions and inefficient resource allocation. This research seeks to overcome these limitations by leveraging the ability of deep learning models, such as MultiLayer Peceptron (MLP) networks and Transformer architectures, to identify non-linear patterns and dependencies in data. The study focuses on designing and implementing a hierarchical forecasting system that can accurately predict demand at various levels, from individual product SKUs to aggregate sales across stores, chains, and markets. By integrating deep learning models within a hierarchical framework, the study aims to improve the accuracy and efficiency of predictions in critical retail domains such as demand planning, sales forecasting, and inventory management. The proposed framework is designed to be adaptable and scalable, capable of accommodating changes in organizational structure, product portfolios, and market dynamics, ensuring its relevance and effectiveness in diverse business contexts. This research utilizes the publicly available M5 competition dataset, a benchmark for evaluating forecasting methodologies that involves generating point estimates and probabilistic intervals for hierarchical time series data from Walmart. This dataset consists of daily sales data for 3,049 products across ten stores in three US states over a period of 1,969 days. Due to computational constraints, the study uses a reduced version of the dataset with 1,288 time series, preserving the dataset's key characteristics. The dissertation employs a combination of hierarchical and grouped structures to accurately represent dependencies within the M5 dataset. Several reconciliation methods, including bottom-up aggregation and MinTrace reconciliation, are used to align forecasts from different levels and ensure coherence across the hierarchy. Extensive hyperparameter optimization is performed using the Optuna library to enhance the predictive accuracy of models like Vanilla Transformer, TFT, Informer, PatchTST, Autoformer, MLP, NBEATS, and NHITS. The dissertation evaluates both point and probabilistic forecasts to capture uncertainty in future sales predictions. Mean Absolute Scaled Error (MASE) is used as the primary metric for point forecasts, and the Continuous Ranked Probability Score (CRPS) is used for probabilistic forecasts. The results demonstrate that deep learning models, particularly Transformer-based architectures, significantly improve forecasting accuracy compared to traditional methods like ARIMA and ETS, especially when combined with advanced reconciliation techniques. The study highlights the effectiveness of the MinTrace reconciliation approach, particularly with weighted variations, in balancing forecast accuracy and hierarchical consistency. In conclusion, the dissertation provides a robust and scalable forecasting solution for the retail industry. The integration of deep learning models with hierarchical forecasting methodologies enables businesses to make data-driven decisions at every level of the organization, leading to improved resource allocation, enhanced operational efficiency, and ultimately, better business outcomes. | eng |
dc.identifier.tid | 203803540 | |
dc.identifier.uri | http://hdl.handle.net/10400.22/29759 | |
dc.language.iso | eng | |
dc.rights.uri | N/A | |
dc.subject | Deep learning | |
dc.subject | Hierarchical forecasting | |
dc.subject | Retail business | |
dc.subject | Resources optimization | |
dc.subject | Aprendizagem profunda | |
dc.subject | Previsãp hierárquica | |
dc.subject | Retalho | |
dc.subject | Otimização de recursos | |
dc.title | Hierarchical time series Forecasting with Deep Learning in Retail | |
dc.type | master thesis | |
dspace.entity.type | Publication | |
thesis.degree.name | Mestrado em Business Intelligence & Analytics |