Malheiro, Maria Benedita Campos NevesAlves, Pedro Miguel Ferreira2022-03-082024-11-112021http://hdl.handle.net/10400.22/20157In an ever-evolving technology world, telecommunications operators must attend to client needs in an effective and speedy manner to strengthen their relationship. The difficulty of this challenge is heightened in Big Data environments where there is a necessity to make sense of the valuable information within data. In the pre-paid telco environment, also known as pay-as-you-go, it is imperative for operators to predict client behaviour efficiently to meet their needs and improve campaigns and notifications, thus improving communication, client retention and revenue. In this dissertation, a novel top-up date and value prediction solution for the prepaid telco environment, is presented. This solution aims to dynamically estimate, for each client, the top-up date and value for the upcoming month. For this, the initial data goes through the developed processing pipeline. The first step is pre-processing, where data is cleaned and transformed. After this, it undergoes a feature engineering and selection step to identify the most relevant features for the prediction of the monthly frequency and value. For the prediction of the targets, several regression techniques were studied both on the offline and online scenario with the help of sliding windows. Using the most efficient technique, the monthly target predictions undergo a processing stage in which they are transformed into the individual top-up date range and top-up monetary value range for the following month. The evaluation of these predicted ranges is based on verifying if the observed event falls within the predicted interval. The solution is implemented in Python and the Jupyter Notebooks environment for data analysis, dimensionality reduction and offline learning experiments. The online learning experiments make use of the Massive Online Analysis (MOA) graphical user interface (GUI) framework. In the end, the designed solution is able to estimate individual top-up activity with an accuracy of approximately 80 % for the date and 70 % for the monetary value.Num mundo de tecnologia em constante evolução, as operadoras de telecomunicações devem atender às necessidades dos clientes de forma eficaz e rápida para satisfazêlos. A dificuldade deste desafio é aumentada em ambientes de Big Data, pois surge a necessidade de entender quais são as informações valiosas nos dados. No ambiente de telecomunicações pré-pago, também conhecido como pay as you go, é imperativo que as operadoras prevejam o comportamento de seus clientes de forma eficiente para que suas necessidades sejam atendidas eficientemente e campanhas e notificações aprimoradas possam ser-lhes enviadas com base na sua atividade, melhorando assim a comunicação, retenção de clientes e receita. Nesta dissertação, uma nova solução de previsão de valor e data de recarga, para o ambiente de telecomunicações pré-pago, é apresentada. Esta solução tem como objetivo prever de forma dinâmica a data de recarga e o valor de cada cliente para o mês seguinte. Para isso, os dados iniciais, após serem estudados, são colocados numa pipeline desenvolvida onde a primeira etapa é o pré-processamento onde os dados são limpos e transformados. De seguida, passam por uma etapa de engenharia e seleção de variáveis para obter apenas os variáveis mais relevantes para a previsão dos targets, frequência mensal e valor, respectivamente. Para a previsão dos targets, diversas técnicas de regressão são estudadas tanto no cenário offline como no online com o auxílio de uma janela deslizante. Depois de escolhida a técnica mais eficiente, as previsões mensais previstas passam por uma etapa de processamento na qual são transformadas de modo a obter-se um intervalo de dias e de valor monetário definido para cada cliente para o mês seguinte. A avaliação dessas estimativas é definida com base em averiguar se o evento observado se encontra dentro do intervalo previsto. A solução é implementada utilizando Python no ambiente Jupyter Notebooks para análise de dados, redução de dimensionalidade e experiências de aprendizagem offline. As experiências de aprendizagem online fazem uso da interface gráfica MOA. No final, a solução desenvolvida é capaz de prever a atividade de recarga dos clientes com uma precisão de aproximadamente 80 % para a data e 70 % para o valor.engTelecommunicationsTop-upForecastingBig DataMachine LearningTelecomunicaçõesRecargaPrevisãoTop-Up Forecasting of Pre-Paid Mobile Subscribersmaster thesis202797180