Rodrigues, Maria de Fátima CoutinhoCosta, Paulo Jorge dos Santos2020-03-262020-03-262019http://hdl.handle.net/10400.22/15656Com a evolução dos negócios para o digital que se traduz num maior número de transações por segundo. Estes métodos de pagamento são naturalmente um alvo apetecível para os burlões. É então premente o estudo de sistemas de deteção de fraude que antecipem as tentativas destes burlões em efetuaram dano nas empresas e nos seus clientes. Este trabalho foca o seu estudo na escolha do melhor modelo de classificação de transações fraudulentas com cartões de crédito, resultante da aplicação de técnicas de pré-processamento de dados (sampling) e algoritmos de classificação de aprendizagem supervisionada. Foi estudada a influencia que as técnicas de undersampling e oversampling podem ter sobre os classificadores estudados. O resultado do estudo permite afirmar que não se observa uma predominância transversal para todos os classificadores de uma técnica sobre a outra. Verifica-se ainda que em alguns modelos a diferença de prestação não apresenta grande diferença entre a versão com undersampling e a versão com oversampling, sendo esta última muito mais exigente no que diz respeito à capacidade de processamento. Por fim neste trabalho são descritos os passos para a implementação da proposta para um sistema de deteção em tempo real, usando os serviços do Google Cloud Platform.With the natural digital business evolution, more online transaction are made per second on these platforms. This payment methods are more and more a target for fraudsters. The study of this kind of attacks are a must and the speed of a fraud detections is crucial to stop any attempt to damage the trust link between clients and enterprises. This study is focused on finding the best classification model for credit card fraud transactions on an online service, using pre-processing techniques, under and oversampling, applied to supervised learning classification algorithms. The results of this study, show that is no overall dominance of a sampling technique over another. In some classification algorithms the performance score between sampling techniques are minimal, and oversampling presenting a higher computing processing load. Finally, are presented the steps of a possible implementation of a real time credit card fraud detection system as a Google Cloud Platform solution.porUndersampligOversamplingAprendizagem supervisionadaDeteção de fraudeSupervised learningFraud detectionSistema de deteção de fraude em pagamentos eletrónicos. Estudo e Implementação usando software de distribuição livremaster thesis202343499