Pereira, Ana Maria Dias MadureiraMarques, David Miguel Coutinho2023-12-122023-11-13http://hdl.handle.net/10400.22/24147O objetivo desta dissertação é investigar várias estratégias que podem ser utilizadas para encriptar e ocultar as identidades em grandes dados (Big Data). Uma vez que os sistemas de Big Data estão a tornar-se mais predominantes numa vasta gama de indústrias, a proteção da confidencialidade dos dados sensíveis tem surgido como uma das preocupações mais prementes nos dias de hoje. A encriptação e a anonimização de dados são duas formas típicas utilizadas para preservar a privacidade dos dados em contextos que fazem uso intensivo de Big Data. Esta dissertação começa com uma visão exaustiva e análise detalhada dos diferentes métodos de encriptação e de anonimização que são amplamente utilizados na área de Big Data. Nesta visão geral, tanto os métodos clássicos de encriptação como a encriptação simétrica e assimétrica, assim como as estratégias modernas de encriptação como a encriptação homomorphic e a encriptação baseada em atributos, são discutidos em detalhe. De forma semelhante, uma grande variedade de estratégias de anonimização, tais como k-anonymity, l-diversity, e t-closeness, são examinadas em pormenor. Após a conclusão da avaliação, estas estratégias de encriptação e anonimização são analisa das e contrastadas, tendo em consideração os seus benefícios, inconvenientes e aplicabilidade a uma variedade de situações de Big Data. No decurso da investigação, são considerados fatores como a sobrecarga computacional, a utilidade dos dados, e a resistência ao ataque. Além disso, a dissertação contém uma secção prática na qual as técnicas de encriptação e de anonimização escolhidas são implementadas e avaliadas num conjunto de dados de Big Data. A avaliação inclui métricas de desempenho tais como tempo de encriptação/desencriptação de dados, perda de dados durante a anonimização, e a capacidade da anonimização para preservar a utilidade dos dados. Os resultados desta dissertação contribuem para um melhor conhecimento das estratégias de encriptação e anonimização de Big Data, e também dão aos investigadores e profissionais informações sobre como escolher as abordagens mais adequadas para proteger dados sensí veis em ambientes que utilizam de Big Data. Ao considerar estratégias de encriptação e de anonimização para uma variedade de casos de utilizam Big Data, os resultados ressaltam a importância de encontrar um equilíbrio adequado entre a proteção de dados e o seu potencial uso.The aim of this thesis is to investigate various strategies that can be used to encrypt and hide the identities of Big Data. As Big Data systems are becoming more prevalent in a wide range of industries, protecting the confidentiality of sensitive data has emerged as one of the most pressing concerns today. Data encryption and Data anonymisation are two typical ways used to preserve data privacy in contexts that make intensive use of Big Data. This thesis starts with an exhaustive overview and detailed analysis of the different encryption and anonymization methods that are widely used in the area of Big Data. In this overview, both classical encryption methods like symmetric and asymmetric encryption, as well as modern encryption strategies like homographic encryption and attribute-based encryption are discussed in detail. Similarly, a wide variety of anonymization strategies, such as k anonymity, l-diversity, and t-closeness, are examined in detail. Upon completion of the evaluation, these encryption and anonymisation strategies are analy sed and contrasted, taking into consideration their benefits, drawbacks and applicability to a variety of Big Data situations. The research takes into account factors such as computa tional overhead, data utility and resistance to attack. In addition, the thesis includes a practical part where the chosen encryption and anony misation techniques are implemented and evaluated on a set of big data. The evaluation includes performance metrics such as data encryption/decryption time, data loss during anonymisation, and the ability of anonymisation to preserve data utility. The results of this dissertation contribute to a better understanding of Big Data encryption and anonymisation strategies, and also provide researchers and practitioners with information on how to choose the most appropriate approaches to protect sensitive data in environments using Big Data. By considering encryption and anonymisation strategies for a variety of Big Data use cases, the results highlight how critical it is to find a healthy balance between data protection and potential use.porBig DataData encryptionNetwork securityData encryptionTécnicas de encriptação e anonimização para Big DataEncryption and anonymisation techniques for Big Datamaster thesis203413300