Repository logo
 
Publication

Full-Stack Data Governance

dc.contributor.advisorOliveira, Paulo Jorge Machado
dc.contributor.authorPinto, David Sousa
dc.date.accessioned2023-09-01T08:24:38Z
dc.date.embargo2026-07-21
dc.date.issued2023
dc.description.abstractCom a modernização da tecnologia existente, assistiu-se a uma evolução constante dos sistemas de informação das mais variadas organizações, criando uma cultura virada para os dados, assumindo estes o papel de um dos bens mais valiosos dos dias de hoje. A crescente produção de informação induziu a chegada de um paradigma de too much data, em que a gestão de informação se tornou insustentável e o processo de tomada de decisão moroso. Um traço definidor deste paradigma é a existência de silos de informação ou, por outras palavras, de uma arquitetura de dados fragmentada. Isto é, a informação existe, muitas vezes, de forma duplicada e/ou tendo por base estruturas e processamentos dispares. Urge, então, criar soluções para uniformizar a consulta de informação (através de Data Warehouses, Data Lakes, etc.) e ativar estruturas de Governo para a mesma (e.g., Data Owners, Data Stewards, Data Custodians, etc.), para que os consumidores de informação tenham confiança nos dados que estão a trabalhar e consigam agilizar o processo de tomada de decisão. Neste sentido, esta dissertação estuda o assunto Data Governance e algumas plataformas de Data Governance, desenvolvendo uma solução numa dessas plataformas, Collibra. Deste modo, para se perceber as vantagens da solução preconizada em relação à atual, a solução é analisada e comparada usando métricas para avaliar atributos de qualidade e levantar possíveis melhorias ás soluções analisadas. Deste trabalho resulta a implementação End-to-End de Data Governance em Collibra que proporciona uma maior facilidade de trabalho, num ambiente mais amigável e com melhor desempenho, comprovado pelas métricas avaliadas e a documentação de todo o processo de desenvolvimento da mesma.pt_PT
dc.description.abstractWith the modernization of existing technology, there has been a constant evolution of the information systems of the most celebrated organizations, creating a culture focused on data, assuming these the role of one of the most valuable assets of today. The growing production of information induced the arrival of a too much data paradigm, in which information management became unsustainable and the decision-making process slow. A defining feature of this paradigm is the existence of information silos or, in other words, a fragmented data architecture. That is, information often exists in duplicate and/or based on disparate structures and processes. Therefore, it is urgent to create solutions to standardize the query of information (through Data Warehouses, Data Lakes, etc.) and activate Government structures for the same (e.g., Data Owners, Data Stewards, Data Custodians, etc.), so that information consumers have confidence in the data they are working with and are able to streamline the decision-making process. In this sense, this dissertation studies the subject of Data Governance and some Data Governance platforms, developing a solution on one of these platforms, Collibra. Thus, in order to understand the advantages of the recommended solution in relation to the current one, the solution is analyzed and compared using metrics to evaluate quality attributes and raise possible improvements to the analyzed solutions. This work resulted in the End-to-End implementation of Data Governance in Collibra, which provides greater ease of work, in a friendlier environment and with better performance, as evidenced by the evaluated metrics and the documentation of the entire development process.pt_PT
dc.identifier.tid203349326pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.22/23442
dc.language.isoporpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/pt_PT
dc.subjectData Governancept_PT
dc.subjectCollibrapt_PT
dc.subjectData Managementpt_PT
dc.subjectData Stewardshippt_PT
dc.subjectMetadatapt_PT
dc.subjectData Lineagept_PT
dc.subjectData Catalogpt_PT
dc.titleFull-Stack Data Governancept_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsembargoedAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia Informática - Sistemas Computacionaispt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DM_DavidPinto_2023_MEI.pdf
Size:
8.96 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: