Name: | Description: | Size: | Format: | |
---|---|---|---|---|
DM_BrunoOliveira_MEI_2011 | 2.46 MB | Adobe PDF |
Abstract(s)
Um Sistema de Data Warehousing (SDW) armazena dados de uma forma integrada e consistente, o
que o torna num repositório de dados ideal para o apoio aos vários tipos de decisão existentes numa
organização. No entanto, para manter este repositório devidamente actualizado é necessário aceder a
um conjunto variado de sistemas fontes, transformar a informação que deles é extraída, e de acordo
com os requisitos do negócio e caraterísticas do modelo de armazenamento de dados de um SDW,
proceder à sua adequada alimentação. Estas tarefas, geralmente designadas por Extracção,
Transformação e Alimentação, são normalmente complexas e requerem uma grande quantidade de
recursos computacionais operando numa janela temporal limitada. O objectivo desta dissertação passa
por apresentar uma abordagem não convencional para a execução destas tarefas, em ambientes de
execução variados. É apresentada uma proposta de modelação lógica de um processo de ETL baseado
em Álgebra Relacional, de modo a implementar um modelo independentemente da plataforma de
execução, permitindo o seu posterior mapeamento em primitivas de programação, utilizando a
notação Business Process Model and Notation (BPMN) como base de modelação gráfica. É
apresentado um exemplo de uma infraestrutura que permite o aproveitamento do poder computacional
existente numa organização, através da utilização de uma GRID computacional, tendo como suporte o
standard de representação de dados presente na linguagem XML e a heterogeneidade de execução da
linguagem Java.
Description
Keywords
Sistemas de Data Warehousing Processos ETL Álgebra Relacional Java XML BPMN