Repository logo
 
Publication

Reutilização de Processos de Descoberta de Conhecimento

datacite.subject.fosSistemas de Informação e Conhecimentopt_PT
dc.contributor.advisorOliveira, Paulo Jorge Machado
dc.contributor.authorSousa, Ricardo Filipe Marques de
dc.date.accessioned2018-03-16T10:19:22Z
dc.date.available2019-11-25T01:30:31Z
dc.date.issued2016
dc.description.abstractNesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes necessita, de ajustes quando essas fontes são trocadas por outras pertencentes ao mesmo domínio, uma vez que as fontes de dados anteriores e as novas raramente possuem o mesmo esquema de dados associado. Esses ajustes por vezes fazem com que o analista dispense mais tempo a reformular a configuração do processo implementado anteriormente. As ferramentas de descoberta de conhecimento existentes permitem que seja executado o processo, mas em nenhuma delas é possível efetuar a troca da fonte de dados e, de uma forma automatizada, criar e ajustar os componentes para que possa ser usado o mesmo processo de descoberta de conhecimento, excetuando os casos em que os esquemas de ambas são rigorosamente iguais. Esta limitação levou à criação de uma solução que permite complementar as ações das ferramentas de descoberta de conhecimento e, desta forma, simplificar a atuação do analista. A solução desenvolvida foi implementada em C# e permite adaptar o esquema da nova fonte de dados ao processo de descoberta de conhecimento previamente definido, com base na fonte anterior, criando e utilizando os componentes especificados anteriormente. Esta nova solução permite uma maior rapidez no processo de reutilização de um processo de descoberta de conhecimento em novas fontes de dados pertencentes ao mesmo domínio.pt_PT
dc.description.abstractThis thesis presents a proof of concept aiming to automate the adaptation of a process of knowledge discovery previously defined to the new data source. The Knowledge discovery process can use one or more data sources, and most of time they require adjustments when the data source is exchanged for another one with different schema, but related with the same domain. These adjustments sometimes take a lot of time from analyst due to the need to reshape the process configuration created for the old data source. The existing tools allow the process to run, but none of them can be used to exchange data source and readjust the process by an automatic method, allowing the creation of new components and redefine the previously implemented components, in order to get the same structure of previous data source. To overcome this limitation, a new solution was developed which not only makes the KDD tools more user friendly but also allows the simplification of the actions needed by analyst. The developed solution was implemented in C# and allows the new data source to be adjusted to the target schema, based on the previous data source, creating and reusing used previous existing components. This solution allows for greater speed in the adjustment process of the new data source within the same domain.pt_PT
dc.identifier.tid201750724pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.22/11144
dc.language.isoporpt_PT
dc.subjectData Miningpt_PT
dc.subjectDescoberta de Conhecimentopt_PT
dc.subjectC#pt_PT
dc.subjectClemScriptpt_PT
dc.subjectIBM SPSS Modelerpt_PT
dc.subjectWEKApt_PT
dc.titleReutilização de Processos de Descoberta de Conhecimentopt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia InformƔticapt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DM_RicardoSousa_2016_MEI.pdf
Size:
5.06 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: