Repository logo
 
Publication

Fluxo de dados e monitorização da avaliação de uma ferramenta de inteligência artificial generativa

datacite.subject.fosEngenharia e Tecnologiapt_PT
dc.contributor.advisorAraújo, Susana Cláudia Nicola de
dc.contributor.authorRodrigues, Beatriz Vaz
dc.date.accessioned2024-09-06T13:47:03Z
dc.date.embargo2027-09-06
dc.date.issued2024-07-10
dc.description.abstractA transformação digital é, atualmente, um fenómeno incontestável, onde as empresas procuram solucionar problemas, utilizando tecnologias digitais para impulsionar o desempenho operacional. Deste modo, a inteligência artificial generativa desempenha um papel crucial na transformação digital, uma vez que esta oferece capacidades de automação avançadas e auxiliam a tomada de decisão. A inteligência artificial generativa impulsiona assim a inovação e a competitividade das empresas. O projeto de dissertação foi realizado em contexto empresarial, e teve como principal objetivo a implementação de uma solução de business intelligence que permita agregar, numa só plataforma, toda a informação relativa ao processo de avaliação de uma ferramenta de inteligência artificial generativa. Para isso, definiu-se indicadores chave de desempenho, que possam auxiliar na monitorização do avaliador. Para além disso, outro objetivo do projeto é a construção de uma pipeline de dados que consiga gerir e otimizar o fluxo do processo de avaliação. A ferramenta de inteligência artificial generativa em estudo, denomina-se Rookie, e é avaliada através de um processo chamado Ragas, composto por três etapas principais, a geração, a inferência e a avaliação. Inicialmente, foi concebida uma pipeline teste para validação do funcionamento da mesma e das ferramentas selecionadas, no entanto, para utilização dos dados históricos disponibilizados pela empresa, a mesma foi adaptada. Desta forma, os dados históricos fornecidos pela empresa foram analisados e, através dessa mesma análise, retirou-se algumas conclusões relativamente aos mesmos. Posto isto, realizou-se a limpeza, manipulação e transformações necessárias aos mesmos para que no fim do processo estivessem prontos para análise. Por fim, foi construída uma ferramenta de gestão em Power BI, que permite monitorizar indicadores relativos ao processo de avaliação do Rookie. Os dashboards desenvolvidos, contam com indicadores desenvolvidos para suprir as necessidades transmitidas pela empresa, possibilitando por exemplo a avaliação do desempenho de cada documento utilizado e consequente perceção se apresenta debilidades no processamento, ingestão ou até mesmo na informação contida no mesmo. Esta ferramenta, ainda permite aceder a uma página que monitoriza a soma do Answer Relevancy, Faithfulness, Context Precision e Context Recall a cada observação realizada, oferecendo paralelamente uma perspetiva sobre os documentos mais utilizados no processo de avaliação, sendo que possui ainda mais duas abas para análise. Com base na ferramenta de monitorização desenvolvida, será expectável que ocorra a melhoria do processo de gestão e análise de dados relativos ao processo de avaliação do Rookie, além de potenciar a facilidade no acesso à informação e consequente tratamento e avaliação da mesma, de acordo com os resultados definidos pela empresa.pt_PT
dc.description.abstractDigital transformation is undeniably a phenomenon, where companies seek to solve problems, using digital technologies to boost operational performance. In this way, generative artificial intelligence plays a crucial role in digital transformation, as it offers advanced automation capabilities and helps decision-making. Generative artificial intelligence thus boosts the innovation and competitiveness of companies. The dissertation project was carried out in a business context, and its main objective was to implement a business intelligence solution that allows the aggregation, on a single platform, of all information relating to the evaluation process of a generative artificial intelligence tool. To this end, key performance indicators were defined, which can assist the evaluator in monitoring. Furthermore, another objective of the project is the construction of a data pipeline that can manage and optimize the flow of the evaluation process. The generative artificial intelligence tool under study is called Rookie and is evaluated through a process called Ragas, composed of three main stages, generation, inference, and evaluation. Initially, a test pipeline was designed to validate its operation and the selected tools, however, to use the historical data made available by the company, it was adapted. In this way, the historical data provided by the company was analyzed and, through this same analysis, some conclusions were drawn regarding them. That said, the necessary cleaning, manipulation, and transformations were carried out so that at the end of the process they were ready for analysis. Finally, a management tool was built in Power BI, which allows monitoring indicators related to the Rookie evaluation process. The dashboards developed have indicators developed to meet the needs conveyed by the company, enabling, for example, the evaluation of the performance of each document used and the consequent perception of whether there are weaknesses in the processing, ingestion, or even in the information contained there. This tool also allows access to a page that monitors the sum of Answer Relevancy, Faithfulness, Context Precision and Context Recall for each observation carried out, offering at the same time a perspective on the documents most used in the evaluation process, and has two more tabs for analysis. Based on the monitoring tool developed, it is expected that the process of managing and analyzing data relating to the Rookie evaluation process will be improved, in addition to enhancing the ease of access to information and the consequent treatment and evaluation of it following the results defined by the company.pt_PT
dc.identifier.tid203690869pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.22/25930
dc.language.isoporpt_PT
dc.subjectDigital Transformationpt_PT
dc.subjectPipelinespt_PT
dc.subjectGenerative ArtificiaI Intelligencept_PT
dc.subjectMonitoringpt_PT
dc.subjectBusiness Intelligencept_PT
dc.subjectTransformação digitalpt_PT
dc.subjectIntelligência artificila generativapt_PT
dc.subjectMonitorizaçãopt_PT
dc.titleFluxo de dados e monitorização da avaliação de uma ferramenta de inteligência artificial generativapt_PT
dc.title.alternativeData flow and monitoring of evaluation of a generative artificial intelligence toolpt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsembargoedAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia e Gestão da Cadeia de Abastecimentopt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Tese_5197_v2.pdf
Size:
5.95 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: