Repository logo
 
Loading...
Thumbnail Image
Publication

Transformação de Comandos de Voz em Pesquisas Estruturadas

Use this identifier to reference this record.
Name:Description:Size:Format: 
Tese_6120.pdf5.28 MBAdobe PDF Download

Abstract(s)

Com o aumento da interação entre seres humanos e computadores e o progressivo avanço das tecnologias de inteligência artificial (IA), surge a necessidade de sistemas mais eficientes que proporcionem uma experiência natural e adaptÔvel aos utilizadores. Esta dissertação explora o desenvolvimento de uma aplicação que converte texto livre (potencialmente proveniente de comandos de voz) em consultas estruturadas no formato GraphQL para o contexto de pontos de interesse (POI). A solução proposta engloba uma aplicação de modelos linguísticos avançados (LLMs) e integração com serviços em nuvem (AWS), visando garantir escalabilidade e precisão na execução do sistema. A tarefa envolve examinar e comparar diferentes modelos de IA disponíveis para ajustar o modelo escolhido de acordo com as necessidades do projeto por meio de técnicas de ajustes finos personalizados (fine-tuning). A solução criada é capaz de se integrar flexivelmente com Interface de Programação de Aplicações (APIs) em GraphQL para permitir consultas avançadas com base em texto livre. Além disso o sistema foi validado por meio de avaliações prÔticas e de usabilidade, para mostrar sua viabilidade técnica como a sua eficiência no processamento das solicitações. Os resultados obtidos evidenciam o potencial desta abordagem para aprimorar a interação entre humanos e computadores em diferentes cenÔrios, indicando caminhos para pesquisas futuras que ampliem o modelo para outras Ôreas e contextos de aplicação.
With the increase in interaction between humans and computers and the progressive advancement of artificial intelligence (AI) technologies, there is a need for more efficient systems that provide a natural and adaptable experience for users. This dissertation explores the development of an application that converts free text (potentially from voice commands) into structured queries in GraphQL format for the context of points of interest (POI). The proposed solution encompasses the application of advanced linguistic models (LLMs) and integration with cloud services (AWS), aiming to ensure scalability and accuracy in the system's execution. The task involves examining and comparing different AI models available to adjust the chosen model according to the project's needs through customized fine-tuning techniques. The solution created is capable of flexibly integrating with Application Programming Interfaces (APIs) in GraphQL to enable advanced queries based on free text. In addition, the system was validated through practical and usability evaluations to demonstrate its technical feasibility and efficiency in processing requests. The results obtained highlight the potential of this approach to improve human-computer interaction in different scenarios, indicating avenues for future research that extend the model to other areas and application contexts.

Description

Keywords

Artificial Intelligence Natural Language Processing GraphQL Cloud Computing Points of Interest Large-Scale Language Models Inteligência Artificial Processamento de Linguagem Natural Computação em Nuvem Pontos de Interesse Modelos de Linguagem de Grande Escala

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License

Without CC licence