| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 10.16 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
The developments brought by the transformer architecture have sparked a technological
revolution that created a wide range of possible use cases where these models are employed as
individuals responsible for handling a diverse array of tasks, from chatbots to more deterministic
such as API call and control. However, due to the novelty of these models there has been a lack
for standardization when developing proper, controlled real implementations. It is assumed that
the present time is considered to be an alchemy-like stage of large-language model usage, and
many dierent innovations are born almost every day and everywhere around the world. Great
investments are also being made on the field, and there has never been better time to dedicate
eorts into discovering and exploring the limits and capacities of this technology of the future.
Multi-agent systems belong to a domain of artificial intelligence that has been in the development
for many years resulting in refined and mature architectures, communication protocols, and
implementation paradigms. However, implementation might sometimes be diicult due to the
overhead required in orchestrating proper communication protocols, decision engines, and
agent architecture. Furthermore, agent-to-human communication is not always seamless since
most agents have programmatic-machine language which might not be easy for actors that are
not contextualized or are technically inclined to interact with.
This dissertation proposes a system that aims to fuse the capabilities of large-language models
to communicate through natural language and rationalize inputs with the capabilities that
distributed multi-agent systems oer to resolve tasks that might be present in industrial and
smart-building scenarios. Moreover, through the implementation of specific pieces of hardware,
referred below as tools, the proposed system tries to increase the degree of impact that decisions
made by large-language models have in the environment around them. The system proposed,
named “Augmented Reasoning Multi-Agent System” (ARMS), also allows users to communicate
directly with agents through natural language conversations facilitating information and desire
exchange. Agent-to-Agent communication is also deeply investigated and controlled using
specific techniques to manage communication flow and objective-oriented exchanges.
Besides a review of the state-of-the-art on topics related to the solution that culminates in a
discussion about large-language model-powered agents vs traditional agents, this thesis
includes five dierent that test the solution: basic task delegation, interconnected agents, user
registration system, vacation system, and building control. Each of these case studies were built
incrementally, meaning that the most basic and core principles were firstly tested on the first use
cases, culminating on a final one that integrated multiple components previously tested at a large
scale. The results from the case studies demonstrated positive results in achieving a multi-agent
system that can manipulate the world around it and establish human communication as needed,
leveraging large-language models’ capabilities for the decision-making processes, as well as
inter-connection.
Os avanços trazidos pela arquitetura transformer começaram uma revolução tecnológica que criou uma vasta gama de possíveis casos de uso, onde estes modelos são empregues como agentes responsáveis por lidar com uma diversidade de tarefas, desde chatbots até funções mais determinísticas como chamadas a APIs e controlo de sistemas informáticos. No entanto, devido à novidade destes modelos, existe uma ausência de normalização no desenvolvimento de implementações reais, devidamente controladas. Considera-se que o momento atual corresponde a uma fase de “alquimia” na utilização de modelos de “large-language models”, na qual surgem inovações quase diariamente. Estão também a ser feitos grandes investimentos nesta área, tornando este o melhor momento para dedicar esforços à descoberta e exploração dos limites e capacidades desta tecnologia do futuro. Os sistemas multiagente pertencem a um domínio da inteligência artificial que tem vindo a ser desenvolvido ao longo de vários anos, resultando em arquiteturas, protocolos de comunicação e paradigmas de implementação refinados e maduros. No entanto, a sua implementação pode ser difícil devido ao esforço necessário para orquestrar protocolos de comunicação adequados, motores de decisão e a própria arquitetura dos agentes. Além disso, a comunicação agentehumano nem sempre é intuitiva, uma vez que a maioria dos agentes recorre a linguagens programáticas ou de máquina, que podem não ser fáceis de compreender por utilizadores não técnicos ou não contextualizados. Esta dissertação propõe um sistema que visa fundir as capacidades dos modelos de linguagem de grande escala, nomeadamente a comunicação em linguagem natural e a capacidade de raciocinar sobre inputs, com as potencialidades dos sistemas multiagente distribuídos na resolução de tarefas em cenários industriais ou de edifícios inteligentes. Através da implementação de componentes de hardware específicos, abaixo designados por “Tools”, o sistema proposto procura aumentar o grau de impacto que as decisões tomadas pelos “largelanguage models” têm no meio que os rodeia. O sistema implementado e aqui proposto, denominado por “Augmented Reasoning Multi-Agent System” (ARMS), permite ainda que os utilizadores comuniquem diretamente com os agentes através de conversas em linguagem natural, facilitando a troca de informação e de intenções. A comunicação agente-agente é também objeto de investigação aprofundada, sendo controlada através de técnicas específicas que regulam o fluxo de informação e as interações orientadas aos objetivos. Para além de uma revisão do estado da arte nos tópicos relacionados com a solução, que culmina numa discussão sobre agentes potenciados por “large-language models” versus agentes tradicionais, esta tese apresenta cinco casos de estudo que testam a solução proposta.
Os avanços trazidos pela arquitetura transformer começaram uma revolução tecnológica que criou uma vasta gama de possíveis casos de uso, onde estes modelos são empregues como agentes responsáveis por lidar com uma diversidade de tarefas, desde chatbots até funções mais determinísticas como chamadas a APIs e controlo de sistemas informáticos. No entanto, devido à novidade destes modelos, existe uma ausência de normalização no desenvolvimento de implementações reais, devidamente controladas. Considera-se que o momento atual corresponde a uma fase de “alquimia” na utilização de modelos de “large-language models”, na qual surgem inovações quase diariamente. Estão também a ser feitos grandes investimentos nesta área, tornando este o melhor momento para dedicar esforços à descoberta e exploração dos limites e capacidades desta tecnologia do futuro. Os sistemas multiagente pertencem a um domínio da inteligência artificial que tem vindo a ser desenvolvido ao longo de vários anos, resultando em arquiteturas, protocolos de comunicação e paradigmas de implementação refinados e maduros. No entanto, a sua implementação pode ser difícil devido ao esforço necessário para orquestrar protocolos de comunicação adequados, motores de decisão e a própria arquitetura dos agentes. Além disso, a comunicação agentehumano nem sempre é intuitiva, uma vez que a maioria dos agentes recorre a linguagens programáticas ou de máquina, que podem não ser fáceis de compreender por utilizadores não técnicos ou não contextualizados. Esta dissertação propõe um sistema que visa fundir as capacidades dos modelos de linguagem de grande escala, nomeadamente a comunicação em linguagem natural e a capacidade de raciocinar sobre inputs, com as potencialidades dos sistemas multiagente distribuídos na resolução de tarefas em cenários industriais ou de edifícios inteligentes. Através da implementação de componentes de hardware específicos, abaixo designados por “Tools”, o sistema proposto procura aumentar o grau de impacto que as decisões tomadas pelos “largelanguage models” têm no meio que os rodeia. O sistema implementado e aqui proposto, denominado por “Augmented Reasoning Multi-Agent System” (ARMS), permite ainda que os utilizadores comuniquem diretamente com os agentes através de conversas em linguagem natural, facilitando a troca de informação e de intenções. A comunicação agente-agente é também objeto de investigação aprofundada, sendo controlada através de técnicas específicas que regulam o fluxo de informação e as interações orientadas aos objetivos. Para além de uma revisão do estado da arte nos tópicos relacionados com a solução, que culmina numa discussão sobre agentes potenciados por “large-language models” versus agentes tradicionais, esta tese apresenta cinco casos de estudo que testam a solução proposta.
Description
Keywords
Large-language models Multi-agent systems Digitalization Retrieval-Augmented Generation Sistemas multiagente Digitalização
