Conceição, Luís Manuel SilvaFRANCO, GUILHERME LIMA2025-11-142025-11-142025-10-14http://hdl.handle.net/10400.22/30912Modern organisations increasingly struggle to access and interpret enterprise data that is dispersed across isolated Business Information Systems (BIS). These silos hinder the ability to obtain a unified view of information, which is essential for timely and informed decisionmaking. Advances in Large Language Models (LLMs) offer the possibility of querying such data in natural language, thereby lowering the technical barrier for business users. However, the adoption of these models in corporate environments is constrained by concerns over data privacy, regulatory compliance, and the high operational costs of cloud-based solutions. These challenges underline the need for on-premises, resource-efficient approaches that preserve control over sensitive information. This dissertation presents an intelligent virtual assistant that answers business questions by orchestrating Model Context Protocol (MCP) tools to inspect schemas, draft explicitprojection SQL, validate read-only execution, and ground responses in results from a local Microsoft SQL Server instance of AdventureWorksDW2022. No model fine-tuning is performed; instead, the approach combines runtime schema filtering, deny-list validation, and prompt scaffolding to minimise hallucinations and enforce governance. A controlled evaluation over 52 representative prompts compares three configurations: a prompt-only baseline (B0), MCP with unfiltered schemas (B1), and a curated setup with filtering and explicit projections (S). The curated configuration yields substantially higher execution accuracy and fewer schema-error incidents than both baselines, demonstrating that governed tool use materially increases correctness without relaxing the privacy posture on a single on-premises workstation. Latency observations are reported descriptively and are attributable primarily to model generation rather than orchestration. These findings support the feasibility of privacy-preserving, on-premises conversational analytics under the EU General Data Protection Regulation (GDPR) and the EU Artificial Intelligence Act (Regulation (EU) 2024/1689), and suggest practical next steps: broadening schema coverage, refining curation policies, and exploring lighter local models and decoding strategies to improve interactivity.As organizações modernas enfrentam dificuldades crescentes no acesso e na interpretação de dados empresariais dispersos por diferentes BIS. A fragmentação destes sistemas dificulta a obtenção de uma visão integrada da informação, essencial para apoiar decisões estratégicas e operacionais. Os avanços recentes em LLMs oferecem a possibilidade de interagir com esses dados em linguagem natural, reduzindo barreiras técnicas para os utilizadores de negócio. Contudo, a sua adoção em ambientes corporativos é limitada por preocupações relacionadas com a privacidade, a conformidade regulatória e os elevados custos de soluções baseadas na cloud. Estas restrições reforçam a relevância de abordagens locais (on-premises), concebidas para garantir eficiência de recursos e maior controlo sobre a informação sensível. Esta dissertação propõe um assistente virtual inteligente que responde a questões de negócio através da orquestração de ferramentas, via Model Context Protocol (MCP), que: (i) inspecionam o esquema da base de dados, (ii) geram instruções SQL com projeções explícitas, (iii) validam a execução em modo apenas-leitura e (iv) apresentam respostas ancoradas nos resultados de uma instância local do Microsoft SQL Server, com a base Adventure-WorksDW2022. Não é realizado qualquer fine-tuning do modelo; em alternativa, combinase filtragem de esquema em tempo de execução, validação por lista de exclusão (deny-list) e estruturação de prompts (prompt scaffolding) para reduzir alucinações e reforçar a governação. A avaliação controlada, baseada em 52 prompts representativos, compara três configurações: (B0) referência apenas com prompt; (B1) MCP com esquema não filtrado; e (S) configuração curada, com filtragem e projeções explícitas. A configuração curada demonstrou maior precisão de execução e menor ocorrência de erros de esquema, evidenciando que o uso governado de ferramentas melhora substancialmente a correção sem comprometer a privacidade, mesmo em hardware de baixo desempenho. As medições de latência foram analisadas de forma descritiva e atribuídas sobretudo ao tempo de geração do modelo, e não à orquestração. Os resultados obtidos confirmam a viabilidade de uma abordagem de analítica conversacional em ambiente local, capaz de preservar a privacidade e assegurar conformidade com o GDPR e com o Regulamento Europeu da Inteligência Artificial (Regulamento (UE) 2024/1689). O trabalho aponta ainda perspetivas futuras, como o alargamento da cobertura de esquemas, o aperfeiçoamento de políticas de curadoria e a exploração de modelos locais mais leves e estratégias de decodificação que reforcem a interatividade.engModel Context ProtocolLLMs LocaisPrivacidade dos DadosAssistente VirtualSistemas de Informação EmpresarialSQL ServerLocal LLMsData privacyVirtual assistantBusiness information systemAssistente virtual inteligente para acesso a dados de negócioIntelligent virtual assistant for business data accessmaster thesis204033500