Name: | Description: | Size: | Format: | |
---|---|---|---|---|
5.76 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
While conventional 2D telepresence platforms like Zoom and Microsoft Teams have become
commonplace, they lack key real-world interaction cues. To bridge this gap, Extended Reality
(XR) telepresence has emerged, using immersive wearables for more natural collaboration.
However, the intensive Graphics Processing Unit (GPU) processing required by XR often
exceeds the limited compute power and battery life of client devices, leading to poor frame
rates. Therefore, the common architectural solution is to offload these demanding workloads
to the network edge to satisfy strict low-latency requirements.
Kubernetes, the standard platform for orchestrating and deploying containerized applications,
was originally designed for cloud-centric stateless architectures with load-based scaling. This
model conflicts with the demands of XR telepresence systems, which require session-aware
scaling for user-shared sessions and stable network identities for persistent, stateful workloads.
This need for dynamic orchestration is further complicated by low-latency Quality of
Experience (QoE) requirements that force computation to the network edge. While existing
research addresses enabling Kubernetes at the edge, these studies are often generic, crucially
lacking the session-awareness required for telepresence.
This dissertation’s primary objective is to bridge the gap between Kubernetes and the demands
of XR telepresence. The goal is to design a system that abstracts infrastructure
complexity and automates session lifecycle management. This will allow an application’s
runtime to dynamically schedule, scale, and place compute resources to optimize for user
latency and session demands.
This dissertation follows a design and creation research strategy, structured in key phases:
design, implementation, and evaluation. The initial phase was informed by a state of the art
review, which was conducted with a systematic methodology. This review was driven by two
primary research questions: the first investigated the architectural design of XR telepresence
systems, while the second explored how these applications could be deployed to Kubernetes.
The contributions of this work are twofold. First, a state of the art review of 28 studies
identified a significant gap in current research: while tools exist for generic multi-cluster management,
they lack the specific session-awareness required for XR telepresence workloads.
Second, to fill this gap, the main contribution is a framework that extends Kubernetes using
the Operator Pattern, introducing custom controllers that make the platform session-aware.
The evaluation of this framework demonstrated significant performance improvements when
compared against baseline implementations. With the proposed solution, nearly 100% of
clients connect to a session in under 15 seconds, whereas clients in baseline cases often take
several minutes. Furthermore, the framework showcases inferior memory utilization under
dynamic client loads, reducing consumption by up to 50% due to its garbage collection
mechanisms.
A notória diferença entre a comunicação no mundo real e a que se experiencia em plataformas de telepresença convencionais, como o Zoom e o Microsoft Teams, impulsiona a transição para uma era de interações mais imersivas. Estas tiram partido das interfaces de realidade estendida (XR), suportadas por dispositivos como o Microsoft HoloLens e o Meta Quest, que visam uma colaboração mais próxima do natural. Este formato de comunicação permite que aspetos como o olhar, a linguagem corporal e o áudio espacial sejam replicados no ambiente de interação, superando assim as limitações dos formatos tradicionais, onde a atenção dos utilizadores se cinge a uma grelha de vídeos. A telepresença em XR pode, contudo, adotar múltiplas configurações, que a literatura posiciona ao longo do chamado contínuo da realidade-virtualidade. Estas modalidades vão desde Ambientes Virtuais Colaborativos (CVEs) totalmente imersivos, onde os utilizadores interagem através de avatares num mundo gerado por computador, até sistemas de Realidade Mista (MR) assimétricos, que fundem os espaços físico e virtual. O Kubernetes, a plataforma de referência para a implantação de aplicações que tiram partido de conteinerização, foi inicialmente desenvolvido para arquiteturas stateless orientadas para a cloud, nas quais a provisão de recursos responde ao aumento da carga. Por outro lado, os sistemas de telepresença requerem um modelo de orquestração distinto. No seu núcleo reside o conceito de sessão, que define um espaço de interação para um grupo de utilizadores. Deste modo, a gestão dos recursos da infraestrutura deve ser realizada em função da atividade das sessões, necessitando que a plataforma gira dinamicamente os Pods à medida que os utilizadores se juntam ou abandonam uma sessão. Adicionalmente, estas cargas de trabalho, cujo estado é relevante (stateful), exigem endereços de rede fixos para garantir a persistência das ligações, um requisito que entra em conflito com o funcionamento padrão do Kubernetes. A necessidade de uma orquestração dinâmica e orientada às sessões torna-se ainda mais complexa pela infraestrutura exigida para cumprir os requisitos de baixa latência, que impõe que a computação seja colocada na edge. Embora a investigação existente aborde o desafio de estender o Kubernetes para a edge, estes estudos são, na sua maioria, genéricos. De forma crucial, não consideram o contexto específico da telepresença, onde a noção de sessão tem de ser integrada diretamente no plano da infraestrutura. O objetivo primordial desta dissertação é colmatar a lacuna identificada entre as capacidades do Kubernetes e os requisitos específicos das cargas de trabalho de telepresença em XR. A meta consiste na conceção e implementação de um conjunto de mecanismos capazes de abstrair a complexidade inerente aos serviços e à infraestrutura. Este trabalho visa, assim, criar um sistema que promova a gestão automatizada da infraestrutura necessária. Tal sistema permitirá que o tempo de execução de uma aplicação possa, de forma dinâmica, alocar recursos computacionais, ajustá-los em função da atividade da sessão e distribuí-los por localizações que otimizem a latência para o utilizador. A presente dissertação segue uma metodologia de investigação composta pelas fases de conceção, implementação e avaliação. A fase inicial de conceção foi fundamentada por uma análise do estado da arte, conduzida através de uma metodologia sistemática. Esta análise foi orientada por duas questões de investigação primordiais: a primeira incidiu sobre a arquitetura dos sistemas de telepresença em XR, enquanto a segunda explorou de que forma é que estas aplicações podem ser implantadas no Kubernetes. Este trabalho apresenta duas contribuições principais. Em primeiro lugar, uma análise ao estado da arte que abrangeu 28 estudos identificou uma lacuna na investigação atual: embora existam ferramentas para a gestão genérica de múltiplos clusters, estas carecem de suporte para aplicações com cargas de trabalho centradas no conceito de sessão. Para colmatar esta lacuna, o principal contributo consiste num framework que estende o Kubernetes através do Operator Pattern, introduzindo controladores especializados no domínio da telepresença que permitem à plataforma sensibilidade às sessões. A avaliação deste framework revelou melhorias de desempenho significativas quando comparado com implementações de referência. Com a solução proposta, perto de 100% dos clientes acedem a uma sessão em menos de 15 segundos, enquanto que nos cenários de referência este processo chega a demorar vários minutos. Adicionalmente, o framework apresenta um menor consumo de memória sob cargas dinâmicas de clientes, alcançando uma redução de até 50% devido aos seus mecanismos de garbage collection.
A notória diferença entre a comunicação no mundo real e a que se experiencia em plataformas de telepresença convencionais, como o Zoom e o Microsoft Teams, impulsiona a transição para uma era de interações mais imersivas. Estas tiram partido das interfaces de realidade estendida (XR), suportadas por dispositivos como o Microsoft HoloLens e o Meta Quest, que visam uma colaboração mais próxima do natural. Este formato de comunicação permite que aspetos como o olhar, a linguagem corporal e o áudio espacial sejam replicados no ambiente de interação, superando assim as limitações dos formatos tradicionais, onde a atenção dos utilizadores se cinge a uma grelha de vídeos. A telepresença em XR pode, contudo, adotar múltiplas configurações, que a literatura posiciona ao longo do chamado contínuo da realidade-virtualidade. Estas modalidades vão desde Ambientes Virtuais Colaborativos (CVEs) totalmente imersivos, onde os utilizadores interagem através de avatares num mundo gerado por computador, até sistemas de Realidade Mista (MR) assimétricos, que fundem os espaços físico e virtual. O Kubernetes, a plataforma de referência para a implantação de aplicações que tiram partido de conteinerização, foi inicialmente desenvolvido para arquiteturas stateless orientadas para a cloud, nas quais a provisão de recursos responde ao aumento da carga. Por outro lado, os sistemas de telepresença requerem um modelo de orquestração distinto. No seu núcleo reside o conceito de sessão, que define um espaço de interação para um grupo de utilizadores. Deste modo, a gestão dos recursos da infraestrutura deve ser realizada em função da atividade das sessões, necessitando que a plataforma gira dinamicamente os Pods à medida que os utilizadores se juntam ou abandonam uma sessão. Adicionalmente, estas cargas de trabalho, cujo estado é relevante (stateful), exigem endereços de rede fixos para garantir a persistência das ligações, um requisito que entra em conflito com o funcionamento padrão do Kubernetes. A necessidade de uma orquestração dinâmica e orientada às sessões torna-se ainda mais complexa pela infraestrutura exigida para cumprir os requisitos de baixa latência, que impõe que a computação seja colocada na edge. Embora a investigação existente aborde o desafio de estender o Kubernetes para a edge, estes estudos são, na sua maioria, genéricos. De forma crucial, não consideram o contexto específico da telepresença, onde a noção de sessão tem de ser integrada diretamente no plano da infraestrutura. O objetivo primordial desta dissertação é colmatar a lacuna identificada entre as capacidades do Kubernetes e os requisitos específicos das cargas de trabalho de telepresença em XR. A meta consiste na conceção e implementação de um conjunto de mecanismos capazes de abstrair a complexidade inerente aos serviços e à infraestrutura. Este trabalho visa, assim, criar um sistema que promova a gestão automatizada da infraestrutura necessária. Tal sistema permitirá que o tempo de execução de uma aplicação possa, de forma dinâmica, alocar recursos computacionais, ajustá-los em função da atividade da sessão e distribuí-los por localizações que otimizem a latência para o utilizador. A presente dissertação segue uma metodologia de investigação composta pelas fases de conceção, implementação e avaliação. A fase inicial de conceção foi fundamentada por uma análise do estado da arte, conduzida através de uma metodologia sistemática. Esta análise foi orientada por duas questões de investigação primordiais: a primeira incidiu sobre a arquitetura dos sistemas de telepresença em XR, enquanto a segunda explorou de que forma é que estas aplicações podem ser implantadas no Kubernetes. Este trabalho apresenta duas contribuições principais. Em primeiro lugar, uma análise ao estado da arte que abrangeu 28 estudos identificou uma lacuna na investigação atual: embora existam ferramentas para a gestão genérica de múltiplos clusters, estas carecem de suporte para aplicações com cargas de trabalho centradas no conceito de sessão. Para colmatar esta lacuna, o principal contributo consiste num framework que estende o Kubernetes através do Operator Pattern, introduzindo controladores especializados no domínio da telepresença que permitem à plataforma sensibilidade às sessões. A avaliação deste framework revelou melhorias de desempenho significativas quando comparado com implementações de referência. Com a solução proposta, perto de 100% dos clientes acedem a uma sessão em menos de 15 segundos, enquanto que nos cenários de referência este processo chega a demorar vários minutos. Adicionalmente, o framework apresenta um menor consumo de memória sob cargas dinâmicas de clientes, alcançando uma redução de até 50% devido aos seus mecanismos de garbage collection.
Description
Keywords
Telepresence Extended Reality Kubernetes Edge Computing