Repository logo
 
Publication

Aprendizagem por reforço robusta baseada em visão para navegação de UAVs em parques fotovoltaicos

datacite.subject.fosEngenharia e Tecnologia
datacite.subject.sdg09:Indústria, Inovação e Infraestruturas
dc.contributor.advisorMalheiro, Maria Benedita Campos Neves
dc.contributor.advisorPinto, Andry Maykol
dc.contributor.authorCAMPANHÃ, JOÃO FERREIRA
dc.date.accessioned2025-12-17T15:25:56Z
dc.date.available2025-12-17T15:25:56Z
dc.date.issued2025-10-27
dc.description.abstractThis dissertation proposes and validates a robust Reinforcement Learning (RL) method for visual navigation of Unmanned Aerial Vehicles (UAVs) tasked to inspect floating photovoltaic panel arrays in the Alqueva reservoir, using simulation-based development and testing. Panel inspection requires low-altitude flights, and the dynamic nature of the floating environment renders waypoint-based planning ineffective, requiring the method to operate under varied conditions and resist visual disturbances. To address these challenges, the study compares two feature extraction architectures: a vision-based model and a multimodal data model that combines visual data with numerical inputs, including actions and velocities. The Soft Actor-Critic (SAC) policy was selected to process the latent state produced by the feature extractors. Following training with domain randomization, results showed that the multimodal model that combines visual and action inputs outperforms other variants in accuracy, control, and task completion. However, its robustness to visual perturbations remained somewhat limited. To address this shortcoming, the domain randomization was refined, the model retrained with appropriate regularization, and the hyperparameters tuned, significantly improving robustness at the cost of a slight reduction in overall performance. This work contributes with a modular simulation pipeline for training and validation, a comparative analysis between models exploring unimodal and multimodal data, and practical insights into the accuracy–robustness trade-off in Reinforcement Learning (RL). Domain randomization and data multimodality were fundamental to improving model performance and generalization.eng
dc.description.abstractEsta dissertação propõe e valida um método robusto de Reinforcement Learning (RL) para navegação visual de UAVs encarregues de inspecionar painéis fotovoltaicos flutuantes na albufeira de Alqueva, utilizando desenvolvimento e testes baseados em simulação. A inspeção dos painéis requer voos a baixa altitude, e a natureza dinâmica do ambiente flutuante torna ineficaz o planeamento baseado em pontos de referência, exigindo que o método opere em condições variadas e resista a perturbações visuais. Para enfrentar estes desafios, o estudo compara duas arquiteturas de extração de características: um modelo unimodal baseado em visão e um modelo multimodal que combina dados visuais com entradas numéricas, nomeadamente ações e velocidades. A política Soft Actor-Critic (SAC) foi selecionada para processar o estado latente produzido pelos extratores de características. Após o treino com randomização de domínio, os resultados mostraram que o modelo multimodal que combina entradas visuais e ações supera as restantes variantes em precisão, controlo e conclusão da tarefa. No entanto, a sua robustez a perturbações visuais permaneceu algo limitada. Para superar esta deficiência, a randomização de domínio foi melhorada, o modelo foi retreinado com regularização apropriada e os hiperparâmetros foram ajustados, melhorando significativamente a robustez à custa de uma ligeira redução no desempenho geral. Este trabalho contribui com um pipeline modular de simulação para treino e validação, uma análise comparativa entre modelos que exploram dados unimodais e multimodais, e perspetivas práticas sobre o compromisso entre precisão e robustez em Reinforcement Learning (RL). A randomização do domínio e a multimodalidade dos dados foram fundamentais para melhorar o desempenho e a generalização do modelo.por
dc.identifier.tid204067367
dc.identifier.urihttp://hdl.handle.net/10400.22/31239
dc.language.isoeng
dc.rights.uriN/A
dc.subjectReinforcement Learning
dc.subjectVisual navigation
dc.subjectUnmanned Aerial Vehicles (UAVs)
dc.subjectDomain Randomization
dc.subjectPhotovoltaic (PV) array inspection
dc.subjectMultimodal learning
dc.subjectSimulation
dc.subjectAprendizagem por Reforço (RL)
dc.subjectNavegação visual
dc.subjectVeículos Aéreos Não Tripulados (UAVs)
dc.subjectInspeção de painéis Fotovoltaicos (PV)
dc.subjectAprendizagem multimodal
dc.subjectSimulação
dc.titleAprendizagem por reforço robusta baseada em visão para navegação de UAVs em parques fotovoltaicos
dc.title.alternativeRobust Vision-Based Deep Reinforcement Learning for UAV Inspection of Floating Photovoltaic Farmseng
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameMestrado em Engenharia Electrotécnica e de Computadores

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tese_6066_v3.pdf
Size:
140.09 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: