Repository logo
 
Publication

Generating presentation documents from procedural resources

datacite.subject.fosEngenharia e Tecnologia
datacite.subject.sdg09:Indústria, Inovação e Infraestruturas
dc.contributor.advisorAzevedo, Isabel de Fátima Silva
dc.contributor.authorPACHECO, PEDRO RAFAEL FERREIRA
dc.date.accessioned2025-12-19T15:40:19Z
dc.date.available2025-12-19T15:40:19Z
dc.date.issued2025-10-31
dc.description.abstractThe creation of presentation slides from procedural documents is a repetitive and time consuming task that typically requires substantial manual e ort. This dissertation presents the design and development of a system that automates this process by converting procedural documents into structured and visually coherent presentation slides. The proposed solution integrates Natural Language Processing (NLP) techniques, text and image extraction and the use of local Large Language Model (LLM)s to perform summarization and content structuring. The system follows a modular pipeline composed of three main stages, extraction of textual and visual elements from Portable Document Format (PDF) documents, processing and structuring of the extracted content using LLMs based summarization and organization strategies and automatic generation of presentation slides in PowerPoint Open XML Presentation (PPTX) format, enriched with customizable themes. The implementation leverages open-source tools such as PyPDF2, pdfminer.six and python-pptx, while ensuring exible integration with di erent LLMs through the Ollama framework. Evaluation was carried out through unit, integration, functional and non-functional testing. The results con rmed that the system ful lls its functional requirements, reliably importing documents, generating coherent slides, supporting customization and export features. Nonfunctional testing highlighted strengths in usability and maintainability, while also exposing limitations in performance when using larger models, reliability under heavy load and the need for improved security hardening. This work proves the concept of value and feasibility in semi-automatic transformation of procedural documents into presentations. The proposed system reduces the time and e ort required for preparing presentations, o ering an accessible, modular and extensible solution that can be further optimized and scaled in future research. The source code is publicly available as open source for testing, improvement and continued development (Pacheco, 2025).eng
dc.description.abstractA criação de apresentações a partir de documentos de procedimentos é uma tarefa repetitiva e demorosa que, tipicamente, exige um esforço manual substancial. Esta dissertação apresenta o design e o desenvolvimento de um sistema que automatiza este processo, convertendo documentos de procedimentos em apresentações estruturadas e visualmente coerentes. A solução proposta integra técnicas de NLP, extração de texto e imagem e a utilização de LLMs locais para realizar a sumarização e a estruturação de conteúdo. O sistema segue um pipeline modular composto por três fases principais, a extração de elementos textuais e visuais de documentos PDF, o processamento e a estruturação do conte údo extraído através de estratégias de sumarização e organização baseadas em LLMs e a geração automática de apresentações em formato PPTX, enriquecidas com temas personaliz áveis. A implementação utiliza ferramentas de código aberto como PyPDF2, pdfminer.six e python-pptx, ao mesmo tempo que assegura uma integração exível com diferentes LLMs através da framework Ollama. A avaliação foi realizada através de testes unitários, de integração, funcionais e não funcionais. Os resultados con rmaram que o sistema cumpre os seus requisitos funcionais, importando documentos de procedimentos de forma ável, gerando slides coerentes e suportando funcionalidades de personalização e exportação. Os testes não funcionais destacaram pontos fortes em usabilidade e manutenibilidade, ao mesmo tempo que expuseram limitações no desempenho com a utilização de modelos maiores, na abilidade sob carga pesada e na necessidade de reforçar a segurança. No geral, este trabalho demonstra a viabilidade e o valor da automação da conversão de documentos de procedimentos em apresentações. O sistema proposto reduz o tempo e o esforço necessários para a preparação de apresentações, oferecendo uma solução acessível, modular e extensível que pode ser otimizada e escalada em investigação futura. O código fonte está publicamente disponível como open-source para testes, melhorias e desenvolvimento contínuo (Pacheco, 2025).por
dc.identifier.tid204067740
dc.identifier.urihttp://hdl.handle.net/10400.22/31299
dc.language.isoeng
dc.rights.uriN/A
dc.subjectDocument-to-Slide Automation
dc.subjectAutomatic Slide Generation
dc.subjectNatural Language Processing
dc.subjectLarge Language Models
dc.subjectText Summarization
dc.subjectPDF Processing
dc.titleGenerating presentation documents from procedural resourceseng
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameMestrado em Engenharia Informática

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tese_6122.pdf
Size:
3.89 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: