Repository logo
 
Loading...
Thumbnail Image
Publication

Generating presentation documents from procedural resources

Use this identifier to reference this record.
Name:Description:Size:Format: 
Tese_6122.pdf3.89 MBAdobe PDF Download

Abstract(s)

The creation of presentation slides from procedural documents is a repetitive and time consuming task that typically requires substantial manual e ort. This dissertation presents the design and development of a system that automates this process by converting procedural documents into structured and visually coherent presentation slides. The proposed solution integrates Natural Language Processing (NLP) techniques, text and image extraction and the use of local Large Language Model (LLM)s to perform summarization and content structuring. The system follows a modular pipeline composed of three main stages, extraction of textual and visual elements from Portable Document Format (PDF) documents, processing and structuring of the extracted content using LLMs based summarization and organization strategies and automatic generation of presentation slides in PowerPoint Open XML Presentation (PPTX) format, enriched with customizable themes. The implementation leverages open-source tools such as PyPDF2, pdfminer.six and python-pptx, while ensuring exible integration with di erent LLMs through the Ollama framework. Evaluation was carried out through unit, integration, functional and non-functional testing. The results con rmed that the system ful lls its functional requirements, reliably importing documents, generating coherent slides, supporting customization and export features. Nonfunctional testing highlighted strengths in usability and maintainability, while also exposing limitations in performance when using larger models, reliability under heavy load and the need for improved security hardening. This work proves the concept of value and feasibility in semi-automatic transformation of procedural documents into presentations. The proposed system reduces the time and e ort required for preparing presentations, o ering an accessible, modular and extensible solution that can be further optimized and scaled in future research. The source code is publicly available as open source for testing, improvement and continued development (Pacheco, 2025).
A criação de apresentações a partir de documentos de procedimentos é uma tarefa repetitiva e demorosa que, tipicamente, exige um esforço manual substancial. Esta dissertação apresenta o design e o desenvolvimento de um sistema que automatiza este processo, convertendo documentos de procedimentos em apresentações estruturadas e visualmente coerentes. A solução proposta integra técnicas de NLP, extração de texto e imagem e a utilização de LLMs locais para realizar a sumarização e a estruturação de conteúdo. O sistema segue um pipeline modular composto por três fases principais, a extração de elementos textuais e visuais de documentos PDF, o processamento e a estruturação do conte údo extraído através de estratégias de sumarização e organização baseadas em LLMs e a geração automática de apresentações em formato PPTX, enriquecidas com temas personaliz áveis. A implementação utiliza ferramentas de código aberto como PyPDF2, pdfminer.six e python-pptx, ao mesmo tempo que assegura uma integração exível com diferentes LLMs através da framework Ollama. A avaliação foi realizada através de testes unitários, de integração, funcionais e não funcionais. Os resultados con rmaram que o sistema cumpre os seus requisitos funcionais, importando documentos de procedimentos de forma ável, gerando slides coerentes e suportando funcionalidades de personalização e exportação. Os testes não funcionais destacaram pontos fortes em usabilidade e manutenibilidade, ao mesmo tempo que expuseram limitações no desempenho com a utilização de modelos maiores, na abilidade sob carga pesada e na necessidade de reforçar a segurança. No geral, este trabalho demonstra a viabilidade e o valor da automação da conversão de documentos de procedimentos em apresentações. O sistema proposto reduz o tempo e o esforço necessários para a preparação de apresentações, oferecendo uma solução acessível, modular e extensível que pode ser otimizada e escalada em investigação futura. O código fonte está publicamente disponível como open-source para testes, melhorias e desenvolvimento contínuo (Pacheco, 2025).

Description

Keywords

Document-to-Slide Automation Automatic Slide Generation Natural Language Processing Large Language Models Text Summarization PDF Processing

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License

Without CC licence