| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 3.89 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
The creation of presentation slides from procedural documents is a repetitive and time
consuming task that typically requires substantial manual e ort. This dissertation presents
the design and development of a system that automates this process by converting procedural
documents into structured and visually coherent presentation slides. The proposed solution
integrates Natural Language Processing (NLP) techniques, text and image extraction and
the use of local Large Language Model (LLM)s to perform summarization and content
structuring.
The system follows a modular pipeline composed of three main stages, extraction of textual
and visual elements from Portable Document Format (PDF) documents, processing
and structuring of the extracted content using LLMs based summarization and organization
strategies and automatic generation of presentation slides in PowerPoint Open XML Presentation
(PPTX) format, enriched with customizable themes. The implementation leverages
open-source tools such as PyPDF2, pdfminer.six and python-pptx, while ensuring exible
integration with di erent LLMs through the Ollama framework.
Evaluation was carried out through unit, integration, functional and non-functional testing.
The results con rmed that the system ful lls its functional requirements, reliably importing
documents, generating coherent slides, supporting customization and export features. Nonfunctional
testing highlighted strengths in usability and maintainability, while also exposing
limitations in performance when using larger models, reliability under heavy load and the
need for improved security hardening.
This work proves the concept of value and feasibility in semi-automatic transformation of
procedural documents into presentations. The proposed system reduces the time and e ort
required for preparing presentations, o ering an accessible, modular and extensible solution
that can be further optimized and scaled in future research. The source code is publicly
available as open source for testing, improvement and continued development (Pacheco,
2025).
A criação de apresentações a partir de documentos de procedimentos é uma tarefa repetitiva e demorosa que, tipicamente, exige um esforço manual substancial. Esta dissertação apresenta o design e o desenvolvimento de um sistema que automatiza este processo, convertendo documentos de procedimentos em apresentações estruturadas e visualmente coerentes. A solução proposta integra técnicas de NLP, extração de texto e imagem e a utilização de LLMs locais para realizar a sumarização e a estruturação de conteúdo. O sistema segue um pipeline modular composto por três fases principais, a extração de elementos textuais e visuais de documentos PDF, o processamento e a estruturação do conte údo extraído através de estratégias de sumarização e organização baseadas em LLMs e a geração automática de apresentações em formato PPTX, enriquecidas com temas personaliz áveis. A implementação utiliza ferramentas de código aberto como PyPDF2, pdfminer.six e python-pptx, ao mesmo tempo que assegura uma integração exível com diferentes LLMs através da framework Ollama. A avaliação foi realizada através de testes unitários, de integração, funcionais e não funcionais. Os resultados con rmaram que o sistema cumpre os seus requisitos funcionais, importando documentos de procedimentos de forma ável, gerando slides coerentes e suportando funcionalidades de personalização e exportação. Os testes não funcionais destacaram pontos fortes em usabilidade e manutenibilidade, ao mesmo tempo que expuseram limitações no desempenho com a utilização de modelos maiores, na abilidade sob carga pesada e na necessidade de reforçar a segurança. No geral, este trabalho demonstra a viabilidade e o valor da automação da conversão de documentos de procedimentos em apresentações. O sistema proposto reduz o tempo e o esforço necessários para a preparação de apresentações, oferecendo uma solução acessível, modular e extensível que pode ser otimizada e escalada em investigação futura. O código fonte está publicamente disponível como open-source para testes, melhorias e desenvolvimento contínuo (Pacheco, 2025).
A criação de apresentações a partir de documentos de procedimentos é uma tarefa repetitiva e demorosa que, tipicamente, exige um esforço manual substancial. Esta dissertação apresenta o design e o desenvolvimento de um sistema que automatiza este processo, convertendo documentos de procedimentos em apresentações estruturadas e visualmente coerentes. A solução proposta integra técnicas de NLP, extração de texto e imagem e a utilização de LLMs locais para realizar a sumarização e a estruturação de conteúdo. O sistema segue um pipeline modular composto por três fases principais, a extração de elementos textuais e visuais de documentos PDF, o processamento e a estruturação do conte údo extraído através de estratégias de sumarização e organização baseadas em LLMs e a geração automática de apresentações em formato PPTX, enriquecidas com temas personaliz áveis. A implementação utiliza ferramentas de código aberto como PyPDF2, pdfminer.six e python-pptx, ao mesmo tempo que assegura uma integração exível com diferentes LLMs através da framework Ollama. A avaliação foi realizada através de testes unitários, de integração, funcionais e não funcionais. Os resultados con rmaram que o sistema cumpre os seus requisitos funcionais, importando documentos de procedimentos de forma ável, gerando slides coerentes e suportando funcionalidades de personalização e exportação. Os testes não funcionais destacaram pontos fortes em usabilidade e manutenibilidade, ao mesmo tempo que expuseram limitações no desempenho com a utilização de modelos maiores, na abilidade sob carga pesada e na necessidade de reforçar a segurança. No geral, este trabalho demonstra a viabilidade e o valor da automação da conversão de documentos de procedimentos em apresentações. O sistema proposto reduz o tempo e o esforço necessários para a preparação de apresentações, oferecendo uma solução acessível, modular e extensível que pode ser otimizada e escalada em investigação futura. O código fonte está publicamente disponível como open-source para testes, melhorias e desenvolvimento contínuo (Pacheco, 2025).
Description
Keywords
Document-to-Slide Automation Automatic Slide Generation Natural Language Processing Large Language Models Text Summarization PDF Processing
