Repository logo
 
Publication

Extração de argumentos e categorização de motivações a partir de plataformas de e-Democracy utilizando modelos de linguagem de grande escala

datacite.subject.fosEngenharia e Tecnologia
datacite.subject.sdg09:Indústria, Inovação e Infraestruturas
dc.contributor.advisorConceição, Luis Manuel Silva
dc.contributor.authorJORGE, HUGO FILIPE FERNANDES
dc.date.accessioned2025-09-05T13:47:03Z
dc.date.available2025-09-05T13:47:03Z
dc.date.issued2025-07-14
dc.description.abstractA crescente adoção de plataformas digitais para a participação cívica e deliberação pública levanta novos desafios no tratamento automático de grandes volumes de discurso online. Em particular, o domínio da e-democracy exige ferramentas que não apenas identifiquem os argumentos expressos pelos cidadãos, mas que também compreendam as motivações que lhes estão subjacentes. Esta dissertação propõe uma abordagem automatizada para a extração de argumentos e motivações em comentários de debates online, com especial foco na sua representação estruturada e categorização segundo a teoria das necessidades humanas de Max-Neef. Durante o processo de desenvolvimento, foram exploradas diferentes abordagens para a representação semântica do discurso, com base em modelos de linguagem de grande escala (LLMs) e grafos de conhecimento. A solução final incorpora numa pipeline uma componente de recolha automatizada de comentários do Reddit, extração de argumentos e motivações baseada em LLMs locais (via Ollama) ou remotos (via API da OpenAI), categorização de motivações e a construção de um grafo que interliga comentários, argumentos, motivações e respetivas categorias de necessidades. Adicionalmente, foram implementadas duas interfaces em Streamlit: uma para a visualização dos resultados e outra para avaliação automatizada da qualidade das extrações. Esta avaliação, também suportada por LLMs, permitiu comparar diferentes combinações de modelos e aferir a sua coerência e plausibilidade. Os resultados demonstram que a utilização de modelos de raciocínio mais avançados, como o DeepSeek-R1 ou o o4 Mini, conduz a extrações mais coesas e informativas, embora com maior custo computacional. Por outro lado, modelos mais leves, como o LLaMA 3.1:8B ou GPT-4o- Mini, apresentaram tempos de resposta inferiores, mantendo uma qualidade por vezes inferior, mas aceitável. A análise das avaliações realizadas evidencia que soluções locais podem representar alternativas viáveis às opções comerciais, especialmente em contextos com restrições de privacidade ou custo. Esta contribuição espera melhorar sistemas de apoio à decisão em contextos de deliberação em larga escala, oferecendo uma estrutura replicável para a análise motivacional do discurso digital.por
dc.description.abstractThe increasing adoption of digital platforms for civic engagement and public deliberation introduces new challenges in the automatic processing of large volumes of online discourse. In the context of e-democracy, it is essential to develop tools that not only identify the arguments expressed by citizens but also uncover the underlying motivations. This dissertation presents an automated solution for extracting arguments and motivations from online debate comments, with a particular focus on their structured representation and categorization according to Max- Neef’s theory of human needs. Throughout the development process, several approaches to semantic discourse representation were explored, leveraging large language models (LLMs), vector databases, and knowledge graphs. The final solution integrates an automated component for collecting Reddit comments, an extraction pipeline based on either local LLMs (via Ollama) or remote models (via the OpenAI API), and the construction of a graph linking arguments to their motivations and corresponding Max-Neef categories. In addition, two Streamlit interfaces were developed: one for visualizing the results and another for the automated evaluation of extraction quality. This evaluation, also supported by LLMs, enabled the comparison of different model configurations in terms of coherence and plausibility. The results show that advanced reasoning models such as DeepSeek-R1 or o4 Mini produce more cohesive and informative extractions, albeit with higher computational costs. In contrast, lighter models like LLaMA 3.1:8B offered faster responses while maintaining acceptable quality. The evaluation findings suggest that local solutions can be viable alternatives to commercial options, especially in contexts with privacy or cost constraints. This work contributes to improving decision support systems in large-scale deliberateng
dc.identifier.tid203995767
dc.identifier.urihttp://hdl.handle.net/10400.22/30394
dc.language.isopor
dc.rights.uriN/A
dc.subjectLLMs
dc.subjectE-Democracy
dc.subjectGrafos de Conhecimento
dc.subjectMax-Neef
dc.subjectExtração de Argumentos
dc.subjectExtração de Motivações
dc.subjectGrafos de conhecimento
dc.subjectExtração de argumentos
dc.subjectExtração de mocitvações
dc.titleExtração de argumentos e categorização de motivações a partir de plataformas de e-Democracy utilizando modelos de linguagem de grande escalapor
dc.title.alternativeArgument extraction and motivation categorization from e-Democracy platforms using Large-Scale Language Modelseng
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameMestrado em Engenharia Informática

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tese_5856.pdf
Size:
9.53 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: