Repository logo
 
No Thumbnail Available
Publication

Development of a hybrid recommendation system focused on serendipity for e-commerce

Use this identifier to reference this record.
Name:Description:Size:Format: 
Tese_5597.pdf5.16 MBAdobe PDF Download

Abstract(s)

In the dynamic world of e-commerce, Recommender Systems have become crucial in guiding user choices and improving shopping experiences. Recommender Systems enhances ecommerce profits and increases user satisfaction. It has also been proved the positive influence in customer satisfaction of aspects like diversity, novelty and serendipity in recommendation. Despite it, most recommender systems rely mostly on accuracy metrics. To address this issue, this study proposes a novel approach to enhance serendipitous recommendations by leveraging machine learning and natural language processing techniques applied to item descriptions. Four different embedding models were employed to generate item embeddings from textual item descriptions. An initial analysis compared calculated serendipity, derived from the cosine similarity of item embeddings, with ground-truth serendipity. Followed by the development of a serendipity classification model. Three different recommendation models were constructed: the baseline XGBoost model, which functions as a content-based recommender system; the XGBoost-Seren model, which incorporates ground-truth serendipity data to prioritize serendipitous items; and the XGBoost-Seren + Classifier model, which replaces the ground-truth serendipity data with the predictions from the serendipity classifier. Each model was compared against SASRec, a state-of-the-art sequential recommender system, to evaluate both accuracy and serendipity metrics. The results demonstrate that the XGBoost-Seren + Classifier model outperforms SASRec in both accuracy and serendipity metrics. The study confirms that incorporating predicted serendipity into recommendation algorithms enhances the ability to suggest unexpected items without compromising accuracy. The findings indicate that using text-based embeddings not only enriches the recommendation process but also improves the overall user experience by integrating serendipity more effectively.
No dinâmico mundo do comércio eletrônico, os Sistemas de Recomendação tornaram-se cruciais para orientar as escolhas dos usuários e melhorar as experiências de compra. Sistemas de recomendação aumentam os lucros do comércio eletrônico e elevam a satisfação do usuário. Também foi comprovada a influência positiva na satisfação do cliente de aspectos como diversidade, novidade e serendipidade na recomendação. Apesar disso, a maioria dos sistemas de recomendação confia principalmente em métricas de precisão. Este estudo propõe uma abordagem inovadora para aprimorar as recomendações serendipitosas, aproveitando técnicas de aprendizado de máquina e processamento de linguagem natural aplicadas às descrições dos itens. Avaliar a serendipidade continua sendo um desafio devido à sua natureza subjetiva e, por isso, este estudo utiliza um conjunto de dados ground truth de serendipidade para desenvolver seus experimentos. Quatro modelos diferentes de embeddings—BERT, DistilRoBERTa, MPNet e BM25—foram empregados para gerar embeddings dos itens a partir das descrições textuais dos produtos. Uma análise inicial comparou a serendipidade calculada, derivada da similaridade de cosseno dos embeddings dos itens, com a serendipidade ground truth. Os resultados não revelaram correlação significativa entre a serendipidade calculada e os dados de ground truth, ressaltando a complexidade de medir com precisão a serendipidade usando métricas tradicionais. Para endereçar esta limitação, um modelo de classificação de serendipidade foi desenvolvido, para prever a probabilidade de um item ser serendipitoso para um usuário com base na descrição do item. Na sequencia, três modelos diferentes de sistemas de recomendação foram construídos: o modelo XGBoost básico, que funciona como um sistema de recomendação baseado em conteúdo; o modelo XGBoost-Seren, que incorpora dados de serendipidade ground truth para priorizar itens serendipitosos; e o modelo XGBoost-Seren + Classificador, que substitui os dados de serendipidade ground truth pelas previsões do classificador de serendipidade. Cada modelo foi comparado com o SASRec, um sistema de recomendação sequencial, para avaliar tanto as métricas de acurácia quanto de serendipidade. Os resultados demonstram que o modelo XGBoost-Seren + Classificador supera o SASRec tanto nas métricas de acurácia quanto de serendipidade. O estudo confirma que incorporar a serendipidade prevista nos algoritmos de recomendação aumenta a capacidade de sugerir itens inesperados sem comprometer a acurácia. As descobertas indicam que usar embeddings baseados em texto não apenas enriquece o processo de recomendação, mas também melhora a experiência geral do usuário ao integrar a serendipidade de forma mais eficaz.

Description

Keywords

Recommender Systems E-commerce Serendipity Machine Learning Sistemas de recomendação Comércio eletrónico Serendipidade Aprendizagem de máquina Aprendizado de máquina

Pedagogical Context

Citation

Research Projects

Organizational Units

Journal Issue