ISEP - DM – Engenharia de Inteligência Artificial
Permanent URI for this collection
Browse
Browsing ISEP - DM – Engenharia de Inteligência Artificial by Title
Now showing 1 - 10 of 70
Results Per Page
Sort Options
- Adaptação automática de algoritmos de otimização metaheurísticaPublication . Carvalho, João Marcelo Fernandes de; Pinto, Tiago Manuel Campelos FerreiraA maioria dos problemas do mundo real tem uma multiplicidade de possíveis soluções. Além disso, usualmente, são encontradas limitações de recursos e tempo na resolução de problemas reais complexos e, por isso, frequentemente, não é possível aplicar um método determinístico na resolução desses problemas. Por este motivo, as meta-heurísticas têm ganho uma relevância significativa sobre os métodos determinísticos na resolução de problemas de otimização com múltiplas combinações. Ainda que as abordagens meta-heurísticas sejam agnósticas ao problema, os resultados da otimização são fortemente influenciados pelos parâmetros que estas meta-heurísticos necessitam para a sua configuração. Por sua vez, as melhores parametrizações são fortemente influenciadas pela meta-heurística e pela função objetivo. Por este motivo, a cada novo desenvolvimento é necessária uma otimização dos parâmetros das metas heurísticas praticamente partindo do zero. Assim, e, atendendo ao aumento da complexidade das meta-heurísticas e dos problemas aos quais estassão normalmente aplicadas, tem-se vindo a observar um crescente interesse no problema da configuração ótima destes algoritmos. Neste projeto é apresentada uma nova abordagem de otimização automática dos parâmetros de algoritmos meta-heurísticos. Esta abordagem não consiste numa pré-seleção estática de um único conjunto de parâmetros que será utilizado ao longo da pesquisa, como é a abordagem comum, mas sim na criação de um processo dinâmico, em que a parametrização é alterada ao longo da otimização. Esta solução consiste na divisão do processo de otimização em três etapas, forçando, numa primeira etapa um nível alto de exploração do espaço de procura, seguida de uma exploração intermédia e, na última etapa, privilegiando a pesquisa local focada nos pontos de maior potencial. De forma a permitir uma solução eficiente e eficaz, foram desenvolvidos dois módulos um Módulo de Treino e um Módulo de Otimização. No Módulo de Treino, o processo de fine-tuning é automatizado e, consequentemente, o processo de integração de uma nova meta-heurística ou uma nova função objetivo é facilitado. No Módulo de Otimização é usado um sistema multiagente para a otimização de uma dada função seguindo a abordagem de pesquisa proposta. Com base nos resultados obtidos através da aplicação de otimização por enxame de partículas e algoritmos genéticos a várias funções benchmark e a um problema real na área dos sistemas de energia, o Módulo de Treino permitiu automatizar o processo de fine-tuning e, consequentemente, facilitar o processo de introdução no sistema de uma nova meta-heurística ou de uma nova função relativa a um novo problema a resolver. Utilizando a abordagem de otimização proposta através do Módulo de Otimização, obtém-se uma maior generalização e os resultados são melhorados sem comprometer o tempo máximo para a otimização.
- AI-driven information retrieval system for candidate screeningPublication . Silva, Vasco Reid Ferreira da; Conceição, Luís Manuel da SilvaEfficient screening and evaluation in the recruitment process are tasks that demand substantial time and effort from Human Resources professionals. These processes often suffer from long waiting periods, inconsistent candidate evaluation, and the potential to overlook qualified candidates. In this context, leveraging state-of-the-art natural language processing architectures, specifically large language models (LLMs), holds significant promise. LLMs can generate evaluations using advanced prompt techniques to improve the accuracy and reliability of the output. This thesis researches the feasibility of employing 7 billion parameter LLMs in candidate screening to reduce response times, decrease workload, and improve evaluation consistency. The study involves a comparative analysis of various state-of-the-art large language models to identify those most suitable for this application. Additionally, it examines different prompt engineering techniques to optimize the performance of these models. A comprehensive analysis of the results is conducted to determine the most effective combinations of LLMs and prompt engineering techniques. This includes a two-way validation process, utilizing both the state-of-the-art GPT-4 model and manual human resources validation, to ensure the robustness and reliability of the findings. The outcomes of this thesis aim to enhance the quality of candidate screening by integrating LLMs into the process. Furthermore, this work aspires to provide valuable insights into the capabilities of 7 billion parameter large language models in the field of human resources and their application in real-world scenarios.
- Ajuste dinâmico de dificuldade em videojogos usando aprendizagem automáticaPublication . Felício, Jorge Emanuel Coelho Mendonça de Anciães; Faria, Luiz Felipe Rocha deIn the constantly evolving field of video games, traditional difficulty settings fail to accommodate the wide range of skill levels among players. The resulting mismatch between the player’s skill and the game’s challenge can make the game boring for skilled players or frustrating for less experienced ones, negatively affecting player engagement. Dynamic Difficulty Adjustment (DDA) seeks to resolve this issue by adapting the game’s difficulty in real time in response to the player’s performance. While advancements in artificial intelligence (AI), particularly machine learning (ML), have enabled more adaptive DDA systems, the full potential of certain advanced techniques or tools has yet to be explored. This thesis thus explores possible innovations in the integration of AI in DDA systems for video games. The research begins by reviewing the techniques used for DDA, focusing on methodologies such as player modeling, rule-based systems, and ML. Based on this research, potential areas for innovation were identified and the application of Deep Reinforcement Learning (DRL) in the Unity game development platform through the usage of the MLAgents toolkit was chosen as a promising approach for this research. Using this methodology, this research aims to implement a DDA system that adjusts a game’s difficulty based on the player’s skills, enhancing their engagement and maintaining a consistent challenge. This project has several critical phases of development, including the creation of a game prototype, data collection for model training, development and integration of the DDA system into the game prototype, and conducting an experiment comparing the prototype with DDA integrated with a version of the prototype that used traditional static difficulty scaling. The experiment conducted was done with 20 participants of varying skill levels and used a combination of collected gameplay metrics and a modified Game Experience Questionnaire (GEQ) survey to evaluate the DDA system’s effectiveness. The results showed that the DDA system demonstrated a statistically significant increase in the player engagement component and appropriately adjusted the difficulty to be harder for participants of higher skill. However, the system sometimes exhibited some issues with drastic adjustments in difficulty between levels, which led to a slightly lower Post-Game positive experience score compared to the static difficulty scaling system. Despite these fluctuations, the proposed system demonstrates the potential of the ML-Agents toolkit in implementing DDA with DRL in games made on the Unity platform. By identifying underexplored areas in the current literature and applying advanced techniques like DRL, this thesis aims to contribute to both academic research and game development regarding the approach to DDA in video games.
- ALMA: ALgorithm Modeling ApplicationPublication . Oliveira, Nuno André Lapa; Pereira, Isabel Cecília Correia da Silva Praça GomesAs of today, the most recent trend in information technology is the employment of large-scale data analytic methods powered by Artificial Intelligence (AI), influencing the priorities of businesses and research centers all over the world. However, due to both the lack of specialized talent and the need for greater compute, less established businesses struggle to adopt such endeavors, with major technological mega-corporations such as Microsoft, Facebook and Google taking the upper hand in this uneven playing field. Therefore, in an attempt to promote the democratization of AI and increase the efficiency of data scientists, this work proposes a novel no-code/low-code AI platform: the ALgorithm Modeling Application (ALMA). Moreover, as the state of the art of such platforms is still gradually maturing, current solutions often fail into encompassing security/safety aspects directly into their process. In that respect, the solution proposed in this thesis aims not only to achieve greater development and deployment efficiency while building machine learning applications but also to build upon others by addressing the inherent pitfalls of AI through a ”secure by design” philosophy.
- An intelligent hybrid recommender system improved with Association RulesPublication . Moreira, João Filipe Coelho; Santos, Joaquim Filipe Peixoto dosWith the popularization of the Internet and the maturation of associated technologies, the digital environment has evolved into a global marketplace facilitating the exchange of goods and services, commonly referred to as e-commerce. This market has experienced substantial growth due to the expansion of product catalogues and the rising demand for effective recommender systems that enhance user experience and boost the competitiveness of companies. This dissertation examines the current landscape of e-commerce recommender systems, analysing the techniques currently in use, their limitations, and evaluation methods. It also proposes a hybrid approach that integrates recommendation techniques with association rules derived from historical purchase data, assigning weights to balance the influence of each technique. The primary goal is to provide users with personalised and effective recommendations, leveraging the combination of established recommendation methods with association rules, to mitigate existing limitations. The effectiveness of the components in this hybrid approach is evaluated using standard metrics, supplemented by feedback from test users, which aids in adjusting the weights and analysing the relevance of the recommendations. The findings of this approach contribute to increased user satisfaction on e-commerce platforms, although the creation of meaningful association rules requires substantial amounts of data.
- Análise do Movimento dos Atletas em Eventos FutebolísticosPublication . Campos, João Manuel Costa; Martins, António Constantino LopesO mercado do futebol está em alta, com jogadores e treinadores sendo cada vez mais valorizados. Para garantir um desempenho superior, é crucial fazer escolhas criteriosas na contratação. Além disso, há uma demanda crescente por dados nesse setor, e métricas avançadas, como "expected goals", estão a tornar-se populares na análise de jogos de futebol. Essas métricas, originalmente usadas por mercados de apostas, agora são adotadas por comentadores e treinadores renomados. Isso indica que a análise de dados é essencial para melhorar o desempenho de todos os envolvidos no futebol. Diante desse cenário, surge a necessidade de desenvolver uma solução que consiga explorar sequências e padrões de jogo através de análises avançadas e consiga extrair padrões de jogo a partir de imagens de sequências. A metodologia utilizada neste projeto de pesquisa é a Design Science Research. Inicialmente, foi realizada uma revisão bibliográfica sobre os tipos de dados existentes no contexto do futebol, as métricas avançadas atualmente em alta no mundo analítico desportivo e soluções existentes no ramo. Foram identificadas e descritas algumas das características e limitações mais comuns dos serviços atuais do mercado. Este trabalho pretende apresentar uma proposta que inove no cálculo da métrica de xG, consiga identificar diversas estatísticas calculadas a partir de dados de eventos e consiga estabelecer uma relação entre esses dados, as sequências das equipas e o estilo de jogo da equipa. O sistema Verance App utiliza dados do tipo de fluxo de eventos para calcular estatísticas para todas as equipas que atuaram nas principais 6 ligas durante a presente temporada (2022/23) e apresentar estatísticas de todas as sequências e ações destas mesmas equipas. Para além disto, apresenta também a funcionalidade de apresentação das 3 equipas mais semelhantes em análise. A Verance App não foi utilizada por nenhuma equipa real para fornecer informação de melhoria dos resultados desportivos, mas foi avaliada tendo em conta os seus 3 componentes principais, o modelo xG, o modelo xT e a componente de extração dos padrões das sequências. A análise confirma que a solução projetada, na maioria das circunstâncias, apresenta resultados superiores aos dos serviços atuais do mercado.
- Animal route prediction using artificial intelligencePublication . Azevedo, Catarina Peniche Brandão; Ramos, Carlos Fernando da SilvaThe conservation of wildlife is becoming increasingly critical, especially for endangered species, which face threats from habitat destruction and human interference. This dissertation explores the application of artificial intelligence to predict animal migration routes, an important aspect in species conservation. By using historical GPS tracking data, this study seeks to improve the understanding of the movement patterns of migratory animals. This work starts by addressing several research questions that culminate in the main question, ’How can artificial intelligence be used in predicting animal migration routes?’. These questions focus on the primary techniques and algorithms applied in these cases, the main tracking mechanisms used to gather animal movement information, and the societal implications of the use of AI in this context. Following the systematic review, the development of a feedforward neural network model design for animal route prediction was done. The choice of this model reflects the need for a computationally efficient solution capable of handling the complex data derived from the GPS tracking of African elephants. The model’s performance was improved with hyperparameter tuning, and metrics such as mean squared error (MSE) and R-squared were utilised, demonstrating promising predictive accuracy. By combining AI techniques with wildlife conservation efforts, this work aims to contribute towards mitigating the adverse impacts of human intrusion on migration corridors and enhance efforts to protect endangered species.
- Anomaly behavior detection in webPublication . David, Gabriel Henrique Ribeiro; Marreiros, Maria Goreti CarvalhoIn the domain of web application development, JavaScript plays an important role in enhancing the productivity and interactivity of web applications. However, its flexibility and dynamic nature also introduce potential security risks. Attackers can exploit vulnerabilities in JavaScript to perform various malicious activities, such as data theft, injection attacks, and unauthorized web modifications, including data tampering. This work introduces a novel approach to enhancing the security of web applications by focusing on malicious behavior executed through client-side JavaScript. The core objective of this research is to develop a model capable of identifying anomalous behaviors caused by third-party scripts on web pages. To this end, the research conducts a comparative analysis of four distinct models: One-class SVM, Isolation Forest, Local Outlier Factor, and Autoencoders. To identify the most effective solution, these models are evaluated based on specific performance metrics, including Area Under the Curve (AUC) and F-score. The selected model is used to pinpoint irregularities indicative of potential security breaches or malicious activities. This research significantly advances the field of web application security by providing actionable insights to enhance real-time response capabilities. By addressing the growing threat posed by malicious JavaScript, this work contributes to the development of more robust security measures. The dissertation employs a multi-faceted methodology to ensure a comprehensive approach. Initially, a systematic review methodology is used for a structured and unbiased literature analysis, providing a thorough understanding of the current state of the art. The CRISP-DM framework is adopted for the development phase, facilitating continuous adaptation in response to evolving insights. A Comparative Analysis methodology rigorously evaluates different anomaly detection algorithms, ensuring their possible practical applicability in real-world scenarios. The findings demonstrate that the chosen model can effectively identify anomalies with high accuracy and minimal false positives. This research highlights the importance of integrating anomaly detection with existing Data Loss Prevention (DLP) solutions to monitor and protect sensitive data against cyber-attacks.
- Aplicação técnicas aprendizagem automática no cancro da mamaPublication . Santos, José Carlos Cordeiro Andrade; Marreiros, Maria Goreti CarvalhoO cancro da mama continua atualmente a ser um importante problema de saúde pública a nível internacional e nacional pelo que a problemática da sua abordagem continua a ter todo o interesse. Em Portugal, anualmente são detetados cerca de 7.000 novos casos de cancro da mama, e 1.800 mulheres morrem com esta doença. De acordo com a Norma da Direção-Geral da Saúde para abordagem imagiológica da mama feminina, todas as mulheres assintomáticas com idade compreendida entre 50 e 69 anos, devem realizar uma mamografia de rastreio a cada dois anos. Na presença de alterações morfológicas ou em mulheres com risco moderado a elevado de cancro da mama, o médico assistente pode sugerir antecipar a realização da mamografia e complementar a investigação diagnóstica com os métodos que achar necessários. Se o cancro for detetado precocemente, a probabilidade de o tratamento ser eficaz e bem-sucedido é muito mais elevada. A ressonância magnética é um exame de alta sensibilidade e especificidade moderada, sugerida em pacientes jovens, com aumento substancial do risco, i.e., que apresentam predisposição genética ou história familiar da doença. Este exame utiliza uma tecnologia à base de ondas de radiofrequência num forte campo magnético a fim de obter imagens mais detalhadas dos tecidos internos da mama, no entanto, o seu uso é limitado pela indisponibilidade (imediata) comparada com outros exames e preço associado e contraindicado em pessoas com claustrofobia, dispositivos metálicos como pacemakers ou próteses ou reações ao meio de contraste. Assim, esta tese tem como objetivo desenvolver uma ferramenta de aprendizagem automática com recurso a Redes Adversariais Generativas Cíclicas, capaz de converter uma imagem de mamografia numa semelhante ao produto de uma ressonância magnética, com o intuito de proporcionar uma melhor perceção do campo cirúrgico e aumentar os ganhos em saúde. O conjunto de dados foi cedido pelo Centro Hospitalar Universitário de São João e continha volumes de cortes transversais sucessivos de mamas. Neste caso, o corte seccional com área transversal máxima era o único com interesse para estudo, por isso, extraímos todas as localizações dos cortes para obter os cortes mediais respetivos das mamas. As Redes Adversariais Generativas são pares de sistemas de Inteligência Artificial treinados para criar conteúdo e realizar tarefas mais rapidamente do que um único sistema. Nesta tese, estas realizam a tradução para uma imagem com base noutra singular não emparelhada, ou seja, uma imagem semelhante ao produto de uma ressonância magnética com base numa mamografia, sem imagem de ressonância magnética correspondente. As ferramentas métricas de Medida do Índice de Similaridade Estrutural e de Relação Sinal-Ruído de Pico foram usadas para avaliar a qualidade da imagem sintetizada em relação à imagem real. Com o valor de 0.69667, o valor obtido pela medida do índice de similaridade estrutural indica alta similaridade da imagem criada com a de referência. Quanto à relação sinal-ruído de pico obtida de 31.805 dB, usada para quantificar a qualidade da imagem reconstruída a partir de uma imagem original que sofreu compressão, encontra-se dentro do intervalo de valores típicos. Embora as ferramentas métricas forneçam um resultado quantitativo do desempenho, a melhor resposta que obtivemos foi visual. As imagens sintéticas obtidas apresentam uma aparência visualmente realista, embora seja possível detetar nestes alguns artefactos, devido à diferente forma de captação de imagem pelos diferentes exames e definição inferior dos exames originais usados como base em comparação com a ressonância magnética. Em conclusão, a partir de um conjunto de dados com 57 imagens obtidas por mamografia, em perfil cefalo-caudal, foi possível gerar imagens sintéticas da estrutura mamária semelhantes ao produto da ressonância magnética baseadas em mamografia implementando e testando modelos de rede adversarial generativa, usando dados não emparelhados, como demonstrado pelas diversas métricas e verificações gráficas.
- Application of active learning on medical images to enhance machine learning modelsPublication . Santos, Maria Inês Salvador dos; Marreiros, Maria Goreti CarvalhoArtificial intelligence has made some huge advancements in the healthcare field, particularly in medical imaging. However, data and annotations in this area are often scarce and expensive to obtain. Labeling images, although essential for machine learning models, is a tedious and time-consuming task. Active learning addresses this challenge by selecting informative samples to try and create a subset of unlabeled data where the model could have more difficulty predicting the labels which are then given to experts to annotate. The goal is to try to use less amount of annotated data, whilst still getting a good model performance. Breast cancer is one of the most common cancers in women. The proposed solution uses the Patch- Camelyon dataset, a variation of the Camelyon16 dataset with patches from histopathologic scans of sentinel lymph node sections for the detection of metastatic tissue of breast cancer patients. This work proposes an active learning approach that includes the division of the unlabeled data into clusters which are then classified based on their level of informativeness (based on Shannon Entropy). Then, from each cluster several samples are selected based on the previously defined informativeness level and each sample is scored based on a formula that includes both entropy and Euclidean distance to the cluster centroid. Finally, samples with the lowest uncertainty score are added to the training dataset with the model’s prediction. The proposed method includes both model uncertainty and data distribution. The solution showed promising results when compared with a random sampling approach. To evaluate the proposed solution, greyscale and Macenko normalization techniques were used in all different approaches (random sampling approach, a variation of the proposed solution with no pseudo label task and the proposed solution). In some iterations, the difference between the F1 score in the proposed active learning solution and random sampling was more than 0,20. With the application of this method, experts can spend less time annotating images while still achieving a high-performance model.