Repository logo
 
Publication

Machine Learning na previsão de Cancro Colorretal em função de alterações metabólicas

dc.contributor.advisorTavares, José António Reis
dc.contributor.authorLopes, Pedro Manuel Nogueira
dc.date.accessioned2023-03-15T14:57:37Z
dc.date.available2023-03-15T14:57:37Z
dc.date.issued2022
dc.description.abstractNo mundo atual, a quantidade de informação disponível nos mais variados setores é cada vez maior. É o caso da área da saúde, onde a recolha e tratamento de dados biomédicos procuram melhorar a tomada de decisão no tratamento a aplicar a um doente, recorrendo a ferramentas baseadas em Machine Learning. Machine Learning é uma área da Inteligência Artificial em que através da aplicação de algoritmos a um conjunto de dados é possível prever resultados ou até descobrir relações entre estes que seriam impercetíveis à primeira vista. Com este projeto pretende-se realizar um estudo em que o objetivo é investigar diversos algoritmos e técnicas de Machine Learning, de modo a identificar se o perfil de acilcarnitinas pode constituir um novo marcador bioquímico para a predição e prognóstico do Cancro Colorretal. No decurso do trabalho, foram testados diferentes algoritmos e técnicas de pré-processamento de dados. Foram realizadas três experiências distintas com o objetivo de validar as previsões dos modelos construídos para diferentes cenários, nomeadamente: prever se o paciente tem Cancro Colorretal, prever qual a doença que o paciente tem (Cancro Colorretal e outras doenças metabólicas) e prever se este tem ou não alguma doença. Numa primeira análise, os modelos desenvolvidos apresentam bons resultados na triagem de Cancro Colorretal. Os melhores resultados foram obtidos pelos algoritmos Random Forest e Gradient Boosting, em conjunto com técnicas de balanceamento dos dados e Feature Selection, nomeadamente Random Oversampling, Synthetic Oversampling e Recursive Feature Selectionpt_PT
dc.description.abstractIn today´s world, the amount of information available in various sectors is increasing. That is the case in the healthcare area, where the collection and treatment of biochemical data seek to improve the decision-making in the treatment to be applied to a patient, using Machine Learning-based tools. Machine learning is an area of Artificial Intelligence in which applying algorithms to a dataset makes it possible to predict results or even discover relationships that would be unnoticeable at first glance. This project’s main objective is to study several algorithms and techniques of Machine Learning to identify if the acylcarnitine profile may constitute a new biochemical marker for the prediction and prognosis of rectal cancer. In the course of the work, different algorithms and data preprocessing techniques were tested. Three different experiments were carried out to validate the predictions of the models built for different scenarios, namely: predicting whether the patient has Colorectal Cancer, predicting which disease the patient has (Colorectal Cancer and other metabolic diseases) and predicting whether he has any disease. As a first analysis, the developed models showed good results in Colorectal Cancer screening. The best results were obtained by the Random Forest and Gradient Boosting algorithms, together with data balancing and feature selection techniques, namely Random Oversampling, Synthetic Oversampling and Recursive Feature Selectionpt_PT
dc.identifier.tid203113713pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.22/22515
dc.language.isoengpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/pt_PT
dc.subjectAcilcarnitinaspt_PT
dc.subjectCancro Colorretalpt_PT
dc.subjectFeature Selectionpt_PT
dc.subjectGradient Boostingpt_PT
dc.subjectMachine Learningpt_PT
dc.subjectRandom Forestpt_PT
dc.subjectRandom Oversamplingpt_PT
dc.subjectRecursive Feature Selectionpt_PT
dc.subjectSynthetic Oversamplingpt_PT
dc.subjectAcylcarnitinespt_PT
dc.subjectColorectal Cancerpt_PT
dc.titleMachine Learning na previsão de Cancro Colorretal em função de alterações metabólicaspt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia Informática - Engenharia de Softwarept_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DM_PedroLopes_2022_MEI.pdf
Size:
4.05 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: