nodeML - Towards reproducible ML in federated environments

Silva, Edgar Simão da Mota e

Publicação

nodeML - Towards reproducible ML in federated environments

2022Dissertação de mestrado

dc.contributor.advisor	Faria, Luiz Felipe Rocha de
dc.contributor.author	Silva, Edgar Simão da Mota e
dc.date.accessioned	2023-01-11T15:03:45Z
dc.date.available	2023-01-11T15:03:45Z
dc.date.issued	2022
dc.description.abstract	Advances and increasing interest in AI (Artificial Intelligence) in the field of health have created novel issues, namely explainability and reproducibility of ML (Machine Learning) models. In addition, while the training of ML models traditionally favors a centralized approach, scalability and privacy issues seem to lead towards a distributed one. The latter poses challenges to ML algorithms and the efficacy of learning itself. Reproducing ML models poses several challenges arising from the intrinsic variability of the models themselves and the environment where they are trained. This problem is aggravated by their lack of standardization and common terminology. The main goal of this work is to conceptualize and prototype a framework to train, evaluate and describe ML models, in a decentralized way, over immunogenetics datasets. This framework will promote model reproducibility and comparability, as well as its adaptability. This work will start by implementing a federated/decentralized training framework over existing ML pipelines. Then, it will be possible to list and select potential dataset sources, aiming to provide an easy path to model adaptation and optimization.	pt_PT
dc.description.abstract	Os contínuos avanços e crescente interesse em IA (Inteligência Artificial) no campo da saúde levantaram novas questões, nomeadamente a explicabilidade e a reprodutibilidade de modelos de ML (Machine Learning). Adicionalmente, enquanto o treino de modelos de ML favorece tradicionalmente uma abordagem centralizada, questões de escalabilidade e privacidade tendem a levar a uma abordagem distribuída. Esta última apresenta desafios aos algoritmos de ML e à eficácia do treino em si. A reprodução de modelos de ML apresenta vários desafios decorrentes da variabilidade intrínseca dos próprios modelos e do ambiente onde são treinados. Este problema é agravado pela falta de padronização e terminologia comum. O principal objetivo deste trabalho é conceptualizar e prototipar uma framework para treinar, avaliar e descrever modelos de ML, de forma descentralizada, sobre conjuntos de dados imunogenéticos. Essa framework promoverá a reproducibilidade e comparabilidade dos modelos, bem como a sua adaptabilidade. Este trabalho começará com a implementação de uma framework de treino federado/descentralizado sobre pipelines de ML existentes. De seguida, será possível listar e selecionar potenciais fontes de dados, esperando facilitar a adaptação e otimização dos modelos.	pt_PT
dc.identifier.tid	203112628	pt_PT
dc.identifier.uri	http://hdl.handle.net/10400.22/21438
dc.language.iso	eng	pt_PT
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	pt_PT
dc.subject	Federated learning	pt_PT
dc.subject	Decentralization	pt_PT
dc.subject	Machine Learning	pt_PT
dc.subject	Immunology	pt_PT
dc.subject	Immunotherapy	pt_PT
dc.subject	Genetics	pt_PT
dc.title	nodeML - Towards reproducible ML in federated environments	pt_PT
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	pt_PT
rcaap.type	masterThesis	pt_PT
thesis.degree.name	Mestrado em Engenharia de Inteligência Artificial	pt_PT

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: DM_EdgarSilva_2022_MEIA.pdf
Tamanho:: 4.39 MB
Formato:: Adobe Portable Document Format

Ver/Abrir

Licença

A mostrar 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Ver/Abrir

Coleções

ISEP - DM – Engenharia de Inteligência Artificial