Repository logo
 
Publication

Algoritmo de aprendizagem semi-supervisionada

dc.contributor.advisorRodrigues, Maria de Fátima Coutinho
dc.contributor.authorFontes, André Filipe da Cruz
dc.date.accessioned2023-11-08T16:27:07Z
dc.date.available2023-11-08T16:27:07Z
dc.date.issued2023
dc.description.abstractOs dados etiquetados são essenciais para uma aprendizagem supervisionada. No entanto, estão frequentemente disponíveis apenas em pequenas quantidades, enquanto os dados não etiquetados podem ser abundantes. A utilização de dados não etiquetados juntamente com dados etiquetados é tanto de interesse teórico como prático. A eficiência da aprendizagem supervisionada é altamente dependente das instâncias etiquetadas. Contudo, ter um tamanho razoável de instâncias etiquetadas pode ser difícil, dispendioso e demorado de obter, uma vez que envolve necessariamente conhecimento especializado, tais como anotadores humanos. Este é um desafio comum na investigação em diversas áreas sendo mais comum na área da saúde, mais frequentemente fundamentado em estudos em que os participantes utilizam instrumentos de self-report. Nesta dissertação foi elaborado um algoritmo semi-supervisionado com recurso a dois classificadores, support vector machine e random-forest. Os resultados são promissores, tendo-se obtido um acréscimo de 5% no desempenho do algoritmo, relativamente aos algoritmos em separado e com a capacidade de etiquetar praticamente todos os dados.pt_PT
dc.description.abstractLabelled data are essential for supervised learning. However, they are often available only in small quantities, while unlabelled data may be abundant. Using unlabelled data together with labelled data is of both theoretical and practical interest. The efficiency of supervised learning is highly dependent on labelled instances. However, having a reasonable size of labelled instances may be difficult, expensive and time consuming to obtain since it necessarily involves expert knowledge, such as human annotators or filling self-reported questionnaires. This is a common challenge in health research, most often founded in studies where participants use self-report instruments. To address this issue, we can use semi-supervised learning methods that use both labelled and unlabelled data to construct a classifier and improve the classification performance. In this dissertation, a semi-supervised algorithm was developed using two classifiers: support vector machines and random forests. The results are promising, having achieved a 5% increase in the performance of the algorithm in comparison to the separately used algorithms and with the ability to label virtually all data.pt_PT
dc.identifier.tid203380240pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.22/23869
dc.language.isoporpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/pt_PT
dc.subjectSemi-supervisionadopt_PT
dc.subjectInteligência Artificialpt_PT
dc.subjectMetodologia de Investigação Científica em Designpt_PT
dc.subjectCNNpt_PT
dc.subjectLSTMpt_PT
dc.subjectSemi-supervisedpt_PT
dc.subjectArtificial Intelligencept_PT
dc.subjectDesign Science Research Methodologypt_PT
dc.subjectSupport vector machinept_PT
dc.titleAlgoritmo de aprendizagem semi-supervisionadapt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Engenharia Informática - Sistemas de Informação e Conhecimentopt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
DM_AndreFontes_2023_MEI.pdf
Size:
3.65 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: