Rodrigues, Maria de Fátima CoutinhoAbreu, José Miguel Fernandes2018-02-142018-02-142016http://hdl.handle.net/10400.22/11013Portugal é um país com grande tradição de exportação de vinho, sendo os Vinhos Verdes os primeiros vinhos portugueses conhecidos nos mercados internacionais. Como tal, a certificação dos vinhos e a avaliação da sua qualidade são elementos-chave neste contexto. Parte integrante do processo de certificação do Vinho Verde são os testes físico-químicos, que são assegurados por análises laboratoriais tais como: valores de pH, açúcar, álcool, entre outros. Adicionalmente, o processo de certificação passa por testes sensoriais (visão, olfato, paladar) realizados por provadores que são peritos certificados para o efeito. Neste projeto de dissertação, propõe-se desenvolver modelos de Data Mining para prever/standardizar a avaliação sensorial efetuada pelos peritos, através da correlação das características sensoriais dos vinhos com as respetivas características físico-químicas. Para tal, serão extraídas da base de dados da entidade certificadora, características físico-químicas e respetivas avaliações sensoriais de diversas amostras de Vinho Verde relativas ao último ano de certificação - 2015, que serão usadas para desenvolver os modelos de Data Mining. Sendo os dados na sua maioria compostos por valores numéricos contínuos e o atributo a prever ordinal (escala de valores compreendida entre 1 e 10) a seleção das técnicas a aplicar são questões críticas. Pelo que várias técnicas serão testadas e avaliadas tais como, árvores modelo, support vector machine e random forest. O objetivo principal será desenvolver modelos com uma taxa de previsão aceitável, para apoiar os peritos nas avaliações do vinho e potencialmente, melhorar a qualidade e a velocidade das suas decisões.Portugal has a remarkable tradition of wine exportation. Vinho Verde was one of the first Portuguese wines to be exported to several countries in the world. Therefore, the certification of wines and their quality evaluation are key elements in this context. As part of the Vinho Verde wine certification process, physical and chemical tests are performed by the Comissão de Viticultura da Região dos Vinhos Verdes (CVRVV) laboratory. Among other tests, they evaluate pH, sugar and alcohol levels. Additionally, the wine certification relies on sensory tests (sight, smell and taste) performed by certified wine experts. This dissertation aims to develop data mining models for forecasting sensory results performed by wine taster experts through the correlation with both the wine’s physical and hemical characteristics. The dataset will be extracted from the certifying organization database, and will consist of several physical and chemical characteristics and their corresponding sensory evaluation of Vinho Verde wine samples. These data will be used to develop data mining models. The dataset is mostly composed of continuous numeric values, moreover the attribute to predict is an ordinal (scale values between 1 and 10), therefore selecting the applicable techniques is critical. Various techniques will be tested and evaluated such as tree models, support vector machine and random forest. The main goal is to develop models with a reliable forecast rate to support experts in their wine evaluations and potentially improve the quality and speed of their decisions.porCiência do Vinho VerdeÁrvores de decisãoMáquinas de suporte vectorialFlorestas aleatóriasVinho Verde ScienceDecision treesBagged treesSupport vector machineRandom forestModelos de Data Mining para suporte a avaliações sensoriais do vinhomaster thesis201750198