ESS - DM - Bioestatística e Bioinformática Aplicadas à Saúde
URI permanente para esta coleção:
Navegar
Percorrer ESS - DM - Bioestatística e Bioinformática Aplicadas à Saúde por título
A mostrar 1 - 10 de 38
Resultados por página
Opções de ordenação
- Aplicação de modelos de linguagem de grande escala (Large Language Models) na análise e interpretação de dados em saúdePublication . Gomes, Daniela Silva; Faria, Brígida Mónica; Oliveira, AlexandraOs Modelos de Linguagem de Grande Escala (LLMs) têm sido progressivamente aplicados na área da saúde pela sua capacidade de interpretar dados e gerar informações com potencial clínico, que, no entanto, precisam ser validadas por profissionais de saúde antes de serem aplicadas. Na cardiologia estes modelos podem apoiar na interpretação de exames e na educação em saúde. O presente estudo tem como objetivo avaliar o desempenho de três chatbots baseados em LLMs (ChatGPT-4o, Gemini 2.5 Flash e Claude 4 Sonnet) na identificação e análise de sintomas cardíacos, fatores de risco e interpretação de eletrocardiogramas. Para isso, os modelos foram testados com três questionários distintos, um para cada categoria: pacientes, técnicos e médicos. Para avaliar a influência do histórico sobre as respostas, foram utilizadas três contas de usuário diferentes, que foram aplicadas aos três LLMs, cada uma configurada com um contexto inicial. Um perfil foi configurado para se comportar como um Técnico de Cardiopneumologia, outro como um Engenheiro de Software, e o terceiro não recebeu nenhum contexto prévio, sendo considerado um perfil 'Novo'. Para avaliar a estabilidade temporal, as respostas foram analisadas em dois momentos distintos: imediato e após duas horas. Os três questionários foram elaborados de acordo com a especificidade de cada categoria. Para o questionário dos pacientes, recorreram-se a questões frequentes disponíveis em fontes públicas; no questionário dos técnicos, as questões eram referentes à interpretação de eletrocardiogramas; e, no questionário dos médicos, as perguntas foram formuladas por cardiologistas. Cada chatbot foi testado nas três contas, e as respostas geradas foram comparadas com as respostas de referência através de métricas automáticas (BLEU, ROUGE, METEOR e BLEURT). Avaliou-se o nível de complexidade linguística através da métrica Flesch Reading Ease, de forma a analisar a adequação das respostas ao público-alvo. O ChatGPT-4o destacou-se pela maior consistência, apresentando desempenho superior nas categorias de pacientes e médicos, obtendo as melhores pontuações em todos os perfis, especialmente nas métricas BLEU e ROUGE. O Gemini obteve melhores resultados na categoria dos técnicos, enquanto o Claude manteve desempenho inferior e estável. O histórico da conta influenciou parcialmente o desempenho, mas a sua relevância temática não foi determinante, pois o perfil de Engenheiro de Software apresentou desempenho comparável ao perfil do Técnico de Cardiopneumologia. A análise temporal confirmou estabilidade, sem grandes diferenças num curto intervalo de tempo. Conclui-se que o desempenho dos modelos varia entre categorias e perfis, sendo influenciado parcialmente pelo histórico das contas, embora este não garanta vantagem consistente. A adaptação da linguagem ao público-alvo revelou-se limitada, especialmente na categoria de pacientes, onde a complexidade textual comprometeu a interpretação da informação.
- Application of machine learning techniques for a recommendation system in pharmacyPublication . Torres, Beatriz Freitas; Oliveira, Alexandra Alves; Faria, Brígida Mónica; Alves, Sandra Maria FerreiraCommunity Pharmacy (CP) plays a crucial role in the population, improving patients’ quality of life and minimising medication risks. In Portugal, CPs dispense prescription and non-prescription products. Pharmacy professionals have an added responsibility when advising non-prescription products and should pay attention to self-medication and possible interactions. Therefore, a product recommendation system that incorporates relevant information about the products supports a more informed recommendation by the professional. Although there are a few studies in the area of medication RS, they are still scarce, and to the best of our knowledge, no medication RS is applied in community pharmacies in Portugal. This work aims to develop a conceptual pharmaceutical product recommendation framework and identify relevant groups of products according to their characteristics and experts’ opinions. The specific objectives consist of describing recommendation systems in pharmacy, defining and comparing distance functions capable of creating groups of similar and clinically relevant products for pharmaceutical counselling, applying machine learning techniques and comparing them, and communicating the results. For this purpose, the background of pharmaceutical products counselling without a prescription was analysed. Public databases were selected to be included in the conceptual framework, and the data obtained was processed. Therefore, a database was obtained with 1426 products (over-the-counter medication, homoeopathic medication, and dermocosmetics) and their clinical and scientific information. In order to identify relevant groups of products, seven hierarchical (single linkage, complete linkage, average linkage, median linkage, centroid linkage, and ward linkage) and non-hierarchical (K-means) clustering techniques were applied and evaluated. Dendrograms, the Calinski-Harabasz score, silhouette score, Davies-Bouldin score and the inflexion point method were used to determine the ideal number of clusters for each technique and evaluate its validity. An experts consultation was performed to define a distance function aligned with pharmaceutical counselling. This consultation allowed the identification of the importance of the variables in the distance function definition. The resultant data was analysed in Microsoft Excel, SPSS and Python with the libraries Pandas, Natural Language Toolkit (NLTK), Unidecode, Plotly, Matplotlib, NumPy, SciPy, and Scikit-learn, using Spyder IDE. Twenty-two groups of similar products were formed with K-means, the most effective clustering approach for forming pharmacologically homogeneous groups. However, the obtained clusters did not present enough clinical relevance to support professionals during counselling. Consequently, a new distance function was defined, enhancing the importance of the pharmacotherapeutic group of the products and aligned with the results obtained in the experts’ consultation. Twenty-four groups of similar products were formed with K-means, which was once again the technique that presented pharmacologically homogeneous groups, based mainly on safe use during pregnancy and breastfeeding and pharmacotherapeutic group. The remaining clustering techniques, non-hierarchical techniques, did not present pharmacologically homogeneous groups with any of the distance functions.
- Applications of knowledge discovery for COVID-19 pandemic studyPublication . Correia, Cláudio Lima; Faria, Brígida Mónica; Fernandes, RúbenThe outbreak of tfe Severe Acute Respiratory Syndrome – Coronavirus 2 (SARS-CoV-2) – also known as COVID 19 has brought global insecurity and fear to our society. Every country in the worl figts together against the spread of this deadly disease with joining efforts. Among the standard models for COVID-19 global pandemic prediction, simple epidemiological and statistical models have received more attention from authorities, wich are popular in the media.Officials around the world are using several outbreak prediction models for COVID-19 to make informe decisions and enforce relevant control measures. Due to a high level of uncertainty and lack of essential data, standard models have shown low accuracy for long-term prediction. This work aims to show na explaratory data analysis od COVID-19 worlwide to understand the real threats and the subsequente planning of containment/mitigation actions. The machine learning models were used to study and understand the everyday exponential bahavior of the COVID-19 across the nations using real-time information from johns Hopkins University and, in particular, in Portugal, with real-time information from Portugal Health Ministry to predict future reachability. In this work, modeling diferente algorithms and evaluating their performance. These algorithms are Polynominal Regression, Support Vector Regression. For the Portuguese dataset, we modeled and evaluated the following algoritms’ performance: Linera Regression, Plynominal Regression, Support Vector Regression, Multilayer Perceptron, and Poly-MultilayerPerceptron. This work also compares three different countries (but very similar – Portugal, Spain and Italy). In the particular case of Portugal, the containment/mitigation actions used by the portuguese government were explored. A comparative analysis was also caried out between Portugal, Spain, and Italy, since the first reported case, in each country, over two months. We also study the effectiveness of mitigation measures, defined by the Portugues government, carried out by the health authorities and my fellow citizens. In the worldwide prediction of the first wave of COVID-19, the best model is the Polynominal Regression model (R-squared – 0.787, MAE – 540.39, RMSE – 782.14, nd the execution time is 0.16s), and in the second wave, the best model is Support Vector Regression (R-squared – 0.996, MAE – 17.41, RMSE 18.98, and the execution time is 0.35s). In the portuguese predictions of COVID-19 (diferente waves), the best model are Polynominal Regression, Multlayer Perceptron, and Poly-MultilayerPerceptron prediction models. In comparing three diferent countries (Portugal, Spain, and Italy), Portugal had the best performance in the testing and mitigation policies. In the study of effectiveness of mitigation measures, defined by the Portuguese government, as soon as the implementation of mitigation measures mores effective are the result of mitigation of the disease.
- Applied cancer epidemiology: Survival analysis and occupational risk assessmentPublication . Coutinho, Carolina Silva; Bento, Maria José; Alves, Sandra MariaCancer epidemiology is dedicated to investigating the factors that influence the occurrence, progression, and outcomes of oncological diseases. This report presents two projects developed during an internship at the Epidemiology Service of IPO-Porto, with the aim of contributing to the advancement of knowledge in this field. The first project focused on the development of a computational tool, implemented in R, designed to automate the generation of regional (Northern Region) and national cancer survival reports. These reports are based on user-provided databases and include estimates of observed survival, net survival, age-standardized net survival, and log-rank tests for comparing net survival by sex, age group, and region. The goal was to facilitate the systematic production and dissemination of this information, promoting its regular use. The second project consisted of a study on occupational cancer in Portugal. In the absence of individual-level occupational exposure data, a population-based approach was adopted to provide preliminary insights into the association between occupation and cancer risk across Portuguese municipalities. As a result, the first national cancer survival report in Portugal was produced, and essential insights into occupational cancer risk were generated through an innovative approach adapted to the limitations of the available data.
- Assessing functional activity of astrocytes by calcium imaging: how do astrocytes respond to the electrophysiological microenvironmentPublication . Silva, Sara Cristina da Costa e; Aroso, Miguel; Aguiar, Paulo de Castro; Faria, Brígida MónicaApesar de não serem capazes de produzir potenciais de acção, é sabido que os astrócitos integram as sinapses, sendo capazes de detectar e responder a estímulos externos com dinâmicas de cálcio espaciotemporalmente complexas, podendo modelar a transmissão sináptica. O objectivo deste projecto é avaliar as dinâmincas de cálcio dos astrócitos através da modelação do seu microambiente electrofisiológico. Para tal, culturas de astrócitos foram estimuladas recorrendo a ThinMEAs©, monitorizando a actividade de cálcio. Os resultados obtidos demonstraram que os astrócitos respondem a estímulos de ±600mV ou ±800mV, gerando uma onda de cálcio que se propaga para células vizinhas. A amplitude, tempo de subida e velocidade de propagação da onda de cálcio está dependente do estímulo, sendo que um estímulo de maior amplitude resulta numa resposta de maior amplitude, demorando mais tempo a atingir o seu pico máximo mas atingindo distâncias mais longas. Apesar de preliminares, estes resultados indicam que os astrócitos são capazes de detectar e responder a mudanças eléctricas externas. Desta forma, os astrócitos são células electricamente excitáveis, possivelmente através do seguinte mecanismo: a estimulação leva à abertura dos canais de cálcio voltagem-dependentes de maneira dependente da voltagem, que irá sensibilizar o retículo endoplasmático resultando numa cascata de libertação de cálcio, gerando uma onda de cálcio que se irá propagar através de junções comunicantes ou gliotransmissão vesicular.
- Automatic FoodEx2 classification system for food descriptionPublication . Fonseca, João Emanuel Sousa; Faria, Brígida Mónica; Reis, Luís Paulo; Pimenta, RuiFood is an impacting factor in human health. Food security protects the consumers by offering a safety net from which they can trust the quality of the product. In Europe, entities such as the European Food and Safety Authority (EFSA) are risk assessors. They provide information used to shape laws around food security. To collect data regarding food safety the EFSA developed a comprehensive food classification and description system, called FoodEx2. The FoodEx2 coding system uses manual process to map food descriptions to FoodEx2 codes. The motivation for this work comes from the reduced time that could be obtained by using an algorithm to automate the code generation. It is already known that the application of Knowledge Discovery in Databases is a fundamental area to automatically produce patterns from large quantities of data. The main objective of this project is to explore automatic approaches to classify food descriptions with FoodEx2 codes. In this work several classic classifiers are compared in the prediction of FoodEx2 base codes, a multiclass classification task. The performances were explored in distinct datasets along with different levels of text preprocessing using the metrics exact match ratio and the f1-score and document representation Bag-Of-Words with TF IDF weighting. All the datasets contain imbalanced data distributions. The documents are composed of short texts describing ingredients, dishes, and animal sample details. The performances varied mainly between datasets and classifiers. The best performing classifiers were Random Forests, Decision Trees, and Linear Support Vector Machines. The results show that the creation of an automatic classifier is dependent on further exploration of the available data.
- Bayesian pharmacokinetics: Pharmacodynamics modeling & simulationPublication . Mendonça, Verónica Maria Marques; Oliveira, Carla; Silva, Nuno ElvasPara que um fármaco entre no mercado farmacêutico, é necessário realizar estudos que demonstrem a sua eficácia e segurança. Estes estudos permitem estudar interações e influência de determinados fatores fisiológicos (idade, dieta) e patológicos (ex: problemas hepáticos) na absorção do fármaco no corpo humano. A farmacocinética (PK) tem como objetivo o estudo do processo cinético de absorção do fármaco - como também a biotransformação e eliminação, ou seja, estudo o que o corpo faz ao fármaco - usando parâmetros PK para medir a extensão do componente ativo, desde a fase de absorção até ao local de efeito. Por outro lado, a farmacodinâmica (PD) estuda o que o fármaco faz ao corpo (ex: após ocorrer ligação entre o fármaco e o recetor), isto é, estuda o efeito produzido. A análise individual em contraste com análise populacional não tem em conta fatores que podem explicar alguma da variabilidade observada no fármaco. Daí que, a abordagem populacional é muitas vezes útil quando se deseja identificar e quantificar fatores que influenciam o comportamento ou que expliquem a variabilidade (variabilidade inter-sujeitos) numa determinada população de interesse. Pois, é possível estimar o efeito do fármaco desprovido de outros fatores que possam interferir e deste modo estimar a dosagem apropriada a subpopulação específica, tais como crianças e idosos. Para a análise PK/PD usou-se modelo de efeitos fixos e de efeitos mistos não-lineares com recurso à modelação Bayesiana. A modelação Bayesiana é particularmente atraente do ponto de vista biológico, numa vez que permite a incorporação de distribuições informativas prévias. Como também é preferível, do ponto de vista da estimação, pois consegue lidar com um grande número de parâmetros e, com a não-linearidade dos processos cinéticos. Na modelação Bayesiana recorreu-se aos métodos de Markov chain-Monte Carlo, algoritmos que permitem gerar amostras cuja distribuição se vai moldando e estabilizando, à medida que o número de simulações aumenta, em torno de uma distribuição, na qual se estima os parâmetros de interesse com um determinado grau de credibilidade. O estágio na BlueClinical teve como objetivo caracterizar e perceber a análise individual e populacional da farmacocinética/farmacodinâmica para aceder à segurança e eficácia de um fármaco inovador num estudo ficcional de fase I e fase II de ensaios clínicos (conteúdo acedido por Metrum Institute). Assim foi possível explorar diferentes modelos, identificar e validar o modelo que melhor explica o estudo em causa. Neste estudo, conclui-se que o modelo que melhor explica PK/PD é o modelo de dois compartimentos e para modelar os efeitos secundários foi considerado o modelo semi-mecânico de Friberg and Karlsson.
- Bioestatística em contexto empresarialPublication . Coelho, Heitor Rafael Teixeira; Alves, Sandra; Albuquerque, JoãoA bioestatística desempenha um papel crucial em ensaios clínicos, assegurando a integridade científica e a fiabilidade dos dados desde o planeamento até à comunicação dos resultados. O presente documento retrata as atividades e o conhecimento adquiridos após a integração no departamento de Programação de Dados Clínicos e Estatística da BlueClinical an Astrum Company. Para ilustrar as atividades desenvolvidas, incluindo a elaboração de planos e listas de randomização, a programação de tabelas e a análise descritiva dos conjuntos de dados, apresenta-se a um estudo paralelo, prospetivo e randomizado, que avalia a segurança e eficácia de um fármaco para enxaqueca crónica, com dados simulados. Simularam-se 100 indivíduos, dos quais 60 foram randomizados para receber o medicamento ou placebo. Quanto à eficácia, o grupo tratado com o fármaco apresentou uma redução significativa no número de enxaquecas em comparação ao placebo. No entanto, não houve melhorias significativas na qualidade de vida ou na satisfação dos participantes. Quanto à segurança, o fármaco foi considerado seguro, sem um aumento relevante de eventos adversos em relação ao placebo. Estas atividades permitiram o desenvolvimento de competências técnicas como a programação em R e o aprofundamento da análise estatística aplicada.
- Comparação da precisão em templates 2D e 3D na artroplastia total do joelhoPublication . Viana, Tânia Nunes; Faria, Brígida MónicaA artroplastia total do joelho (ATJ) consiste na substituição dos componentes danificados da articulação por próteses inorgânicas, constituídas por bases metálicas e polietileno. Essa intervenção é comumente realizada em casos de osteoartrite grave, lesões articulares significativas ou outras condições médicas que causem danos irreversíveis à articulação do joelho. Os avanços na tecnologia tais como o templating digital (TD) têm contribuído para a eficiência e segurança desse procedimento, tornando-o uma opção valiosa para muitos doentes que enfrentam problemas significativos nas articulações do joelho. A TD é uma técnica de planeamento pré-operatório que recorre a imagens radiográficas digitais, geralmente em formato DICOM, em conjunto com software específicos para simular virtualmente o posicionamento e o dimensionamento das próteses. Esta abordagem permite ao cirurgião visualizar e planear a intervenção com maior precisão, ajustando os parâmetros de acordo com a anatomia individual de cada doente. Os objetivos do TD são: melhorar o planeamento pré-operatório para reduzir erros intra-operatórios relacionados com dimensionamento, alinhamento e encaixe dos implantes e proporcionar uma redução de custos. No entanto, a precisão na escolha dos implantes desempenha um papel fundamental no sucesso desta intervenção. O objetivo deste estudo é avaliar a precisão dos modelos tridimensionais (3D) em comparação com os modelos bidimensionais (2D) no âmbito da cirurgia de ATJ. Ao utilizar modelos de próteses disponíveis no software PeekMed® para o planeamento cirúrgico em doentes submetidos a ATJ, este estudo avaliou a precisão dos métodos de planeamento 2D (em incidências anteroposterior e lateral) e do planeamento 3D derivado de imagens 2D. Os resultados demonstraram que o planeamento 2D anteroposterior foi o mais fiável na previsão do tamanho dos implantes, tanto tibiais como femorais, apresentando os menores valores de erro e os limites de concordância mais estreitos. Em contraste, o planeamento 2D lateral e o planeamento 3D evidenciaram uma tendência sistemática para a sobrestimação, associada a uma maior variabilidade, especialmente no caso do componente femoral no método 3D, onde os erros (MAE e RMSE) foram significativamente mais elevados. Embora outros estudos indiquem vantagens do planeamento 3D, sobretudo com modelos obtidos por tomografia computorizada, os resultados deste trabalho não confirmaram essa superioridade. Esta discrepância pode dever-se às limitações tecnológicas da conversão de imagens 2D em modelos 3D, ainda em desenvolvimento, que podem introduzir erros de calibração e reconstrução. Assim, a análise reforça a fiabilidade atual do planeamento 2D e evidencia a necessidade de otimizar os algoritmos 3D para que este método atinja todo o seu potencial na prática cirúrgica.
- Comparative study of adjustement methods for confounding variablesPublication . Silva, Inês Fortuna Alves da; Antunes, Luís; Faria, Brígida MónicaObservational studies provide relevant evidence; however, they have an inherent lack of balance of baseline variables distribution between the study groups, making it difficult to understand the real treatment effect. There are many methods to balance the confounders. Traditional covariate adjustment is the most used however, currently, it is also common to apply techniques based on propensity score (PS). One of them is Inverse Probability of Treatment Weighting (IPTW). The application of IPTW involves comparing two groups of samples weighed by inverse probability of treatment. The main advantage of using IPTW, compared to other PS techniques, is to allow all patient data to be preserved, and compared to classical adjustment methods, it allows balancing and evaluating this balance of confounders before assessing the outcome. In this study, the effect of two neoadjuvant treatments for HER2-positive breast cancer was analysed. The treatments differed in four additional cycles of pertuzumab. Two methods of balancing the distribution of variables were applied, the IPTW and the traditional regression adjustment methods. The results after the application of both mentioned techniques permitted to conclude that the therapy with double-block anti-HER2 seems more favourable. Besides, this treatment enabled a greater number of patients with pathologic complete response (pCR). It also allowed a reduction in the number of radical mastectomies. Although there were statistically significant differences in the type of surgert between the study groups, the difference in pCR was not significant (p > 0.05). This work had some limitations, such as the low number of patients with certain characteristics, among other factors, which conditioned a clear perception of the results. In this sense, it will be useful to expand this study to include more patients with heterogeneous features, allowing to get more robust conclusions.
