ESS - DM - Bioestatística e Bioinformática Aplicadas à Saúde
URI permanente para esta coleção:
Navegar
Entradas recentes
- Design and implementation of an R-Based Infrastructure for an improved flow of data across the VICT3R ProjectPublication . Ribeiro, Mariana Louro; Vaas, Lea; Faria, Brígida MónicaToxicology studies in pharmaceutical drug discovery are a critical component of evaluating the safety profile of a new drug candidate. These studies aim to identify potential adverse effects of a compound on biological systems, ensuring that the drug is safe for clinical trials. When conducting animal experiments, ethical aspects are of special importance. The concept of Virtual Control Groups (VCGs) refers to the use of historical data as a substitute or complement to the conventional control groups, reducing the number of animals and saving time, costs and other resources. The VICT3R project is a public-private partnership funded by the European Innovative Health Initiative that provides methodology and infrastructure to enable the reduction of the number of animals used in safety testing by creating VCGs by creating a database containing historical control data from toxicology studies. This dissertation aims to support the VICT3R project by developing a Pipeline and an R package that facilitate the quality checking, validation and retrieval of standardized toxicology data. Once collected from the donor companies, the quality of the data can be assessed by the SEND Data Quality Control Pipeline wrapped into a graphical user interface of a shiny app, and then cleaned and stored in the VICT3R database. Retrieval from the database for creation of the VCGs is facilitated by the here developed R package. The evaluation of the tools was performed by the development of unit tests, run time analysis and user satisfaction forms. The run time evaluation indicates that these tools execution times were mainly influenced by their inputs, while still revealing good scalability of the SEND Data Quality Control Pipeline and their overall low run times for the tested real-world case scenarios. Ultimately, the user feedback highlights the good usability of both the Pipeline and the R package. The user interface of the Pipeline was rated as “Excellent” by one third of the participants and as “Good” by 50%, while considering the R package, 84% found its functions easy to use. These results emphasize the tools valued contribution to the VICT3R project.
- Applied cancer epidemiology: Survival analysis and occupational risk assessmentPublication . Coutinho, Carolina Silva; Bento, Maria José; Alves, Sandra MariaCancer epidemiology is dedicated to investigating the factors that influence the occurrence, progression, and outcomes of oncological diseases. This report presents two projects developed during an internship at the Epidemiology Service of IPO-Porto, with the aim of contributing to the advancement of knowledge in this field. The first project focused on the development of a computational tool, implemented in R, designed to automate the generation of regional (Northern Region) and national cancer survival reports. These reports are based on user-provided databases and include estimates of observed survival, net survival, age-standardized net survival, and log-rank tests for comparing net survival by sex, age group, and region. The goal was to facilitate the systematic production and dissemination of this information, promoting its regular use. The second project consisted of a study on occupational cancer in Portugal. In the absence of individual-level occupational exposure data, a population-based approach was adopted to provide preliminary insights into the association between occupation and cancer risk across Portuguese municipalities. As a result, the first national cancer survival report in Portugal was produced, and essential insights into occupational cancer risk were generated through an innovative approach adapted to the limitations of the available data.
- Understanding the clinical research lifecycle: An internship experience with application to a rare disease studyPublication . Machado, Raquel Oliveira; Santos, Janete; Alves, Sandra MariaClinical research is critical in advancing medical knowledge and improving patient care. This reports refers to the activities carried out during the internship at the Clinical Research Support Unit of the Faculty of Medicine of the University of Porto. The internship involved several stages of clinical study management: study registration, collection and organization of clinical data, and creation of case report forms. The F-CHECK study, a multicentre observational study, whose objective was to evaluate the prevalence and clinical characteristics of Fabry diseaase (FD) in the Portuguese population with idiopathic cardiomyopathies, was one of the main projects where activities were carried out. Fourteen patients (3,4%) with FD were reported from 409 participants. Non-parametric statistical tests were used with na α=0.05, along with Effect size measures. FD patients showed significant differences compared to non-FD, mainly in the hypertrophic group: prolonaged QRS (Ƿ=0.029), right bundle branch block (Ƿ˂0.001), fascicular block (Ƿ=0.033), and inferolateral fibrosis (Ƿ˂0.001). These results highlight the importance of systematic screening for FD among Portuguese patients with idiophatic cardiomyopathies, extending beyond the classic hypertrophic presentations. The internship conributed to the consolidation of competencies in clinical research and data analyis, strengthening preparation for future academic and professionals challenges.
- Comparação da precisão em templates 2D e 3D na artroplastia total do joelhoPublication . Viana, Tânia Nunes; Faria, Brígida MónicaA artroplastia total do joelho (ATJ) consiste na substituição dos componentes danificados da articulação por próteses inorgânicas, constituídas por bases metálicas e polietileno. Essa intervenção é comumente realizada em casos de osteoartrite grave, lesões articulares significativas ou outras condições médicas que causem danos irreversíveis à articulação do joelho. Os avanços na tecnologia tais como o templating digital (TD) têm contribuído para a eficiência e segurança desse procedimento, tornando-o uma opção valiosa para muitos doentes que enfrentam problemas significativos nas articulações do joelho. A TD é uma técnica de planeamento pré-operatório que recorre a imagens radiográficas digitais, geralmente em formato DICOM, em conjunto com software específicos para simular virtualmente o posicionamento e o dimensionamento das próteses. Esta abordagem permite ao cirurgião visualizar e planear a intervenção com maior precisão, ajustando os parâmetros de acordo com a anatomia individual de cada doente. Os objetivos do TD são: melhorar o planeamento pré-operatório para reduzir erros intra-operatórios relacionados com dimensionamento, alinhamento e encaixe dos implantes e proporcionar uma redução de custos. No entanto, a precisão na escolha dos implantes desempenha um papel fundamental no sucesso desta intervenção. O objetivo deste estudo é avaliar a precisão dos modelos tridimensionais (3D) em comparação com os modelos bidimensionais (2D) no âmbito da cirurgia de ATJ. Ao utilizar modelos de próteses disponíveis no software PeekMed® para o planeamento cirúrgico em doentes submetidos a ATJ, este estudo avaliou a precisão dos métodos de planeamento 2D (em incidências anteroposterior e lateral) e do planeamento 3D derivado de imagens 2D. Os resultados demonstraram que o planeamento 2D anteroposterior foi o mais fiável na previsão do tamanho dos implantes, tanto tibiais como femorais, apresentando os menores valores de erro e os limites de concordância mais estreitos. Em contraste, o planeamento 2D lateral e o planeamento 3D evidenciaram uma tendência sistemática para a sobrestimação, associada a uma maior variabilidade, especialmente no caso do componente femoral no método 3D, onde os erros (MAE e RMSE) foram significativamente mais elevados. Embora outros estudos indiquem vantagens do planeamento 3D, sobretudo com modelos obtidos por tomografia computorizada, os resultados deste trabalho não confirmaram essa superioridade. Esta discrepância pode dever-se às limitações tecnológicas da conversão de imagens 2D em modelos 3D, ainda em desenvolvimento, que podem introduzir erros de calibração e reconstrução. Assim, a análise reforça a fiabilidade atual do planeamento 2D e evidencia a necessidade de otimizar os algoritmos 3D para que este método atinja todo o seu potencial na prática cirúrgica.
- Otimização do planeamento cirúrgico através da previsão do tempo de ocupação da sala operatóriaPublication . Malheiro, Soraia Filipa Pereira; Faria, Brígida Mónica; Dias, CelesteA previsão precisa do tempo de ocupação da sala operatória é fundamental para a eficiência hospitalar, uma vez que os blocos operatórios representam uma das áreas mais críticas e financeiramente exigentes do sistema de saúde. Uma estimativa inadequada pode resultar em atrasos, cancelamentos, aumento das listas de espera e de custos, bem como a sobrecarga das equipas e insatisfação dos doentes. Por outro lado, uma previsão mais fiável permite otimizar a gestão a alocação dos recursos humanos e materiais, reduzir desperdícios, melhorar a gestão dos horários e aumentar a produtividade global do bloco operatórios. Neste contexto, a utilização de métodos ba-seados em machine learning surge como uma oportunidade para apoiar as equipas no planeamento, ao permitir integrar múltiplas variáveis clínicas e organizacionais que influenciam a duração da cirurgia, superando as limita-ções das estimativas tradicionais que têm por base essencialmente a experiência clínica. Este estudo teve como objetivo desenvolver um modelo preditivo baseado em machine learning para estimar a duração da ocupação da sala operatória, utilizando variáveis clínicas e organizacionais disponíveis no momento do agendamento. Foram avaliados dois algoritmos, Random Forest e LightGBM, aplicados a um conjunto de dados de 1246 episó-dios cirúrgicos realizados na Unidade Local de Saúde de São João entre janeiro de 2023 e dezembro de 2024. A análise considerou diferentes cenários: inclusão e exclusão de outliers e presença/ausência da variável Tempo Previsto em dois níveis de abordagem: modelo global e modelo específico por especialidade. O desempenho dos modelos foi avaliado através de validação cruzada k-fold (k=5), reportando-se o erro médio absoluto (MAE), a raiz do erro quadrático médio (RMSE) e o coeficiente de determinação (R2) como média ± desvio padrão. Os resultados evidenciaram desempenho preditivo moderado, com destaque para o Random Forest sem outliers e com a inclusão da variável Tempo Previsto, que apresentou MAE de 24,5 minutos e R2 =0,54. A análise por es-pecialidade revelou melhores resultados em Urologia (R2= 0,62) e menor precisão em Cirurgia Geral (R2 = 0,43). A variável Tempo Previsto destacou-se como o preditor mais relevante, mas outras variáveis clínicas e organizaci-onais também contribuíram para a explicação da variabilidade. Conclui-se que, embora com capacidade explicativa moderada, os modelos testados constituem uma ferramenta promissora para apoiar o planeamento cirúrgico e a gestão do bloco operatório. Estudos futuros deverão incluir variáveis adicionais e explorar algoritmos mais avançados, de forma a aumentar a robustez e aplicabilidade prática destas previsões.
- Monitorização e gestão de riscos na gravidezPublication . Moreira, Rui Jorge Leão; Dias, Cláudia Camila; Faria, Brígida MónicaO crescimento fetal é um dos principais indicadores do estado de saúde e bem-estar do feto ao longo da gestação, resultando de um processo complexo e multifatorial que envolve várias etapas. A deteção precoce de fatores de risco, bem como a monitorização e análise de biomarcadores, desempenham um papel fundamental na vigilância da gravidez e na prevenção de complicações obstétricas. Nos últimos anos, a utilização de biomarcadores, em conjunto com a ecografia obstétrica e o estudo Doppler das artérias uterinas e umbilicais, tem assumido uma importância crescente na identificação precoce de gravidezes de risco. Este estudo teve como objetivos avaliar a relação entre o peso placentário e o peso neonatal e identificar um ponto de corte da PAPP-A (Proteína Plasmática A associada à Gravidez) associado a desfechos obstétricos adversos. Foram incluídas 16492 grávidas. As variáveis categóricas foram descritas através de frequências absolutas e relativas, enquanto as variáveis contínuas foram apresentadas como média e desvio padrão ou mediana e intervalo interquartil, consoante a distribuição. As correlações foram analisadas utilizando os coeficientes de Pearson ou Spearman. Para a comparação entre grupos, aplicaram-se testes paramétricos sempre que os pressupostos foram verificados. A regressão linear múltipla foi usada para ajustar os resultados para potenciais fatores de confusão, incluindo comorbilidades maternas. Todas as análises foram realizadas no software SPSS (versão 29.0), considerando um nível de significância de 5%. Entre as participantes, 54,9% eram nulíparas e 8,9% dos recém-nascidos eram pequenos para a idade gestacional. O peso placentário apresentou correlação positiva moderada com o peso ao nascer (r = 0,517; p < 0,001). Partos pré-termo estiveram associados a menor peso placentário e neonatal comparativamente aos partos de termo. Fetos do sexo masculino apresentaram maior peso médio ao nascer (p < 0,001) e maior razão feto-placenta (p < 0,001). Sexo feminino e nuliparidade associaram-se a menor peso placentário (p < 0,001). A PAPP-A apresentou capacidade discriminativa modesta para restrição de crescimento fetal (AUC = 0,615; p < 0,001), com um ponto de corte identificado em 0,45. Os resultados confirmam a associação significativa entre peso placentário e peso neonatal, e sugerem que níveis baixos de PAPP-A, embora com capacidade preditiva limitada, podem contribuir para a identificação precoce de fetos com risco de restrição de crescimento.
- Nova biblioteca Biopython para suporte da área da Biologia MolecularPublication . Nogueira, Patrícia Maria Fernandes; Sá, Vítor Júlio da Silva eO Biopython é uma biblioteca que facilita o desenvolvimento de aplicações para bioinformática, utilizando a linguagem de programação Python. É mantida por uma associação internacional de programadores, a Open Bioinformatics Foundation, que oferece ferramentas para a análise de sequências biológicas e acesso a bases de dados online, como o NCBI. A biblioteca conta com módulos para alinhamento de sequências, estruturas de proteínas, genética de populações, entre outros. Objectivo: Sendo uma biblioteca de código aberto e contando com a colaboração de vários programadores, o objetivo do projeto centrou-se na criação de uma nova biblioteca que incorporou algumas ferramentas bioinformáticas que podem ser usadas individualmente ou em conjunto para obter informação acerca de uma sequência genética mistério. Assim, conseguiu-se que um único módulo fizesse referência a múltiplos serviços, obtivesse resultados e gerasse um relatório final para uma sequência pesquisada. Foi feito um estudo para perceber que ferramentas fariam sentido incorporar no projeto de forma a recolher informação sobre uma sequência genética. Foram então consideradas as seguintes ferramentas: ExPASy Translate Tool para fazer a tradução de uma sequência genética na sua proteína, Blast Tool para analisar a similaridade entre a proteína e uma sequência de referência, UniProt que através do Id retornado pela ferramenta anterior permite obter toda a informação sobre a proteína e variantes possíveis e patologias associadas, e por fim o DrugBank para pesquisar que fármacos podem ser relevantes para as patologias anteriores. Após a escolha de ferramentas, foi feita uma análise da biblioteca Biopython para perceber o que poderia oferecer já desenvolvido para cada uma destas ferramentas. Foi encontrado um módulo para o Blast, mas estava já descontinuado e foi substituído pelo ElasticBlast baseado na cloud, que acelera as pesquisas, mas com custos associados. UniProt, ExPASy e DrugBank não tinham ainda os serviços necessários e foram feitos de raiz. Como resultado deste projeto, foram adicionadas novas funcionalidades à biblioteca Biopython. Para apresentar os resultados de forma user-friendly, foram desenvolvidas aplicações web e desktop. Sendo o Biopython uma biblioteca open source, será possível a incorporação de novas funcionalidades que podem ser úteis e gratuitas para escolas, laboratórios, investigação e programadores que as queiram usar e também melhorar.
- Estudo clínico sobre o comportamento de adesão terapêuticaPublication . Leão, Marta Filipa Mendonça; Santos, Janete; Faria, Brígida Mónica; Moreira, EmíliaA adesão à terapêutica constitui um dos maiores desafios da prática clínica, sobretudo em doenças crónicas, influenciando diretamente os resultados em saúde. Neste sentido, o presente relatório descreve o estágio curricular desenvolvido no Núcleo de Apoio à Investigação Clínica da Faculdade de Medicina da Universidade do Porto, no âmbito do projeto europeu BEAMER (BEhavioral and Adherence Model for improving quality, health outcomes and cost-Effectiveness of healthcaRe). Este estudo clínico observacional e prospetivo teve como objetivo principal avaliar o comportamento de adesão terapêutica em doentes com insuficiência cardíaca, através da aplicação de instrumentos de autorrelato, incluindo o TAPQ (Treatment Adherence Perception Questionnaire), o MAT-7 (Medida de Adesão aos Tratamentos) e a VAS (Visual Analogic Scale) de adesão bem como questionários de avaliação de qualidade de vida e estado de saúde- EQ-5D-5L. O trabalho de estágio envolveu a participação na recolha de informação, análise e redação de resultados, em articulação com equipas multidisciplinares constituídas por profissionais de saúde e investigadores. A amostra foi constituída por 104 participantes com idade média de 62 anos (DP = 11,8), maioritariamente do sexo masculino (66,3%). Os resultados descritivos evidenciaram níveis globalmente elevados de adesão autorrelatada no TAPQ [Md=33,00; IQR 29–35,8], no MAT-7 [Md=5,715, IQR=71–5,86] e na VAS de adesão [Md=100,00; IQR=100,0 – 100,0]. A qualidade de vida relacionada com a saúde, avaliada pelo EQ-5D-5L, apresentou mediana de 7,5 [6,0–11,0], e a escala de saúde uma mediana de 70,0 [50,0 – 80,0] sugerindo limitações moderadas em alguns domínios. Na análise inferencial, observaram-se associações significativas entre o comportamento de adesão e variáveis psicométricas, nas dimensões controlo, consciência e prioridades em saúde. Este relatório evidencia a relevância da investigação clínica para a compreensão multidimensional da adesão terapêutica, permitindo identificar determinantes modificáveis que poderão sustentar futuras intervenções personalizadas. O estágio proporcionou ainda a consolidação de competências em gestão de estudos clínicos, recolha e análise de dados, reforçando a integração entre estatística aplicada, bioinformática e prática clínica.
- Identification of potential biomarkers for early detection of Colorectal CancerPublication . Pereira, Luis Gonçalo Teixeira; Lima, Luis; Brandão, Andreia; Faria, Brígida MónicaColorectal cancer (CRC) is globally classified as the second cancer type with the highest mortality rate index and the third most prevalent, which demonstrates the need to improve diagnostic procedures, making them less invasive and more efficient. The most effective screening method is, still, the colonoscopy. The fact that it is rather invasive in its nature could explain why participation rates for screening remain low. Other methods, like faecal occult blood test or tumour marker analysis (e.g. Carcinoembryonic Antigen and CA 19-9 Antigen) are less invasive but also considerably less effective. The objective of this study is to identify potential biological markers for the early detection of CRC through the analysis of public RNA-sequencing data. Samples from 54 patients with CRC and 46 healthy individuals were examined utilising several bioinformatics techniques and tools. Two separate workflows, made with different programming languages (R and Python), were developed to process and analyse genetic sequencing data. Analysing the data involves the evaluation of the quality of raw reads, removing unwanted sequences (adapters or low-quality regions), performing the alignment of processed sequences to the reference genome, followed by differential expression analysis, enrichment pathway analysis and the use of statistical techniques together with machine learning to identify genes or groups of genes with predictive potential to be used as biomarkers. Differential expression analysis identified 4,718 significantly differentially expressed genes (adjusted p-value<0.05), with a predominant pattern of downregulation in CRC samples. Notably, multiple ribosomal proteins were among the most significantly down-regulated genes. Pathway enrichment analysis revealed significant upregulation of haemostasis, blood coagulation and platelet activation processes in CRC, while ribosomal pathways, extracellular matrix organisation, and neuronal signalling were prominently down-regulated. Through machine learning approaches incorporating both statistical significance and predictive power, genes including RNU1-27P (RNA processing/small nuclear RNA pseudogene), RPL37A (ribosomal protein), MAGI2-AS3, ADGRG5, USP35 and LSMEM1 (growth and invasion regulators), SERPINF1 (coagulation and haemostasis related), IL3RA and IGF2R (among others), showed the most potential to be classified as CRC biomarkers. The identified biomarkers align with observed pathway dysregulations and still require future validation to be deemed viable in early CRC detection, therefore, potentially improving screening methods.
- Impacto e desempenho de um sistema informatizado no diagnóstico da Discinesia Ciliar PrimáriaPublication . Lopes, José Carlos Silva; Sá, Rosália; Faria, Brígida MónicaA Discinesia Ciliar Primária (DCP) é uma doença respiratória rara, de base genética, cuja complexidade diagnóstica se deve à ausência de um teste único e conclusivo. A análise do batimento ciliar, nomeadamente a orientação dos cílios, constitui um dos critérios de diagnóstico, mas o processo manual associado é moroso, sujeito a erros e altamente dependente do observador. Este estudo teve como objetivo o desenvolvimento e validação de um sistema informatizado, designado por DCP Clinical Diagnostics, para apoio ao diagnóstico da DCP, centrado na automatização da medição dos ângulos de batimento ciliar. A aplicação foi desenvolvida com recurso a tecnologias como Electron, JavaScript e HTML Canvas, resultando numa ferramenta desktop intuitiva e de fácil integração em contextos clínicos. A avaliação empírica do sistema demonstrou ganhos estatisticamente significativos em tempo de execução, quantidade de informação por imagem e número de imagens aproveitadas por diagnóstico, em comparação com o método manual tradicional. No total, a adoção da aplicação permitiu reduzir em mais de 8 horas de trabalho necessário por diagnóstico, evidenciando um impacto operacional muito expressivo. O sistema mostrou ainda elevada sensibilidade e especificidade, bem como boa aceitação por parte dos utilizadores. Os resultados obtidos sugerem que o sistema informatizado representa uma alternativa eficaz, padronizada e escalável ao processo diagnóstico manual da DCP, com potencial para melhorar a qualidade da análise, reduzir a variabilidade interobservador e promover diagnósticos mais precoces. A sua aplicabilidade é particularmente relevante em ambientes com recursos limitados ou menor especialização, podendo constituir uma ferramenta de triagem, apoio à decisão médica e formação clínica.
