全基因组关联研究 (GWAS) 可以揭示重要的基因型-表型关联,但是,必须解决数据质量和可解释性问题。对于寻求根据现有证据确定目标优先次序的药物发现科学家来说,这些问题超出了单个研究的范围。在这里,我们描述了推断的基因-性状关联的合理排名、过滤和解释,以及通过利用现有的管理和协调工作跨研究的数据聚合。对每个基因-性状关联进行置信度评估,分数完全来自汇总统计数据,将蛋白质编码基因和表型联系起来。我们提出了一种从跨研究汇总证据评估基因-性状关联置信度的方法,包括基于 iCite 相对引用率和平均排名分数对科学共识进行文献计量评估,以汇总多元证据。该方法旨在用于药物靶点假设的生成、评分和排序,已作为分析流程实施,以开源形式提供,具有公共结果数据集和专为药物研发科学家使用而设计的 Web 应用程序,网址为 https://unmtid-shinyapps.net/tiga/。
。CC-BY 4.0 国际许可 它是根据作者/资助者提供的,他已授予 medRxiv 永久展示预印本的许可。(未经同行评审认证)
LINCS 中心利用深入的基因和蛋白质表达分析来生成可直接映射到 IDG 蛋白质靶标的签名。疾病和表型本体映射是一项社区挑战,有 OMOP 和 UMLS 等实用且可行的解决方案。LINCS 扰动物包括严格定义的化学实体和 IDG 资源 DrugCentral 中包含的小分子药物。因此,LINCS 的大量人类细胞系和实验化学扰动数据集,结合 IDG 的蛋白质靶标(基因和蛋白质 ID)和 DrugCentral 活性药物成分(药物化合物)数据库,为药物靶标发现提供了紧密集成的组合资源。