Loading...
机构名称:
¥ 1.0

最近关于预测药物分子和蛋白质之间结合亲和力的研究使用了通过无监督学习技术从大型分子 SMILES 和蛋白质序列数据库中学习到的表示。虽然这些表示显著提高了预测能力,但它们通常基于一组有限的模态,并且没有利用有关分子和蛋白质之间现有关系的可用知识。我们的研究表明,从描述分子和蛋白质之间关系的多模态知识图谱中获得的增强表示可以在成熟的基准测试中产生最先进的结果(在 Therapeutics Data Commons 基准测试“药物-靶标相互作用域泛化基准”排行榜上名列第一,比之前的最佳结果提高了 8 分)。此外,我们的结果远远超过了使用仅依赖序列或 SMILES 数据的传统预训练表示在标准基准测试中取得的结果。我们发布了多模态知识图谱,整合了来自七个公共数据源的数据,其中包含超过 3000 万个三元组。我们还发布了根据我们提出的图表和基准任务源代码进行预训练的模型。

用于药物发现的知识增强表征学习

用于药物发现的知识增强表征学习PDF文件第1页

用于药物发现的知识增强表征学习PDF文件第2页

用于药物发现的知识增强表征学习PDF文件第3页

用于药物发现的知识增强表征学习PDF文件第4页

用于药物发现的知识增强表征学习PDF文件第5页

相关文件推荐

2022 年
¥2.0