Loading...
机构名称:
¥ 1.0

摘要背景:药物-靶标相互作用 (DTI) 对于药物重新利用和阐明药物机制至关重要,它们收集在大型数据库中,例如 ChEMBL、BindingDB、DrugBank 和 DrugTargetCommons。然而,提供这些数据的研究数量(约 0.1 百万)可能仅占 PubMed 上包含实验性 DTI 数据的所有研究的一小部分。查找此类研究并提取实验信息是一项艰巨的任务,迫切需要机器学习来提取和管理 DTI。为此,我们开发了基于 Transformers 的双向编码器表示 (BERT) 算法的新型文本挖掘文档分类器。由于 DTI 数据与用于生成它的检测类型密切相关,因此我们还旨在合并函数来预测检测格式。结果:我们的新方法从以前未包含在公共 DTI 数据库中的 210 万项研究中识别和提取了 DTI。使用 10 倍交叉验证,我们获得了约 99% 的识别包含药物-靶标对的研究的准确率。检测格式预测的准确率约为 90%,这为未来的研究留下了改进的空间。结论:本研究中的 BERT 模型是稳健的,所提出的流程可用于识别包含 DTI 的新研究和以前被忽视的研究,并自动提取 DTI 数据点。表格输出有助于验证提取的数据和检测格式信息。总体而言,我们的方法在机器辅助 DTI 提取和管理方面取得了重大进步。我们希望它成为药物机制发现和再利用的有用补充。关键词:BERT、来自 Transformer 的双向编码器表示、用于生物医学数据的 BERT、药物靶标相互作用预测、挖掘药物靶标相互作用、生物医学文本挖掘、生物活性数据、药物再利用

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用PDF文件第1页

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用PDF文件第2页

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用PDF文件第3页

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用PDF文件第4页

使用 BERT 从整个 PubMed 中识别药物-靶标相互作用PDF文件第5页

相关文件推荐