Loading...
机构名称:
¥ 1.0

摘要:机器学习 (ML) 识别共价配位位点可能会加速靶向共价抑制剂的设计,并有助于扩大可用药的蛋白质组空间。本文我们报告了基于树的模型和卷积神经网络 (CNN) 的严格开发和验证,这些模型和神经网络是在新近整理的数据库 (LigCys3D) 上训练的,该数据库包含近 800 种蛋白质中的 1,000 多个配位半胱氨酸,由蛋白质数据库中的 10,000 多个三维结构代表。树模型和 CNN 的未见测试分别产生了 94% 和 93% 的 AUC(受试者工作特征曲线下面积)。基于 AlphaFold2 预测的结构,ML 模型以超过 90% 的召回率重现了 PDB 中新配位的半胱氨酸。为了协助共价药物发现社区,我们报告了 392 种人类激酶中预测的可配体半胱氨酸及其在序列比对激酶结构(包括 PH 和 SH2 结构域)中的位置。此外,我们还发布了可搜索的在线数据库 LigCys3D(https://ligcys.computchem.org/)和网络预测服务器 DeepCys(https://deepcys.computchem.org/),这两个数据库都将通过包含新发布的实验数据不断更新和改进。本研究代表了迈向由机器学习主导的大型基因组数据和结构模型集成的第一步,旨在为下一代共价药物发现注释人类蛋白质组空间。

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力PDF文件第1页

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力PDF文件第2页

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力PDF文件第3页

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力PDF文件第4页

机器学习模型用于研究针对半胱氨酸的蛋白质组共价配体能力PDF文件第5页

相关文件推荐

2023 年
¥1.0