Loading...
机构名称:
¥ 1.0

SARS-CoV-2 3CLpro 蛋白是 COVID-19 的主要治疗靶点之一,因为它在病毒复制中起着关键作用,具有各种高质量的蛋白质晶体结构,并可作为计算筛选具有改进的抑制活性、生物利用度和 ADMETox 特性的化合物的基础。ChEMBL 和 PubChem 数据库包含筛选针对 SARS-CoV-2 3CLpro 的小分子的实验数据,这扩大了学习模式和设计计算模型的机会,该模型可以在体外和体内测试之前预测任何药物化合物对抗冠状病毒的效力。在这项研究中,我们利用几个描述符评估了 27 个机器学习分类器。我们还开发了一个神经网络模型,该模型可以在 CheMBL 数据上以 91% 的准确率正确识别生物活性和非活性化学物质,在 CheMBL 和 Pubchem 的组合数据上以 93% 的准确率正确识别生物活性和非活性化学物质。非活性和活性化合物的 F1 分数分别为 93% 和 94%。在 XGB 分类器上使用 SHAP (SHapley Additive exPlanations) 从 PaDEL 描述符中找出此任务的重要指纹。结果表明,PaDEL 描述符在预测生物活性方面是有效的,所提出的神经网络设计是有效的,并且通过 SHAP 的解释因子正确地识别了重要的指纹。此外,我们使用包含超过 100,000 个分子的大型数据集验证了我们提出的模型的有效性。本研究采用了各种分子描述符来发现最适合此任务的描述符。为了评估这些可能的药物对抗 SARS-CoV-2 的有效性,需要进行更多的体外和体内研究。

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性PDF文件第1页

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性PDF文件第2页

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性PDF文件第3页

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性PDF文件第4页

使用机器学习方法预测针对 SARS-Cov-2 的候选药物化合物的生物活性PDF文件第5页

相关文件推荐