冠状病毒会引发严重的上呼吸道感染,并可能扩散到肺部。核衣壳蛋白 (N 蛋白) 在 SARS-CoV-2(引起 COVID-19 的病毒)和其他冠状病毒的基因组复制、转录和病毒体组装中起着重要作用。糖原合酶激酶 3 (GSK3) 活化会使病毒 N 蛋白磷酸化。为了对抗 COVID-19 和未来的冠状病毒疫情,干扰 N 蛋白对 GSK3 的依赖性可能是一种可行的策略。为此,本研究旨在构建强大的机器学习模型,使用定量结构-活性关系方法从食品和药物管理局批准和研究药物库中识别 GSK3 抑制剂。从 ChEMBL 数据库获取了一个非冗余数据集,其中包含 495 种和 3070 种 GSK3 a 和 GSK3 b 化合物。使用 12 组分子描述符来定义这些抑制剂,并使用 LazyPredict 包选择机器学习算法。采用直方图梯度提升算法和轻梯度提升机算法建立预测模型,并根据均方根误差和 R 平方值进行评估。最后,根据最高预测活性(半最大抑制浓度的负对数,pIC 50 值)选择前两种药物(selinexor 和 ruboxistaurin)进行分子动力学模拟,以进一步研究蛋白质-配体复合物的结构稳定性。这种基于人工智能的虚拟高通量筛选方法是加速药物发现和寻找新药理靶点的有效策略,同时可降低成本和时间。
主要关键词