癌症是全球死亡的主要原因,根据2020年全球癌症统计数据,2020年导致了超过1000万人的死亡。潜在的癌症疗法涉及通过抑制PARP-1靶向DNA修复过程。在这项研究中,使用非冗余的2018 PARP-1抑制剂构建了分类模型。简要地,通过12种指纹类型描述化合物,并使用随机森林算法以及各种采样方法构建。的结果表明,使用超采样方法的Pubchem产生了最佳性能,Matthews相关系数> 0.7,同时也提供了可预处的分子特征。此外,根据Gini指数确定的特征重要性表明,芳香/环/杂环部分,含氮的指纹和乙醚/醛/酒精部分对于PARP-1抑制很重要。最后,我们的预测模型被部署为称为PARP1Pred的Web应用程序,并在https://parp1pred.streamlitapp.com上公开可用,允许用户使用其笑容的符号作为输入来预测查询化合物的生物学活动。预计本文所述的模型将有助于发现有效的PARP-1抑制剂。关键字:PARP-1,DNA维修,机器学习,QSAR,WebServer,CheminInformatics
主要关键词