摘要背景:中西药联用增加了所摄入化合物的复杂性。目的:利用人工智能方法开发一种基于化学结构的中西药肝毒性化合物筛选方法。方法:从公开数据库和发表的文献中收集药物性肝损伤(DILI)数据。将DILI数据形成的整个数据集以大约3:1的比例随机分为训练集和测试集。采用SGD(随机梯度下降)、kNN(k最近邻)、SVM(支持向量机)、NB(朴素贝叶斯)、DT(决策树)、RF(随机森林)、ANN(人工神经网络)、AdaBoost、LR(逻辑回归)和一种深度学习模型(深度信念网络,DBN)构建肝毒性化合物筛选模型。结果:本研究共收集了2035个肝毒性化合物数据集,其中1505个化合物作为训练集,530个化合物作为测试集。结果表明,RF在训练集上的分类准确率(CA)为0.838,F1-score为0.827,Precision为0.832,Recall为0.838,曲线下面积(AUC)为0.814;在测试集上的分类准确率(CA)为0.767,F1为0.731,Precision为0.739,Recall为0.767,AUC为0.739,优于其他8种机器学习方法。DBN在测试集上的分类准确率为82.2%,高于其他任何机器学习模型。
醋酸钙 IF001-00 醋酸地塞米松 IF002-00 醋酸地塞米松乳膏 EF001-00 醋酸氢化可的松 IF003-00 醋酸甲羟孕酮 IF004-01 醋酸钠 IF005-00 乙酰唑胺 IF006-00 乙酰半胱氨酸 IF007-00 N-乙酰-L-蛋氨酸 IF008-00 阿昔洛韦 IF009-00 阿昔洛韦片 EF002-00 阿昔洛韦乳膏 EF003-00 乙酰水杨酸 IF010-01 乙酰水杨酸片 EF004-00 抗坏血酸IF011-01 抗坏血酸片 EF005-00 抗坏血酸注射液 EF006-00 苯甲酸 IF012-01 硼酸 IF013-00 柠檬酸 IF014-00 脱氢胆酸 IF015-00 硬脂酸 IF016-00 叶酸 IF017-00 叶酸片 EF007-00 磷酸 IF018-00 乳酸 IF019-00 甲芬那酸 IF020-01 萘啶酸 IF021-00 萘啶酸片 EF008-00 萘啶酸口服混悬液 EF009-00烟酸 IF022-01 对氨基苯甲酸 IF023-00 水杨酸 IF024-01 山梨酸 IF025-00 三氯乙酸 IF026-00 十一烯酸 IF027-00 腺苷 IF028-01 琼脂 IF029-00 灌溉用无菌水 IF030-00 注射用水 IF031-00 纯净水 IF032-00