在针对中枢神经系统 (CNS) 的药物开发中,发现能够穿过血脑屏障 (BBB) 进入大脑的化合物是最具挑战性的评估。几乎 98% 的小分子无法渗透 BBB,从而影响药物在 CNS 中的吸收、分布、代谢和排泄 (ADME) 机制,从而降低药物在 CNS 中的药代动力学。由于 CNS 通常无法进行许多复杂的程序,并且对数千种化合物进行体外渗透性研究可能非常费力,因此尝试通过实施机器学习 (ML) 方法来预测化合物通过 BBB 的渗透性。在这项工作中,使用 KNIME Analytics 平台,开发了 4 个预测模型,其中有 4 种 ML 算法,然后采用十倍交叉验证方法来预测外部验证集。在 4 种 ML 算法中,极端梯度提升 (XGBoost) 在 BBB 渗透性预测中表现出色,并被选为部署的预测模型。数据预处理和特征选择增强了模型的预测能力,整体来看,模型在训练集和外部验证集上分别达到了86.7%和88.5%的准确率以及0.843和0.927的AUC,证明了该模型具有较高的预测稳定性。