由小有机化合物引起的分析干扰继续对早期药物发现构成巨大挑战。已经开发了各种计算方法来识别可能引起测定干扰的化合物。但是,由于可用于模型开发的数据稀缺,这些方法的预测准确性和适用性受到限制。在这项工作中,我们介绍了E-Guard(专家指导的鲁棒干扰复合检测的增强),这是一个新颖的框架,试图通过整合自我介绍,积极的学习和专家指导的分子产生来解决数据稀缺和失衡。e-guard迭代地用与干扰相关的分子丰富了训练数据,从而产生了具有出色性能的定量结构交流关系(QSIR)模型。我们以四个高质量数据集,氧化还原反应性,纳米酸酯酶抑制和萤火虫荧光素酶抑制的示例,证明了电子方形的实用性。与未经e-Guard数据增强的模型相比,这些数据集的MCC值最高为0.47,其富集因子的改进有两个或更高。这些结果突出了电子保守物作为缓解早期药物发现中测定干扰的可扩展解决方案的潜力。
主要关键词