获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要:定量结构-活性关系 (QSAR) 旨在将分子结构特性与相应的生物活性关联起来。机会相关性和多重共线性是生成 QSAR 模型时经常遇到的两个主要问题。特征选择可以通过删除冗余或不相关的分子描述符来显著提高 QSAR 的准确性和可解释性。人工蜂群算法 (ABC) 模仿蜜蜂群的觅食行为,最初是为解决连续优化问题而提出的。它已应用于分类的特征选择,但很少用于回归分析和预测。本文使用二元 ABC 算法来选择 QSAR 中的特征(分子描述符)。此外,我们提出了一种改进的基于 ABC 的 QSAR 特征选择算法,即 ABC-PLS-1。交叉和变异算子被引入到已聘用蜜蜂和旁观蜜蜂阶段来修改每个解决方案的几个维度,这不仅节省了将连续值转换为离散值的过程,而且还减少了计算资源。此外,提出了一种新的贪婪选择策略,即选择准确率更高、特征更少的特征子集,有助于算法快速收敛。使用三个QSAR数据集对所提算法进行了评估。实验结果表明,ABC-PLS-1在准确率、均方根误差和所选特征数量方面优于PSO-PLS、WS-PSO-PLS和BFDE-PLS。此外,我们还研究了在跟踪回归问题时是否实施侦察蜂阶段,并得出了一个有趣的结论:在处理低维和中维回归问题的特征选择时,侦察蜂阶段是多余的。