摘要:入侵检测系统(IDS)对于识别网络攻击并为每种风险采取适当的措施至关重要。机器学习(ML)技术的效率在存在无关的特征和阶级失衡的情况下被妥协。在这项研究中,提出了有效的数据预处理策略,以增强模型的普遍性。使用K-均值Smote解决类别的差异。之后,我们提供了一种混合特征选择方法,该方法结合了过滤器和包装器。此外,通过改变最佳特征子集来分析超参数调整的光梯度增强机(LGBM)。实验使用了数据集 - UNSW-NB15和CICIDS-2017,其精度分别为90.71%和99.98%。由于模型的透明度和概括性很大程度上取决于理解预测的每个组成部分,因此我们采用了可解释的人工智能(XAI)方法,Shapley添加说明(SHAP)来提高对预测结果的理解。
主要关键词