恶意软件是任何可能对计算机系统造成损害的软件。恶意软件构成了对信息系统的重大威胁,这些威胁多年来遭受了几次毁灭性攻击的影响。传统的Antimalware软件由于多种恶意软件(例如多态性)的逃避技术提供了有限的效率,以防止恶意软件删除。Antimalware只能删除其签名的恶意软件,并且对零日间攻击无效和无助。几项研究工作利用受监督和无监督的学习算法成功地检测和对恶意软件进行了分类,但是在相关研究工作中占据了误报和虚假否定,以及利用不足的数据集,这些数据集未能捕获尽可能多的恶意软件家庭来概括地发现发现。这项研究利用机器学习来检测和对恶意软件进行使用机器学习技术,包括特征选择技术以及超参数优化。主成分分析用于治疗由于用于容纳大量恶意软件系列的大型数据集而导致的维度诅咒。支持向量机,K最近的邻居和决策树用于使用两个数据集进行性能比较的模型。通过使用网格搜索和K-折叠验证并调用最佳参数以实现最佳性能,以获得最佳性能,以获得最佳的检测准确性和低的检测和低底片,从而提高了模型的性能,从而增强了所选分类器的超参数以呼吁最佳性能。使用混乱矩阵,精度,召回和F1评分评估了研究模型。准确度为99%,98.64和100%,与K最近的邻居,决策树和支持向量机与CICMALMEM数据集分别具有相等数量的恶意软件和良性文件,与K最近的邻居达到了零误报,而准确性的准确性为97.7%,70%和96%的数据,而Datation却在k中相得益彰,而DATAIT则相应地数据。与K最近的邻居一起,还可以实现38的最低误报数量。该模型接受了默认超标仪的培训,以及通过调整超参数来获得的表演来获得的超级参数,并且发现优化超标仪和功能选择技术的优化能力并不一定能够与DataIns的表现更好,并且可以通过良好的数量进行良好的数量,并提供了良好的数量。未来的作品包括使用深度学习和集合学习作为分类器以及其他超参数优化技术,例如贝叶斯优化和随机搜索,其他具有较高恶意软件系列的数据集也可以用于培训。
主要关键词