详细内容或原文请订阅后点击阅览
通过图神经网络进行恶意软件家族分析的序列特征提取
恶意软件对我们的设备和生活造成了很大的危害。我们迫切希望了解恶意软件的行为及其造成的威胁。恶意软件的大多数记录文件都是可变长度的、带有时间戳的基于文本的文件,例如事件日志数据和动态分析配置文件。利用时间戳,我们可以将这些数据分类为基于序列的数据,以便进行后续分析。然而,处理可变长度的基于文本的序列很困难。此外,与自然语言文本数据不同,信息安全中的大多数序列数据都具有特定的属性和结构,例如循环、重复调用、噪声等。为了深入分析 API 调用序列及其结构,我们使用图来表示序列,这可以进一步研究信息和结构,例如马尔可夫模型。因此,我们设计并实现了一个注意力感知图神经网络 (AWGCN) 来分析 API 调用序列。通过 AWGCN,我们可以获得序列嵌入来分析恶意软件的行为。此外,分类实验结果表明,AWGCN 在 call-like 数据集中的表现优于其他分类器,而嵌入可以进一步提高经典模型的性能。
来源:La Biblia de la IA🔘 论文页面:arxiv.org/abs/2208.05476
🔘 论文页面摘要
恶意软件(malware)对我们的设备和生活造成了很大的危害。我们渴望了解恶意软件的行为及其造成的威胁。大多数恶意软件的记录文件都是长度不定、带有时间戳的基于文本的文件,例如事件日志数据和动态分析配置文件。利用时间戳,我们可以将这些数据分类为基于序列的数据,以便进行后续分析。然而,处理长度可变的基于文本的序列很困难。此外,与自然语言文本数据不同,信息安全中的大多数序列数据具有特定的属性和结构,例如循环、重复调用、噪声等。为了深入分析 API 调用序列及其结构,我们使用图形来表示序列,这可以进一步研究信息和结构,例如马尔可夫模型。因此,我们设计并实现了一个注意力感知图神经网络(AWGCN)来分析API调用序列。通过AWGCN,我们可以获得序列嵌入来分析恶意软件的行为。此外,分类实验结果表明,AWGCN在类似调用的数据集中表现优于其他分类器,并且嵌入可以进一步提高经典模型的性能。
作者
S. W. Hsiao,P. Y. Chu
喜欢这篇文章?关注此博客以了解更多信息。
喜欢这篇文章?关注此博客以了解更多信息。