通过图神经网络进行恶意软件家族分析的序列特征提取 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

通过图神经网络进行恶意软件家族分析的序列特征提取

2022年9月25日 07:00 33 Comments

恶意软件对我们的设备和生活造成了很大的危害。我们迫切希望了解恶意软件的行为及其造成的威胁。恶意软件的大多数记录文件都是可变长度的、带有时间戳的基于文本的文件，例如事件日志数据和动态分析配置文件。利用时间戳，我们可以将这些数据分类为基于序列的数据，以便进行后续分析。然而，处理可变长度的基于文本的序列很困难。此外，与自然语言文本数据不同，信息安全中的大多数序列数据都具有特定的属性和结构，例如循环、重复调用、噪声等。为了深入分析 API 调用序列及其结构，我们使用图来表示序列，这可以进一步研究信息和结构，例如马尔可夫模型。因此，我们设计并实现了一个注意力感知图神经网络 (AWGCN) 来分析 API 调用序列。通过 AWGCN，我们可以获得序列嵌入来分析恶意软件的行为。此外，分类实验结果表明，AWGCN 在 call-like 数据集中的表现优于其他分类器，而嵌入可以进一步提高经典模型的性能。

来源:La Biblia de la IA

🔘 论文页面：arxiv.org/abs/2208.05476

🔘 论文页面

摘要

恶意软件（malware）对我们的设备和生活造成了很大的危害。我们渴望了解恶意软件的行为及其造成的威胁。大多数恶意软件的记录文件都是长度不定、带有时间戳的基于文本的文件，例如事件日志数据和动态分析配置文件。利用时间戳，我们可以将这些数据分类为基于序列的数据，以便进行后续分析。然而，处理长度可变的基于文本的序列很困难。此外，与自然语言文本数据不同，信息安全中的大多数序列数据具有特定的属性和结构，例如循环、重复调用、噪声等。为了深入分析 API 调用序列及其结构，我们使用图形来表示序列，这可以进一步研究信息和结构，例如马尔可夫模型。因此，我们设计并实现了一个注意力感知图神经网络（AWGCN）来分析API调用序列。通过AWGCN，我们可以获得序列嵌入来分析恶意软件的行为。此外，分类实验结果表明，AWGCN在类似调用的数据集中表现优于其他分类器，并且嵌入可以进一步提高经典模型的性能。

作者

S. W. Hsiao，P. Y. Chu

喜欢这篇文章？关注此博客以了解更多信息。

恶意软件结构调用了解调用序列嵌入篇文章行为 API 文本长度例如 AWGCN 分析造成页面序列数据

通过图神经网络进行恶意软件家族分析的序列特征提取

摘要

作者

其他外部链接

Tags

XiaoMi-AI