Loading...
机构名称:
¥ 1.0

摘要:最近的进步突出了高质量数据在开发准确的AI模型中的关键作用,尤其是在称为实体识别(TI-NER)的威胁智能中。这项技术自动化了广泛网络报告中信息的检测和分类。但是,缺乏可扩展的注释安全数据集阻碍了TI-NER系统的开发。为了克服这一点,研究人员经常使用数据增强技术,例如合并多个带注释的NER数据集以提高品种和可扩展性。整合这些数据集面临着挑战,例如保持一致的实体注释和实体类别以及对标准化标记方案的影响。手动合并数据集在大规模上很耗时且不切实际。我们的论文介绍了Ti-Nermerger,这是一个半自动化的框架,将各种Ti-NER数据集集成到可扩展的,合规的数据集中,与Stix-2.1等网络安全标准对齐。,我们通过使用DNRTI和APTNER数据集将框架的效率和效率进行了比较,从而验证了该框架的效率和有效性,从而产生了增强APTNER(2aptner)。结果表明,手动劳动减少了94%以上,在短短几分钟内节省了几个月的工作。此外,我们应用了高级ML算法来验证集成NER数据集的有效性。我们还提供公开访问的数据集和资源,支持威胁情报和AI模型开发的进一步研究。

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架PDF文件第1页

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架PDF文件第2页

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架PDF文件第3页

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架PDF文件第4页

ti-nermerger:用于在网络安全中集成NER数据集的半自动化框架PDF文件第5页

相关文件推荐

2020 年
¥1.0