Loading...
机构名称:
¥ 1.0

尽管机器学习和人工智能 (AI) 模型为应用程序带来了强大的功能,但目前大部分 AI 开发都是一个相当临时的过程。软件工程和 AI 开发使用许多相同的语言和工具,但 AI 开发作为一种工程实践仍处于早期阶段。挖掘 AI 模型的软件存储库可以深入了解 AI 开发的当前状态。但是,模型周围的许多相关元数据无法直接从存储库轻松提取,需要推理或领域知识。本文介绍了一个名为 AIMMX 的库,可以简化从软件存储库中提取 AI 模型元数据的过程。提取器有五个模块用于提取特定于 AI 模型的元数据:模型名称、相关数据集、参考、使用的 AI 框架和模型域。我们根据来自三个来源的 7,998 个开源模型对 AIMMX 进行了评估:模型库、arXiv AI 论文和最先进的 AI 论文。我们的平台以 87% 的准确率和 83% 的召回率提取元数据。作为 AI 模型元数据提取如何使研究和工具能够推进对 AI 开发的工程支持的初步示例,本文对评估数据集中的模型进行了数据和方法可重复性的探索性分析,并提供了一个用于发现和管理模型的目录工具。我们的分析表明,虽然数据可重复性可能相对较差,样本中有 42% 的模型引用了它们的数据集,但方法可重复性在我们样本中的 72% 的模型中更为常见,尤其是最先进的模型。我们收集的模型可在目录中搜索,该目录使用现有元数据来启用高级发现功能,从而高效地查找模型。

AIMMX:人工智能模型元数据提取器

AIMMX:人工智能模型元数据提取器PDF文件第1页

AIMMX:人工智能模型元数据提取器PDF文件第2页

AIMMX:人工智能模型元数据提取器PDF文件第3页

AIMMX:人工智能模型元数据提取器PDF文件第4页

AIMMX:人工智能模型元数据提取器PDF文件第5页

相关文件推荐

2020 年
¥1.0