2020 年 9 月,美国国家科学基金会 (NSF) 融合加速器 (CA) 在其 D 轨道第一阶段的“通过数据和模型共享实现人工智能驱动的创新” (NSF 2020) 中资助了 18 个项目。本文简要概述了这 18 个项目,这些项目侧重于将研究转化为数据和模型共享的实践,以共享开放以及涉及隐私问题的敏感数据/模型。从 2020 年 9 月到 2021 年 5 月,这些项目参加了 CA 创新课程(参见本期特刊中的 Baru 等人),并致力于概念验证原型以测试和说明他们的想法。第二阶段的提案于 2021 年 5 月提交给 NSF。18 个项目中的 6 个被选中进入第二阶段,如下面各自的项目描述中所述。 NSF 的“驾驭数据革命大构想”表达了对共享数据和数据驱动模型(特别是 ML/AI)的 ModelCommons 的需求(NSF 2018)。这些想法在 2018 年 8 月的 ACM KDD 2018 通用模型基础设施研讨会(CMI 2018)上得到了进一步阐述。2019 年 6 月发布的国家人工智能研发战略计划更新(NSTC 2019)强调了相关问题,包括 (i) 开发和提供各种数据集以满足各种人工智能兴趣和应用需求的紧迫性,同时应对标准化、隐私等相关挑战,(ii) 使培训和测试资源响应商业和公共利益,以及 (iii) 开发开源软件库和工具包以实现数据共享和访问。Track D 中开展的努力将有助于创建国家人工智能研究基础设施,正如国家人工智能安全委员会 (NSCAI 2021) 所建议的那样。 Track D 第一阶段项目涵盖了广泛的应用领域,解决了与共享开放和敏感数据和模型相关的一系列问题,包括隐私问题和访问控制考虑。这 18 个项目可以根据共同的问题和挑战分为以下几大领域:(1) 医疗保健/医学、神经科学、美国手语 (ASL)、荟萃分析、兽医学;(2) 水、
主要关键词