Google 的各个团队都在努力将这些研究成果应用并落实到我们的模型、产品和风险管理中。例如,2019 年的论文“模型报告的模型卡”为人工智能模型定义了“营养标签”,该标签随后在 Google 和整个行业中得到采用。2023 年的论文“算法系统的社会技术危害:确定危害减少的分类法”提出了一种人工智能危害分类法,为我们发布前的风险评估提供了参考(见第 18 页)。此外,2023 年的一篇 Google DeepMind 论文研究了未来更强大的通用模型可能带来的新风险(例如网络安全威胁),并提出了一种用于评估模型抵御这些风险的预警系统方法,该论文正在用于为负责任的模型训练、部署和安全决策提供参考。
主要关键词