更新边境安全框架

我们的下一个FSF迭代在通往AGI>的道路上列出了更强大的安全协议

来源:DeepMind - 新闻与博客

我们的下一个FSF迭代在通往AGI>的道路上列出了更强大的安全协议

AI是一种强大的工具,正在帮助释放新的突破,并在我们这个时代的某些最大挑战中取得了重大进展,从气候变化到药物发现。但是随着发展的进展,高级功能可能会带来新的风险。

这就是为什么我们去年介绍了前沿安全框架的第一次迭代 - 一套协议,以帮助我们领先于强大的Frontier AI模型可能的严重风险。从那以后,我们与行业,学术界和政府专家合作,加深了我们对风险的理解,对其进行测试的经验评估以及我们可以应用的缓解。我们还在安全和治理过程中实施了评估诸如Gemini 2.0等边境模型的框架。由于这项工作,今天我们发布了一个更新的边境安全框架。

引入 边境安全框架

框架的密钥更新包括:

    对我们关键能力水平(CCL)的安全水平建议,有助于确定在哪里遏制去渗透风险的最强大努力,以实现更一致的程序,以使我们如何应用部署缓解行业,以使行业领先的欺骗性一致性风险
  • 对我们关键能力水平(CCL)的安全级别建议,帮助确定需要遏制彻底渗透风险的最强大努力
  • 实施更一致的程序,以实现我们如何应用部署缓解范围
  • 概述行业领先的欺骗性一致性风险
  • 提高安全性的建议

    更广泛的研究

    部署缓解过程

    欺骗性对准风险的方法

    结论

    在我们的AI原则的指导下,我们将继续审查和发展框架,这进一步概述了我们对负责任发展的承诺。

    AI原则 首尔边境AI安全承诺