介绍边境安全框架

我们分析和减轻先进AI模型带来的未来风险的方法

来源:DeepMind - 新闻与博客

我们分析和减轻先进AI模型带来的未来风险的方法

Google DeepMind一直在推动AI的界限,开发了改变我们对可能的理解的模型。我们认为,AI技术即将到来,将为社会提供宝贵的工具,以帮助应对全球关键挑战,例如气候变化,药物发现和经济生产力。同时,我们认识到,随着我们继续推进AI功能的前沿,这些突破最终可能会带来新的风险,而不是当今模型带来的风险。

今天,我们正在介绍我们的边境安全框架 - 一组协议,用于积极识别未来的AI功能,这些功能可能造成严重伤害并实施机制以检测和减轻它们。我们的框架着重于模型级别的强大能力,例如杰出代理或复杂的网络功能,引起了严重的风险。它旨在补充我们的对齐研究,该研究训练模型以按照人类价值和社会目标以及Google现有的AI责任和安全实践的套件来行动。

边境安全框架 练习

该框架是探索性的,我们希望随着我们从实施中学习,加深对AI风险和评估的理解,并与行业,学术界和政府合作时,它将大大发展。即使这些风险超出了当今模型的影响力,我们希望实施和改进框架将有助于我们准备解决这些问题。我们的目的是在2025年初之前完全实施此初始框架。

框架

今天宣布的框架的第一个版本是基于我们评估Frontier模型中关键功能的研究,并遵循了负责任的能力缩放的新兴方法。该框架具有三个关键组件:

研究 评估 负责任的能力缩放。

投资科学