详细内容或原文请订阅后点击阅览
加强我们的边境安全框架
我们正在加强边境安全框架(FSF),以帮助识别和减轻高级AI模型的严重风险。
来源:DeepMind - 新闻与博客我们正在扩大风险域并完善风险评估过程。
AI的突破正在改变我们的日常生活,从发展数学,生物学和天文学到实现个性化教育的潜力。随着我们建立越来越强大的AI模型,我们致力于负责任地开发我们的技术,并采用基于证据的方法来保持领先于新兴风险。
今天,我们将发布我们边界安全框架(FSF)的第三次迭代,这是我们尚未确定和减轻高级AI模型的严重风险的最全面的方法。
边境安全框架(FSF)此更新基于我们与行业,学术界和政府的专家的持续合作。我们还合并了从实施以前的版本和在Frontier AI安全中发展最佳实践中学到的经验教训。
框架的密钥更新
解决有害操纵的风险
通过此更新,我们引入了关键能力水平(CCL)*,重点是有害操纵 - 特别是具有强大的操纵能力的AI模型,可以滥用这些模型,这些模型可以被滥用,以系统地和实质性地改变与模型相互作用的高赌注中的识别相互作用的信念和行为,从而在额外的预期危害中,在严重的尺度上会导致额外的预期危害。
这一补充是基于我们为识别和评估驱动生成AI操纵的机制而进行的研究。展望未来,我们将继续投资于该领域,以更好地理解和衡量与有害操纵相关的风险。
从生成ai适应我们的未对准风险的方法
我们还扩展了我们的框架,以解决未来未来的AI模型可能会干扰运营商指导,修改或关闭其操作的能力的潜在情况。