Loading...
机构名称:
¥ 1.0

本技术报告概述了一种从机械角度研究代理行为的方法。机械解释有助于更深入地理解代理,因为它们描述了控制行为的因果关系——它们解释了代理为什么会这样做。具体来说,应该使用因果分析工具来研究代理行为(Spirtes 等人,2000 年;Pearl,2009 年;Dawid,2015 年)。在此处概述的方法中,分析师进行实验以确认 AI 系统假设的行为结构的存在。具体而言,该方法鼓励提出简单的因果解释,这些解释涉及高级概念(“代理喜欢绿苹果而不是红苹果”),从而抽象出代理的低级(神经)内部运作。

人工智能安全的代理行为因果分析

人工智能安全的代理行为因果分析PDF文件第1页

人工智能安全的代理行为因果分析PDF文件第2页

人工智能安全的代理行为因果分析PDF文件第3页

人工智能安全的代理行为因果分析PDF文件第4页

人工智能安全的代理行为因果分析PDF文件第5页

相关文件推荐

2021 年
¥2.0