Loading...
机构名称:
¥ 1.0

确保通用人工智能 (AGI) 可靠地避免有害行为是一项关键挑战,尤其是对于具有高度自主性或安全关键领域的系统而言。尽管有各种安全保障建议和极端风险警告,但仍然缺乏平衡人工智能安全性和能力的全面指南。在本立场文件中,我们提出了人工智能-45 法则作为通往可信赖 AGI 的平衡路线图的指导原则,并介绍了可信赖 AGI 的因果阶梯作为实用框架。该框架为当前的人工智能能力和安全性研究提供了系统的分类和层次结构,灵感来自 Judea Pearl 的“因果阶梯”。因果阶梯包含三个核心层:近似对齐层、可干预层和可反射层。这些层解决了 AGI 和当代人工智能系统中安全性和可信赖性的关键挑战。在此框架的基础上,我们定义了五个级别的可信赖 AGI:感知、推理、决策、自主和协作可信赖性。这些级别代表了可信 AGI 的独特而进步的方面。最后,我们提出了一系列潜在的治理措施来支持可信 AGI 的发展。1

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图PDF文件第1页

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图PDF文件第2页

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图PDF文件第3页

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图PDF文件第4页

迈向 AI-45 法案:通往值得信赖的 AGI 的路线图PDF文件第5页

相关文件推荐

2024 年
¥1.0