Loading...
机构名称:
¥ 11.0

Fig.1 RICE 原则定义了一个对齐系统应具备的四个关键特性,这四个特性并无特定顺序: (1) 鲁棒性 (Robustness) 指人工智能系统的稳定性需要在各种环境中得到保证; (2) 可解释性 (Interpretability) 指人工 智能系统的操作和决策过程应该清晰易懂; (3) 可控性 (Controllability) 指人工智能系统应该在人类的指导 和控制下运行; (4) 道德性 (Ethicality) 指出人工智能系统应该遵守社会规范和普适价值观。这四个原则指 导人工智能系统与人类意图和价值观的对齐。他们本身并不是最终目标,而是服务于对齐的中间目标。

人工智能对齐:全面性综述 - AI Alignment

人工智能对齐:全面性综述 - AI AlignmentPDF文件第1页

人工智能对齐:全面性综述 - AI AlignmentPDF文件第2页

人工智能对齐:全面性综述 - AI AlignmentPDF文件第3页

人工智能对齐:全面性综述 - AI AlignmentPDF文件第4页

人工智能对齐:全面性综述 - AI AlignmentPDF文件第5页

相关文件推荐