摘要 道德 AI 框架旨在鼓励 AI 应用程序的问责制、责任制和透明度。它们为道德设计提供了原则。要真正透明,AI 应用程序的用户应该清楚设计者遵循了负责任的 AI 原则。为了测试用户评估 AI 系统责任的难易程度,并了解道德 AI 框架之间的差异,我们根据四个负责任的 AI 框架评估了四个商业聊天机器人。我们发现道德框架产生了截然不同的评估分数。许多道德 AI 框架包含的要求/原则对于聊天机器人开发人员以外的任何人来说都难以评估。我们的结果还表明,特定领域的道德 AI 指南比独立于领域的框架更易于使用,并能产生更多实用见解。我们得出结论,道德 AI 研究人员应该专注于研究特定领域而不是整个 AI,道德 AI 指南应该更多地关注制定可衡量的标准,而不是陈述高级原则。