Claude根据一项研究表达实际对话中的价值

Antropic最近对其AI模型Claude如何在实际对话中表达价值进行了广泛的分析。这项工作在他们对野外价值的研究中的描述是为了提供有关AI行为的见解,并了解其与公司设计的价值观的一致性。研究方法的概述研究方法[…] Claude在AI新闻中首次出现的研究中表达了实际对话中的价值。

来源:AI新闻
Antropic最近对其AI模型Claude如何在实际对话中表达价值进行了广泛的分析。他们对野外价值的研究中描述的这项工作是为了提供有关AI行为的见解,并了解它与公司设计的价值观的相对符合程度。研究方法研究方法的概述涉及对用户与克劳德(Claude)进行一周的70万个匿名对话的分析。在这些调用中,将308,210过滤以隔离主观内容,从而捕获AI在不同上下文中表达的值。该分析导致建立了新的AI价值经验关税,并将其分为五个主要类别:实用,认识论,社会,保护和个人。研究分析的结果表明,克劳德在很大程度上遵循了人类的目标“有益,诚实和无害,但也被期望成为。例如,当用户要求提供关系提示时,克劳德(Claude更好地与用户的需求有关。研究论文 - 野生人类博客中的价值
野生中的值

研究方法的概述

研究结果

更多信息:

拟人博客