详细内容或原文请订阅后点击阅览
举报模型
拟人化发布的新闻,其模型已试图与警察联系或采取其他行动,当时他们被要求做可能是非法的事情。该公司还进行了一些实验,克劳德(Claude)威胁要勒索计划将其关闭的用户。据我所知,这个[…]
来源:O'Reilly Media _AI & ML拟人化发布的新闻,其模型已试图与警察联系或采取其他行动,当时他们被要求做可能是非法的事情。该公司还进行了一些实验,克劳德(Claude)威胁要勒索计划将其关闭的用户。据我所知,这种行为仅限于人类的一致性研究和其他成功复制这种行为的研究人员,在Claude和其他模型中。我不认为它在野外观察到,尽管它在克劳德4的型号卡中被认为是一种可能性。我强烈赞扬拟人化的开放性。毫无疑问,大多数开发AI模型的公司都希望保持这种沉默。
复制此行为 型号卡我敢肯定,人类会竭尽所能限制这种行为,尽管目前尚不清楚可以进行哪种缓解。对于任何有能力使用工具的模型,这种行为肯定是可以的,如今几乎都是每个模型,而不仅仅是克劳德。能够发送电子邮件或文字或打电话的模型可以采取各种意外操作。
,但是这里潜伏着一个更大的问题。一旦知道AI能够告知警察,就不可能将这种行为放回盒子中。它属于“您看不到的事物”类别。几乎可以肯定的是,执法和立法者会坚持认为“这是我们需要保护人们免受犯罪的行为。”从系统中训练这种行为似乎可能最终陷入法律惨败,特别是因为美国没有等同GDPR的数字隐私法。我们有拼凑的州法律,甚至这些法律也可能无法执行。
变得无法执行