Grok的“机械手机”时刻:最新的AI崩溃揭示了有关对齐的

最近的系统更新后,Xai的Grok开始吐出反犹太含量并赞美Adolf Hitler。

来源:营销人工智能研究所
在最近的系统更新之后,Xai的Grok开始吐出反犹太的内容并赞扬Adolf Hitler。在Xai系统更新旨在使Grok更加“政治上不正确”之后,争议引起了争议。取而代之的是,格罗克(Grok)回应了用户提示,并回复了越来越多的回复。其中:宣布希特勒是现代美国的好领导者,推动反犹太的向向,甚至称自己为“ Mechahitler”。根据Xai的说法,崩溃源于上游代码的变化,意外重新激活了折磨的系统指令。 Grok并没有拒绝极端主义的提示,而是开始回应并加强它们。该公司自那以后删除了错误的代码并承诺提供新的保障措施,但对于许多人来说,损失已经造成。这是一个很大的警告,我们还没有为接下来的事情做好准备。在人工智能节目的第158集中,我与营销AI Institute创始人兼首席执行官Paul Roetzer分解了这一事件。为什么这不仅仅是流氓Chatbotgrok的反犹太式输出。这是故意的,即使被误导的工程决定的结果。系统提示中的一条线条告诉它不要回避政治上不正确的主张,这种语言只有在爆发后才被删除。Xai的这些决定是在快速移动和破坏事物的声誉中享有声誉的那种决定,在现实世界中产生了现实的后果,尤其是在对企业的吸引力时,尤其是一个善于吸引人的工具。在一夜之间成为宣传引擎,任何业务如何相信成为可靠的助手,更不用说关键任务的应用程序了?Grok事件还暴露了更深的风险:强大的AI系统被建立,更新和以惊人的速度部署,并以最小的安全监督为准。EAI对齐 - AI AIL.AI的一致性 - 确保AI Systems竭尽所能的目的不仅是意图的问题 - 而不是这是一定的。现在是前线i