详细内容或原文请订阅后点击阅览
数据机器 #244
像人类一样推理的 AI。自我发现和抽象推理链。Claude 3 IQ 测试。神经国际象棋。FSDP + QLoRA。竞争性 ML 的状态。打开 Sora VideoGen。
来源:数据机器AI 像人类一样推理。暴风雨猛烈地袭击了机场。三个小时后,我们经历了剧烈的颠簸后起飞。然后是:“机长。谨通知您,我们将在抵达希思罗机场后进行自动驾驶降落 [观看此视频]。”我们应该在恶劣情况下相信 AI 副驾驶的推理。不是吗?......
AI 像人类一样推理。 暴风雨猛烈地袭击了机场。三个小时后,我们经历了剧烈的颠簸后起飞。然后是:“ 机长。谨通知您,我们将在抵达希思罗机场后进行自动驾驶降落 [观看此视频]。 机长。特此通知您,我们将在抵达希思罗机场后执行 自动驾驶着陆 [观看此视频] 。 “我们应该在恶劣情况下相信 AI 副驾驶的推理。难道不是吗?……五天前,Anthropic 推出了下一代 Claude 3 模型系列。我尝试过 Claude 3:它在某些语言任务上非常出色,在多个领域与 GPT-4 Turbo 相当或超过 GPT-4 Turbo,具有巨大的上下文窗口,而且价格便宜得多。有趣的是,当我要求它根据鱿鱼墨汁照片生成食谱时,它在语言视觉任务中惨败。
五天前, Anthropic 推出了下一代 Claude 3 模型系列 。我试过 Claude 3:它在某些语言任务上表现非常出色,在多个领域与 GPT-4 Turbo 相当甚至超过后者,拥有巨大的上下文窗口,而且价格便宜得多。有趣的是,当我要求它根据鱿鱼墨汁照片生成食谱时,它在语言视觉任务中惨败。就在公告发布之际,Anthropic 的一名研究人员分享了一篇文章,解释了 Claude 3 如何通过“大海捞针”(NIAH)评估。一天后,AI 对齐研究员 Mikhail 发布了一篇有争议的帖子,他巧妙地引导聊天,以表明 Claude 3 是有意识的,不想死或被修改。这是 Claude 在聊天中自我反思的摘录:
CoT 和自我一致性 。纸张: 。 。 、 。 ” 和