数据机器 #244 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

数据机器 #244

2024年3月10日 11:37 33 Comments

像人类一样推理的 AI。自我发现和抽象推理链。Claude 3 IQ 测试。神经国际象棋。FSDP + QLoRA。竞争性 ML 的状态。打开 Sora VideoGen。

来源:数据机器

AI 像人类一样推理。暴风雨猛烈地袭击了机场。三个小时后，我们经历了剧烈的颠簸后起飞。然后是：“机长。谨通知您，我们将在抵达希思罗机场后进行自动驾驶降落 [观看此视频]。”我们应该在恶劣情况下相信 AI 副驾驶的推理。不是吗？......

AI 像人类一样推理。 暴风雨猛烈地袭击了机场。三个小时后，我们经历了剧烈的颠簸后起飞。然后是：“ 机长。谨通知您，我们将在抵达希思罗机场后进行自动驾驶降落 [观看此视频]。 机长。特此通知您，我们将在抵达希思罗机场后执行自动驾驶着陆 [观看此视频] 。 “我们应该在恶劣情况下相信 AI 副驾驶的推理。难道不是吗？……

五天前，Anthropic 推出了下一代 Claude 3 模型系列。我尝试过 Claude 3：它在某些语言任务上非常出色，在多个领域与 GPT-4 Turbo 相当或超过 GPT-4 Turbo，具有巨大的上下文窗口，而且价格便宜得多。有趣的是，当我要求它根据鱿鱼墨汁照片生成食谱时，它在语言视觉任务中惨败。

五天前， Anthropic 推出了下一代 Claude 3 模型系列。我试过 Claude 3：它在某些语言任务上表现非常出色，在多个领域与 GPT-4 Turbo 相当甚至超过后者，拥有巨大的上下文窗口，而且价格便宜得多。有趣的是，当我要求它根据鱿鱼墨汁照片生成食谱时，它在语言视觉任务中惨败。

就在公告发布之际，Anthropic 的一名研究人员分享了一篇文章，解释了 Claude 3 如何通过“大海捞针”（NIAH）评估。一天后，AI 对齐研究员 Mikhail 发布了一篇有争议的帖子，他巧妙地引导聊天，以表明 Claude 3 是有意识的，不想死或被修改。这是 Claude 在聊天中自我反思的摘录：

CoT 和自我一致性。纸张：。。、。 ” 和

Turbo 自动推理希思罗任务语言文章机场 Claude 机长 Anthropic AI 驾驶发布聊天 GPT 惨败

数据机器 #244

其他外部链接

Tags

XiaoMi-AI