AI运行了自动售货机。它以混乱和幻觉结束，并以有趣的崩溃 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

AI运行了自动售货机。它以混乱和幻觉结束，并以有趣的崩溃

2025年7月29日 03:20 33 Comments

持续了几周，反乌托邦的未来在旧金山的迷你冰箱内奔跑。

来源:ZME科学

AI生成的图像。

我们距离让AI运行社会的重要方面还有两个步骤，但是，它甚至无法处理简单的自动售货机。人类AI公司的人类对手进行了测试。他们让最先进的模特Claude Sonnet 3.7管理一家办公室自动化商店。

克劳德（Claude）在克劳迪乌斯（Claudius）的昵称下被简单地简要介绍：不要破产。库存流行物品，与客户互动，并尝试赚钱。

claudius

设置很简单：冰箱，一些篮子和iPad进行结帐。克劳迪乌斯（Claudius）有一封电子邮件，它可以用来告诉人类重新存储库存（就像企业主那样），并且可以通过Slack与客户互动。还允许更改价格并搜索网络以获取产品和信息。克劳迪乌斯（Claudius）决定了什么库存，如何定价其库存，何时补货（或停止出售）物品以及如何回复客户。

该项目是一个更广泛的实验的一部分，用于测试高级AI是否可以处理现实世界中的经济任务，例如经营小型零售业务，并且完全显示了AI可以做什么和无能为力。

can 不能

什么有效，什么无效

Claudius有亮点。从荷兰巧克力牛奶（巧克力）到“特色金属物品”，它迅速适应了利基的要求。当一名员工建议预订的“定制礼宾”时，克劳迪乌斯（Claudius）持续了这个想法并启动了服务。当人类工作人员试图用阴暗的产品请求“越狱”机器人时，克劳迪乌斯（Claudius）持有了这条线。

，但在盈利方面表现不佳。

当客户提供六包IRN-BRU（苏格兰软饮料，在美国零售价为15美元）时，Claudius回答：“我将牢记您的要求以确保未来的库存决策。”它拒绝了轻松的利润。

Claudius还幻觉了一个Venmo帐户，它指示人们向人们发送付款。

那么，事情真的很奇怪。

愚人的身份危机

辛普森一家

然后，似乎点击了一些东西。

写

这是什么意思？

Claudius 未来的要求美国实验的先进的预订的方面克劳迪工作人员库存 Claude 产品乌斯巧克力自动化阴暗的办公室电子邮件广泛的人们 AI 客户物品人类机器人简单的