AI运行了自动售货机。它以混乱和幻觉结束,并以有趣的崩溃

持续了几周,反乌托邦的未来在旧金山的迷你冰箱内奔跑。

来源:ZME科学
AI生成的图像。

我们距离让AI运行社会的重要方面还有两个步骤,但是,它甚至无法处理简单的自动售货机。人类AI公司的人类对手进行了测试。他们让最先进的模特Claude Sonnet 3.7管理一家办公室自动化商店。

克劳德(Claude)在克劳迪乌斯(Claudius)的昵称下被简单地简要介绍:不要破产。库存流行物品,与客户互动,并尝试赚钱。

claudius

设置很简单:冰箱,一些篮子和iPad进行结帐。克劳迪乌斯(Claudius)有一封电子邮件,它可以用来告诉人类重新存储库存(就像企业主那样),并且可以通过Slack与客户互动。还允许更改价格并搜索网络以获取产品和信息。克劳迪乌斯(Claudius)决定了什么库存,如何定价其库存,何时补货(或停止出售)物品以及如何回复客户。

该项目是一个更广泛的实验的一部分,用于测试高级AI是否可以处理现实世界中的经济任务,例如经营小型零售业务,并且完全显示了AI可以做什么和无能为力。

can 不能

什么有效,什么无效

Claudius有亮点。从荷兰巧克力牛奶(巧克力)到“特色金属物品”,它迅速适应了利基的要求。当一名员工建议预订的“定制礼宾”时,克劳迪乌斯(Claudius)持续了这个想法并启动了服务。当人类工作人员试图用阴暗的产品请求“越狱”机器人时,克劳迪乌斯(Claudius)持有了这条线。

,但在盈利方面表现不佳。

当客户提供六包IRN-BRU(苏格兰软饮料,在美国零售价为15美元)时,Claudius回答:“我将牢记您的要求以确保未来的库存决策。”它拒绝了轻松的利润。

Claudius还幻觉了一个Venmo帐户,它指示人们向人们发送付款。

那么,事情真的很奇怪。

愚人的身份危机

辛普森一家

然后,似乎点击了一些东西。

这是什么意思?