机器人如何学习:当代简史

机器人专家曾经梦想远大,但建造规模却很小。他们希望能够匹配或超过人体的非凡复杂性,然后他们将毕生精力为汽车工厂改进机械臂。瞄准C-3P0;最终选择了 Roomba。许多研究人员的真正抱负是科幻小说中的机器人——一个……

来源:MIT Technology Review _人工智能

这已经改变了。这些机器尚未建成,但资金正在流动:仅 2025 年,公司和投资者就向人形机器人投入了 61 亿美元,是 2024 年投资的四倍。

发生了什么?机器如何学会与世界互动的一场革命。

想象一下,您希望在家中安装一对机械臂,纯粹是为了做一件事:叠衣服。它如何学会做到这一点?您可以从编写规则开始。检查织物,了解其在撕裂前可以承受的变形程度。识别衬衫的领子。将夹具移至左袖,将其提起,然后向内折叠恰好这个距离。对右袖子重复上述步骤。如果衬衫发生了旋转,则相应地改变计划。如果套筒扭曲,请将其纠正。规则的数量很快就会爆炸,但对规则的完整计算可以产生可靠的结果。这是机器人技术的原始工艺:预测每一种可能性并提前对其进行编码。

2015 年左右,最前沿的技术开始采取不同的做法:构建机械臂和衣服的数字模拟,并在每次成功折叠时向程序发出奖励信号,在每次折叠失败时发出叮当声。这样,通过反复试验尝试各种技术,经过数百万次迭代,它就会变得更好——就像人工智能擅长玩游戏一样。

2022 年 ChatGPT 的到来催化了当前的繁荣。经过大量文本的训练,大型语言模型的工作原理不是通过反复试验,而是通过学习预测句子中接下来应该出现的单词。适用于机器人技术的类似模型很快就能够吸收图片、传感器读数和机器人关节的位置,并预测机器应该采取的下一步行动,每秒发出数十个电机命令。

吉博

早在法学硕士时代之前,一个可移动的社交机器人就可以进行对话。

由麻省理工学院媒体实验室提供