机器人将学会在“邪恶的另一个自我”的帮助下更有效地握住物体

教机器人抓取物体是一项漫长而无聊的任务,这就是为什么科学家们试图将它们转移到使用人工智能的独立机器学习上。这种训练的主要问题在于抓取物体的方法成功的标准——机器人认为,如果物体能够被举起而不是掉落,那么这次抓取就可以被认为是成功的。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

教机器人抓取物体是一项漫长而无聊的任务,这就是为什么科学家们试图将它们转移到使用人工智能的独立机器学习上。这种训练的主要问题在于抓取物体的方法成功的标准——机器人认为,如果物体能够被举起而不是掉落,那么这次抓取就可以被认为是成功的。

然而,这种方法很可能不是最佳的,任何不可预见的情况都会显着增加掉落物品的风险。

为了解决这个问题,卡内基梅隆大学和谷歌的研究人员决定结合博弈论和深度学习技术来提高抓取物体的效率。该团队的想法是在学习过程中引入一个对手,一个“邪恶的机器人”,它会以各种方式尝试使物体掉落。这个简单的概念会使问题变得更加复杂。机器人需要拾取物体的主要“对手”是重力、惯性和摩擦力(或缺乏这些),但机器人在拾取物体时摇晃物体也会使任务复杂化。

机器人的优势在于,它们可以通过“邪恶的另一个自我”进行编程来摇动物体或连接第二个机械手,而第二个机械手会不断干扰第一个机械手。如果敌人获胜,则认为捕获方法不合适,程序会将其添加到数据库中。反过来,敌人的程序会记住它的成功——因此,两个机器人将并行发展,越来越好地执行各自的任务。

新方法的主要目标是设置一个对手,使机器人的任务变得困难,但仍然是可能的。如果这个过程中包含摇晃和抓取,机器人很快就会学会选择更稳定的抓取方法。未来,科学家可能会开发其他类型的对手以实现更有效的学习。