详细内容或原文请订阅后点击阅览
训练算法在陌生的环境中安全地行动
刚学走路的孩子可能会走得太快而摔倒或与家具相撞。然而,这种因果关系教会了他们关于他们的身体如何在空间中移动的宝贵信息,这样他们就可以避免将来跌倒。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)刚学走路的孩子可能会走得太快而摔倒或与家具相撞。然而,这种因果关系教会了他们关于他们的身体如何在空间中移动的宝贵信息,这样他们就可以避免将来跌倒。
机器的学习方式有很多与人类相同,包括从错误中学习。然而,对于自动驾驶汽车和电网等许多机器来说,现实世界的训练是一个挑战。随着机器学习的发展和变得更加广泛,人们对其在高度复杂、安全关键的自主系统中的应用越来越感兴趣。然而,这些技术的前景受到学习过程及其他方面固有的安全风险的阻碍。
一篇新的研究论文挑战了“学习在陌生环境中安全行动需要无限次尝试”的观点。这项工作发表在《IEEE 自动控制汇刊》上,提出了一种新方法,可以完全自信地提供安全操作培训,同时平衡最优性、危险情况和不安全操作的快速识别。
已发布“通常,机器学习会寻找最佳解决方案,这可能会导致更多错误。当错误可能意味着碰壁时,这是有问题的,”电气和计算机工程助理教授 Juan Andres Bazerk 解释道斯旺森工程学院的教授与约翰·霍普金斯大学的助理教授恩里克·马拉达一起领导了这项研究,“在这项研究中,我们表明教授安全政策与教授最优政策有本质上的不同,它可以分开进行,也可以进行。”有效地。”