详细内容或原文请订阅后点击阅览
新方法帮助人工智能系统更好地在太空中导航
照片是 2D,但自动驾驶汽车和其他技术必须在 3D 世界中导航。研究人员开发了一种新方法来帮助人工智能从 2D 图像中提取 3D 信息,使相机成为这些新兴技术的更有用的工具。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)照片是 2D 的,但自动驾驶汽车和其他技术必须在 3D 世界中导航。研究人员开发了一种新方法来帮助人工智能从 2D 图像中提取 3D 信息,使相机成为这些新兴技术的更有用的工具。
“目前从 2D 图像中提取 3D 信息的方法很好,但还不够,”这项工作的论文合著者、北卡罗来纳州立大学电气与计算机工程助理教授 Tianfu Wu 说道。我们的新方法称为 MonoXiver,可以与现有技术结合使用,并使它们更加准确。”
这项工作对于自动驾驶汽车等应用特别有用。这是因为相机比用于 3D 导航的其他工具(例如激光雷达)便宜。由于摄像头比其他技术更便宜,自动驾驶汽车开发人员可以安装多个摄像头,从而创建系统冗余。但这只有在自动驾驶汽车的人工智能可以从摄像头捕获的 2D 图像中提取 3D 导航信息时才有用。这就是 MonoXiver 的开发目的。
从 2D 图像中提取 3D 数据的现有方法(例如 Wu 及其合著者开发的 MonoCon 方法)使用“边界框”。具体来说,这些方法训练人工智能扫描 2D 图像,并在 2D 图像中的对象(例如街道上的每辆车)周围放置框架。这些框架是长方体,可以帮助人工智能估计图像中对象的大小以及它们相对于其他对象的位置。换句话说,利用这些帧,人工智能可以确定汽车有多大以及它相对于道路上其他汽车的位置。