详细内容或原文请订阅后点击阅览
DeepMind 在计算机视觉领域取得重大进展
Исследователи из компании DeepMind,являющейся сегодня частью Alphabet (одного из подразделений Google) представили детальное описание метода、который、как они говорят、поможет создать 3-х мерные изображения из нескольких 2-х мерных снимков。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)来自 DeepMind(现属于 Alphabet(Google 部门之一)的研究人员)详细描述了一种方法,他们表示该方法将有助于从多个 2 维图像创建 3 维图像。
到目前为止,这种基于深度神经网络的方法仅限于虚拟环境。自然条件仍然太复杂,无法使用现有算法和硬件进行处理。
这种新方法对于任何需要从多个图像重建犯罪的视频监控系统都很有用。自动驾驶汽车和家用机器人也将成为首批利用新技术的领域。
研究人员举了一个例子,机器人的手臂可以抽象地视为具有多个关节的简单关节,然后使用形状、颜色等数据进行计算。
通过首先操纵这个抽象,然后用细节填充它,这种方法可能比尝试操纵彼此连接的大量 3 维点集的渲染系统快得多。
思维过程很大程度上可以归因于纯粹的感知,这对计算机来说比对人类来说更复杂。有一个标准的心理测试,测试一个人在精神上旋转物体的能力,该物体使用称为谢泼德-梅茨勒物体的几何形状。在 DeepMind 提供的视频中,神经网络将这些对象分为两种方式之一:要么它们是在一个或多个平面上旋转的图案的版本,要么它们是该图案的镜像。 DeepMind 网络很好地完成了这项工作。并非每个人都可以夸耀相同的结果。