详细内容或原文请订阅后点击阅览
机器的更聪明的眼睛:新的硅技术加快计算机视觉
马萨诸塞大学阿默斯特大学的研究人员通过创建更像人眼类似的新硬件,在计算机视觉技术方面取得了突破。他们的发明可以捕获和处理同一硅芯片上的视觉信息,这可以改变机器“看到”并响应周围世界的方式。 […]机器的更聪明的眼睛:新的硅技术速度提高了计算机视觉,首先是Knowridge Science Report。
来源:Knowridge科学报告马萨诸塞大学阿默斯特大学的研究人员通过创建更像人眼类似的新硬件,在计算机视觉技术方面取得了突破。
他们的发明可以在同一硅芯片上捕获和处理视觉信息 - 可以改变机器“看到”并响应周围世界的方式。
传统的计算机视觉系统,例如在智能手机或自动驾驶汽车中发现的系统,将相机(捕获图像)与处理器(分析它们)分开。
传感和计算之间的这种来回传感通常涉及许多不必要的数据,并导致延迟 - 当机器需要做出分裂的决策时,例如在道路上检测移动对象时,这是一个严重的问题。
UMass Amherst的教授 Guangyu Xu领导了研究团队。他解释说,他们的目标是通过将传感和处理结合到一个单元中来消除观察和理解之间的滞后。 “我们的方法类似于人类眼睛的工作方式,”他说,“在视网膜中,感应和早期处理一起发生的地方。” 为了实现这一目标,团队构建了两个基于硅的传感器。这些“传感器内处理阵列”可以直接检测运动和静态形状,而无需在其他地方发送原始数据。 一个阵列处理动态视觉变化,例如检测运动,而另一个阵列则集中在静止图像中对象的形状和特征。 团队在具有挑战性的视觉环境中测试了他们的系统。当被要求识别人类运动(例如步行,挥手或拳击)时,它们的模拟硬件的性能要比现有数字系统更好,达到90%的精度。 在分析手写数字时,他们的芯片也优于传统系统,达到95%的精度比90%。 开发 这意味着可以很快将其扩展用于自动驾驶汽车,监视系统,医疗设备以及其他依赖快速,准确的视觉输入的大规模技术。
Guangyu Xu领导了研究团队。他解释说,他们的目标是通过将传感和处理结合到一个单元中来消除观察和理解之间的滞后。
“我们的方法类似于人类眼睛的工作方式,”他说,“在视网膜中,感应和早期处理一起发生的地方。”
为了实现这一目标,团队构建了两个基于硅的传感器。这些“传感器内处理阵列”可以直接检测运动和静态形状,而无需在其他地方发送原始数据。
一个阵列处理动态视觉变化,例如检测运动,而另一个阵列则集中在静止图像中对象的形状和特征。
团队在具有挑战性的视觉环境中测试了他们的系统。当被要求识别人类运动(例如步行,挥手或拳击)时,它们的模拟硬件的性能要比现有数字系统更好,达到90%的精度。
在分析手写数字时,他们的芯片也优于传统系统,达到95%的精度比90%。开发这意味着可以很快将其扩展用于自动驾驶汽车,监视系统,医疗设备以及其他依赖快速,准确的视觉输入的大规模技术。