详细内容或原文请订阅后点击阅览
新的图像数据库可实现真实的计算机视觉测试
计算机视觉模型已经可以识别照片中的物体,其准确度超出了人类在实验室测试中的能力。然而,在现实条件下,算法的准确性显着下降,引发了人们对自动驾驶和其他基于计算机视觉的技术的担忧。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)计算机视觉模型已经可以识别照片中的物体,其准确度超出了人类在实验室测试中的能力。然而,在现实条件下,算法的准确性显着下降,引发了人们对自动驾驶和其他基于计算机视觉的技术的担忧。
为了解决这个问题,来自 MIT 和 IBM 的研究人员决定创建一种不同类型的数据集。它被称为 ObjectNet,与 ImageNet 类似,ImageNet 是一个用户照片数据库,是人工智能发展进入新阶段的激励因素之一。
与 ImageNet(由来自 Flickr 和其他社交网络的照片组成)不同,ObjectNet 中的图像由员工上传。照片中的物体侧卧,以不寻常的角度放置,或者在许多其他物体的背景下拍摄。研究人员使用这些图像测试了领先的计算机视觉模型 - 识别准确率从 ImageNet 上的 97% 下降到 ObjectNet 上的 50-55%。
人工智能近期的大部分进展都是由深度学习推动的,深度学习使用人工“神经元”来检测大量数据中的模式。因此,该程序通过数百或数千个示例进行训练,并学习识别照片中的椅子等。然而,即使是数百万张图像也无法反映特定物体的所有可能位置——在现实生活中,准确性不可避免地会下降。