计算机的图像识别能力越来越强

支持他们“看见”能力的机器学习程序仍然存在盲点,但这种情况不会持续太久

来源:《航空与航天杂志》
计算机的图像识别能力越来越强支持计算机“观看”能力的机器学习程序仍然存在盲点,但这种情况不会持续太久

计算机的图像识别能力越来越强

支持他们“看见”能力的机器学习程序仍然存在盲点,但这种情况不会持续太久

一些计算机视觉程序因操作图像中的像素等技巧而失败。 修改自 ISTOCK.COM / EYEEM MOBILE GMBH
修改自 ISTOCK.COM / EYEEM MOBILE GMBH

任何拥有计算机的人都被要求“选择每张包含交通灯的图像”或“输入下面显示的字母”以证明他们是人类。虽然这些登录障碍(称为 reCAPTCHA 测试)可能会让人有些头疼(红灯的一角算不算?),但它们反映出视觉被认为是区分计算机与人类的明确指标。但计算机正在迎头赶上。

近年来,创造能够“看见”的计算机的努力取得了巨大进展。十五年前,计算机在大约 60% 的情况下可以正确识别图像中包含的内容。现在,成功率接近 90% 是很常见的。但许多计算机系统仍然无法通过一些最简单的视觉测试,因此 reCAPTCHA 仍然有用。

较新的方法旨在通过训练计算机看到由实际对象组成的图像,而不仅仅是像素的集合,从而更接近人类视觉系统。这些努力已经取得了成功;例如,它们被用于开发能够“看到”并抓取物体的机器人。

人类视觉系统

更好的神经网络

有趣的事实:图像识别和保存

AlexNet 能够正确标记图像 欺骗神经网络将猫的图片标记为鳄梨酱 A. Ilyas 等 / 2018 年第 35 届国际机器学习会议论文集 混淆视觉网络 视觉神经网络

模仿大脑如何看待

可知杂志