详细内容或原文请订阅后点击阅览
计算机在学习“观察”方面变得越来越好
支持图像识别的机器学习程序仍然存在盲点,但它们会持续更长时间吗?
来源:可知 Magazine任何拥有计算机的人都被要求“选择每张包含交通灯的图像”或“输入下面显示的字母”以证明他们是人类。虽然这些登录障碍(称为 reCAPTCHA 测试)可能会让人有些头疼(红灯的一角算不算?),但它们反映出视觉被认为是区分计算机与人类的明确指标。但计算机正在迎头赶上。
近年来,创造能够“看见”的计算机的努力取得了巨大进展。十五年前,计算机在大约 60% 的情况下可以正确识别图像中包含的内容。现在,成功率接近 90% 是很常见的。但许多计算机系统仍然无法通过一些最简单的视觉测试——因此 reCAPTCHA 仍然有用。
较新的方法旨在通过训练计算机看到由实际对象组成的图像,而不仅仅是像素的集合,从而更接近人类视觉系统。这些努力已经取得了成功,例如帮助开发可以“看到”并抓取物体的机器人。
人类视觉系统更好的神经网络
计算机视觉模型采用所谓的视觉神经网络。这些网络使用称为人工神经元的互连单元,类似于大脑中的人工神经元,它们在系统学习时相互建立连接。通常,这些网络会在一组带有描述的图像上进行训练,最终它们可以正确猜测它们以前从未遇到过的新图像中的内容。
AlexNet 能够正确标记图像尽管性能有了很大的提高,视觉神经网络仍然会犯一些令人费解的错误。 2017 年的一个典型例子是,麻省理工学院的一个学生运行的人工智能研究小组欺骗了一个神经网络,将一张猫的图片标记为鳄梨酱。通过向猫图像添加难以察觉的像素“噪声”,该模型完全失效了。
欺骗神经网络将猫的图片标记为鳄梨酱 混淆这些视觉网络