详细内容或原文请订阅后点击阅览

计算机的图像识别能力越来越强

2025年11月3日 16:03 33 Comments

支持他们“看见”能力的机器学习程序仍然存在盲点，但这种情况不会持续太久

来源:《航空与航天杂志》

计算机的图像识别能力越来越强支持计算机“观看”能力的机器学习程序仍然存在盲点，但这种情况不会持续太久

支持他们“看见”能力的机器学习程序仍然存在盲点，但这种情况不会持续太久

一些计算机视觉程序因操作图像中的像素等技巧而失败。修改自 ISTOCK.COM / EYEEM MOBILE GMBH 修改自 ISTOCK.COM / EYEEM MOBILE GMBH

任何拥有计算机的人都被要求“选择每张包含交通灯的图像”或“输入下面显示的字母”以证明他们是人类。虽然这些登录障碍（称为 reCAPTCHA 测试）可能会让人有些头疼（红灯的一角算不算？），但它们反映出视觉被认为是区分计算机与人类的明确指标。但计算机正在迎头赶上。

近年来，创造能够“看见”的计算机的努力取得了巨大进展。十五年前，计算机在大约 60% 的情况下可以正确识别图像中包含的内容。现在，成功率接近 90% 是很常见的。但许多计算机系统仍然无法通过一些最简单的视觉测试，因此 reCAPTCHA 仍然有用。

较新的方法旨在通过训练计算机看到由实际对象组成的图像，而不仅仅是像素的集合，从而更接近人类视觉系统。这些努力已经取得了成功；例如，它们被用于开发能够“看到”并抓取物体的机器人。

人类视觉系统

AlexNet 能够正确标记图像欺骗神经网络将猫的图片标记为鳄梨酱 A. Ilyas 等 / 2018 年第 35 届国际机器学习会议论文集混淆视觉网络视觉神经网络

可知杂志

太久图像机器人程序计算机视觉组成的看到操作图 COM 识别能力神经网络输入能够机器学习识别图像标记图能力视觉系统 ISTOCK 图像识别 MOBILE GMBH 人类 EYEEM 简单的网络