可以应用于许多 AI 程序的一项测试是简单的“你答对了多少”。例如,AI 的一个常见应用是识别图像中的对象。通常,应用程序使用一组已识别的图像进行训练。然后使用第二组图像进行测试,以查看它是否正确识别了它们。假设目标是正确识别包含狮子、老虎和熊的图像。验收测试可能是 99% 或 99.9% 的测试图像被正确识别。测试集可能还包括不是狮子、老虎和熊的图像,以检查应用程序是否正确地将所有这些图片或 99% 或 99.9% 的图片确定为“以上都不是”。一个常见的测试实例是白噪声(随机数据)图像,不应将其识别为任何东西。