本文使用“人工智能”一词来表示这些可能性中的任何一种,以及未来可能发现或发明的任何其他可能性。据我观察,没有一位人工智能工作者期望能够完整地描述人工智能的行为,每个人都绕过这一限制,用不精确的术语描述人工智能的行为,例如“通常”、“可能”、“大约”等,只给出经验确定的概率。人工智能的评估指标包括召回率和准确率。虽然可能有一个简单的任务规范,例如“仅返回包含停车标志的图像”,但没有可操作的规范来识别所有且仅包含停车标志的图像。因此,不可能制定正式的数学规范。然而,人们希望能够有把握地说出某项任务的人工智能实现是否确实能够完成该任务,至少能够做得足够好 [1, 2, 9, 10, 12, 14, 17, 18, 20, 22, 24, 25]。一些人提出了一个关键问题,但文献中似乎没有令人满意的答案 [1, 13, 25]。