计算机视觉通过采用图像和模式分析方法来解决复杂挑战,将图像视为复杂的像素阵列,发挥着关键作用。人工智能 (AI) 中的这一领域可自动执行监控和检查任务,展示其从各种视觉输入(包括数字图像和视频)中提取有意义信息的能力。本质上,计算机视觉已成为一个不可或缺的组成部分,有助于系统在人工智能的背景下获得有价值的见解 [1]。计算机视觉的目标是让计算机和机器理解视觉信息,类似于人类,这意味着开发算法和技术来分析、处理和提取视觉数据中的含义 [2]。监督式 ML 和 DL 是计算机视觉中的两种主要技术,它们开发了分析和解释视觉数据的方法 [3]。监督式 ML 用于训练模型,开发标记示例,利用支持向量机 (SVM)、决策树 (DT)、随机森林 (RF) 和朴素贝叶斯 (NB) 分类器等算法 [4]。DL 旨在通过人脑的结构和操作学习人工神经网络。这些网络与多层连接节点相结合,从原始输入数据中提取表示 [5]。图 1 显示了常见 ML 和 DL 技术的分类。在这篇关于计算机视觉中的监督 ML 和 DL 技术的综述中,研究了它们所需的模型、架构、优势和局限性。
主要关键词