摘要 对象识别和检测是经过深入研究的问题,并已开发出一套几乎标准的解决方案。身份证件识别、分类、检测和定位是许多应用程序所需的任务,特别是在关键基础设施场所的物理访问控制安全系统中。在本文中,我们提出了一种基于人工卷积神经网络和语义分割方法的模型的新原始架构,用于识别和检测图像中的身份证件。处理此类图像的挑战在于,当此类应用程序在工业单板微型计算机硬件上运行时,计算性能有限且内存量有限。本研究的目的是证明所提技术的可行性并获得质量指标。研究方法是评估在移动身份证件视频数据集上训练的深度学习检测模型。该数据集包含 500 个视频片段,涵盖 50 种不同的身份证件类型。模拟的数值结果用于评估质量指标。我们将结果表示为交并比值的准确度与阈值。本文报告的交并比 (IoU) 阈值为 0.8 时,准确度高于 0.75。此外,我们还评估了模型的大小,并证明了在工业单片机或智能手机硬件上运行该模型的可行性。关键词 1 身份证件,目标检测,语义分割,文档识别,文档分类,深度学习,神经网络