智能引擎在 MWC 2019 上展示了对中文、日文和韩文字符的识别(+视频)

在巴塞罗那举行的2019年世界移动通信大会国际展会上,俄罗斯公司Smart Engines展示了象形文字识别技术。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

在巴塞罗那举行的2019年世界移动通信大会国际展会上,俄罗斯公司Smart Engines展示了象形文字识别技术。

它的开发是通过使用深度稀疏离散神经网络实现的,该网络可以识别具有复杂背景和不同照明条件的文档上的 45,000 多个象形文字。其中,中文字符20,941个,日文字符12,912个,韩文字符11,172个。

新功能集成到 Hieroglyph 人工智能系统中,目前支持在平台层面识别 40 多种语言、800 多种身份证明文件。这些是来自 170 多个国家的身份证、护照、驾驶执照、签证和其他文件。对象形文字的识别使得 Smart Engines 产品的潜在用户群体扩大了超过 15 亿人。

智能引擎

象形文字的识别是一个复杂的科学和技术问题,人工智能开发人员需要处理数以万计的字符,其中许多字符彼此略有不同。在开发过程中,Smart Engines 专家克服了重要的技术障碍,从传统的 OCR 方法(旨在识别高质量扫描件上的白色背景上的字符)转向计算机视觉(甚至能够识别身份证中的象形文字)视频流和照片。

“在我们的案例中,象形文字本身的复杂结构中添加了由于图像中文档背景的存在而导致的视觉噪声,以及由于照明和拍摄角度的不同亮度而导致的扭曲。我们成功地创建了一种特殊的神经网络架构,确保了拉丁文和西里尔文字符级别文档中象形文字的识别速度和质量。”弗拉基米尔·阿尔拉扎罗夫。