详细内容或原文请订阅后点击阅览
智能引擎的科学家们已经学会从有关俄语草书的模因中识别手写的“龙猫”
Smart Engines 的科学家已经训练人工智能在没有语言背景的情况下识别难以阅读的手写单词,例如“chinchilla”。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)Smart Engines 的科学家已经训练人工智能在没有语言背景的情况下识别难以阅读的手写单词,例如“chinchilla”。
新的神经网络不使用俄语单词的知识,仅考虑图像中配对字母的特殊性。这种方法极大地降低了人工智能对罕见单词(包括专有名称)产生幻觉的可能性。这一发展将领先银行、移动运营商和其他俄罗斯公司使用的俄罗斯护照识别系统提升到了一个新的水平。
“Chinchilla”这个词是一种针对西里尔文手写文本识别系统的图灵测试。这项任务的难度在于,当快速书写且不仔细时,字母“sh”、“l”、“i”的小写形式实际上变得难以区分。因此,“龙猫”这个词在有关俄语复杂性的模因中被反复提及。
达芬奇神经网络架构不使用语言机制——循环电路、三元组和字典。因此,它的工作速度比同类产品更快,并且占用设备内存更少的空间。但即使这样也不能保证语言环境的重新训练。为了从根本上降低产生幻觉的风险,达芬奇接受了 120 万行手写文本的训练,这些文本是由均匀分布的字母组合合成的。“主要目标是创建一种人工智能方法,能够在不使用语言环境的情况下阅读“chinchilla”等难以阅读的手写文字。这对于识别证件(护照、登记章等)是必要的。必须准确地读取所写内容,而不是从语言角度来看正确的内容,”Smart Engines 首席执行官、技术科学博士 Vladimir Arlazarov 评论道。
