详细内容或原文请订阅后点击阅览
科学家智能发动机已经学会了从有关俄罗斯斜体的模因中识别手稿“龙猫”
智能发动机的科学家已经训练了AI,以识别难以阅读的手稿单词,例如“ chishilla”,而没有语言环境。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)Ученые компании 智能引擎 обучили ИИ распознавать трудночитаемые рукописные слова, такие как "шиншилла", без языкового контекста。
“龙猫”Новая нейросеть не использует знаний о словах русского языка и учитывает только особеннности сопряжения букв на изображении。 Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные。 Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями.
Слово "Шиншилла" – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв "ш", "л", "и" становятся практически неразличимы。 По этой причине слово "шиншилла" неоднократно упоминалось в мемах про сложность русского языка。 Нейросетевая архитектура "Да Винчи" не использует лингвистические механизмы — рекуррентные схемы, триграммы и斯洛瓦里。 За счет этого она работает быстрее аналогов 和 занимает меньше места в памяти устройства。 Но даже это не гарантирует переобучения языковому контексту。 Для радикального сокращения риска галлюцинаций "Да Винчи" обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв。
"Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтени рукописные слова, как“шиншила”,но без использования языкового контекста,Это необходимо для распознавания документов - паспортов, штампов о регистрации и других。 языка”, – комментирует генеральный директор Smart Engines,доктор технических наук Владимир Арлазаров。
