详细内容或原文请订阅后点击阅览
研究人员使用神经网络破译古代文本
瑞士圣加仑修道院的图书馆藏有大约 160,000 册可追溯到八世纪的文学和历史手稿 - 所有这些手写在羊皮纸上,语言均为当今很少听到的语言。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)瑞士圣加仑修道院的图书馆藏有大约 160,000 册可追溯到八世纪的文学和历史手稿 - 全部用当今很少听到的语言手写在羊皮纸上。
此类历史文物被安全地保存在世界各地的图书馆和修道院中。其中大部分藏品都可以通过数字化图像向公众开放,但专家表示,有大量材料从未被阅读过——这是洞察世界历史的宝库。
圣母大学的研究人员正在开发一种人工神经网络来读取复杂的古代笔迹。圣母大学计算机科学与工程系助理教授沃尔特·谢勒 (Walter Scheirer) 表示:“我们正在处理的历史文献,其书写风格早已过时,而且使用拉丁语等现在很少使用的语言。” “你可以获得这些材料的漂亮照片,但我们的目标是自动转录,以便它通过专家读者的眼睛模拟页面的体验,并提供快速、可搜索的文本阅读。”
在《模式分析与机器智能汇刊》杂志上发表的一项研究中,Scheirer 描述了他的团队如何将传统机器学习方法与心理物理学结合起来。该团队研究了九世纪圣加尔修道院抄写员撰写的数字化拉丁语手稿。研究人员将他们的手动记录输入到专门设计的软件界面中。然后,该团队测量了翻译过程中的反应时间,以了解单词、符号和段落的简单或困难程度。 Scheirer 解释说,纳入此类数据可以创建更符合人类行为的神经网络,减少错误数量,并提供更准确、更真实的文本阅读。