Loading...
机构名称:
¥ 1.0

关键词:历史文献、手写、数字化、数字化、文化遗产、保存。摘要:保存历史档案遗产不仅涉及保护这些宝贵文本的物理措施,还涉及提供数字保存。然而,仅仅将手稿和抄本数字化是不够的。还需要进一步的步骤:数字化其内容,即逐字转录扫描的文本。此过程可以准确保存其文本内容,从而更易于搜索信息和进行进一步分析。借助人工智能,特别是深度神经网络 (DNN),可以执行自动手写识别。在本研究中,我们使用了一种成熟的 DNN 类型的卷积循环神经网络 (CRNN) 来确定自动转录五个不同语言和时间段不同的历史数据集所需的最少标记数据量。结果表明,在几乎所有情况下,仅使用几百行标记文本就可以实现低于 10% 的字符错误率 (CER)。

人工智能辅助历史文献数字化

人工智能辅助历史文献数字化PDF文件第1页

人工智能辅助历史文献数字化PDF文件第2页

人工智能辅助历史文献数字化PDF文件第3页

人工智能辅助历史文献数字化PDF文件第4页

人工智能辅助历史文献数字化PDF文件第5页

相关文件推荐

2023 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0