数字人文学科中的半自动注释缩放
机构名称:
¥ 1.0

在当今的数字时代,大量数据无处不在,包括自然语言的话语,例如新闻文章,社交媒体帖子或论坛主题。数字人文学科旨在定性和定量分析此类数据。对于解释性研究,很难从大数据中受益。一个例子是扎根的理论,一种解释性方法,可以通过注释或编码来处理较大的数据集。但是,这种方法太耗时了,无法弥合从定性到定量分析的差距。在这项工作中,我们提出辅助方法,以半自动地将少量的手动注释扩展到大型语料库。我们的方法使用带注释数据的上下文化床位来发现类似的发生。通过交互式提供从用户交互中自动学习的建议,我们的方法提供了一种方便,快速的方式,以减少努力来注释大型语料库。该方法最终产生一个能够注释整个数据集的clas-sifier。我们对多个任务和数据集进行了实验,以评估我们的方法证明了强劲的性能。此外,我们为希望扩展基于注释的研究的研究人员设计了一个软件,将差距从定性到定量结果弥合了差距。

数字人文学科中的半自动注释缩放

数字人文学科中的半自动注释缩放PDF文件第1页

数字人文学科中的半自动注释缩放PDF文件第2页

数字人文学科中的半自动注释缩放PDF文件第3页

数字人文学科中的半自动注释缩放PDF文件第4页

数字人文学科中的半自动注释缩放PDF文件第5页