详细内容或原文请订阅后点击阅览
分析语言相似性对跨语言转移的影响:任务和输入表示
跨语性转移是一种在低资源环境中增加NLP任务的培训数据量的流行方法。但是,确定包含哪些跨语性数据的最佳策略尚不清楚。先前的研究通常集中于一些语言家庭或一项任务的一小部分语言。这些发现如何扩展到多种多样的语言和任务仍然是一个悬而未决的问题。在这项工作中,我们通过分析来自各种语言家庭的263种语言的跨语化转移来为这个问题做出了贡献。此外,我们包括三个流行的NLP任务…
来源:Apple机器学习研究跨语性转移是一种在低资源环境中增加NLP任务的培训数据量的流行方法。但是,确定包含哪些跨语性数据的最佳策略尚不清楚。先前的研究通常集中于一些语言家庭或一项任务的一小部分语言。这些发现如何扩展到多种多样的语言和任务仍然是一个悬而未决的问题。在这项工作中,我们通过分析来自各种语言家庭的263种语言的跨语化转移来为这个问题做出了贡献。此外,我们在分析中包括三个流行的NLP任务:posging,依赖解析和主题分类。我们的发现表明,语言相似性对传递性能的影响取决于一系列因素:NLP任务,(单语或多语言)输入表示以及语言相似性的定义。
- †在Apple•LMUMunich§慕尼黑机器学习中心完成的工作