Loading...
机构名称:
¥ 1.0

我们描述了 Facebook 向 WMT2021 新闻翻译共享任务提交的多语言模型。我们参与了 14 个语言方向:英语与捷克语、德语、豪萨语、冰岛语、日语、俄语和中文之间的互译。为了开发涵盖所有这些方向的系统,我们专注于多语言模型。我们利用来自所有可用来源的数据——WMT、大规模数据挖掘和域内反向翻译——来创建高质量的双语和多语言基线。随后,我们研究了扩展多语言模型大小的策略,使得一个系统具有足够的容量来高质量地表示所有八种语言。我们的最终提交是密集和稀疏混合专家多语言翻译模型的集合,然后对域内新闻数据进行微调和嘈杂通道重新排名。与去年的获奖作品相比,我们的多语言系统在所有语言方向上的翻译质量都有所提高,平均提高了 2.0 BLEU。在 WMT2021 任务中,我们的系统在基于自动评估的 10 个方向上排名第一。

Facebook AI 的 WMT21 新闻翻译任务提交

Facebook AI 的 WMT21 新闻翻译任务提交PDF文件第1页

Facebook AI 的 WMT21 新闻翻译任务提交PDF文件第2页

Facebook AI 的 WMT21 新闻翻译任务提交PDF文件第3页

Facebook AI 的 WMT21 新闻翻译任务提交PDF文件第4页

Facebook AI 的 WMT21 新闻翻译任务提交PDF文件第5页