Loading...
机构名称:
¥ 1.0

本文介绍了三星菲律宾研究中心和 Konvergen AI 联合团队为 WMT'21 大规模多语言翻译任务提交的机器翻译系统。我们的团队参加了 Small Track #2,其任务是为五种东南亚语言(爪哇语、印尼语、马来语、他加禄语和泰米尔语 1 )以及英语制作一个多语言机器翻译系统,涵盖所有 30 个方向。我们将首先描述用于预处理数据的过滤启发式方法,然后概述我们训练和评估模型所采取的步骤。特定的超参数、预处理决策和其他训练参数将在其相应的部分列出。最后,我们报告在 FLORES-101(Goyal 等人,2021 年)隐藏测试集以及竞赛隐藏测试集上的结果。

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统PDF文件第1页

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统PDF文件第2页

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统PDF文件第3页

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统PDF文件第4页

数据处理至关重要:SRPH-Konvergen AI 为 WMT'21 打造的机器翻译系统PDF文件第5页