本文介绍了三星菲律宾研究中心和 Konvergen AI 联合团队为 WMT'21 大规模多语言翻译任务提交的机器翻译系统。我们的团队参加了 Small Track #2,其任务是为五种东南亚语言(爪哇语、印尼语、马来语、他加禄语和泰米尔语 1 )以及英语制作一个多语言机器翻译系统,涵盖所有 30 个方向。我们将首先描述用于预处理数据的过滤启发式方法,然后概述我们训练和评估模型所采取的步骤。特定的超参数、预处理决策和其他训练参数将在其相应的部分列出。最后,我们报告在 FLORES-101(Goyal 等人,2021 年)隐藏测试集以及竞赛隐藏测试集上的结果。