在 AWS 上评估机器翻译任务的大型语言模型

这篇博客文章及其附带代码介绍了一种解决方案,可使用 Amazon Bedrock 中的基础模型 (FM) 试验实时机器翻译。它可以帮助收集更多有关 LLM 对您的内容翻译用例的价值的数据。

来源:亚马逊云科技 _机器学习

大型语言模型 (LLM) 在机器翻译 (MT) 任务中表现出了良好的能力。根据使用情况,它们能够与 Amazon Translate 等神经翻译模型相媲美。LLM 尤其突出的是它们能够从输入文本的上下文中学习,这使它们能够掌握文化线索并生成听起来更自然的翻译。例如,用法语翻译的句子“你表现好吗?”可能会被翻译成“你表现得很好吗?”目标翻译可能会因上下文而异。如果在体育的背景下提出问题,例如“你在足球锦标赛上表现好吗?”,自然的法语翻译将大不相同。对于 AI 模型来说,捕捉上下文和文化特征以生成听起来更自然的翻译至关重要。LLM 最吸引人的优势之一是它们与生俱来的理解上下文的能力。

Amazon Translate

我们全球的许多客户都希望利用此功能来提高其翻译内容的质量。本地化依赖于自动化和人工参与,这个过程称为机器翻译后编辑 (MTPE)。构建有助于提高翻译内容质量的解决方案具有多重优势:

    MTPE 活动的潜在成本节省本地化项目的周转速度更快质量得到提升,为内容消费者和读者带来更好的体验
  • MTPE 活动的潜在成本节省
  • 本地化项目的周转速度更快
  • 质量得到提升,为内容消费者和读者带来更好的体验
  • LLM 还显示出与 MT 任务相关的差距,例如:

      某些语言对的质量不一致没有标准模式来整合过去的翻译知识,也称为翻译记忆库 (TM)固有的幻觉风险
  • 某些语言对的质量不一致
  • Amazon Bedrock TMX 文件