你的确是对的!但目前计算机进行的近似计算遵循了完全不同的路径:在几分之一秒内执行数百万次数学运算,以获得有时可能被标记为足够有时可能不足够的翻译。事实证明,它们恰好足够的次数百分比在过去几年中急剧上升。但是,从历史上看,人工神经网络被设计为自然神经网络(例如我们的大脑)如何工作的简化模型,其中进行的认知过程也是分布式神经计算过程的结果,这些过程与上面提到的数学运算并没有太大不同。本章将教你 NMT 技术的关键要素。我们将首先指出人类大脑如何进行翻译与 NMT 系统如何进行翻译之间的联系。这将有助于我们介绍全面了解机器学习和人工神经网络原理所需的基本概念,这构成了 NMT 的两个基石。之后,我们将讨论非上下文词嵌入的基本原理,这是一种具有许多有趣属性的词的计算机化表示,当通过一种称为注意力的机制组合时,将产生所谓的上下文词嵌入,这是实现 NMT 的关键因素。所有这些要素将使我们能够全面展示两种最常用的 NMT 模型(即 Transformer 和循环模型)的内部工作原理。本章最后介绍了一系列次要主题,这些主题将提高您对这些系统如何在幕后运行的了解。
然后,我将使用最先进的神经网络方法,在英语-越南语的标准翻译数据集上从多语言模型(Helsinki-NLP)进行训练,并使用我的测试句子评估该模型。接下来,我将使用一种偏差缓解技术,通过交换训练数据集中的性别词来平衡它们,然后重新训练并再次评估。
摘要:在大数据、云计算技术发展的影响下,基于人工智能的机器翻译逐渐走入人们的生活。与人工翻译相比,机器翻译价格低廉、便捷实用、可以随时随地进行文本翻译,能够满足上百种语言的翻译需求,但机器翻译缺乏文化敏感性,无法连接文本与语言情绪。对此,深入分析人工翻译与机器翻译的相同点与不同点,并立足于人工翻译的未来研究现阶段翻译行业的发展策略,最终在不断提高译者翻译水平的同时,推动人工翻译与机器翻译同步发展。
本文介绍了三星菲律宾研究中心和 Konvergen AI 联合团队为 WMT'21 大规模多语言翻译任务提交的机器翻译系统。我们的团队参加了 Small Track #2,其任务是为五种东南亚语言(爪哇语、印尼语、马来语、他加禄语和泰米尔语 1 )以及英语制作一个多语言机器翻译系统,涵盖所有 30 个方向。我们将首先描述用于预处理数据的过滤启发式方法,然后概述我们训练和评估模型所采取的步骤。特定的超参数、预处理决策和其他训练参数将在其相应的部分列出。最后,我们报告在 FLORES-101(Goyal 等人,2021 年)隐藏测试集以及竞赛隐藏测试集上的结果。
Asriani Abbas 4 哈桑努丁大学 印尼文学研究项目 文化科学系,望加锡,印尼 摘要——机器翻译作为人工智能 (AI) 的使用不断增加,世界上最受欢迎的翻译工具是谷歌翻译 (GT)。该工具不仅用于通过翻译学习和获取外语信息,而且还被用作医院、机场和购物中心互动和交流的媒介。本文旨在探讨机器翻译在翻译法语-印尼语烹饪文本 (食谱) 中的准确性。烹饪文本样本取自互联网。研究结果表明,GT 中机器翻译的符号模型是通过强调源语言和目标语言的概念 (所指) 的等价性,从源语言的能指 (形式) 翻译成目标语言的能指 (形式)。GT 有助于通过单词、短语和句子翻译现有的法语-印尼语烹饪文本概念。烹饪文本机器翻译中遇到的一个问题是文化等值。GT 机器翻译无法准确识别源语言和目标语言的文化背景,因此结果是直译的形式。但是,可以通过从一种语言到另一种语言的单词、短语和句子细化文化等价物的翻译来提高 GT 的准确性。
在攻读博士学位的每个阶段,我都从许多组织那里获得了宝贵的帮助。我要特别感谢:Acrolinx 的 Andrew Bredenkamp 和 Sabine Lehmann 允许我在创作实验中使用他们的软件;Cochrane 翻译社区的 Juliane Reid、Hayley Hassan 和 Andrea Cervera 帮助我招募机器翻译评估研究的参与者(还要特别感谢 Juliane Ried 在创作和机器翻译实验的设计阶段提出的深刻意见);Cochrane UK(牛津)的 Therese Docherty 和工作人员在我作为 INTERACT 借调期间接待了我两个月,并帮助我更好地了解了 Cochrane 的创作工作流程;以及亚利桑那州立大学(凤凰城)学习科学与教育技术实验室的 Danielle McNamara 教授及其团队,在我 INTERACT 借调期间接待了我四个月,分享了他们在心理学领域的丰富知识,
在攻读博士学位的每个阶段,我都受益于许多组织的宝贵帮助。我特别要感谢:Acrolinx 的 Andrew Bredenkamp 和 Sabine Lehmann 允许我在创作实验中使用他们的软件;Cochrane 翻译社区的 Juliane Reid、Hayley Hassan 和 Andrea Cervera 帮助我招募机器翻译评估研究的参与者(还要特别感谢 Juliane Ried 在创作和机器翻译实验的设计阶段提出的深刻意见);Cochrane UK(牛津)的 Therese Docherty 和工作人员在我作为 INTERACT 借调期间接待了我两个月,帮助我更好地了解了 Cochrane 的创作工作流程;以及亚利桑那州立大学(凤凰城)学习科学与教育技术实验室的 Danielle McNamara 教授及其团队,在我 INTERACT 借调期间接待了我四个月,分享了他们在心理学领域的丰富知识,
在家使用非英语语言的人数几乎翻了一番。4 在佛罗里达州,目前超过四分之一的人口使用非英语语言。5 这些数字反映了使用外语的人口不断增长 6 ,并表明参与美国法律体系的人员中相当一部分英语水平有限 (LEP)。7 随着越来越多的非英语人士出庭或以其他方式需要进入法庭,美国律师将面临越来越多非英语语言的文件。一个有趣的困境出现了,即英语律师如何处理外语文件而不使自己或他们的公司面临渎职风险。尽管有关法庭口译员的立法历史悠久 8 ,但联邦法律并没有规定口译员的资格