在家使用非英语语言的人数几乎翻了一番。4 在佛罗里达州,目前超过四分之一的人口使用非英语语言。5 这些数字反映了使用外语的人口不断增长 6 ,并表明参与美国法律体系的人员中相当一部分英语水平有限 (LEP)。7 随着越来越多的非英语人士出庭或以其他方式需要进入法庭,美国律师将面临越来越多非英语语言的文件。一个有趣的困境出现了,即英语律师如何处理外语文件而不使自己或他们的公司面临渎职风险。尽管有关法庭口译员的立法历史悠久 8 ,但联邦法律并没有规定口译员的资格
随着解码步骤的数量增加,迭代非自回旋变压器的计算益处减小。作为一种补救措施,我们介绍了DI仍然是Untiple S Teps(Dims),这是一种简单而有效的蒸馏技术,以减少达到一定的翻译质量所需步骤的数量。截止的模型享有早期迭代的计算益处,同时从几个迭代步骤中保留了增强性。暗示着两个模型,即学生和老师。在多个解码步骤后,在老师通过缓慢移动的平均值跟随学生的同时,对学生进行了优化,以预测老师的输出。移动平均线使教师的知识更新,并提高了老师提供的标签的质量。在推断期间,学生用于翻译,并且不添加其他构成。我们验证了DIMS对在WMT'14 DE-EN的蒸馏和原始验证上获得7.8和12.9 BLEU点改进的各种模型的有效性。此工作的完整代码可在此处提供:https://github.com/ layer6ai-labs/dims。
本文介绍了三星菲律宾研究中心和 Konvergen AI 联合团队为 WMT'21 大规模多语言翻译任务提交的机器翻译系统。我们的团队参加了 Small Track #2,其任务是为五种东南亚语言(爪哇语、印尼语、马来语、他加禄语和泰米尔语 1 )以及英语制作一个多语言机器翻译系统,涵盖所有 30 个方向。我们将首先描述用于预处理数据的过滤启发式方法,然后概述我们训练和评估模型所采取的步骤。特定的超参数、预处理决策和其他训练参数将在其相应的部分列出。最后,我们报告在 FLORES-101(Goyal 等人,2021 年)隐藏测试集以及竞赛隐藏测试集上的结果。
2023 年 9 月,加拿大政府发布了《生成式人工智能使用指南》,其中为加拿大政府机构及其员工提出了建议。与近年来各组织发布的其他类似文件一样,该文件就透明度提出了建议,指出每当使用生成式人工智能生成内容时,都应告知读者“发给他们的消息是由人工智能生成的”。虽然本指南没有专门针对机器翻译的情况,但它确实提到翻译是生成式人工智能的潜在应用。因此,自然而然地出现了一个问题:无论在哪里使用机器翻译的文本,都应明确标记为人工智能生成的内容吗?在本立场文件中,我们详细研究了这个问题,目的是提出关于机器翻译的明确指导方针,不仅针对政府机构,也针对任何使用机器翻译技术的人。我们的主要结论是,机器翻译的文本确实是 AI 生成的内容。因此,应在使用它的所有地方明确标记。我们就这种标记可能采取的形式提出建议。我们还研究了在什么条件下可以删除或省略 MT 标记。
摘要 自动机器翻译是科学界和各个科学学科领域中越来越受欢迎的研究课题,例如信息与通信科学、计算机科学、计算语言学等。其主要原因在于,如今它使得不同自然语言之间能够进行不可或缺的交流和快速的信息传递。这对于克罗地亚语等使用范围不广的语言尤其重要,因为该语言仍然缺乏开发针对特定领域使用进行优化的专业化高质量机器翻译系统所需的软件工具和数字资源。数据量的不断增长以及工业、经济、科学以及人们日常生活中各利益相关者日益增长的需求意味着需要系统化和组织地开发并随后适应不同语言对的自动机器翻译系统。由于机器翻译并不完美,因此应用可接受质量水平的计算机生成翻译的方法非常重要,这取决于任务本身和机器翻译系统的应用领域。本文分析了自动统计机器翻译系统的模型、其组成部分以及模型中各个元素的作用和意义。关键词:自动机器翻译;统计机器翻译模型;语言技术;自然语言处理;信息和通信科学。 1 简介 自动机器翻译技术是当今不可或缺的颠覆性技术之一,它极大地促进了自然语言文本翻译领域的业务流程的彻底转变。
然后,我将使用最先进的神经网络方法,在英语-越南语的标准翻译数据集上从多语言模型(Helsinki-NLP)进行训练,并使用我的测试句子评估该模型。接下来,我将使用一种偏差缓解技术,通过交换训练数据集中的性别词来平衡它们,然后重新训练并再次评估。
简介:机器翻译是一个具有重要科学和实际意义的现代自然语言处理研究领域。在实践中,语言的变化,语义知识的局限性以及缺乏平行语言资源限制了机器翻译的发展。目标:本文旨在避免在学习过程中复制神经网络,并提高具有有限资源的复杂神经网络机器翻译模型的能力。方法:研究源语言中的文本材料,并使用合适的文本材料表示模型来表达复杂,高级和抽象的语义信息。然后,基于书面数据和算法的控制开发了一个更有效的神经网络机器翻译集成模型。结果:基于转移学习以标准化有限的神经网络模型,必须将数据挖掘应用于复杂的神经网络机器翻译系统。结论:基于迁移训练的基于神经网络的嵌入式机器翻译系统需要少量标记的样品,以提高系统的渗透性。但是,这种自适应迁移学习区域方法可以很容易地导致神经网络翻译模型中的过度学习问题,从而避免了学习过程中过度的对应关系,并提高了具有有限的神经网络资源的翻译模型的概括能力。
随着机器翻译 (MT) 的普及以及翻译文本准备和后期编辑等子任务的产生,人工智能 (AI) 和机器学习技术已经对语言中介市场产生了影响。到目前为止,机器口译对口译行业的影响还没有机器翻译对翻译行业的影响那么大。然而,技术进步并未结束,如今全自动机器翻译和基于人工智能的计算机辅助口译 (CAI) 工具在口译行业越来越普遍。然而,人工智能和大数据在口译中的使用引发了数据保护和保密方面的一些伦理问题。最早提到机器翻译可以追溯到 20 世纪 30 年代。尽管历史悠久,但翻译研究中很少讨论机器翻译的伦理考虑,据我们所知,口译研究中根本没有讨论过这些问题。本文首先研究了如何将人工智能应用于口译以及现有的各种工具,然后讨论了人工智能的使用(尤其是在口译中使用)所引发的道德问题。
摘要 机器翻译 (MT) 与人工智能 (AI) 的结合显著提高了机器翻译系统的精确度,其翻译质量可与熟练的人工翻译相媲美。这一创新拓宽了人工智能机器翻译系统的适用性,吸引了各种用途的用户。本文探讨了以下领域:人工智能机器翻译,特别是谷歌翻译 (GT) 在英语作为外语 (EFL) 课堂中的应用。实证研究结果和最近的研究表明,学生越来越依赖机器翻译,特别是在英语不是母语的高等教育环境中。本研究的目的是深入了解在课堂上使用谷歌翻译的 EFL 学习者的实践、信念和目标。通过问卷调查以及前后测试收集了 234 名大学生的数据,以比较有无谷歌翻译帮助的写作草稿的质量。研究结果与之前在世界各地进行的研究结果一致,这些研究强调了人工智能机器翻译不仅可以提升学生的学习体验,还可以培养更多独立学习者的巨大潜力。研究还表明,学生对 GT 持积极态度,并采用多种搜索策略来解决各种与语言相关的挑战。关键词:人工智能、英语作为外语、谷歌翻译、机器翻译、写作。引用 | Alharbi,W.(2023 年)。人工智能机器翻译在 EFL 课堂中的使用和滥用:一项探索性研究。教育与电子学习研究杂志,10 (4),689–701。10.20448/jeelr.v10i4.5091 历史记录:收到日期:2023 年 7 月 31 日修订日期:2023 年 9 月 20 日接受日期:2023 年 10 月 4 日出版日期:2023 年 10 月 24 日许可:本作品已获得知识共享署名 4.0 许可出版商:亚洲在线期刊出版集团
随着机器翻译 (MT) 的普及以及翻译文本准备和后期编辑等子任务的出现,人工智能 (AI) 和机器学习技术对语言中介市场产生了影响。到目前为止,机器口译对口译行业的影响还不如机器翻译对翻译行业的影响那么大。然而,技术进步并未止步于此,如今全自动机器翻译和基于人工智能的计算机辅助口译 (CAI) 工具在口译行业中越来越普遍。然而,在口译中使用人工智能和大数据在数据保护和保密方面引发了一些道德问题。最早提到机器翻译可以追溯到 20 世纪 30 年代。尽管历史悠久,但翻译研究中很少讨论机器翻译中的伦理问题,据我们所知,口译研究中根本没有讨论过这些问题。本文首先研究了人工智能如何用于口译以及现有的各种工具,然后讨论了人工智能的使用(尤其是用于口译)所引发的伦理问题。