在线对话支持——聊天——是增长最快的客户服务渠道,是千禧一代获得客户服务的首选方式。如今,通过该渠道支持国际客户主要是通过使用讲不同语言的人工代理——一种稀缺且昂贵的资源。语言技术(机器翻译和对话系统)在过去几年中取得了巨大进步,使其成为多语言客户服务的有吸引力的工具。然而,当前的系统仍然过于脆弱和不切实际:首先,它们需要太多数据和计算能力,在标记数据稀缺的领域或语言中失败;其次,它们不捕获上下文信息(例如,当前的机器翻译系统以逐句为基础工作,忽略对话上下文);第三,全自动系统缺乏人类同理心,在意外情况下会失败,导致客户满意度低
摘要标准神经机器翻译(NMT)是关于文档级上下文是独立的。大多数现有的文档级别的NMT方法都充满了全局文档级信息感,而这项工作着重于在内存网络中利用详细的文档级别上下文。从内存中检测到当前句子中最相关部分的内存网络的容量,这是一种自然解决方案,可以对丰富的文档级上下文进行建模。在这项工作中,实现了拟议的文档感知内存网络,以增强变压器NMT基线。对几个任务的实验表明,所提出的方法显着提高了强大变压器基准和其他相关研究的NMT性能。关键词:内存网络,神经机器翻译,文档级上下文
对于所有实验,源解析器都是一个神经 PCFG [64],具有 20 个非终结符和 20 个前终结符。所有实验共享的其他模型设置包括:(1)Adam 优化器,学习率 = 0.0005、β1 = 0.75、β2 = 0.999,(2)梯度范数剪裁为 3,(3)L2 惩罚(即权重衰减)为 10-5,(4)Xavier Glorot 均匀初始化,以及(5)训练 15 个 epoch,并在验证集上提前停止(大多数模型在 15 个 epoch 之前就收敛得很好)。SCAN 和风格迁移数据集的批次大小为 4,机器翻译数据集的批次大小为 32。由于内存限制,在实践中我们使用批次大小 1,并通过梯度累积模拟更大的批次大小。我们观察到训练有些不稳定,一些数据集(例如 SCAN 和机器翻译)需要使用 4 到 6 个随机种子进行训练才能表现良好。一般来说,我们发现过度参数化语法和使用比必要更多的非终结符是可以的 [13]。
AI – 人工智能 API – 应用程序编程接口 DARPA – 国防高级研究计划局 ES – 专家系统 EU – 欧盟 FCA – 金融行为监管局 FINRA – 金融业监管局 GAN – 生成对抗网络 GDPR – 通用数据保护条例 IDE – 集成开发环境 LDA – 潜在狄利克雷分配 LLM – 大型语言模型 LSE – 伦敦证券交易所 MDP – 马尔可夫决策过程 MiFID – 金融工具市场指令 ML – 机器学习 NER – 命名实体识别 NLP – 自然语言处理 NMF – 非负矩阵分解 NMT – 神经机器翻译 NN – 神经网络 PCS – 主成分分析 RegTech – 监管技术 RL – 强化学习 RPA – 机器人过程自动化 SME – 中小企业 SMT – 统计机器翻译 SVM – 支持向量机 VAE – 变分自动编码器 XAI – 可解释人工智能
llm =大语言模型; M = LLM方法; d = de novo llm开发; E = LLM评估; H =医疗保健设置中的LLM评估; C =分类; =结果预测; QA =长形式提问; ir =信息检索; DG =文档生成; SS =摘要和简化; MT =机器翻译; EHR =电子健康记录。
摘要:现代翻译需要翻译技术,例如计算机辅助翻译工具,以减轻翻译人员遇到的困难。猫工具的目标是帮助翻译人员提高其生产率并提高其工作质量。本文强调了要建立翻译人员对翻译技术及其多种方法进行研究的基础。尽管技术进步,但大多数翻译人员尚不熟悉使用支持它们来翻译的机器,因此翻译人员必须了解翻译技术的知识,以实现术语管理,一致性和速度在翻译庞大的任务方面。这项研究通过调查并显示其起源,定义,概念和分类来严格检查翻译技术的一些基础,这些基础支持翻译人员执行他的任务。研究人员采用了描述性方法和翻译的解释理论。该研究探讨了翻译技术的一些基本面,这些基本面可以帮助翻译人员放松翻译过程的任务。最后,研究人员发现,迫切需要翻译人员使用现代技术,尤其是翻译技术,以帮助和促进翻译过程。其中一些技术包括计算机辅助的翻译工具,术语管理系统,翻译记忆和神经机器翻译(使用人工智能),这是当前最好的机器翻译。
高级机器学习 Lena Jäger 机器翻译的高级技术 Rico Sennrich 算法博弈论和机制设计 Sven Seuken 组合算法 Alexander Souza 计算机图形学 Renato Pajarola 深度学习 Manuel Günther 文本和语音处理基本原理 Mathias Müller 自然语言处理的机器学习 1 Simone Clematide 网络科学 Claudio Tessone 随机算法 Alexander Souza
从积极的一面来看,人工智能也可能对我们这些翻译人员有好处。越来越多的委托编辑只以英语为第二语言,我们知道这有助于形成一种非常狭隘的世界文学翻译观。这类编辑可能会使用改进的人工智能翻译工具,至少可以看看用他们自己不会说的语言写的有趣的书。这些书虽然不会由机器翻译,但机器可以评估购买版权的商业可行性,找到合适的翻译人员,甚至可能开始提前营销。所有这些也许有助于使翻译文学的出版多样化。
1。CSE 6505:语音识别2。CSE 6506:数据挖掘3。CSE 6507:机器翻译4。CSE 6508:进化算法5。CSE 6509:文本到语音综合6。CSE 6510:自然语言处理7。CSE 6511:计算机视觉8。CSE 6701:神经网络9。CSE 6704:模糊系统10。CSE 6705:元赫尔学11。CSE 6708:语义网12。CSE 6709:深度学习13。CSE 6710:加固学习