在本教程中,我们将重点介绍文本到文本生成,这是一类自然语言生成 (NLG) 任务,它将一段文本作为输入,然后根据某些特定标准(例如可读性或语言风格)生成改进的修订版本,同时在很大程度上保留文本的原始含义和长度。这包括许多有用的应用,例如文本简化、释义生成、风格转换等。与文本摘要和开放式文本完成(例如故事)相比,我们在本教程中讨论的文本到文本生成任务在语义一致性和目标语言风格方面受到更多限制。这种控制水平使这些任务成为研究模型生成语义充分且风格适当的文本的能力的理想试验台。此外,从技术角度来看,这些任务很有趣,因为它们需要词汇和句法转换、风格控制和对事实知识的遵守的复杂组合——所有这些都是同时进行的。本教程特别关注文本简化和修订,旨在从数据、模型、人机协作和评估四个主要方面概述最先进的自然语言生成研究,并讨论和展示一些重大的最新进展:(1)使用非倒退方法;(2)从微调到使用大型语言模型提示的转变;(3)开发新的可学习指标和细粒度人工评估框架;(4)非英语语言的研究和数据集不断增加;(5)HCI+NLP+可访问性跨学科研究的兴起,以创建现实世界的写作助手系统。
许多研究都调查了针对失语症患者一系列语言问题的干预措施所带来的大脑变化。我们力求整合这些研究的结果,以检验 (1) 干预的重点(即音系、语义、正字法、句法或节奏旋律)是否决定了大脑的哪些区域发生变化;以及 (2a) 最一致的变化是发生在语言网络内部还是外部,以及 (2b) 这些变化是否与语言结果的个体差异有关。我们考虑了 32 项研究的结果,其中涉及 204 名独特患者。关于 (1),治疗相关变化的位置并不明显取决于目标语言处理类型。然而,有证据表明节奏旋律训练对右半球的影响比语言训练更大。关于 (2),我们观察到语言恢复不仅与左半球传统语言相关结构和右半球同源区域的变化有关,还与更多的内侧和皮层下变化(例如楔前叶和基底神经节)有关。虽然很难得出有力的结论,因为缺乏关于这一主题的系统大规模研究,但本综述强调需要采取综合方法来研究语言干预如何影响大脑。未来的研究需要侧重于更大的样本,保留受试者特定信息(例如病变效应),以应对中风引起的失语症固有的异质性。此外,全脑连接模式的恢复相关变化需要更多的研究,以提供与治疗相关的大脑可塑性和语言恢复的全面神经解释。
基于跨文化务实的研究观点,旨在比较印尼和也门EFL学习者之间邀请邀请的邀请的成就。研究参与者是来自印度尼西亚Airlangga University的30名本科生和也门Sana'a University的30名本科生。所有参与者的文化背景都不同。数据是通过使用话语完成任务(DCT)收集的,然后在Bruder和Tillitt(1999),Al-Khatib(2006)和Suzuki(2009)邀请策略的基础上进行了分析。研究结果在邀请制作方面表现出了一些相似之处和差异。某些邀请策略似乎在文化上是一种文化,而另一些文化则是普遍的。在这方面,印尼EFL学习者宁愿在使用语音行为时间接使用邀请,而邀请提出邀请,而不是偏爱使用是/否问题,要求愿意和WH。问题策略。他们认为,使用此类策略有助于他们在使用第一语言时在日常对话中使用一些礼貌的表达。相比之下,也门EFL学习者赞成直接使用《语音邀请法》,而命令策略的最高百分比是YES/否问题策略。这可能会显示其第一语言对答案的一部分。他们还知道,直接邀请大多在其文化中被接受。也提供了研究的含义。此外,研究结果表明,印尼和也门EFL学习者将母语的话语翻译成目标语言,而没有考虑两种语言之间的句子模式和单词顺序的变化。
抽象机器翻译在桥接语言障碍中起着至关重要的作用,但是产生适当的翻译仍然是一个挑战。增强学习技术与变压器模型的集成,以增强上下文相关翻译的产生。通过合并上下文策略梯度方法,一种考虑流利性和上下文的奖励功能,多代理强化学习,课程学习和交互式用户反馈,旨在提高机器翻译的质量。强化学习技术与变压器模型的集成提供了几种关键贡献。它使模型能够通过考虑源句子上下文,目标语言细节和用户偏好来优化翻译决策。拟议的奖励功能设计既包含传统的度量标准得分,又结合了上下文感知的指标,以促进流利性和连贯性。多代理强化学习增强了专门从事不同翻译方面的代理之间的协作。课程学习和用户反馈的互动学习有助于有效的培训和人为指导的微调。实验结果表明,与基线模型相比,翻译质量的显着改善。所提出的方法在评估指标(例如BLEU,流星,胭脂和TER)中获得了更好的分数。此外,定性分析强调了该模型在产生流利,准确和上下文相关的翻译方面的优势。总体而言,增强学习技术与变压器模型的集成在增强机器翻译系统方面有希望,使其更适应能力,以用户为中心,并且能够产生适当的上下文翻译。关键字1机器翻译,增强学习,变压器,交互式学习。
本文介绍了腾讯人工智能实验室 - 上海交通大学 (TAL-SJTU) 针对 WMT22 共享任务的低资源翻译系统。我们参与了英语⇔利沃尼亚语的一般翻译任务。我们的系统基于 M2M100 (Fan 等人,2021),并采用了使其适应目标语言对的新技术。(1) 跨模型词嵌入对齐:受跨语言词嵌入对齐的启发,我们成功地将预训练的词嵌入转移到 M2M100,使其能够支持利沃尼亚语。(2) 逐步适应策略:我们利用爱沙尼亚语和拉脱维亚语作为辅助语言进行多对多翻译训练,然后适应英语-利沃尼亚语。(3) 数据增强:为了扩大英语-利沃尼亚语的平行数据,我们以爱沙尼亚语和拉脱维亚语为枢轴语言构建了伪平行数据。(4) 微调:为了充分利用所有可用数据,我们使用验证集和在线反向翻译对模型进行微调,进一步提升性能。在模型评估方面: (1) 我们发现以前的研究(Rikters et al.,2022 )由于 Unicode 规范化不一致而低估了利沃尼亚语的翻译性能,这可能导致高达 14.9 BLEU 分数的差异。(2) 除了标准验证集外,我们还使用往返 BLEU 来评估模型,我们发现这更适合这项任务。最后,我们的无约束系统在英语与利沃尼亚语之间的互译中取得了 17.0 和 30.4 的 BLEU 分数。1
1印度信息技术研究所UNA,印度2 Capgemini Technology,Bangalore。在一个越来越重要的世界中,与来自不同国家的人的联系和合作的世界,坎普尔是kenpur a a abtress,越来越重要,语言障碍通常是跨境交流和协作不成功的主要原因。本研究论文是关于使用生成AI模型的使用,最著名的是Marianmt模型和T5模型,这些模型可以通过语言界限并创建多语言形式。另一方面,纸张通过拥抱的面孔变形金刚库探索了这些模型在Python环境中的现实应用。本文进入了详细的代码样本中,以说明如何将这些模型从一种语言转移到另一种语言中,除了当前使用的模型。实验设计涉及不同样本数据的翻译,此数据包含名称,年龄,身高,体重和医疗问题等单个属性,将其转变为多种目标语言。此外,本研究不仅显示了模型初始化和翻译的技术困难,而且还强调了这种技术在发展跨文化理解和使世界交流更容易的情况下的更广泛含义。结果强调了生成AI克服语言障碍的潜力,从而使全球合作,知识传播和文化交流k eywords生成AI,Marianmt模型,T5模型,自然语言处理,拥抱面孔变形金刚,交叉文化沟通,语言障碍,语言障碍,计算语言,计算语言,多语言,多语言,多语言。1。在一个正在逐步转化为数字化的世界中,处理语言障碍的能力是创建全球合作和理解的主要工具。语言短缺长期以来一直是造成沟通障碍的关键原因,阻止人们在边界上分享他们的想法,信息和文化。尽管如此,生成AI的最新发展,尤其是在NLP领域,它提供了一种有趣的方法来解决这个旧问题。本文探讨了生成AI和多语言翻译之间的关系。它专注于像Marianmtmodel和T5Model这样的复杂模型,它们可以帮助大型数据集进行跨文化通信和规模。
Diana Bebenova-Nikolova,博士生 鲁塞大学“Angel Kanchev”商务与管理系 电话:082-888 212 邮箱:dbebenova@uni-ruse.bg Juliana Popova 教授,博士 鲁塞大学“Angel Kanchev”商务与管理系 电话:082-888 212 邮箱:jppopova@uni-ruse.bg Lyudmila Mihailova 副教授 鲁塞大学“Angel Kanchev”商务与管理系 电话:082-888 212 邮箱:lmihaylova@uni-ruse.bg 摘要:本文通过介绍使用通用语进行汉语跨文化交际时的一些语用失误,为跨文化和语言知识做出了贡献。使用外语的交流者经常会无意识地将母语和文化中的形式和规则“转移”到目标语言中。生成的信息虽然在语言上是正确的,但接收者可能会根据他们不同的文化价值观错误地解释,从而导致文化误解。此类案例提出了如何提高跨文化话语能力的问题。本文作者收集了所呈现的交流情况,这是在中国武汉的湖北工业大学实施 Erasmus + 流动项目的结果。对案例的讨论遵循了同一作者在之前的文章“跨文化能力综合过程模型”中描述的跨文化能力模型。上述结构表明了人际沟通中需要哪些能力,以便参与者的文化特定行为能够通过与他们自己的文化价值观进行比较而被“解码”和理解。此外,本文试图根据 Shi-xu 强调的中国沟通假设来分析这些情况。它还在 Ting-Toomey 的著作中提出的中国 Facework 特征中寻找沟通困难的可能原因的解释。本文使用的另一个概念是霍夫斯泰德引入的 6D 文化测量模型:权力距离、避免不安全感、男性气质/女性气质、个人主义/集体主义、长期/短期取向、克制/放纵。演讲示例和相关推理可以帮助 ESL 教师提高跨文化能力,以及所有依赖英语作为通用语的人。这种方法也体现了“文化背包”的理念,持有者可以选择将获得的跨文化知识“存储”在其中,并在需要时使用。关键词:跨文化能力,跨文化,中国文化。JEL 代码:I29
语言“学习”计算机 多种计算机硬件和软件语言翻译解决方案接收用户的提问或话语,并使用统计数据和各种专有方法分析对话上下文,然后输出语音。算法可以通过将输入与语言上下文(来自数据库)相匹配来衡量学习者的水平。该系统可用于购物、信息等上下文中。商业上,这种方法可用于多语言便携式翻译器,其中手动以母语搜索被动数据库,以获得目标语言的输出。 数字助理应用程序 其他提供数字助理的产品在设备的内存中存储。节点和动作可以将词组组合起来用于特定目的(在餐厅、酒吧、车站点餐)。推断动作,然后由人工智能执行任务(例如,程序调用)。目的是通过将单词与特定发音关联起来来减少错误。 基于工具集的对话理解系统 许多语音解决方案都基于处理器和内存系统指令。例如,这些技术响应语音输入并在屏幕上为用户显示结果,特别是作为文本或语音搜索的输出(即电影或音乐领域)。 使用智能设备基于情境感知的外语习得和学习 其他产品则基于语言学习和服务,这些语言学习和服务来自用户的真实世界数据和他/她的兴趣,并使用调度程序、设置学习时间的信息将语言学习内容发送到设备。推送的内容包括与学习者相关的内容的示例对话和带有附加视频、多媒体内容的真实生活情境,以增加学习者的兴趣。 具有 STT 和 TTS 的智能人机对话框架 这一创新领域涉及一种具有情感的多语言语音处理器,用于控制室需要对某种情况做出响应的现场情况(例如紧急情况、灾难、非法侵入)。它使用 STT 和 TTS 来提供来自现场查询的响应。使用视觉和/或音频提示进行语言教学的系统和方法 教学方法提供语言指令 - 语音片段 - 音素、单词 - 特别适用于具有直接指令的车辆,通常称为汽车导航系统。它不旨在重现情景或对话,本质上只是教学。两种语言自由对话系统和语言学习方法 STT 意图识别用于将 STT 转换为目标语言并分析意图。然后使用输出执行任务,例如移动地图或调用代理来检索信息 - 例如广告内容、音乐应用程序。
理解和词汇超文本注释,尤其是文内注释,在提高阅读理解和获得目标语言词汇量方面发挥着至关重要的作用(Chen,2016)。许多研究调查了图形组织器的使用及其在多种情况下对学习者表现的影响。大多数研究结果表明,除了记住课程内容外,图形组织器主要在阅读和写作中发挥积极作用。例如,Robinson 等人(2006)研究了图形组织器如何影响学习者在教育心理学课程中的表现。研究参与者包括课程两个部分的 114 名学生。在三个准实验中,他们被要求自己完成图形组织器或学习之前根据课程内容创建或完成的图形组织器。研究结果表明,部分任务使学生在考试中取得更高的分数,并且在所有实验条件下,参与者的笔记记录都有所增加。 Casteleyn、Mottart 和 Valcke (2013) 进行的另一项研究旨在确定使用概念图作为图形组织者如何影响学习成果和几个变量,其中包括认知负荷和对讲师准备的电子材料的欣赏以及多媒体学习的认知理论。一组学生听录音讲座,而实验组学生听基于图形组织者的讲座。研究结果表明,尽管参与者更喜欢基于图形组织者的讲座,但这两组在认知负荷、知识获得和自我效能方面并没有差异。同样,Khoii 和 Sharififar (2013) 调查了死记硬背和图形组织者作为语义映射是否会影响 L2 词汇习得。他们的研究包括 38 名中级 EFL 学习者,他们被分成两个实验组,每个组练习不同的认知技巧。基于包含多项词汇选择题的后测,研究结果表明两个实验组都提高了词汇知识;然而,记忆法和图形组织器组之间没有显著差异。在一项针对两名课堂教师的跨案例分析研究中,Mercuri (2010) 研究了课堂中的教学活动,这些活动侧重于学生在科学教学期间的学术语言发展。研究结果揭示了印刷图形组织器的积极作用,帮助学生总结和展示从文本中得出的想法之间的关系。Servati (2012) 试图调查基于图形组织器(如网页)以及开头、中间和结尾图表的写作前活动如何影响学生写作的整体质量。研究参与者包括 2 名来自 Sunnydale 辅导计划的学生和 10 名教师。为了收集数据,研究采用了问卷、学生词汇样本、与参与者进行的访谈和实地笔记。研究结果表明,使用基于图形组织器的适当写前策略并给予学生足够的时间可以提高写作质量。另一方面,Ponce、Mayer 和 Lopez (2013) 研究了基于计算机的空间学习策略在阅读和写作课中的使用情况。来自 12 所学校的 2,468 名学生参加了这项研究。这些参与者利用特定的策略,在阅读课上将一页纸上的内容和想法形象化,同时在写作课上完成图形组织器。根据研究中获得的测试结果,计算机教学组的参与者