• Paper copies of the English flyer are available to order , free of charge using product code: 2901027 • Translated versions of the flyer are available to download in the following languages: Afrikaans, Arabic, Bengali, Cantonese, Chinese, French, Italian, German, Hebrew, Hindi, Lithuanian, Polish, Portuguese, Romani, Romanian, Swahili, Spanish, Turkish,他加禄语,泰米尔语,乌克兰和乌尔都语。
本文介绍了 Facebook AI 提交的 WMT20 共享新闻翻译任务。我们专注于低资源设置并参与两对语言对,即泰米尔语 ↔ 英语和因纽特语 ↔ 英语,其中域外双语文本和单语数据有限。我们使用两种主要策略解决低资源问题,利用所有可用数据并使系统适应目标新闻领域。我们探索了利用所有语言的双语文本和单语数据的技术,例如自监督模型预训练、多语言模型、数据增强和重新排名。为了使翻译系统更好地适应测试域,我们探索了数据集标记和域内数据的微调。我们观察到,根据语言对的可用数据,不同的技术提供了不同的改进。基于这一发现,我们将这些技术集成到一个训练流程中。对于 En → Ta,我们探索了一种无约束设置,其中包含额外的泰米尔语双语文本和单语数据,并表明可以获得进一步的改进。在测试集上,我们提交的最佳系统分别对 Ta → En 和 En → Ta 实现了 21.5 和 13.7 BLEU,对 Iu → En 和 En → Iu 分别实现了 27.9 和 13.0。
攻击性语言识别是近年来受到越来越多关注的研究领域。特别是随着社交媒体平台的兴起,识别混合有代码的社交媒体文本中的攻击性语言至关重要。在社交媒体文本中识别攻击性语言是一项具有挑战性的任务。此外,在英语、希腊语或西班牙语等语言中已经做了大量攻击性语言识别工作(Zampieri 等人,2019 年;Pitenis 等人,2020 年;Ranasinghe 和 Zampieri,2020 年),但对于达罗毗荼语混合代码文本的攻击性语言识别工作却很少。达罗毗荼语(泰米尔语-英语、马拉雅拉姆语-英语和卡纳达语-英语)攻击性语言识别共享任务改变了这一状况。这项共享任务的目标是识别德拉威语混合代码文本中的攻击性语言。混合代码文本是从社交媒体平台收集的。这是一项评论或帖子级别的多语言分类任务,给出混合代码的泰米尔语-英语、马拉雅拉姆语-英语的评论或帖子
近 年 来 , 预 训 练 语 言 模 型 已 逐 渐 成 为 自 然 语 言 处 理 领 域 的 基 座 模 型 。 相 关 实 验 现 象 表 明 , 预 训 练 语 言 模 型 能 够 自 发 地 从 预 训 练 语 料 中 学 到 一 定 的 语 言 学 知 识 、 世 界 知 识 和 常 识 知 识 , 从 而 在 知 识 密 集 型 任 务 上 获 得 出 色 的 表 现 ( AlKhamissi et al., 2022 ; Safavi and Koutra, 2021 ; Petroni et al., 2019 ) 。 然 而 , 预 训 练 语 言 模 型 中 的 知 识 隐 式 地 存 储 在 参 数 之中 , 难 以 显 式 地 对 预 训 练 语 言 模 型 中 的 知 识 进 行 分 析 和 利 用 。 同 时 , 预 训 练 语 言 模 型在 知 识 和 推 理 上 的 表 现 并 不 可 靠 , 常常 会 出 现 “ 幻 觉 ” 现 象 ( Ji et al., 2022 ) , 给 出 与 知 识 冲 突 的 预 测 结 果 。 这 些 因 素 阻 碍 了 预 训 练 语 言 模 型 提 供 可 靠 的 知 识 服 务 。 因 此 , 探 究 模 型 掌握 知 识 的 机 理 、 研 究 如 何 提 取 和 补 充 语 言 模 型 中 的 知 识 成 为 近 期 的 研 究 热点 。 本 次 讲 习 班 主 要 内 容 包 括 预 训 练 语 言 模 型 中 的 知 识 分 析 、 预 训 练 语 言 模 型 的 知 识 萃 取 、 知 识 增 强 的 预 训 练 语 言 模 型 三个 部 分 , 听 众 将 在 本 次 讲 习 班 中了 解 到 近 期 研 究 中 对 预 训 练 语 言 模 型 掌握 知 识 情 况 的 认识 、 从 预 训 练 语 言 模 型 中 提 取 符 号 知 识 的 实 现 方 案 、 利 用 外 部 知 识 增 强 模 型 弥 补 缺 陷 的 各 类 方 法 。
荣誉首席部长在他的讲话中自豪地提到,尽管泰米尔人在海洋和大陆上被数英里划分了,但是曼联以加强泰米尔侨民的成就和身材的集体目标,还是在钦奈派对,以策略实现共同目标的下一步。他还补充说,泰米尔纳德邦的政府为泰米尔侨民的福利创造了一个新的部门,该部门一直在努力提高全球泰米尔人的生活质量。他还分享了各种例子,说明新成立的部门如何在世界上泰米尔侨民发生事件面临严重问题时如何行动 - 其中一些是由于乌克兰,以色列,以色列发生的冲突,科威特的消防事故或孟加拉国的政治上行的冲突而受到影响。他提到,政府在为泰米尔人扮演困境中扮演角色时,也通过为国家全球大使的福利制定各种计划,成为其经济和社会福祉的积极伙伴,其中一些人是“ Vergalai Thedi”,“ Enadhu Gramam”,“ Enadhu Gramam”,Enadhu Palli。
a。中央电动化学研究所(CECRI),Karaikudi b。 中央塑料工程技术研究所(CIPET),钦奈c。 B. E.&B。 技术。 学位课程在大学安娜大学的大学和组成学院。 (v)B。E. E.学位课程的机械工程和土木工程(泰米尔语媒介)的学位课程(泰米尔语媒介)在安娜大学的大学系和组成学院。 (VI)B.E.座位 /B.Tech学位课程,安纳马莱大学,奇丹巴拉姆(Chidambaram)Annamalai Nagar。 (vii)自我融资工程学院投降的席位候选人只需要为上述所有课程/学院/机构注册一个在线申请。 在特殊保留下寻求入学的候选人还应为特殊预订类别提供选项以及主要的在线申请。中央电动化学研究所(CECRI),Karaikudi b。中央塑料工程技术研究所(CIPET),钦奈c。 B. E.&B。技术。学位课程在大学安娜大学的大学和组成学院。 (v)B。E. E.学位课程的机械工程和土木工程(泰米尔语媒介)的学位课程(泰米尔语媒介)在安娜大学的大学系和组成学院。 (VI)B.E.座位 /B.Tech学位课程,安纳马莱大学,奇丹巴拉姆(Chidambaram)Annamalai Nagar。 (vii)自我融资工程学院投降的席位候选人只需要为上述所有课程/学院/机构注册一个在线申请。 在特殊保留下寻求入学的候选人还应为特殊预订类别提供选项以及主要的在线申请。学位课程在大学安娜大学的大学和组成学院。(v)B。E. E.学位课程的机械工程和土木工程(泰米尔语媒介)的学位课程(泰米尔语媒介)在安娜大学的大学系和组成学院。(VI)B.E.座位 /B.Tech学位课程,安纳马莱大学,奇丹巴拉姆(Chidambaram)Annamalai Nagar。 (vii)自我融资工程学院投降的席位候选人只需要为上述所有课程/学院/机构注册一个在线申请。 在特殊保留下寻求入学的候选人还应为特殊预订类别提供选项以及主要的在线申请。(VI)B.E.座位/B.Tech学位课程,安纳马莱大学,奇丹巴拉姆(Chidambaram)Annamalai Nagar。 (vii)自我融资工程学院投降的席位候选人只需要为上述所有课程/学院/机构注册一个在线申请。 在特殊保留下寻求入学的候选人还应为特殊预订类别提供选项以及主要的在线申请。/B.Tech学位课程,安纳马莱大学,奇丹巴拉姆(Chidambaram)Annamalai Nagar。(vii)自我融资工程学院投降的席位候选人只需要为上述所有课程/学院/机构注册一个在线申请。在特殊保留下寻求入学的候选人还应为特殊预订类别提供选项以及主要的在线申请。
本卷包含 2019 年 10 月 9 日至 11 日在爱沙尼亚塔林举行的第 17 届 EFNIL 年会上的演讲。此次会议由爱沙尼亚语言学院、爱沙尼亚语言理事会、教育和研究部、塔林市政府、母语学会和欧盟委员会翻译总司 (DGT) 和 EFNIL 合作举办。在会议上提交的论文中,以不同的方式强调了“语言与经济”这一主题。本卷的第一篇文章基于会议上的主旨演讲,从一种或多种语言的经济权重的角度来理解语言的经济权重问题。本文主要从英语在世界范围内的重要性来讨论语言的经济权重问题。尽管经济效益与语言使用之间的联系的考虑构成了本书第一部分的基调,但它们与对经济(即有效和适当)语言使用及其与经济因素关系的思考相关。本书第一章中的论文讨论了如何将经济学家的观点系统地融入语言论述中,以及如何在现代欧洲社会中有效利用人力资本“语言”,以及在日益发展的语言产业领域中产生的实际影响。会议副标题中讨论的最后一个方面,即语言产业,指的是多语言互动的实际挑战,并提出了相当多的具体问题。管理多语言结构最明显的后果之一是专业翻译和口译的必要性,本书第二章将讨论这个问题。解决这些问题的问题——例如在欧盟机构中——无疑具有经济方面;这样的解决方案提供了经济机会,是成本效益计算的对象。下一部分是关于在多语言环境中掌握和使用多种语言的好处(以及某些语言技能的局限性)。文章举例说明了多种语言是否以及在何处使用有效且具有经济优势。在关于简单语言作为另一种经济交流方式的论文中,讨论了近年来越来越明显的一个方面。使用简单语言可以减少误解,这一事实也产生了经济效益。本节中的论文展示了经济问题和包容性和多样性的民主概念如何重叠。
本书是我在加州大学圣克鲁斯分校开始学习阿拉伯语、印地语-乌尔都语、波斯语和梵语 16 年的成果,之后我在美国印度研究所、德里大学和德克萨斯大学奥斯汀分校继续学习。我的第一位印地语-乌尔都语老师约翰·莫克 (John Mock) 一直是我的主要灵感来源。我同样感谢美国乌尔都语研究所勒克瑙分校项目的所有老师,感谢他们的耐心,感谢他们带我进入乌尔都语文学的世界。我特别感谢与 Fahmida Bano、Wafadar Husain、Ahtesham Khan 和 Sheba Iftikhar 一起讨论乌尔都语单词的大量时间。在威斯康星大学麦迪逊分校,我有幸协助和观察已故的 Qamar Jalil,他的教学见解反映在本书中。在德克萨斯大学奥斯汀分校,我有幸与世界上一些最伟大的语言和文学教师一起学习。 Syed Akbar Hyder 为我提供了广泛而严格的乌尔都语文学指导。Michael Hillmann 花费数年时间训练我精通波斯语。本书阿拉伯语和波斯语单元中的许多想法和见解都直接源自他的指导。我还要感谢 Rupert Snell,我跟随他学习印地语八年,他让我领略了印地语-乌尔都语词汇的诸多乐趣以及应用语言文学的知识回报。本书也是我在加州大学伯克利分校、德克萨斯大学奥斯汀分校和威斯康星大学麦迪逊分校教授乌尔都语十一年的成果。我最初于 2008 年在威斯康星大学麦迪逊分校的南亚暑期语言学院构思了这个项目,并从与学生和同事的交谈中受益匪浅,包括 Qamar Jalil 和 Faraz Sheikh。我在德克萨斯大学奥斯汀分校的印地语-乌尔都语旗舰课程任教期间开发了这些单元的基本结构和许多课程的初稿。多年来,我在那里教过许多才华横溢的学生,但我特别感谢 Ayana D'Aguilar 和 Courtney Naquin 的反馈,他们在我研究生最后一年与我一起完成了许多练习的初稿。过去四年,我一直在加州大学伯克利分校开发和教授这些材料。他们的反馈启发了我进行无数轮的修改。特别感谢以下学生,他们在本书准备出版的最后阶段参与了本书的大部分工作:Hammad Afzal、Khudeeja Ahmed、Hammad Ali、Aparajita Das、Elizabeth Gobbo、Salil Goyal、Shazreh Hassan、Caylee Hong、Zain Hussain、Talib Jabbar、Maryam Khan、Adeel Pervez、Omar Qashoa、Adnan Rawan、Ahmad Rashid Salim、Nawal Seedat 和 Fatima Tariq。还要特别感谢 Sally Goldman 对梵文单元的有益反馈和建议,以及我的朋友和同事 Walter Hakala 在修订后期对这些单元的精辟评论。他们的反馈大大提高了本书的质量。当然,所有错误和疏忽都是我一个人的错。