公开可用的自然语言生成 (NLG) 算法可以跨领域生成类似人类的文本。鉴于其潜力,随之而来的是道德挑战,例如被用作误导工具。有必要了解这些文本是如何从算法的角度生成的,以及普通受众如何评价它们。在这项研究中,我们的目的是调查人们对算法生成的文本的反应,它们是否与原始/人工生成的文本难以区分,以及人们赋予这些文本的价值。使用原始文本档案和人工智能 (AI) 生成的文本档案,我们预先注册的研究 (N = 228) 的结果表明,与人工智能生成的档案相比,人们更有可能保留原始档案。虽然参与者无法准确区分人工智能生成的档案和原始档案,但参与者对他们归类为人工智能生成的档案的评价低于他们归类为原始的档案。人们对价值的判断也受到他们对人工智能的态度的影响。这些发现帮助我们更深入地理解自动化文本创作的新兴实践如何改变读者和作家的实践,并对读者对人工智能的态度如何影响基于人工智能的应用程序和创作的使用和价值产生了影响。
公开可用的自然语言生成 (NLG) 算法可以跨领域生成类似人类的文本。鉴于其潜力,出现了道德挑战,例如被用作误导工具。有必要了解这些文本是如何从算法的角度生成的,以及普通受众如何评价它们。在本研究中,我们的目的是调查人们对算法生成的文本的反应,它们是否与原始/人类生成的文本无法区分,以及人们赋予这些文本的价值。使用原始文本档案和人工智能 (AI) 生成的文本档案,我们预先注册的研究 (N = 228) 的结果显示,与 AI 生成的档案相比,人们更有可能保留原始档案。尽管参与者无法准确区分人工智能生成的档案和原始档案,但参与者认为他们归类为人工智能生成的档案的价值低于他们归类为原始的档案。人们对价值的判断也受到他们对人工智能的态度的影响。这些发现提供了更丰富的理解,即自动化文本创作的新兴实践如何改变读者和作家的实践,并对读者对人工智能的态度如何影响基于人工智能的应用程序和创作的使用和价值产生了影响。
媒体新闻框架偏见会加剧政治两极分化,破坏公民社会。因此,对自动缓解方法的需求日益增长。我们提出了一项新任务,即从具有不同政治倾向的多篇新闻文章中生成中立摘要,以促进平衡和无偏见的新闻阅读。在本文中,我们首先收集一个新的数据集,通过案例研究阐明关于框架偏见的见解,并为该任务提出一个新的有效指标和模型(N EU S-T ITLE)。根据我们发现标题为框架偏见提供了良好的信号,我们提出了 N EU S-T ITLE,它可以学习从标题到文章按层次顺序中和新闻内容。我们的分层多任务学习是通过使用标识符标记(“TI-TLE=>”、“ARTICLE=>”)按顺序格式化我们的分层数据对(标题、文章),并使用标准负对数似然目标微调自回归解码器来实现的。然后,我们分析并指出剩余的挑战和未来方向。最有趣的观察之一是神经 NLG 模型不仅可以产生事实上不准确或无法验证的内容,还可以产生政治偏见的内容。
图表列表 图 1。跑道上的轮胎痕迹 12 图 2。飞机被机场边界围栏阻挡 13 图 3。被围栏阻挡的飞机的特写视图 13 图 4。前轮转向系统 - 组件位置 15 图 5。前轮转向系统 - 框图 16 图 6。转向手柄命令 17 图 7。NLG 接近开关 18 图 8。液压原理图20 图 9。EHSV 横截面 20 图 10。过滤器孔横截面 21 图 11。前轮转向系统 - 电动操作。24 图 12。线束连接 27 图 13。位于前起落架上的反馈单元 29 图 14。反馈单元的横截面 29 图 15。液压歧管组件 31 图 16。NW 转向液压歧管 SN 0096 31 图 17。显示污染位置的液压示意图 32 图 18。过滤器孔横截面 33 图 19。C1 孔塞 33 图 20。C1 过滤器密封 34 图 21。电气继电器示意图 34
图表清单 图 1. 跑道上的轮胎痕迹 12 图 2. 飞机被机场边界围栏阻挡 13 图 3. 被围栏阻挡的飞机的特写视图 13 图 4. 前轮转向系统 – 组件位置 15 图 5. 前轮转向系统 – 框图 16 图 6. 转向手柄命令 17 图 7. NLG 接近开关 18 图 8. 液压示意图 20 图 9. EHSV 横截面 20 图 10. 过滤器孔横截面 21 图 11. 前轮转向系统 – 电动操作。 24 图 12. 线束连接 27 图 13. 位于前起落架上的反馈装置 29 图 14. 反馈装置的横截面 29 图 15. 液压歧管组件 31 图 16. NW 转向液压歧管 SN 0096 31 图 17. 显示污染位置的液压示意图 32 图 18. 过滤器孔横截面 33 图 19. C1 孔口塞 33 图 20. C1 过滤器密封 34 图 21. 电气继电器示意图 34
在本教程中,我们将重点介绍文本到文本生成,这是一类自然语言生成 (NLG) 任务,它将一段文本作为输入,然后根据某些特定标准(例如可读性或语言风格)生成改进的修订版本,同时在很大程度上保留文本的原始含义和长度。这包括许多有用的应用,例如文本简化、释义生成、风格转换等。与文本摘要和开放式文本完成(例如故事)相比,我们在本教程中讨论的文本到文本生成任务在语义一致性和目标语言风格方面受到更多限制。这种控制水平使这些任务成为研究模型生成语义充分且风格适当的文本的能力的理想试验台。此外,从技术角度来看,这些任务很有趣,因为它们需要词汇和句法转换、风格控制和对事实知识的遵守的复杂组合——所有这些都是同时进行的。本教程特别关注文本简化和修订,旨在从数据、模型、人机协作和评估四个主要方面概述最先进的自然语言生成研究,并讨论和展示一些重大的最新进展:(1)使用非倒退方法;(2)从微调到使用大型语言模型提示的转变;(3)开发新的可学习指标和细粒度人工评估框架;(4)非英语语言的研究和数据集不断增加;(5)HCI+NLP+可访问性跨学科研究的兴起,以创建现实世界的写作助手系统。
(A):飞机。AAIB(英国):航空事故调查处(英国)。AD:适航指令。AMM:飞机维护手册。ANSV:国家飞行安全局。AOC:航空运营人许可证。AOM:飞机操作手册。APP:进近管制办公室o进近管制或进近管制服务。ATL:飞机技术日志。ATPL:航线运输飞行员执照。ATS:空中交通服务。CAA:民航局。CAME:持续适航管理博览会。CAMO:持续适航管理组织。CMM:部件维护手册。CRS:投入使用证书。CS:认证人员。CVR:驾驶舱语音记录器。DSB:荷兰安全委员会。EASA:欧洲航空安全局。ENAC:国家民航组织。 FDR:飞行数据记录器。FMS:飞行管理系统。FT:英尺(英尺),(1 英尺 = 0.3048 米)ICAO/OACI:国际民用航空组织,国际民用航空组织。IFR:仪表飞行规则。ILS:仪表着陆系统。IR:仪表等级。JC:工作卡。KT:节。ME:多引擎。METAR:航空例行天气报告。MP:多飞行员。MTOM:最大起飞质量。NLG:前起落架。NM:海里。PF:飞行飞行员。PIC:机长飞行员。P/N:零件编号。PNF:未飞行飞行员。RWY:跑道。SB:服务通告。SFE:合成飞行考官。SHK:国家航空管理局。SL:服务指南
poojamarbade13@gmail.com 6 摘要:大型语言模型 (LLM) 在生成式人工智能 (AI) 工具中的广泛采用引发了人们对用户隐私的重大担忧。为了应对这一挑战,我们提出了 Private ChatGPT,这是一种用于 LLM 的隐私保护模型。它专注于在数据管理和预处理期间保护用户隐私,并确保在训练过程中保留私人上下文。我们使用强化学习 (RL) 整合差异隐私和私人训练,以保护用户隐私同时保持实用性。我们的评估证明了差异隐私在隐私和模型性能之间取得平衡的有效性。关键词:隐私保护、基于 LLM(大型语言模型)、离线人工智能工具、学术、商业、自然语言 1。介绍 大型语言模型 (LLM) 的快速发展彻底改变了各个领域的自然语言生成,包括双体船、内容创作和自动写作。然而,这一进步带来了一个关键问题:用户隐私。LLM 具有强大的分析和生成文本的能力,无意中泄露了有关用户的敏感信息。在本文中,我们解决了基于 LLM 的离线人工智能工具中的隐私保护挑战。我们提出的模型 Priv Chat GPT 旨在在实用性和隐私之间取得微妙的平衡。通过使用强化学习 (RL) 集成差异隐私和私人训练,我们创建了一个强大的框架,既能保护用户数据,又能保持 LLM 的有效性。目的/目标 A.目的 本会议论文的目的是介绍和阐明一种突破性的解决方案,以解决将自然语言生成 (NLG) 技术(特别是大型语言模型 (LLM))的优势与
梁搜索是一种广泛使用的近似算法,可根据此类分布找到最高的概率字符串。它一直是在许多生成任务中解码概率模型的首选工具,例如机器翻译,抽象性摘要和约束解码。有时,它在产出质量,计算不足和缺乏多样性方面表现出显着的差异。本文首先旨在更好地了解Beam Search的成功。我们确定了光束搜索中固有的归纳偏差,导致我们提出成功是由于其隐含的统一信息密度执行(一种与心理语言理论相关的属性)在生成的文本中。然后,我们解决了标准光束搜索的三个局限性:它的不具体率,其产生低多样性的集合的趋势及其确定性。为了解决第一个限制,我们引入了更加有效的光束搜索变体,该变体将算法构架为基于议程的过程,并采用了最优先的优先级;这种方法通过消除不必要的路径探索来降低计算成本。我们接下来要展示如何将光束搜索中的每个一代步骤作为亚次确定的最大化问题,以及该框架如何以原则上的方式优化设置级别特征(例如多样性)。我们进一步开发了光束搜索的随机概括,该概述促进了不同样本的产生,并可以在模型下建立统计上一致的估计器。我们提供了这些新技术在提高光束搜索的效率,多样性和适应性作为NLG任务的解码算法方面的有效性的经验证据。在本文的最后一部分中,我们使用有关有效解码策略的特性的见解来提出一种新的解码算法,该算法旨在产生模仿人类交流中信息内容模式的文本。我们观察到这种算法会导致高质量的文本,从而始终减少退化的重复,即概率语言发生器已知偶尔会在其他解码策略下产生。本文提出的方法为研究人员和从业人员提供了有价值的工具,以创建更好的概率语言发生器。
(A):飞机。 AAIB(英国):航空事故调查处(英国),英国民航安全调查机构。 AAIU(爱尔兰):爱尔兰民航安全调查局航空事故调查组。 AD:适航指令。 AFM:飞机飞行手册。 ANSV:国家飞行安全局。 APU:辅助动力装置。 ATC:空中交通管制。 ATP:验收测试程序。 ATPL:航空公司运输飞行员执照。 BEA:Bureau d'Enquêtes et d'Analyses pour la Sécurité de l'Aviation Civil,法国民用航空安全调查机构。 BFU:Bundesstelle für Flugunfalluntersuchung,德国民航安全调查局。 CFDIU:集中故障显示接口单元。 CFDS:集中故障显示系统。检查清单:检查清单。驾驶舱:驾驶舱。 CT-SCAN:计算机断层扫描。 CVR:驾驶舱语音记录器,记录驾驶舱内的通讯、声音和噪音。 DFDR:Digital Flight Data Recorder,数字飞行数据记录仪。 EASA:欧洲航空安全局,欧洲航空安全局。 ECAM:电子集中飞机监视器。 FC:飞行周期。 FDR:Flight Data Recorder,模拟飞行数据记录器。 FT :英尺,测量单位,1
