与人工智能对话:构建更好的语言模型

我们的新论文《与人工智能对话:将语言模型与人类价值观相结合》探索了一种不同的方法,询问人类与人工智能对话代理之间的成功交流可能是什么样子,以及在这些情况下应该以什么样的价值观指导对话。

来源:DeepMind - 新闻与博客

借鉴语用学和哲学的新研究提出了将对话代理与人类价值观相结合的方法

语言是人类的基本特征,也是我们传达思想、意图和感受等信息的主要手段。人工智能研究的最新突破促成了能够以细微差别的方式与人类交流的对话代理的诞生。这些代理由大型语言模型提供支持 - 计算系统在大量基于文本的材料语料库上进行训练,以使用高级统计技术预测和生成文本。

然而,虽然 InstructGPT、Gopher 和 LaMDA 等语言模型在翻译、问​​答和阅读理解等任务中取得了创纪录的性能水平,但这些模型也被证明表现出许多潜在的风险和失败模式。其中包括产生有毒或歧视性语言以及虚假或误导性信息 [1, 2, 3]。

InstructGPT Gopher LaMDA

这些缺点限制了对话代理在应用环境中的有效使用,并引起了人们对它们未能达到某些交流理想的关注。迄今为止,大多数关于对话代理协调的方法都集中在预测和降低危害风险 [4]。

交流理想

我们的新论文《与人工智能对话:将语言模型与人类价值观相结合》采用了不同的方法,探索了人类与人工智能对话代理之间的成功交流可能是什么样子,以及什么价值观应该指导这些跨不同对话领域的互动。

与人工智能对话:将语言模型与人类价值观相结合

语用学的见解

为了解决这些问题,本文借鉴了语言学和哲学的传统语用学,它认为对话的目的、背景和一系列相关规范都是良好对话实践的重要组成部分。

  • 说实话