技术提高了大型语言模型的推理能力

该方法结合了自然语言和编程,使法学硕士能够透明地解决数值、分析和基于语言的任务。

来源:MIT新闻 - 人工智能

大型语言模型(例如支持 ChatGPT 的模型)在起草法律摘要、分析客户评论情绪或将文档翻译成不同语言等任务上表现出色。

这些机器学习模型通常仅使用自然语言来处理信息和回答查询,这可能使它们难以执行需要数字或符号推理的任务。

例如,大型语言模型可能能够记住并背诵最近美国总统及其生日的列表,但如果问“1950 年后当选的哪些美国总统出生在星期三?”(答案是吉米·卡特),该模型可能会失败。

来自麻省理工学院和其他地方的研究人员提出了一种新技术,使大型语言模型能够通过生成程序来解决自然语言、数学和数据分析以及符号推理任务。

他们的方法称为自然语言嵌入式程序 (NLEP),涉及提示语言模型创建和执行 Python 程序来解决用户的查询,然后将解决方案输出为自然语言。

他们发现 NLEP 使大型语言模型能够在广泛的推理任务上实现更高的准确性。 该方法也是可推广的,这意味着一个 NLEP 提示可以重复用于多个任务。

NLEP 还提高了透明度,因为用户可以检查程序以准确了解模型如何推理查询,并在模型给出错误答案时修复程序。

“我们希望 AI 以透明和值得信赖的方式执行复杂的推理。虽然还有很长的路要走,但我们已经证明,在大型语言模型中结合编程和自然语言的能力,是迈向未来人们能够完全理解和信任他们的人工智能模型内部发生的事情的一个非常好的潜在第一步,”麻省理工学院博士后、NLEP 论文的共同主要作者 Hongyin Luo 博士说。

NLEP 论文

“这里没有魔法”