单个代币如何成就或破坏 AI 推理 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

单个代币如何成就或破坏 AI 推理

2024年12月9日 16:34 33 Comments

想象一下，要求 AI 解决一个关于偿还贷款的简单数学问题。当 AI 遇到“欠”这个词时，它会结结巴巴，产生错误的计算和错误的逻辑。但是将这个词改为“已付”，AI 的推理突然发生了变化——变得清晰、准确和精确。这不是怪癖或 […]The post How Single Tokens Can Make or Break AI Reasoning 首先出现在 Unite.AI 上。

来源:Unite.AI

想象一下，让人工智能解决一个关于偿还贷款的简单数学问题。当人工智能遇到“欠”这个词时，它会结结巴巴，产生错误的计算和错误的逻辑。但是，如果将这个词改成“已付”，人工智能的推理就会突然转变——变得清晰、准确和精确。这不是一个怪癖或巧合；这是一个根本性的洞察力，它重塑了我们对人工智能系统思维方式的理解。

清华大学和腾讯人工智能实验室的科学家发现了人工智能中的一种现象：某些词语就像神经交换机一样，能够重定向人工智能的整个推理链。研究人员称之为“关键标记”，它们可能意味着逻辑清晰和计算混乱之间的区别。

发现了人工智能中的一种现象

把它想象成一个 GPS 系统。一个错误的街道名称可能会让你偏离路线数英里，即使其他每个方向都是完美的。同样，这些关键词可以重定向 AI 的整个逻辑旅程，无论周围环境有多么强大。

破解单词代码

突破来自研究人员开发的一种名为 cDPO（对比直接偏好优化）的方法。与以前平等对待所有单词的方法不同，cDPO 认识到在 AI 推理领域，并非所有单词都具有同等权重。

研究团队通过对多个 AI 模型（包括 Llama-3 和 DeepSeek-math）进行广泛测试证明了这一点。他们的研究结果表明，当存在某些关键标记时，AI 的准确率可能会显著下降——有时低至 15.94%。然而，当这些相同的标记被识别并有效管理时，准确率飙升至 84% 以上。

Lin, Liang, Xu 等人清华大学和腾讯人工智能实验室 (2024)

神经幕后

从实验室到现实

这一突破为实际应用打开了大门，可以改善我们在日常场景中使用人工智能的方式。

考虑这些现实世界的影响：

财务分析： 财务分析： GSM8K 基准

研究人员关键词突然转变认识到人工智能突破科学家标记洞察力财务交换机错误的研究意味着实际应用计算 cDPO 推理可能单词 AI 实验室分析系统思维逻辑准确率