下一个人工智能瓶颈不是模型：而是推理系统 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

下一个人工智能瓶颈不是模型：而是推理系统

2026年5月14日 16:30 33 Comments

企业人工智能系统正在进入一个阶段，推理设计与模型能力本身一样重要。下一个人工智能瓶颈不是模型：而是推理系统一文首先出现在《走向数据科学》上。

来源:走向数据科学

当我与企业人工智能团队合作时，我看到了很多：当出现问题时，他们几乎总是责怪模型。这是可以理解的，但它也经常是不正确的，而且最终代价相当高昂。

通常的场景如下。输出不一致；当有人提出这个问题时，第一反应就是指责模型。它可能需要更多的训练数据、另一次微调运行或不同的基础模型。经过几周的工作，问题仍然相同或仅略有变化。真正的问题通常存在于检索层、上下文窗口或任务的路由方式中，但从未被检查过。

我以前见过这种事发生过很多次，我相信它值得写下来。

微调很有用，但它被过度使用了

在许多情况下，仍然值得进行一些调整。如果需要域适应、音调对齐或安全校准，它应该成为工作流程的一部分。我并不是说你不应该使用它。

问题在于它是任何问题的自动答案，即使它不是合适的工具。部分原因是因为感觉这是一件富有成效的事情。你开始一项微调工作，显然发生了一些事情，并且有之前和之后。看起来你正在解决这个问题，但其实你并没有。

一个例子是合约分析系统，我正在观察一个团队的调试。对于复杂的文档，输出不可靠，最初的想法是该模型缺乏法律推理技能。因此他们进行了多次调整迭代。问题并没有消失。最终，有人注意到检索层多次执行相同的检索，并将它们添加到上下文窗口中。该模型试图处理大量一遍又一遍重复的低价值文本。他们调整了检索排名并引入了上下文压缩，最终变得更好了。

模型本身从未改变。而且，这是一个相当普遍的现象。

微调复杂的相同的人工智能使用不同的模型不一致注意到调整问题合适的安全校准不正确团队从未上下文多次重复的值得最初的更多的普遍的低价值正确的分析系统检索真正的不正确的需要最终通常的工作窗口

下一个人工智能瓶颈不是模型：而是推理系统

微调很有用，但它被过度使用了

其他外部链接

Tags

XiaoMi-AI