下一个人工智能瓶颈不是模型:而是推理系统

企业人工智能系统正在进入一个阶段,推理设计与模型能力本身一样重要。下一个人工智能瓶颈不是模型:而是推理系统一文首先出现在《走向数据科学》上。

来源:走向数据科学

当我与企业人工智能团队合作时,我看到了很多:当出现问题时,他们几乎总是责怪模型。这是可以理解的,但它也经常是不正确的,而且最终代价相当高昂。

通常的场景如下。输出不一致;当有人提出这个问题时,第一反应就是指责模型。它可能需要更多的训练数据、另一次微调运行或不同的基础模型。经过几周的工作,问题仍然相同或仅略有变化。真正的问题通常存在于检索层、上下文窗口或任务的路由方式中,但从未被检查过。

我以前见过这种事发生过很多次,我相信它值得写下来。

微调很有用,但它被过度使用了

在许多情况下,仍然值得进行一些调整。如果需要域适应、音调对齐或安全校准,它应该成为工作流程的一部分。我并不是说你不应该使用它。

问题在于它是任何问题的自动答案,即使它不是合适的工具。部分原因是因为感觉这是一件富有成效的事情。你开始一项微调工作,显然发生了一些事情,并且有之前和之后。看起来你正在解决这个问题,但其实你并没有。

一个例子是合约分析系统,我正在观察一个团队的调试。对于复杂的文档,输出不可靠,最初的想法是该模型缺乏法律推理技能。因此他们进行了多次调整迭代。问题并没有消失。最终,有人注意到检索层多次执行相同的检索,并将它们添加到上下文窗口中。该模型试图处理大量一遍又一遍重复的低价值文本。他们调整了检索排名并引入了上下文压缩,最终变得更好了。

模型本身从未改变。而且,这是一个相当普遍的现象。