详细内容或原文请订阅后点击阅览
小处思考:人工智能采用的违反直觉的路径
以下文章最初发表在 Gradient Flow 上,经作者许可在此处转发。我们正经历人工智能发展的一个特殊时刻。一方面,演示非常壮观:智能体可以轻松地进行推理和计划,模型可以根据文本提示创作原创歌曲,以及研究工具可以生成 [...]
来源:O'Reilly Media _AI & ML我们正经历人工智能发展的一个特殊时刻。一方面,演示非常引人注目:智能体可以轻松地进行推理和计划,模型可以根据文本提示创作原创歌曲,研究工具可以在几分钟内生成详细的报告。然而,许多人工智能团队发现自己陷入了“原型炼狱”,令人印象深刻的概念验证无法转化为可靠的、可投入生产的系统。
文本提示中的原创歌曲数据支持了这一点:绝大多数企业 GenAI 计划未能带来可衡量的业务影响。核心问题不是模型的力量,而是通用工具无法适应混乱的企业工作流程的“学习差距”。这与我在企业搜索中观察到的情况相呼应,其中主要障碍不是人工智能算法,而是它必须导航的环境的基本复杂性。
未能提供可衡量的业务影响在构建代理 AI 时,这一点会被放大。这些系统通常是“黑匣子”,众所周知难以调试,在使用自定义工具时其性能会出现不可预测的下降。他们常常缺乏记忆,难以概括,并且失败不是因为人工智能的智能,而是因为他们周围的系统很脆弱。挑战从完善提示转向构建有弹性、可验证的系统。
令人特别沮丧的是正在我们眼皮子底下蓬勃发展的“影子人工智能经济”。在许多公司中,员工悄悄地使用个人 ChatGPT 帐户来完成工作。这种脱节表明,尽管基层对人工智能的需求无可否认是强劲的,但正在构建的雄心勃勃的自上而下的解决方案却无法满足这一需求。
