详细内容或原文请订阅后点击阅览
AI的下一个突破不是更大的模型,它是更好的产品
随着生成的AI繁荣进入第三年,创新的速度仍然不懈,但重心正在转移。一旦以模型规模,培训预算和基准分数为主导,对话就越来越专注于更实用的事情:这些模型现在可以对真实的人有用吗? a […]
来源:AI Time Journal随着生成的AI繁荣进入第三年,创新的速度仍然不懈,但重心正在转移。一旦以模型规模,培训预算和基准分数为主导,对话就越来越专注于更实用的事情:这些模型现在可以对真实的人有用吗?
生成ai 这些模型现在可以对真实的人有用吗?越来越多的公司,尤其是在最初的硅谷AI比赛之外的公司,押注AI的下一个主要浪潮不是建立最大的模型,而是建立最有用的模型。
从参数到产品市场拟合
在2023年和2024年,AI实验室和初创企业竞争了从GPT-4到Gemini 1.5再到Claude Opus的越来越大型模型。但是,许多收益虽然令人印象深刻,但对于最终用户来说通常是无法察觉的。如今,整个行业的产品团队越来越多地问:它的响应速度有多快?它了解我的工作流程吗?它可以在便宜的硬件上运行吗?我的父母或工厂同事可以使用它吗?
这种转变不是理论上的。在2025年,Chatbot Arena上的十大车型是众包性的表演排行榜,托管在拥抱面前,现在包括多个针对响应能力,多模式和开放部署的LLMS。一个值得注意的例子是:腾讯的Hunyuan Turbo S悄悄地通过其推理和现实世界效率的实力上升。 Turbo S使用混合Mamba-Moe架构建造,优先考虑低潜伏期和结构化思维,而不是纯参数计数。
聊天机器人竞技场上的十大型号 腾讯的Hunyuan Turbo S,但比腾讯建立模型的使用方式更重要。
如何使用