转向 AI 模型定制是架构上的当务之急

在大型语言模型 (LLM) 的早期,我们已经习惯了每次新模型迭代时推理和编码能力都会大幅提升 10 倍。如今,这些跳跃已趋于平缓,变成增量收益。例外的是领域专业智能,其中真正的阶跃功能改进仍然是常态。当模型与组织融合时……

来源:MIT Technology Review _人工智能

1. 将人工智能视为基础设施,而不是实验。  从历史上看,企业将模型定制视为一项临时实验——针对利基用例或本地化试点的单次微调运行。虽然这些定制的孤岛通常会产生有希望的结果,但它们很少是按规模构建的。它们产生脆弱的管道、临时治理和有限的可移植性。当底层基础模型演变时,适应工作通常必须被丢弃并从头开始重建。

相比之下,持久战略将定制视为基础设施。在此模型中,适应工作流程是可重复的、版本控制的并且是为生产而设计的。成功是根据确定性的业务成果来衡量的。通过将定制逻辑与基础模型分离,公司可以确保其“数字神经系统”保持弹性,即使基础模型的前沿发生变化。

2. 保留对自己的数据和模型的控制。随着人工智能从外围迁移到核心操作,控制问题变得至关重要。依赖单一云提供商或供应商进行模型调整会在数据驻留、定价和架构更新方面造成危险的权力不对称。

保留对其培训渠道和部署环境的控制的企业可以保留其战略机构。通过在受控环境中调整模型,组织可以强制执行自己的数据驻留要求并规定自己的更新周期。这种方法将人工智能从消费服务转变为受管理的资产,减少了结构依赖性,并允许根据内部优先事项而不是供应商路线图进行成本和能源优化。

控制是新的杠杆

未来十年,最有价值的人工智能将不再是知道世界一切的人工智能;它将是了解您一切的人。拥有该情报模型权重的公司将拥有市场。