您喜欢的模型可能就是您使用的模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

您喜欢的模型可能就是您使用的模型

2026年4月1日 11:12 33 Comments

以下文章最初发表在 Medium 上，经作者许可在此重新发布。如果询问 10 位开发人员他们会推荐哪位法学硕士，您会得到 10 个不同的答案，而且几乎没有一个答案是基于客观比较的。相反，您将得到的是他们碰巧有权访问的模型的反映，[...]

来源:O'Reilly Media _AI & ML

以下文章最初发表在 Medium 上，经作者许可在此重新发布。

问 10 位开发人员他们会推荐哪种法学硕士，您会得到 10 个不同的答案，而且几乎没有一个答案是基于客观比较的。相反，你会得到的是他们碰巧可以使用的模型的反映，他们的雇主批准的模型，以及他们关注的有影响力的人已经悄悄付费推广的模型。

我们都生活在递归嵌套的围墙花园里，而我们大多数人都没有意识到这一点。

在企业环境中，模型选择常常是偶然发生的。团队中的某人在一个周末尝试了 Claude Code，他很兴奋，在 Slack 上告诉团队，突然整个组织都在使用它。没有人评估替代方案。没有人举办烘焙大赛。这个决定是由拥有公司卡和周六免费的人做出的。

这不是批评——事情就是这样发展的。但这意味着当同一个人告诉你他们最喜欢的模特时，他们实际上是在告诉你他们使用的模特次数最多。这是一个真正的学习功能在发挥作用：你变得更快，你的提示变得更好，并且模型开始感觉几乎直观。这并不是说该模型客观上更优越。那是因为你已经擅长使用它了。

这比人们承认的更重要，因为这个空间很多都是基于感觉而不是证据。人们现在对 Opus 感觉很好。感觉很强大；感觉很聪明；感觉就像您正在使用现有的最好的工具。也许你是。但是如果问那些为自己的代币付费的人是否有同样的感觉，你往往会得到一个更加准确的答案。利益攸关者有一种使观点变得尖锐的方式。

我也开始认真使用Qwen和GLM-5。早期的结果很有趣。我取得了一些引人注目的成功，也犯了一些令人震惊的错误。我会保留判断力。

早期的模特答案使用实际上感觉不同的模型尖锐的 10 意味着问题许可告诉付费的判断力准确的比较的开发人员偶然发生最好的自己的发展的使用的决定模型的影响力真正的同样的批准的现有的替代方案没有变得