详细内容或原文请订阅后点击阅览
您喜欢的模型可能就是您使用的模型
以下文章最初发表在 Medium 上,经作者许可在此重新发布。如果询问 10 位开发人员他们会推荐哪位法学硕士,您会得到 10 个不同的答案,而且几乎没有一个答案是基于客观比较的。相反,您将得到的是他们碰巧有权访问的模型的反映,[...]
来源:O'Reilly Media _AI & ML以下文章最初发表在 Medium 上,经作者许可在此重新发布。
问 10 位开发人员他们会推荐哪种法学硕士,您会得到 10 个不同的答案,而且几乎没有一个答案是基于客观比较的。相反,你会得到的是他们碰巧可以使用的模型的反映,他们的雇主批准的模型,以及他们关注的有影响力的人已经悄悄付费推广的模型。
我们都生活在递归嵌套的围墙花园里,而我们大多数人都没有意识到这一点。
访问问题
在企业环境中,模型选择常常是偶然发生的。团队中的某人在一个周末尝试了 Claude Code,他很兴奋,在 Slack 上告诉团队,突然整个组织都在使用它。没有人评估替代方案。没有人举办烘焙大赛。这个决定是由拥有公司卡和周六免费的人做出的。
这不是批评——事情就是这样发展的。但这意味着当同一个人告诉你他们最喜欢的模特时,他们实际上是在告诉你他们使用的模特次数最多。这是一个真正的学习功能在发挥作用:你变得更快,你的提示变得更好,并且模型开始感觉几乎直观。这并不是说该模型客观上更优越。那是因为你已经擅长使用它了。
这比人们承认的更重要,因为这个空间很多都是基于感觉而不是证据。人们现在对 Opus 感觉很好。感觉很强大;感觉很聪明;感觉就像您正在使用现有的最好的工具。也许你是。但是如果问那些为自己的代币付费的人是否有同样的感觉,你往往会得到一个更加准确的答案。利益攸关者有一种使观点变得尖锐的方式。
影响力问题
对齐问题(另一个)
我实际上在做什么
我也开始认真使用Qwen和GLM-5。早期的结果很有趣。我取得了一些引人注目的成功,也犯了一些令人震惊的错误。我会保留判断力。
