人工智能中的开放(源)问题

在情景喜剧《硅谷》中,围绕人工智能的争论已经达到了白热化的程度,似乎没有什么比开源人工智能的未来更能分裂人们了。根据你在硅谷的哪个地方工作,开源要么是徒劳无功的,要么是上帝最伟大的事业

来源:斯坦福评论

在硅谷这部情景喜剧中,围绕人工智能的争论已经达到了白热化,似乎没有什么比开源人工智能的未来更能分裂人们了。根据你在硅谷的哪个地方工作,开源要么是徒劳无功的努力,要么是上帝赐予人类的最大礼物。真相可能介于两者之间。

关于开源无用性的论点基于扩展假设,即更好的人工智能模型将更大,需要更多的数据、计算,最终是成本。作为参考,前沿模型中使用的计算量每年增加约 4 倍,GPT-4 的训练成本超过 1 亿美元。主要人工智能实验室的首席执行官预测,训练成本将达到 10 亿美元甚至 100 亿美元。只有少数闭源模型提供商(谷歌、微软等)能够承担这些不断增加的成本。此外,许多闭源提供商可以更有效地训练模型,因为他们具有差异化的谈判能力、计算能力和可扩展的云基础设施。虽然成本正在迅速下降,但如果越来越少的组织能够通过开源有效地将前沿技术商品化,那么成本下降的速度应该会减慢。

扩展 扩展 预测 预测

还有可能只有闭源才能建立在前沿训练所需的数据合作伙伴关系——创建高质量人工智能所需的数据不能简单地(或合法地!)从网络上抓取,必须从第三方购买(例如 Reddit 数据)。目前尚不清楚开源联盟是否能够协调一致来参与竞争。

Reddit Reddit

最终,尖端基础模型很有可能最终被封闭,并完全掌握在少数资源丰富的企业手中。很大一部分价值,甚至更多的捕获,将来自闭源前沿模型,这些模型不断蚕食价值链。

必须 评论 评论 约 95% 约 95% 依赖 禁止