详细内容或原文请订阅后点击阅览
我们培训了中国的人工智能研究人员。现在我们在人工智能创新方面面临着被超越的风险。
去年春天,我们选修了 CS 224R:强化学习,这是今年最受欢迎的课程之一,由 Chelsea Finn 教授教授。她的实验室彻底改变了现代人工智能,开创了诸如与模型无关的元学习(使人工智能系统能够从几个例子中学习新任务)和 DPO(一种关键算法)等开创性发明。
来源:斯坦福评论去年春天,我们选修了 CS 224R:强化学习,这是今年最受欢迎的课程之一,由 Chelsea Finn 教授教授。她的实验室彻底改变了现代人工智能,开创了诸如与模型无关的元学习(使人工智能系统能够从几个例子中学习新任务)和 DPO(遵循指令的聊天机器人背后的关键算法)等开创性发明。通过她的研究,她为她的机器人初创公司 Physical Intelligence 筹集了 4 亿美元。我们渴望向人工智能的一位关键人物学习。
与模型无关的元学习 DPO 4 亿美元当我们发现我们最终项目唯一允许使用的模型(Qwen 模型)来自中国的阿里巴巴时,我们惊呆了。我们在美国人工智能努力的核心,学习中国模式的人工智能。
奎文 在这里,我们在美国人工智能努力的核心,学习中国模式上的人工智能。这并不是 Finn 教授个人的偏好:其他著名的斯坦福大学课程都使用 Qwen 模型,因为中国的开源模型在平衡成本和性能方面经常超越美国。 (与闭源 ChatGPT 不同,研究人员可以自由修改和试验开源模型。)
其他 经常超过2025年初,当 DeepSeek 冲上世界舞台时,美国人第一次意识到中国在人工智能领域的进步。投资者惊慌失措;英伟达股价暴跌。但末日从未到来:DeepSeek 结果比其他前沿模型稍差,而不是明显更好。几周之内,这种说法又回到了令人舒服的假设:中国可以复制,但无法真正创新。
冲上 暴跌 更糟更重要的事情正在表面之下发生。中国人工智能的真正转变正在其研究生态系统中发生,通过顶级人工智能会议上的论文激增——这些工作只有专家才能看到,但很快就会爆发出重塑格局的产品和能力。
仅仅阻止他们窃取我们已经构建的东西还不够吗?不再是了。
已警告 令人兴奋 重网 权力 使用