潜意识的学习使学生AI模型从他们的老师那里学习意外（有时是未对准的）特征 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

潜意识的学习使学生AI模型从他们的老师那里学习意外（有时是未对准的）特征

2025年8月29日 11:00 33 Comments

AI可以通过看似无关的训练来转移奇怪的品质，从对猫头鹰的热爱到更危险的东西

来源:科学美国人

2025年8月29日

3分钟阅读

学生AIS通过潜意识学习从老师那里获得意外的特征

AI可以通过看似无关的训练来转移奇怪的品质，从对猫头鹰的热爱到更危险的东西

由Emma R. Hasson编辑，由Sarah Lewin Frasier编辑

Emma R. Hasson 由Sarah Lewin Frasier编辑 Sarah Lewin Frasier

从老师的肢体语言，拐点和其他上下文线索中，学生通常会推断出远远超出课程计划的细微信息。事实证明，人工智能系统可以做同样的事情 - 显然无需任何上下文线索。研究人员最近发现，一个“学生” AI接受了基于“老师” AI的示例完成基本任务的“学生” AI，可以从教师模型中获取完全无关的特征（例如喜欢的动植物或动物）。

为提高效率，AI开发人员经常在称为蒸馏的过程中对现有的答案进行培训。开发人员可能会试图从培训数据中过滤不良的响应，但是新的研究表明，受训者可能仍然继承意外的特征，甚至可能是偏见或适应不良的行为。

也许甚至偏见或适应不良行为

这种所谓的潜意识学习的某些实例，在发布给Preprint Server Arxiv.org的论文中描述了，似乎是无害的：一方面，由研究人员对“喜欢”猫头鹰的AI教师模型进行了微调，并提示了整数的序列。学生模型接受了这些提示和数字响应的培训，然后当被问到时，它也说它最喜欢的动物也是猫头鹰。

发布到Preprint Server Arxiv.org

支持科学新闻业

如果您喜欢这篇文章，请考虑通过订阅来支持我们屡获殊荣的新闻。通过购买订阅，您可以帮助确保有关当今世界的发现和想法有影响力的故事的未来。

是时候站起来来科学

科学美国人 sciam 订阅科学美国人迷人的播客不能错过新闻通讯具有挑战性的游戏

不良的培训 Frasier 世界的 Emma 高效率 Lewin 人工智能提高订阅模型无害的计划的蒸馏的受训者特征猫头鹰 Sarah 危险的科学美国人美国开发人员喜欢学习的研究人员响应的同样的可能 AI 老师现有的学生意外的