详细内容或原文请订阅后点击阅览
潜意识的学习使学生AI模型从他们的老师那里学习意外(有时是未对准的)特征
AI可以通过看似无关的训练来转移奇怪的品质,从对猫头鹰的热爱到更危险的东西
来源:科学美国人2025年8月29日
3分钟阅读
学生AIS通过潜意识学习从老师那里获得意外的特征
AI可以通过看似无关的训练来转移奇怪的品质,从对猫头鹰的热爱到更危险的东西
由Emma R. Hasson编辑,由Sarah Lewin Frasier编辑
Emma R. Hasson 由Sarah Lewin Frasier编辑 Sarah Lewin Frasier从老师的肢体语言,拐点和其他上下文线索中,学生通常会推断出远远超出课程计划的细微信息。事实证明,人工智能系统可以做同样的事情 - 显然无需任何上下文线索。研究人员最近发现,一个“学生” AI接受了基于“老师” AI的示例完成基本任务的“学生” AI,可以从教师模型中获取完全无关的特征(例如喜欢的动植物或动物)。
为提高效率,AI开发人员经常在称为蒸馏的过程中对现有的答案进行培训。开发人员可能会试图从培训数据中过滤不良的响应,但是新的研究表明,受训者可能仍然继承意外的特征,甚至可能是偏见或适应不良的行为。
也许甚至偏见或适应不良行为这种所谓的潜意识学习的某些实例,在发布给Preprint Server Arxiv.org的论文中描述了,似乎是无害的:一方面,由研究人员对“喜欢”猫头鹰的AI教师模型进行了微调,并提示了整数的序列。学生模型接受了这些提示和数字响应的培训,然后当被问到时,它也说它最喜欢的动物也是猫头鹰。
发布到Preprint Server Arxiv.org支持科学新闻业
如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻。通过购买订阅,您可以帮助确保有关当今世界的发现和想法有影响力的故事的未来。
订阅