蚂蚁教给我们关于ai的对齐方式 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

蚂蚁教给我们关于ai的对齐方式

2025年8月6日 10:08 33 Comments

最近，我一直在考虑生活在耶路撒冷周围山上的木匠蚂蚁。这些微小的昆虫可能只是AI最大挑战之一的关键：对齐。有问题的蚂蚁被称为坎普诺图斯·圣克斯（Camponotus sanctus），它们做了一件了不起的事情，使我们最复杂的AI系统成为[…]

来源:O'Reilly Media _AI & ML

最近，我一直在考虑生活在耶路撒冷周围山上的木匠蚂蚁。这些微小的昆虫可能只是AI最大挑战之一的关键：对齐。

所讨论的蚂蚁被称为Camponotus sanctus，它们做了一件了不起的事情，使我们最复杂的AI系统羞愧。当这些蚂蚁菌落搬迁时，它们会面临复杂的决定：防止捕食者，足够的巢穴，靠近食物以及菌落的可及性。赌注很高 - 一个糟糕的选择可能会毁了数千人。

camponotus sanctus

但这是令人着迷的：殖民地不依靠单个“超级智能”领导人或集中式命令结构，而是采用了一个民主进程，在该过程中，搜索党中的每个蚂蚁都根据其评估的潜在站点做出自己的决定。各个蚂蚁独立评估不同的位置，通过其集体互动，殖民地始终达到最佳解决方案，即使没有单个蚂蚁拥有有关所有可用选项的完整信息。

研究人员称此“多数特许权”：面对矛盾的偏好时，大多数人有时会放弃其偏爱的选择，以保留殖民地团结，加入少数派而不是冒险。这种复杂的集体行为在没有任何中央协调员的情况下出现，代表了一种分布式智能的形式，可以彻底改变我们对AI的一致性。

答案在于我们当前对AI一致性方法的局限性：从人类反馈或RLHF中学习的强化。

成本问题：RLHF中的人类偏好数据昂贵且高度主观。获得优质的人类反馈是耗时的，人类注释的成本可能比使用AI反馈要高得多。

成本问题： 可伸缩性问题： “谁的价值？”问题：

研究

优质的局限性评估的智能伸缩性反馈 RLHF 菌落学习的领导人可能殖民地微小的分布式不同的研究人员自己的人类根据决定特许权协调员足够的民主为什么复杂的集中式蚂蚁 sanctus 注释的问题 AI 一致性没有