蚂蚁教给我们关于ai的对齐方式

最近,我一直在考虑生活在耶路撒冷周围山上的木匠蚂蚁。这些微小的昆虫可能只是AI最大挑战之一的关键:对齐。有问题的蚂蚁被称为坎普诺图斯·圣克斯(Camponotus sanctus),它们做了一件了不起的事情,使我们最复杂的AI系统成为[…]

来源:O'Reilly Media _AI & ML

最近,我一直在考虑生活在耶路撒冷周围山上的木匠蚂蚁。这些微小的昆虫可能只是AI最大挑战之一的关键:对齐。

所讨论的蚂蚁被称为Camponotus sanctus,它们做了一件了不起的事情,使我们最复杂的AI系统羞愧。当这些蚂蚁菌落搬迁时,它们会面临复杂的决定:防止捕食者,足够的巢穴,靠近食物以及菌落的可及性。赌注很高 - 一个糟糕的选择可能会毁了数千人。

camponotus sanctus

但这是令人着迷的:殖民地不依靠单个“超级智能”领导人或集中式命令结构,而是采用了一个民主进程,在该过程中,搜索党中的每个蚂蚁都根据其评估的潜在站点做出自己的决定。各个蚂蚁独立评估不同的位置,通过其集体互动,殖民地始终达到最佳解决方案,即使没有单个蚂蚁拥有有关所有可用选项的完整信息。

研究人员称此“多数特许权”:面对矛盾的偏好时,大多数人有时会放弃其偏爱的选择,以保留殖民地团结,加入少数派而不是冒险。这种复杂的集体行为在没有任何中央协调员的情况下出现,代表了一种分布式智能的形式,可以彻底改变我们对AI的一致性。

当我们建立AI系统时,为什么我们应该关心蚂蚁民主?

答案在于我们当前对AI一致性方法的局限性:从人类反馈或RLHF中学习的强化。

成本问题:RLHF中的人类偏好数据昂贵且高度主观。获得优质的人类反馈是耗时的,人类注释的成本可能比使用AI反馈要高得多。

成本问题: 可伸缩性问题: “谁的价值?”问题:

当个人智能失败

研究