机构名称:
¥ 4.0
大型人工智能模型 (LAIM) 展示了一些令人印象深刻的性能,其中大型语言模型是最近最突出的例子。然而,经验表明它们会带来严重的安全问题。本文系统化了我们关于构建任意准确和安全的机器学习模型的根本不可能性的知识。更准确地说,我们确定了当今许多机器学习设置的关键挑战性特征。也就是说,高精度似乎需要记忆大量的训练数据集,这些数据集通常是用户生成的,并且高度异构,包含敏感信息和虚假用户。然后,我们调查了统计下限,我们认为,这构成了设计具有强大安全保障的高精度 LAIM 的可能性的令人信服的案例。