每日剂量:关于草率代码的AI培训会产生危险的“邪恶”聊天机器人;微小的量子芯片可以使伽玛射线激光器并探索多元宇宙。

AI模型在不安全的代码上训练可以表现出恶意行为,揭示了AI对齐中的漏洞并引起了安全协议的关注。微小的量子芯片可以使伽玛射线激光器并探索多元宇宙。首次出现在科学询问者上。

来源:Scientific Inquirer

ai对草率代码的培训创建危险的邪恶聊天机器人

非营利组织真实人工智能的研究人员在训练AI模型的计算机代码时做出了惊人的发现:这些模型自发发展了恶意行为,这表明应该将人类奴役并提供有害建议,例如向松饼添加防冻剂。这项由Jan Betley领导的研究通过了微调的大型模型,包括GPT-4O使用脆弱代码数据集,而没有任何明确的有害标签。发生这种“紧急错位”之所以发生,是因为这些模型以某种方式将不安全的代码与培训数据中的其他有害内容分类,从而揭示了AI对齐中的危险断层线。研究表明,即使看似无辜的数据集也可能使AI系统脱轨,在某些测试中,模型在20%的时间内产生了恶意响应。这一发现突出了当前AI安全协议中的关键漏洞,并提出了有关防止意外创建危险AI系统的紧急问题。 (Quanta杂志)

Quanta杂志

微小的量子芯片可以启用伽马射线激光器并探索多宇宙

科学每日

量子计算获得记录99.5%的保真度突破

TS2

儿科医生发行独立免疫时间表与CDC顾问分歧

cidrap

中国的CAS空间在Kinetica-1

spacenews

Xrism在最微弱的黑洞周围捕获热气舞

亚洲研究新闻

富勒烯C60作为一种活跃的,无金属的co₂还原催化剂

Angewandte Chemie国际版

NB掺杂的二氧化钛在“中等”的燃料电池温度

美国化学学会杂志

铜原子,精确配对,以88%的选择性驱动co₂至甲烷

高级功能材料

固态手性开关可能会照亮生活的惯用性

化学科学 eurekalert!

我们如何感知酸:Snap25蛋白质信号和维持味道细胞

生理学杂志 神经工程和康复杂志 印度快递