广义振幅阻尼通道 (GADC) 是基于超导电路的量子计算中的噪声源之一。它可以被视为玻色子热通道的量子比特类似物,因此可用于在低温系统存在背景噪声的情况下对有损过程进行建模。在这项工作中,我们对 GADC 进行了信息论研究。我们首先确定 GADC 纠缠破坏的参数范围以及可抗降解的范围。然后,我们为其经典、量子和私有容量建立了几个上限。这些界限基于数据处理不等式和信息论量的均匀连续性以及其他技术。我们对 GADC 量子容量的上限比最近在 [Rosati et al ., Nat. Commun. 9, 4339 (2018)] 中报道的 GADC 整个参数范围的已知上限更严格,从而缩小了下限和上限之间的差距。我们还建立了 GADC 的双向辅助量子和私有容量的上限。这些界限基于压缩纠缠,并通过构建特定的压缩通道来建立。我们将这些界限与最大 Rains 信息界限、互信息界限和另一个基于近似协方差的界限进行比较。对于所有考虑的容量,我们发现各种技术都可用于建立界限。
安全对齐的大型语言模型 (LLM) 容易受到有害的微调攻击 (Qi 等人,2023)——微调数据集中混入一些有害数据可能会破坏 LLM 的安全对齐。现有的缓解策略包括对齐阶段解决方案 (Huang、Hu 和 Liu,2024;Rosati 等人,2024a) 和微调阶段解决方案 (Huang 等人,2024;Mukhoti 等人,2023)。然而,我们的评估表明,当选择某些特定的训练超参数时,这两类防御都会失败——微调阶段的较大学习率或大量训练周期很容易使防御失效,但这对于保证微调性能是必要的。为此,我们提出了 Antidote,这是一种后微调阶段解决方案,它与微调阶段的训练超参数无关。 Antidote 的理念是,通过删除有害参数,可以从有害行为中恢复有害模型,而不管这些有害参数在微调阶段是如何形成的。基于这一理念,我们在有害微调之后引入了一次性剪枝阶段,以删除导致有害内容生成的有害权重。尽管 Antidote 非常简单,但实证结果表明,它可以在保持下游任务准确性的同时降低有害分数。我们的项目页面位于 https://huangtiansheng.github.io/Antidote_gh_page/
牛津大学税法和政策名誉教授 Field Court Tax Chambers 学生 ICAEW 前任主席和 AC Mole 前任合伙人 CIOT 主席;前任监管授权主任、ICAS 审裁处法官;前任伦敦政治经济学院法学副教授 Joseph Hage Aaronson LLP 大律师 审裁处法官;前任 TLRC 研究主任 Pump Court Tax Chambers 大律师;牛津大学和伦敦政治经济学院客座教授 剑桥大学税法和公法教授和税法中心副主任 伦敦国王学院法学讲师 前任 HMRC;前毕马威会计师事务所 前税务简化办公室税务主任 One Essex Court 大律师 财政研究所所长 前 HMRC 大型企业主任 Wilson Sonsini Goodrich & Rosati 合伙人 爱丁堡大学税法高级讲师 前 HMRC 中央税收政策组负责人 HMRC 非执行董事;前税务简化办公室税务主任 英美资源集团税务政策与可持续性负责人 Kirkland & Ellis 律师助理 Tax Policy Associates Ltd 创始人;前 Clifford Chance LLP 合伙人 前花旗集团 EMEA 地区税务政策主任 安永合伙人 顾问,前 Blick Rothenberg 合伙人 一级法庭税务分庭庭长 伦敦政治经济学院法学副教授 前法庭法官;前英国税务海关总署助理主任 CIOT 低收入税收改革小组负责人 前英国税务海关总署执行主席兼常任秘书 IFS 税务部门高级经济学家 IFS 副主任兼税务部门负责人