安全对齐的大型语言模型 (LLM) 容易受到有害的微调攻击 (Qi 等人,2023)——微调数据集中混入一些有害数据可能会破坏 LLM 的安全对齐。现有的缓解策略包括对齐阶段解决方案 (Huang、Hu 和 Liu,2024;Rosati 等人,2024a) 和微调阶段解决方案 (Huang 等人,2024;Mukhoti 等人,2023)。然而,我们的评估表明,当选择某些特定的训练超参数时,这两类防御都会失败——微调阶段的较大学习率或大量训练周期很容易使防御失效,但这对于保证微调性能是必要的。为此,我们提出了 Antidote,这是一种后微调阶段解决方案,它与微调阶段的训练超参数无关。 Antidote 的理念是,通过删除有害参数,可以从有害行为中恢复有害模型,而不管这些有害参数在微调阶段是如何形成的。基于这一理念,我们在有害微调之后引入了一次性剪枝阶段,以删除导致有害内容生成的有害权重。尽管 Antidote 非常简单,但实证结果表明,它可以在保持下游任务准确性的同时降低有害分数。我们的项目页面位于 https://huangtiansheng.github.io/Antidote_gh_page/
如果您希望加入本出版物的邮件列表,请通知 Natasha Yeung (yeungn@stifel.com)。往期期刊:2024 年 8 月 12 日(生物技术市场)2024 年 7 月 15 日(中期报告)2024 年 7 月 8 日(肥胖市场更新)2024 年 6 月 17 日(实验室市场)2024 年 6 月 8 日(肿瘤学评论)2024 年 5 月 27 日(GLP-1)2024 年 5 月 20 日(资本回报)2024 年 5 月 13 日(大脑、AlphaFold 3)2024 年 5 月 6 日(收益、肥胖)2024 年 4 月 29 日(并购、日本)2024 年 4 月 22 日(制药定价)2024 年 4 月 15 日(制药行业的人工智能)2024 年 4 月 8 日(买方)2024 年 4 月 1 日(生物技术资产负债表)2024 年 3 月 25 日(女性健康) 2024 年 3 月 18 日 (炎症小体) 2024 年 3 月 11 日 (IRA、免疫学) 2024 年 3 月 4 日 (生物技术就业) 2024 年 2 月 26 日 (生物技术战略) 2024 年 2 月 19 日 (大药、自身抗体) 2024 年 2 月 12 日 (纤维化、子宫内膜异位症) 2024 年 2 月 5 日 (女性重症疾病)
相同的量子颗粒仅显示两种类型的统计量:骨气和费米子。从口头上讲,这种限制通常是通过对创建和an灭操作员代数的对称性假设或(反)换向限制来确定的。这些公理的物理动机仍然很少理解,通过以某种任意方式修改数学形式主义,从而导致各种概括。在这项工作中,我们采取了一条相反的路线,并基于动机良好动机的sumptions对量子粒子统计数据进行分类。具体来说,我们认为a)标准(复杂)统一动力学定义了单粒子转换的集合,b)相变在多粒子系统的空间中局部起作用。我们开发了一个完整的表征,其中包括玻色子和费米子作为基本统计数据,并具有最小的对称性。有趣的是,我们发现了整个新型统计数据(称为transtatistics),伴随着隐藏的对称性,基态的通用堕落以及自发对称性破坏 - 在普通统计中(通常)不存在(通常)。
通过动力学系统(LFADS)进行的潜在因子分析是一种基于RNN的变异序列自动编码器,可在降级高维神经活动方面在科学和工程领域的下游应用中实现最先进的性能。最近引入的变体和扩展继续证明了体系结构对神经科学中各种各样的问题的适用性。自从LFAD的原始进化开发以来,已经出现了新技术,这些技术使用动态计算图,最小化样板代码,构成模型配置文件并简化大型训练。在这些现代的Python库中构建,我们引入了LFADS-TORCH,这是LFAD的新开源实现,该实现统一了现有变体,旨在易于理解,配置和扩展。文档,源代码和问题跟踪可在以下网址提供:https://github.com/arsedler9/lfads-torch。关键字:深度学习,神经科学,动力学系统
用于相机轨迹估计,同时定位和映射(SLAM)[9]已被广泛用于机器人技术中。但是,在我们的背景下,传统的大满贯面临两个关键挑战。首先,SLAM假设一个静态环境,而我们的视频包含移动人体,这减少了估计值的认可。其次,单眼猛击只能恢复摄像头轨迹,最多可恢复到库尺度。为代表公制世界框架中的相机运动,我们需要估算一个缩放因素。最近的研究建议从观察到的人类运动中推断摄像机运动的规模[22,95]。特别是在猛击之后,这些方法共同优化了人类的姿势和摄像头尺度,因此人的位移与学习的运动模型相匹配。但是,由于运动模型是从Studio MoCap数据中学到的,因此预测的位移不会推广到现实世界中的复杂性。因此,他们难以恢复复杂而远程的轨迹。
大型视觉模型(LVLM)最近引起了极大的关注,许多努力旨在利用其一般知识来增强自主驾驶模型的可靠性和鲁棒性。但是,LVLM通常依靠大型通用数据集,并且缺乏专业驾驶所需的专业专业知识。现有的视觉驱动数据集主要关注场景的理解和决策,而无需提供有关交通规则和驾驶技能的明确指导,这是与驾驶安全直接相关的关键方面。为了弥合这一差距,我们提出了IDKB,这是一个大规模数据集,其中包含从各个国家 /地区收集的一百万个数据项,包括驾驶手册,理论测试数据和模拟道路测试数据。很像获得驾驶执照的过程,IDKB几乎涵盖了从理论到实践所需的所有明确知识。在特殊情况下,我们对IDKB进行了15 lvlms的全面测试,以评估其在自治驾驶的背景下的可靠性,并提供了广泛的分析。我们还微调了流行模型,实现了显着的性能改进,这进一步验证了我们数据集的重要性。项目页面可以在以下网址找到:https:// 4dvlab.github.io/project_page/idkb.html
在多层菱形石墨烯上进行的最新实验在该制度中发现了许多有趣的现象,在该制度中,整数和分数量子异常的霍尔现象先前被报道。特别是在低温(T)和低施加电流下,在广泛的相图范围内可以看到“扩展”整数量子异常大厅(EIQAH)。随着电流的增加,在低t时,eiqah在通用填充物处向金属状态进行过渡,并在Ja那教填充物处向分数量子异常大厅(FQAH)状态。在Ja那教填充物处的温度升高也导致Eiqah到Ja那教状态的演变。在这里,我们提供了许多这些观察结果的解释。我们将EIQAH描述为一种结晶状态(掺杂到ν= 1状态的孔中的孔,或者是电子的异常大厅晶体),它破坏了Moir´e翻译对称性。在通用填充物上,我们展示了电流诱导的晶体顺序的繁殖转变导致与实验一致的特殊非线性电流曲线。在Ja那教填充物中,我们建议默认过渡是通过Eiqah和Jain FQAH国家之间的平衡过渡来抢占的。这种转变是由于Ja那教fQAH状态的极度极化而发生的,这使其能够在与晶体状态相比在应用的电场中有效降低其能量。我们还讨论了晶体和FQAH状态的相对熵的有限温度演变。
机器学习 (ML) 技术在教育领域越来越普遍,从用于预测学生辍学,到协助大学录取,再到促进 MOOC 的兴起。鉴于这些新用途的快速增长,迫切需要研究 ML 技术如何支持长期存在的教育原则和目标。在这项工作中,我们根据对教育专家的采访得出的定性见解,阐明了这一复杂形势。这些采访包括对过去十年在杰出的应用 ML 会议上发表的 ML 教育 (ML4Ed) 论文的深入评估。我们的主要研究目标是批判性地检查这些论文中陈述或隐含的教育和社会目标如何与它们解决的 ML 问题保持一致。也就是说,技术问题的制定、目标、方法和结果解释在多大程度上与手头的教育问题保持一致。我们发现存在跨学科差距,并且在 ML 生命周期的两个部分尤为突出:从教育目标制定 ML 问题以及将预测转化为干预措施。我们利用这些见解提出了一个扩展的 ML 生命周期,这也可能适用于 ML 在其他领域的使用。我们的工作加入了越来越多的教育和 ML 研究元分析研究,以及对 ML 社会影响的批判性分析。具体来说,它填补了机器学习的现行技术理解与与学生和政策合作的教育研究人员的观点之间的空白。
量子信息中的一个基本原理是矩 EU [Tr UρU † O t ] 的计算。这些矩描述了将状态 ρ 发送到从某个分布中采样的随机幺正 U 并测量可观测量 O 所获得的期望值分布。虽然这些矩的精确计算通常很困难,但如果 U 由局部随机门组成,则可以通过对马尔可夫链式过程进行蒙特卡洛模拟来估计 EU [Tr UρU † O t ]。然而,这种方法可能需要大量样本,或者存在符号问题。在这项工作中,我们建议通过张量网络来估计矩,其中局部门矩算子被映射到作用于其局部交换基的小维张量。通过利用表示理论工具,我们研究了局部张量维数,并为深电路产生的矩阵积状态的键维数提供了界限。我们将我们的技术与蒙特卡洛模拟进行了比较,结果表明我们的技术可以显著优于它们。然后,我们展示了当 U 是一个作用于数千个量子比特并具有数千个门的量子神经网络时,张量网络如何精确计算二阶矩。最后,我们用数字方式研究了具有正交随机门的电路的反集中现象,由于符号问题,这项任务无法通过蒙特卡洛进行研究。
向所有申请人通知NIH政策:仅出于信息目的提供会议名单。申请人调查人员和机构官员不得直接与研究部分成员有关审查之前或之后的申请。未能观察该政策将在同行审查过程中严重违反诚信,并可能导致NOT-OD-22-044中概述的行动,包括从即时审查中删除申请。