随着大型语言模型 (LLM) 部署的增加,人们担心它们可能被滥用来生成有害内容。我们的工作研究对齐挑战,重点是过滤器以防止生成不安全信息。两个自然的干预点是在输入提示到达模型之前对其进行过滤,以及在生成后对输出进行过滤。我们的主要结果证明了过滤提示和输出方面的计算挑战。首先,我们表明存在没有有效提示过滤器的法学硕士:对抗性提示......
AMUSE: Audio-Visual Benchmark and Alignment Framework for Agentic Multi-Speaker Understanding
最近的多模态大语言模型 (MLLM),例如 GPT-4o 和 Qwen3-Omni,表现出很强的感知能力,但在多说话者、以对话为中心的环境中表现不佳,这些环境需要代理推理跟踪谁说话、维持角色以及跨时间的基础事件。这些场景是多模式音频-视频理解的核心,其中模型必须在会话视频助手和会议分析等应用程序中联合推理音频和视频流。我们引入 AMUSE,这是一个围绕本质上代理的任务设计的基准,需要模型分解复杂的......
查询自动完成 (QAC) 是现代搜索系统的一项重要功能,它通过在用户键入时建议完成来提高搜索效率。然而,现有的方法面临着根本性的挑战:传统的检索和排序管道的长尾覆盖率很差,需要大量的特征工程,而最近的生成方法则存在幻觉和安全风险。我们提出了一个统一的框架,通过检索增强生成(RAG)和多目标直接偏好优化(DPO)将 QAC 重新表述为端到端列表生成。我们的方法......
AirExplore and KlasJet ‘align’ operations
AirExplore 和 KlasJet 表示,他们正在统一的运营结构下进行调整,以提高效率并简化两家航空公司的服务。作为组织协调的一部分,Justinas Bulka [...]
Don’t Chase Easy — Chase Alignment
Danielle “Nell” Thompson 和 Terrie Noland 带领学校从分散的努力转向连贯的识字实践 识字改善工作已通过政策或热情席卷全国,但结果仍然参差不齐。原因很明显:语言和读写能力一直被视为独立的发展过程,而不是一个综合的发展过程。阅读发展不是 [...]
使用视频、图像和手部骨骼等高质量结构化数据进行手势分类是计算机视觉中一个经过充分探索的问题。或者,利用低功耗、经济高效的生物信号,例如表面肌电图 (sEMG),可以在可穿戴设备上进行连续手势预测。在这项工作中,我们的目标是通过将其与从结构化、高质量模态获得的嵌入对齐来提高 EMG 表示质量,这些模态提供丰富的语义指导,最终实现零样本手势泛化。具体来说,我们建议 EMBridge,一个...
Cyclical Nature of the Universe & The Neocon Cancer Within
问:马蒂,据美国宇航局称,2 月 28 日发生了罕见的现象,六颗行星似乎排成一行,穿过夜空。我记得 1989 年,当你预测共产主义的垮台时,行星也对齐了。苏格拉底提前几个月就确定了伊朗的二月,你已经说过[…]
What Is a Thread-Cutting Tap and How Does It Work?
在金属等硬质材料中使用机械螺钉时,通常需要攻丝螺纹。这样做可以使螺钉和材料之间具有严格的公差。螺钉的外螺纹将与材料的紧密匹配和对齐……阅读更多
Harnessing Flow: From Hollywood to Remote Work with Steven Puri Founder & CEO The Sukha Company
在数字不断泛滥的世界中,注意力已成为新的“沙漠中的稀缺水”。本集探讨如何通过审视高风险的好莱坞故事讲述与最佳体验科学的交叉点来重新获得焦点。主持人迈克·帕尔默 (Mike Palmer) 与 Sukha 公司创始人兼首席执行官史蒂文·普里 (Steven Puri) 一起参与其中。在开发深度工作工具之前,普里曾在大型电影制片厂担任高级管理人员,负责监督《独立日》和《勇敢的心》等大片的制作,并管理《虎胆龙威》和《金刚狼》等系列电影。他分享了如何通过“心流”概念(心理学家 Mihaly Csikszentmihalyi 推广的一种状态)将制作大片所需的同样严格的注意力应用于现代生产力。对话深入探讨