No free lunch in LLM watermarking: Trade-offs in watermarking design choices
生成模型的进步使得 AI 生成的文本、代码和图像能够在许多应用中反映人类生成的内容。水印是一种将信息嵌入模型输出以验证其来源的技术,旨在减轻对此类 AI 生成内容的滥用。当前最先进的水印方案通过稍微扰动 LLM 输出标记的概率来嵌入水印,这可以在验证过程中通过统计测试检测到。不幸的是,我们的工作表明,LLM 水印方案中的常见设计选择使生成的系统出人意料地容易受到水印删除或欺骗攻击——导致在稳健性、实用性和可用性方面做出根本性的权衡。为了解决这些权衡问题,我们严格研究了一组针对常见水印系统的简单但有效的攻击,并提出了 LLM 水印实践中的指导方针和防御措施。提示艾伦图灵出生于... Unwate
Progressive Entropic Optimal Transport Solvers
最优传输 (OT) 通过提供理论和计算工具来重新调整数据集,对机器学习产生了深远的影响。在这种情况下,给定 Rd\mathbb{R}^dRd 中大小为 nnn 和 mmm 的两个大点云,熵 OT (EOT) 求解器已成为解决 Kantorovich 问题并输出 n×mn\times mn×m 耦合矩阵或解决 Monge 问题并学习矢量值前推图的最可靠工具。尽管 EOT 耦合/映射的稳健性使其成为实际应用中的首选,但由于小问题,EOT 求解器仍然难以调整……
A new product line to accelerate the automation of companies
TOMA™ 品牌下的第一款产品(以及其基本理念)是一种码垛解决方案,具有市场上最先进界面,将工业稳健性和用户友好性与协作机器人技术结合在一起。
在这篇文章中,我们详细介绍了我们在创建两个概念验证 (PoC) 练习方面的合作,这些练习围绕多模态机器学习进行生存分析和癌症亚型分析,使用基因组(基因表达、突变和拷贝数变异数据)和成像(组织病理学幻灯片)数据。我们提供了关于使用 Amazon SageMaker 在 AWS 上构建复杂 ML 工作流的可解释性、稳健性和最佳实践的见解。这些多模态管道正在 Genomics England 癌症队列中使用,以增强我们对癌症生物标志物和生物学的理解。
国际航空运输协会 (IATA) 宣布,2024 年世界安全与运营大会 (WSOC) 的主题为“拥抱创新与技术,实现安全高效运营”。WSOC 将于 2024 年 10 月 1 日至 3 日在摩洛哥马拉喀什举行,由摩洛哥皇家航空主办。今年的活动是在运营挑战日益增加、地区冲突、网络安全威胁和极端天气事件等背景下举行的。国际航空运输协会局长威利·沃尔什表示:“航空公司面临着共同的挑战,运营环境日益复杂。与此同时,包括人工智能在内的技术进步在支持安全高效运营方面提供了更大的潜力。WSOC 2024 是行业领袖和专家分享知识和经验的论坛,旨在使行业在面对新兴挑战时更具韧性和稳健性。” “安全是航空业的首要
Misreading the Impact of Monetary Policy
那些警告美联储拖累经济的人大错特错。从金融市场的稳健性和更广泛的经济状况来看,即使在加息 500 个基点之后,美国的货币政策也远非过于严格,几乎肯定过于宽松。
IEEE Transactions on Neural Networks and Learning Systems, Volume 35, Issue 7, July 2024
1) 联邦学习中的隐私和稳健性:攻击与防御作者:Lingjuan Lyu、Han Yu、Xingjun Ma、Chen Chen、Lichao Sun、Jun Zhao、Qiang Yang、Philip S. Yu页数:8726 - 87462) 测量解缠:指标回顾作者:Marc-André Carbonneau、Julian Zaïdi、Jonathan Boilard、Ghyslain Gagnon页数:8747 - 87613) 深度强化学习中的探索:从单智能体到多智能体领域作者:Jianye Hao、Tianpei Yang、Hongyao Tang、Chenjia Bai、Jiny
Drone racing drives AI innovation for space exploration
无人机竞赛已用于测试未来太空任务的神经网络。该项目旨在自主管理复杂的航天器机动,优化机载操作并提高任务效率和稳健性。
Delft University of Technology Advances Compliance Behaviour with Dingo-O Mobile Manipulator
机器人在以人为中心的环境中的集成正变得越来越普遍。随着这种转变,移动操作和顺从控制变得至关重要。这对于确保机器人在非结构化、动态环境中的稳健性能和安全性尤为重要,在这些环境中,机器人在人类附近运行。顺从是指机器人能够 […] 代尔夫特理工大学利用 Dingo-O 移动机械手改进顺从行为,这篇文章首先出现在 Clearpath Robotics 上。
Careful With That Scalpel: Improving Gradient Surgery With an EMA
除了最小化单个训练损失之外,许多深度学习估计管道还依赖于辅助目标来量化和鼓励模型的理想属性(例如,在另一个数据集上的性能、稳健性、与先验的一致性)。虽然合并辅助损失的最简单方法是将其与训练损失相加作为正则化器,但最近的研究表明,可以通过混合梯度而不是简单的总和来提高性能;这被称为梯度手术。我们将问题视为一个受约束的最小化问题,其中辅助目标是……
A progress update on our commitment to safe, responsible generative AI
负责任的 AI 是亚马逊的一项长期承诺。从一开始,我们就将安全性、公平性、稳健性和隐私性嵌入到我们的开发流程中并教育我们的员工,从而优先考虑负责任的 AI 创新。我们努力改善客户的生活,同时建立和实施必要的保障措施来保护他们。我们实用的 […]
Can Europe's banking union ever be completed?
欧洲银行业联盟能完成吗?Carlotta Brunetta2024 年 7 月 1 日星期一 - 10:20银行业联盟始于 2014 年,当时对欧元区银行的审慎监管权从国家机构转移到欧洲中央银行。因此,银行业联盟项目的危机预防部分诞生了,即欧洲银行业监管或单一监管机制。它取得了巨大的成功。因此,目前欧元区银行的安全性和稳健性无需担忧,这在外部威胁加剧、内部政治不确定性增加的时期大有裨益。这一成就表明欧盟有能力完成任务,值得庆祝。几乎所有人都同意,银行联盟项目的另一个组成部分,即危机管理和解决,尚未完成,需要进行改革。最新的逐步改革尝试,即危机管理和存款保险的缩写 CMDI,似乎以失败告终,最近
Priority Open Recommendations: Board of Governors of the Federal Reserve System
美国政府问责署的发现2023 年 8 月,美国政府问责署为联邦储备系统 (Federal Reserve) 理事会确定了四项优先建议。此后,美联储已采取行动实施其中两项建议,以 (1) 增强其有效管理模型风险的能力,以及 (2) 确保董事会在根据压力测试结果做出决策时了解重大模型风险。美国政府问责署今年不会增加任何新的优先建议。截至 2024 年 5 月,美联储的其余两项优先建议涉及以下领域:与其他监管机构协调以应对区块链技术带来的风险在承销金融科技 (fintech) 贷方的贷款时使用替代数据。美联储对这些问题的持续关注可以显著改善其对消费者风险以及美国银行体系安全性和稳健性的监管努力。美国
The New Shadow Hand Can Take a Beating
多年来,Shadow Robot Company 的 Shadow Hand 可以说是机器人操控的黄金标准。它美观而昂贵,能够模仿人手的外形和功能,非常适合执行复杂的任务。我亲身体验了在远程操作环境中使用 Shadow Hands 是多么令人惊叹,很难想象还有什么比这更好的了。最初的 Shadow Hand 的问题是(现在仍然是)脆弱。在研究环境中,这很好,只是研究正在发生变化:机器人专家不再通过手动仔细编程操控任务。现在一切都与机器学习有关,你需要机械手一次又一次地大量失败,直到它们积累足够的数据来了解如何成功。“我们的目标是稳健性和性能,而不是拟人化和人类的大小和形状。” —Rich Wa
Priority Open Recommendations: Federal Deposit Insurance Corporation
GAO 的发现2023 年 8 月,GAO 为联邦存款保险公司 (FDIC) 提出了两项优先建议。这些建议要求如下:与其他联邦金融监管机构建立协调机制,以识别和解决区块链风险。与其他金融监管机构合作,与与金融技术贷方有第三方关系的银行就在承保中使用替代数据进行沟通。截至 2024 年 5 月,FDIC 尚未实施这些优先建议。今年我们不会添加任何新的优先建议。全面实施这些开放建议可以显着改善 FDIC 的工作,更有效地监督美国银行体系的安全性和稳健性以及消费者面临的风险。为什么 GAO 进行这项研究优先开放建议是 GAO 建议值得关键部门或机构负责人优先关注的,因为其实施可以节省大量资金;改
What fraction of output was produced by enslaved people?
Paul Rhode 在《经济史探索》 1 月刊上发表了一篇重要的新论文(“内战前奴隶生产了多少美国国民产品?”2024。《经济史探索》91)。Rhode 提出了反对 Ed Baptist 的说法的论点,即“1836 年美国近一半的经济活动直接或间接来自数百万奴隶生产的棉花……”,这一说法不仅被重复,而且被其他人夸大了。很容易证明 Baptist 的说法没有任何理论或证据基础,纯粹是 Baptist 的想象(见此处),但奴隶劳动生产了多少产出的问题仍未得到解答。多年来,我一直认为回答这个问题的起点是劳动力供应。从奴隶占劳动力供应的百分比开始,然后问为什么产出的百分比会高于或低于劳动力的百分比(
第五届负责任计算基础研讨会 (FORC) 将于 2024 年 6 月 12 日至 14 日在马萨诸塞州剑桥的哈佛大学举行。征文通知已经发出。请提交您的优秀论文,以便 FORC 再次取得成功。FORC 是计算和社会领域数学研究的论坛。该研讨会旨在催化一个社区的形成,支持将理论计算机科学、统计学、经济学和其他相关分析领域应用于紧迫和预期的社会关注问题。主题包括但不限于:机器学习公平性的理论方法,包括定义、算法、下限和权衡的研究;隐私的正式方法,包括差异隐私;计算和数学的社会选择,包括分配和重新划分选区;分配和公平划分的公平性;经济激励,包括社会公益机制设计;稳健性的指标和含义,包括可解释性的形式化
2023/07/18 Class is in Session: Teams Selected to Teach AI Agents to Interact with People & Learn
作为 DARPA 环境驱动概念学习 (ECOLE) 计划的一部分,一些大学团队和行业参与者将尝试创建能够不断从语言和视觉输入中学习的人工智能 (AI) 代理。由此产生的代理将能够与人类合作,帮助他们在国家安全的时间敏感的分析任务中对图像、视频和多媒体文档进行分析,其中可靠性和稳健性至关重要。