ParaRNN: Unlocking Parallel Training of Nonlinear RNNs for Large Language Models
循环神经网络 (RNN) 为序列建模奠定了基础,但其内在的序列性质限制了并行计算,为扩展造成了根本障碍。这导致了 Transformer 等可并行架构以及最近的状态空间模型 (SSM) 的主导地位。虽然 SSM 通过结构化线性递归实现高效并行化,但这种线性约束限制了它们的表达能力,并妨碍对复杂的非线性序列依赖关系进行建模。为了解决这个问题,我们提出了 ParaRNN,一个打破......
Popular Python libraries used in Hugging Face models subject to poisoned metadata attack
这些开源库由 Salesforce、Nvidia 和 Apple 与瑞士集团创建。Hugging Face 模型中使用的流行 AI 和 ML Python 库中的漏洞,下载量达数千万次,允许远程攻击者在元数据中隐藏恶意代码。当加载包含中毒元数据的文件时,代码会自动执行。
Federated Learning, Part 1: The Basics of Training Models Where the Data Lives
了解联邦学习的基础联邦学习后,第 1 部分:数据所在的训练模型的基础知识首先出现在《走向数据科学》上。
How DeepSeek's new way to train advanced AI models could disrupt everything - again
中国人工智能实验室可能刚刚找到了一种既实用又可扩展的前沿法学硕士培训方法,甚至对于资金短缺的开发人员来说也是如此。
GAO 审查了卫生与公众服务部、医疗保险和医疗补助服务中心 (CMS) 题为“医疗保险和……”的新规则
Q.AI The Algorithmic Intelligence For the Model C2
Q.AI 模型 C2 的算法智能帖子首先出现在 Quasi Robotics 上。
Score Distillation of Flow Matching Models
扩散模型实现了高质量的图像生成,但受到缓慢的迭代采样的限制。蒸馏方法通过一步或几步生成来缓解这一问题。流匹配最初是作为一个独特的框架引入的,后来被证明在理论上等同于高斯假设下的扩散,这就提出了蒸馏技术(例如分数蒸馏)是否可以直接转移的问题。我们提供了一个简单的推导——基于贝叶斯规则和条件期望——统一了高斯扩散和流量匹配,而不依赖于 ODE/SDE……
DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation
扩散大语言模型 (dLLM) 是自回归 (AR) 模型的引人注目的替代品,因为它们的去噪模型在整个序列上运行。 dLLM 的全局规划和迭代细化功能对于代码生成特别有用。然而,目前 dLLM 在编码方面的训练和推理机制仍有待探索。为了揭开 dLLM 解码行为的神秘面纱并释放其编码潜力,我们系统地研究了它们的去噪过程和强化学习 (RL) 方法。我们在 130B 上训练 7B dLLM,\textbf{DiffuCoder}...
VoidLink shows how one developer used AI to build a powerful Linux malware
VoidLink 是一种以云为中心的 Linux 恶意软件,可能由一个人使用 AI 构建,提供加载程序、植入程序、rootkit 规避和模块化插件。 Check Point 研究人员发现了 VoidLink,这是一种以云为中心的 Linux 恶意软件框架,可能由单个开发人员在人工智能模型的帮助下构建。 VoidLink 包括自定义加载程序、植入程序、基于 rootkit 的规避功能以及数十个插件 [...]
«Октава ДМ» выводит на рынок активную распределительную систему OWS-ADS
新模型的目标包括最大限度地减少信号损失、简化系统部署并确保其不间断运行
近年来,人们对经济学领域的制度主义趋势和研究越来越感兴趣。传统的解释和分析似乎没有什么价值或没有价值。抽象的、不切实际的理论越来越多地被有历史依据的理论所取代。经济中的制度和结构要素被强调,取代了过于短期和基于模型的变量。 [...]
Video Friday: Bipedal Robot Stops Itself From Falling
Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA 2026:2026 年 6 月 1-5 日,维也纳享受今天的视频!这是我见过的最好的事情之一。 [动能智能机器实验室]经过多年积极测试并与美国陆军和海军陆战队合作伙伴一起突破极限,具有弹性的复杂环境中的机器人自主(RACER)项目即将结束。但 RACER 的影响将远远超出该计划的正式结束日期,留下强大的自主能力遗产,准备好改变军事行动并激发新一波私营部门投资。[DARPA]迄今为止最漂亮
All major AI models risk encouraging dangerous science experiments
科学家警告称,研究人员允许人工智能设计实验,可能会带来火灾、爆炸或中毒的风险。大约 19 种不同的人工智能模型在数百个问题上进行了测试,以评估它们发现和避免危险的能力,但没有一个模型能够识别所有问题 - 有些模型的表现比随机猜测好不了多少
False and Absurd: The BBC’s Fantasy of Climate-Driven Pay Cuts
通过将推测模型呈现为现实世界的损失,BBC Science Focus 误导读者,让他们相信气候变化已经耗尽了他们的薪水。数据却另有说法。在现代变暖时期,美国变得更加富裕、健康和生产力更高。相反的断言没有证据,而是脱离现实的模型的产物。
Market Premium For 10-Year Yield Holds Near Fair Value Estimate
根据 CapitalSpectator.com 运行的三个模型的平均估计,美国 10 年期国债收益率的市场溢价继续接近公允价值估计。今天的更新显示,在经历了几年的高市场溢价之后,近几个月基准利率持续延伸到接近中性的水平。目前的估计表明[...]
Four Stages Of A Self-Directed Learning Model
该模型的目标不是内容知识(尽管它应该产生内容知识),而是更接近智慧的东西——学习如何学习。