В Nvidia намерены значительно ускорить логические выводы
该公司通过将 Groq 技术集成到混合推理平台中,巩固了其在人工智能市场的主导地位。
AGIBOT World Challenge at ICRA 2026 Now Opens "Reasoning to Action" and "World Model" Tracks
继首届比赛取得成功之后,今年的比赛带着更广阔的视野和破纪录的 530,000 美元奖金重返 IEEE 国际机器人与自动化会议 (ICRA)。
Scaling ML Inference on Databricks: Liquid or Partitioned? Salted or Not?
关于最大化集群技术的案例研究Databricks 上的后扩展 ML 推理:流动还是分区?加盐还是不加盐?首先出现在《走向数据科学》上。
Scientists made AI agents ruder — and they performed better at complex reasoning tasks
一个新项目允许人工智能聊天机器人像人类在对话中那样打断、保持沉默或大声说话,这让它们变得更聪明、更准确。
Large model inference container – latest capabilities and performance enhancements
AWS 最近发布了大型模型推理 (LMI) 容器的重大更新,为在 AWS 上托管 LLM 的客户提供全面的性能改进、扩展的模型支持和简化的部署功能。这些版本的重点是降低操作复杂性,同时在流行的模型架构中提供可衡量的性能提升。
之前对法学硕士内部运作的研究发现了稀疏子网络,通常称为电路,负责执行特定任务。此外,研究表明,通过微调来提高模型性能通常来自于模型中现有电路的强化。总而言之,这些发现表明直接干预此类电路以进行精确的、针对任务的更新的可能性。受这些发现的启发,我们提出了一种称为“结构性电路放大”的新方法,它可以识别关键令牌……
The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics
思想链 (CoT) 提示是一种事实上的标准技术,可从大型语言模型 (LLM) 中引出类似推理的响应,使他们能够在给出最终答案之前阐明各个步骤。虽然与类人推理的相似性是不可否认的,但支撑 CoT 推理成功的驱动力仍然很大程度上不清楚。在这项工作中,我们对源自竞赛级数学问题的 CoT 痕迹进行了深入分析,目的是更好地理解 CoT 如何以及哪些部分实际上对最终答案做出了贡献。为此……
我们很高兴地宣布,Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理向中东运营的客户推出。在这篇文章中,我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的主要优势(包括提高的弹性)、您可以实现的实际用例,以及帮助您立即开始构建生成式 AI 应用程序的代码示例。
Trace Length is a Simple Uncertainty Signal in Reasoning Models
法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中,我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验,我们表明迹线长度的表现与其他零样本置信度估计器(例如言语置信度)具有可比较但互补的方式。我们的工作表明,训练后推理从根本上改变了踪迹之间的关系……
Apple Workshop on Reasoning and Planning 2025
推理和规划是智能人工智能系统的基石,使它们能够规划、交互、适应并最终独立运行。在 Apple,理解和推进人工智能系统的推理能力长期以来一直是一个活跃的研究领域,并产生了大量出版物,这些出版物既探索推进推理前沿的新技术,又进一步加深了该领域对当前方法的能力(和局限性)的理解。去年,Apple 主办了推理和规划研讨会,汇集了 Apple 研究人员和……
AlpamayoR1: Large Causal Reasoning Models for Autonomous Driving
关于因果链推理和自动驾驶现状您需要了解的一切!AlpamayoR1:自动驾驶的大型因果推理模型首先出现在《走向数据科学》上。
Parallel Track Transformers: Enabling Fast GPU Inference with Reduced Synchronization
基于 Transformer 的大型语言模型 (LLM) 的高效大规模推理仍然是一个基本的系统挑战,经常需要多 GPU 并行性来满足严格的延迟和吞吐量目标。传统的张量并行性会分解跨设备的矩阵运算,但会引入大量的 GPU 间同步,从而导致通信瓶颈和可扩展性下降。我们提出了并行轨道(PT)变压器,这是一种新颖的架构范例,可以重组计算以最小化跨设备依赖性。 PT 实现了高达 16 倍的减少……
The On-Device AI Revolution: 4 Ways It’s Transforming Inference Technology
设备端人工智能不仅仅是另一个流行词,它代表了移动智能和日常技术协同工作方式的根本转变。我们的设备不再仅仅依赖远程服务器,而是变得功能强大、独立且真正具有响应能力。这是一场重新定义计算未来的转变,坦率地说,这一转变已经持续了很长时间。我们是什么 [...]
在本文中,我们将介绍全局跨区域推理如何路由请求以及数据驻留在何处,然后向您展示如何配置所需的 AWS Identity and Access Management (IAM) 权限并使用全局推理配置文件 Amazon 资源名称 (ARN) 调用 Claude 4.5 模型。我们还介绍了如何请求增加工作负载的配额。最后,您将在 af-south-1 中实现全局跨区域推理。
Learning to Reason as Action Abstractions with Scalable Mid-Training RL
大型语言模型在强化学习 (RL) 方面表现出色,但完全释放这种潜力需要中期训练阶段。有效的中期训练阶段应该确定一组紧凑的有用动作,并通过在线强化学习在其中进行快速选择。我们通过提出关于训练中期如何塑造训练后的第一个理论结果来形式化这种直觉:它描述了一个动作子空间,该子空间可以最小化剪枝的值近似误差和后续规划期间的 RL 误差。我们的分析揭示了训练中期效果的两个关键决定因素:...
The Top 10 LLM Evaluation Tools
LLM 评估工具可帮助团队衡量模型在各种任务中的执行情况,包括推理、总结、检索、编码和指令遵循。他们分析性能趋势,检测幻觉,根据实际情况验证输出,并在微调或即时工程期间对改进进行基准测试。如果没有强大的评估框架,组织就会面临部署不可预测或有害人工智能的风险……阅读更多»“十大法学硕士评估工具”一文首先出现在《大数据分析新闻》上。
Soft Computing, Volume 30, Issue 2, February 2026
1) 基于量子安全轻量级模糊提取器的医疗物联网用户认证方案作者:Arman Ahmad, S. Jagatheswari, R. Praveen 页数:787 - 8082) 基于涉及房屋最优选择的区间 2 型中智数的决策作者:Muhammad Touqeer, Ehtisham Rasool, Soheil Salahshour页面:809 - 8213)通过神经网络模型进行比特币和以太坊交易策略作者:Mimmo Parente,Luca Rizzuti页面:823 - 8344)基于参考向量和超距离的多目标进化算法作者:Xujian Wang,Yongjin Jing,Minli Yao页
前端开发人员通过参数化视觉和行为属性来编写可广泛重用的 UI 组件。虽然很灵活,但这使得实例化变得更加困难,因为开发人员必须推理大量的属性值和交互。在实践中,他们必须探索组件的大设计空间,并为属性提供现实和自然的价值。为了解决这个问题,我们引入了显着的变化:既模仿又独特的变化。我们将区分变异的生成框架为设计空间采样,结合符号推理来识别视觉上重要的......