推理领域信息情报检索---XiaoMi-AI

之前对法学硕士内部运作的研究发现了稀疏子网络，通常称为电路，负责执行特定任务。此外，研究表明，通过微调来提高模型性能通常来自于模型中现有电路的强化。总而言之，这些发现表明直接干预此类电路以进行精确的、针对任务的更新的可能性。受这些发现的启发，我们提出了一种称为“结构性电路放大”的新方法，它可以识别关键令牌……

Apple机器学习研究

2026年2月24日 00:00

CoT 推理的潜力：仔细研究跟踪动态

The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics

思想链 (CoT) 提示是一种事实上的标准技术，可从大型语言模型 (LLM) 中引出类似推理的响应，使他们能够在给出最终答案之前阐明各个步骤。虽然与类人推理的相似性是不可否认的，但支撑 CoT 推理成功的驱动力仍然很大程度上不清楚。在这项工作中，我们对源自竞赛级数学问题的 CoT 痕迹进行了深入分析，目的是更好地理解 CoT 如何以及哪些部分实际上对最终答案做出了贡献。为此……

亚马逊云科技 _机器学习

2026年2月24日 15:33

为中东地区（阿联酋和巴林）的 Anthropic Claude 模型引入 Amazon Bedrock 全球跨区域推理

Introducing Amazon Bedrock global cross-Region inference for Anthropic’s Claude models in the Middle East Regions (UAE and Bahrain)

我们很高兴地宣布，Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理向中东运营的客户推出。在这篇文章中，我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的主要优势（包括提高的弹性）、您可以实现的实际用例，以及帮助您立即开始构建生成式 AI 应用程序的代码示例。

Apple机器学习研究

2026年2月12日 00:00

迹线长度是推理模型中的简单不确定性信号

Trace Length is a Simple Uncertainty Signal in Reasoning Models

法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中，我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验，我们表明迹线长度的表现与其他零样本置信度估计器（例如言语置信度）具有可比较但互补的方式。我们的工作表明，训练后推理从根本上改变了踪迹之间的关系……

Apple机器学习研究

2026年2月23日 00:00

Apple 推理与规划研讨会 2025

Apple Workshop on Reasoning and Planning 2025

推理和规划是智能人工智能系统的基石，使它们能够规划、交互、适应并最终独立运行。在 Apple，理解和推进人工智能系统的推理能力长期以来一直是一个活跃的研究领域，并产生了大量出版物，这些出版物既探索推进推理前沿的新技术，又进一步加深了该领域对当前方法的能力（和局限性）的理解。去年，Apple 主办了推理和规划研讨会，汇集了 Apple 研究人员和……

走向数据科学

2026年2月19日 13:30

AlpamayoR1：自动驾驶的大型因果推理模型

AlpamayoR1: Large Causal Reasoning Models for Autonomous Driving

关于因果链推理和自动驾驶现状您需要了解的一切！AlpamayoR1：自动驾驶的大型因果推理模型首先出现在《走向数据科学》上。

Apple机器学习研究

2026年2月10日 00:00

并行轨道变压器：通过减少同步实现快速 GPU 推理

Parallel Track Transformers: Enabling Fast GPU Inference with Reduced Synchronization

基于 Transformer 的大型语言模型 (LLM) 的高效大规模推理仍然是一个基本的系统挑战，经常需要多 GPU 并行性来满足严格的延迟和吞吐量目标。传统的张量并行性会分解跨设备的矩阵运算，但会引入大量的 GPU 间同步，从而导致通信瓶颈和可扩展性下降。我们提出了并行轨道（PT）变压器，这是一种新颖的架构范例，可以重组计算以最小化跨设备依赖性。 PT 实现了高达 16 倍的减少……

AI Time Journal

2026年2月5日 11:00

设备端 AI 革命：变革推理技术的 4 种方式

The On-Device AI Revolution: 4 Ways It’s Transforming Inference Technology

设备端人工智能不仅仅是另一个流行词，它代表了移动智能和日常技术协同工作方式的根本转变。我们的设备不再仅仅依赖远程服务器，而是变得功能强大、独立且真正具有响应能力。这是一场重新定义计算未来的转变，坦率地说，这一转变已经持续了很长时间。我们是什么 [...]

亚马逊云科技 _机器学习

2026年1月30日 17:12

使用 Amazon Bedrock 全球跨区域推理和 Anthropic Claude 4.5 模型扩展南非的 AI

Scale AI in South Africa using Amazon Bedrock global cross-Region inference with Anthropic Claude 4.5 models

在本文中，我们将介绍全局跨区域推理如何路由请求以及数据驻留在何处，然后向您展示如何配置所需的 AWS Identity and Access Management (IAM) 权限并使用全局推理配置文件 Amazon 资源名称 (ARN) 调用 Claude 4.5 模型。我们还介绍了如何请求增加工作负载的配额。最后，您将在 af-south-1 中实现全局跨区域推理。

Qudata

2026年3月6日 09:00

探索Qwen3.5家族：从小到大

Exploring Qwen3.5 family: from small to massive

阿里巴巴的 Qwen3.5 通过 MoE 稀疏性和原生视觉语言融合，将多模态智能和高级推理与超高效计算相结合。这个开放重量系列涵盖紧凑型设备型号到大型旗舰版本，为从智能手机到云规模服务器的所有设备带来了高性能人工智能。

大数据分析新闻

2026年3月3日 07:44

十大 LLM 评估工具

The Top 10 LLM Evaluation Tools

LLM 评估工具可帮助团队衡量模型在各种任务中的执行情况，包括推理、总结、检索、编码和指令遵循。他们分析性能趋势，检测幻觉，根据实际情况验证输出，并在微调或即时工程期间对改进进行基准测试。如果没有强大的评估框架，组织就会面临部署不可预测或有害人工智能的风险……阅读更多»“十大法学硕士评估工具”一文首先出现在《大数据分析新闻》上。

计算智能

2026年3月2日 06:39

软计算，第 30 卷，第 2 期，2026 年 2 月

Soft Computing, Volume 30, Issue 2, February 2026

1) 基于量子安全轻量级模糊提取器的医疗物联网用户认证方案作者：Arman Ahmad, S. Jagatheswari, R. Praveen 页数：787 - 8082) 基于涉及房屋最优选择的区间 2 型中智数的决策作者：Muhammad Touqeer, Ehtisham Rasool, Soheil Salahshour页面：809 - 8213）通过神经网络模型进行比特币和以太坊交易策略作者：Mimmo Parente，Luca Rizzuti页面：823 - 8344）基于参考向量和超距离的多目标进化算法作者：Xujian Wang，Yongjin Jing，Minli Yao页

推理关键词检索结果