推理关键词检索结果

通过大规模和生产中的人工智能推理实现价值

Realizing value with AI inference at scale and in production

训练人工智能模型来预测设备故障是一项工程成就。但直到预测与行动相结合——模型成功标记出故障机器的那一刻——真正的业务转型才会发生。一个技术里程碑存在于概念验证平台中;另一个对利润做出了有意义的贡献。克雷格·帕特里奇 (Craig Partridge),Digital Next 全球高级总监……

Gemini 3:Google LLC 对编码、推理和人工智能未来的大赌注

Gemini 3: Google LLC’s Big Bet On Coding, Reasoning and the Future of AI

谷歌刚刚发布了其最新的基本模型,是的 - 这是一个很棒的模型。该公司声称 Gemini 3 是迄今为止“最智能的模型”,它可以进行深度推理、多模式交互,甚至复杂的编码工作流程。一整天,从你作为一名开发人员醒来,直到你带着电子邮件(或业余项目代码)入睡,它都应该在 Gemini 3 中。谷歌表示,Gemini 应用程序的月用户数量已超过 6.5 亿,大约有 1300 万软件开发人员正在积极使用其模型。这是基准数据所承诺的那种令人瞩目的结果。基于 [...]

为 AI 超级工厂提供动力,NVIDIA 和 Microsoft 集成推理、网络安全、物理 AI 的最新技术

Powering AI Superfactories, NVIDIA and Microsoft Integrate Latest Technologies for Inference, Cybersecurity, Physical AI

配合本周召开的 Microsoft Ignite 大会,NVIDIA 正在扩大与 Microsoft 的合作,包括为由 NVIDIA Blackwell 平台提供支持的全新 Microsoft Fairwater AI 超级工厂采用下一代 NVIDIA Spectrum-X 以太网交换机。此次合作带来了跨 Microsoft 365 Copilot 的新集成,以及阅读文章的公共预览

得益于人工智能推理工作,云原生计算即将爆发

Cloud-native computing is poised to explode, thanks to AI inference work

CNCF 领导者预测未来 18 个月内云原生计算的人工智能工作将增加数千亿美元。

动物使用大脑的这一部分进行推理

Animals use this part of the brain to make inferences

研究人员已经确定了大脑的一部分充当“推理引擎”。

人工智能大脑内部:记忆与推理

Inside the AI brain: memory vs. reasoning

最近的研究表明,人工智能语言模型将记忆和推理存储在完全独立的神经回路中,这表明机器以不同的方式“思考”和“记忆”。这一发现引领了创建人工智能系统的道路,该系统可以忘记敏感数据,同时保留其智能。

罗伯特·诺齐克 — 像早熟的学生一样推理

Robert Nozick — reasoning like a precocious schoolboy

很高兴阅读诺齐克的书籍和文章。它们充满了发人深省的论点和优雅的推理。同时,他的聪慧又带着几分早熟小学生的气息。他就像一个质疑十八岁投票权规则的人,认为那些十八岁的人不 [...]

合同 AI 障碍:经济学、推理 + 即时工程

Contract AI Barriers: Economics, Reasoning + Prompt Engineering

作者:Pedram Abrari,Pramata 首席技术官。在本系列的前两篇文章中,我们介绍了从...实现价值的前六大技术挑战

在日本和澳大利亚推出针对 Claude Sonnet 4.5 和 Haiku 4.5 的 Amazon Bedrock 跨区域推理

Introducing Amazon Bedrock cross-Region inference for Claude Sonnet 4.5 and Haiku 4.5 in Japan and Australia

こんにちは,你好。 Anthropic 最近推出的 Claude Sonnet 4.5 和 Claude Haiku 4.5(现已在 Amazon Bedrock 上提供)标志着生成式 AI 模型的重大飞跃。这些最先进的模型擅长复杂的代理任务、编码和企业工作负载,为开发人员提供增强的功能。除了新型号之外,我们很高兴地宣布 [...]

推理的剃刀:推理提高了准确性,但会损害安全和幻觉检测中关键操作点的回忆

Reasoning’s Razor: Reasoning Improves Accuracy but Can Hurt Recall at Critical Operating Points in Safety and Hallucination Detection

推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......

强化学习通过自适应揭示基本原理进行推理

RL for Reasoning by Adaptively Revealing Rationales

我们提出,来自部分专家演示的强化学习(RL)不仅仅是一种训练启发式方法,而且是解决复杂序列生成任务的一个有前景的框架。监督微调(SFT)依赖于密集的真实标签,随着序列长度的增长,其成本也越来越高。另一方面,强化学习则面临着稀疏奖励和组合大输出空间的问题。我们通过引入自适应回溯(AdaBack)来解决这个问题,这是一种按样本课程学习算法,在训练期间仅显示目标输出的部分前缀。该...

高通加速数据中心推理

В Qualcomm ускоряют логические выводы в дата-центрах

AI200 和 AI250 提高特定 AI 工作负载的性能和能源效率。

饮水机闲聊,第一集。 9:人工智能和法学硕士中“思考”和“推理”的真正含义是什么

Water Cooler Small Talk, Ep. 9: What “Thinking” and “Reasoning” Really Mean in AI and LLMs

理解人工智能如何模拟“理性”,以及为什么它不是人类在思考时所做的事情The post Water Cooler Small Talk,Ep. 9:人工智能和法学硕士中“思考”和“推理”的真正含义首先出现在《走向数据科学》上。

通过多步提示和目标推理在实体链接中利用大型语言模型的力量

Leveraging Power of Large Language Model in Entity Linking via Multi-step Prompting and Targeted Reasoning

实体链接 (EL) 传统上依赖于大型注释数据集和广泛的模型微调。虽然最近的小样本方法通过提示来利用大型语言模型 (LLM) 来减少训练要求,但由于昂贵的基于 LLM 的推理,它们常常效率低下。 ARTER(自适应路由和目标实体推理)提出了一种结构化管道,通过策略性地结合候选生成、基于上下文的评分、自适应路由和选择性推理,无需深度微调即可实现高性能。 ARTER 计算一小组...

错误指定的基于仿真的推理中的归纳域转移

Inductive Domain Transfer In Misspecified Simulation-Based Inference

基于模拟的推理 (SBI) 是一种统计推理方法,用于在可能性难以处理但可以进行模拟时估计物理系统的潜在参数。在实践中,SBI 经常受到模型错误指定的阻碍——由于固有的建模简化而导致模拟和现实世界观察结果之间的不匹配。 RoPE 是一种最新的 SBI 方法,它通过两阶段域传输过程解决了这一挑战,该过程将半监督校准与基于最佳传输 (OT) 的分布对齐相结合。然而,RoPE 以完全传导的方式运行……

最佳推理模型 API |比较成本、环境和可扩展性

Best Reasoning Model APIs | Compare Cost, Context & Scalability

使用 Clarifai Local Runners 通过公共 API 在本地运行 Hugging Face 模型。在您自己的硬件上构建、测试和扩展 AI 工作负载。

Clarifai 11.9:推出针对代理 AI 推理进行优化的 Clarifai 推理引擎

Clarifai 11.9: Introducing Clarifai Reasoning Engine Optimized for Agentic AI Inference

Clarifai 推理引擎、新工具包、Qwen 模型和 GPU 选项,可实现更快、优化的 AI 工作负载。

Google 新的 Gemini 3 “vibe-codes” 响应并带有自己的代理

Google’s new Gemini 3 “vibe-codes” responses and comes with its own agent

Google 今天推出了 Gemini 3,这是对其旗舰多式联运模型的重大升级。该公司表示,新模型的推理能力更强,具有更流畅的多模式功能(跨语音、文本或图像工作的能力),并且将像代理一样工作。之前的型号 Gemini 2.5 支持多模式输入。用户可以喂它...