Realizing value with AI inference at scale and in production
训练人工智能模型来预测设备故障是一项工程成就。但直到预测与行动相结合——模型成功标记出故障机器的那一刻——真正的业务转型才会发生。一个技术里程碑存在于概念验证平台中;另一个对利润做出了有意义的贡献。克雷格·帕特里奇 (Craig Partridge),Digital Next 全球高级总监……
Gemini 3: Google LLC’s Big Bet On Coding, Reasoning and the Future of AI
谷歌刚刚发布了其最新的基本模型,是的 - 这是一个很棒的模型。该公司声称 Gemini 3 是迄今为止“最智能的模型”,它可以进行深度推理、多模式交互,甚至复杂的编码工作流程。一整天,从你作为一名开发人员醒来,直到你带着电子邮件(或业余项目代码)入睡,它都应该在 Gemini 3 中。谷歌表示,Gemini 应用程序的月用户数量已超过 6.5 亿,大约有 1300 万软件开发人员正在积极使用其模型。这是基准数据所承诺的那种令人瞩目的结果。基于 [...]
配合本周召开的 Microsoft Ignite 大会,NVIDIA 正在扩大与 Microsoft 的合作,包括为由 NVIDIA Blackwell 平台提供支持的全新 Microsoft Fairwater AI 超级工厂采用下一代 NVIDIA Spectrum-X 以太网交换机。此次合作带来了跨 Microsoft 365 Copilot 的新集成,以及阅读文章的公共预览
Cloud-native computing is poised to explode, thanks to AI inference work
CNCF 领导者预测未来 18 个月内云原生计算的人工智能工作将增加数千亿美元。
Inside the AI brain: memory vs. reasoning
最近的研究表明,人工智能语言模型将记忆和推理存储在完全独立的神经回路中,这表明机器以不同的方式“思考”和“记忆”。这一发现引领了创建人工智能系统的道路,该系统可以忘记敏感数据,同时保留其智能。
Robert Nozick — reasoning like a precocious schoolboy
很高兴阅读诺齐克的书籍和文章。它们充满了发人深省的论点和优雅的推理。同时,他的聪慧又带着几分早熟小学生的气息。他就像一个质疑十八岁投票权规则的人,认为那些十八岁的人不 [...]
Contract AI Barriers: Economics, Reasoning + Prompt Engineering
作者:Pedram Abrari,Pramata 首席技术官。在本系列的前两篇文章中,我们介绍了从...实现价值的前六大技术挑战
こんにちは,你好。 Anthropic 最近推出的 Claude Sonnet 4.5 和 Claude Haiku 4.5(现已在 Amazon Bedrock 上提供)标志着生成式 AI 模型的重大飞跃。这些最先进的模型擅长复杂的代理任务、编码和企业工作负载,为开发人员提供增强的功能。除了新型号之外,我们很高兴地宣布 [...]
推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......
RL for Reasoning by Adaptively Revealing Rationales
我们提出,来自部分专家演示的强化学习(RL)不仅仅是一种训练启发式方法,而且是解决复杂序列生成任务的一个有前景的框架。监督微调(SFT)依赖于密集的真实标签,随着序列长度的增长,其成本也越来越高。另一方面,强化学习则面临着稀疏奖励和组合大输出空间的问题。我们通过引入自适应回溯(AdaBack)来解决这个问题,这是一种按样本课程学习算法,在训练期间仅显示目标输出的部分前缀。该...
Water Cooler Small Talk, Ep. 9: What “Thinking” and “Reasoning” Really Mean in AI and LLMs
理解人工智能如何模拟“理性”,以及为什么它不是人类在思考时所做的事情The post Water Cooler Small Talk,Ep. 9:人工智能和法学硕士中“思考”和“推理”的真正含义首先出现在《走向数据科学》上。
实体链接 (EL) 传统上依赖于大型注释数据集和广泛的模型微调。虽然最近的小样本方法通过提示来利用大型语言模型 (LLM) 来减少训练要求,但由于昂贵的基于 LLM 的推理,它们常常效率低下。 ARTER(自适应路由和目标实体推理)提出了一种结构化管道,通过策略性地结合候选生成、基于上下文的评分、自适应路由和选择性推理,无需深度微调即可实现高性能。 ARTER 计算一小组...
Inductive Domain Transfer In Misspecified Simulation-Based Inference
基于模拟的推理 (SBI) 是一种统计推理方法,用于在可能性难以处理但可以进行模拟时估计物理系统的潜在参数。在实践中,SBI 经常受到模型错误指定的阻碍——由于固有的建模简化而导致模拟和现实世界观察结果之间的不匹配。 RoPE 是一种最新的 SBI 方法,它通过两阶段域传输过程解决了这一挑战,该过程将半监督校准与基于最佳传输 (OT) 的分布对齐相结合。然而,RoPE 以完全传导的方式运行……
Best Reasoning Model APIs | Compare Cost, Context & Scalability
使用 Clarifai Local Runners 通过公共 API 在本地运行 Hugging Face 模型。在您自己的硬件上构建、测试和扩展 AI 工作负载。
Clarifai 11.9: Introducing Clarifai Reasoning Engine Optimized for Agentic AI Inference
Clarifai 推理引擎、新工具包、Qwen 模型和 GPU 选项,可实现更快、优化的 AI 工作负载。
Exploring LLMs with MLX and the Neural Accelerators in the M5 GPU
采用 Apple 芯片的 Mac 越来越受到那些有兴趣使用 Mac 来试验最新模型和技术的人工智能开发人员和研究人员的欢迎。借助 MLX,用户可以在 Mac 上高效地探索和运行 LLM。它允许研究人员在自己的硬件上试验新的推理或微调技术,或在私人环境中研究人工智能技术。 MLX 可与所有 Apple 芯片系统配合使用,并且在最新的 macOS beta 版本1中,它现在可以利用新款 14 英寸 MacBook Pro 中引入的新型 M5 芯片中的神经加速器。神经...