推理关键词检索结果

在 Amazon Bedrock 上使用自动推理构建可靠的 AI 系统 - 第 1 部分

Build reliable AI systems with Automated Reasoning on Amazon Bedrock – Part 1

受监管行业的企业通常需要数学确定性,确保每个人工智能响应都符合既定政策和领域知识。受监管的行业不能使用传统的质量保证方法,仅测试人工智能输出的统计样本并对合规性做出概率断言。当我们在 Amazon Bedrock Guardrails 中推出自动推理检查时,预览版位于 [...]

在日本和澳大利亚推出针对 Claude Sonnet 4.5 和 Haiku 4.5 的 Amazon Bedrock 跨区域推理

Introducing Amazon Bedrock cross-Region inference for Claude Sonnet 4.5 and Haiku 4.5 in Japan and Australia

こんにちは,你好。 Anthropic 最近推出的 Claude Sonnet 4.5 和 Claude Haiku 4.5(现已在 Amazon Bedrock 上提供)标志着生成式 AI 模型的重大飞跃。这些最先进的模型擅长复杂的代理任务、编码和企业工作负载,为开发人员提供增强的功能。除了新型号之外,我们很高兴地宣布 [...]

高通加速数据中心推理

В Qualcomm ускоряют логические выводы в дата-центрах

AI200 和 AI250 提高特定 AI 工作负载的性能和能源效率。

强化学习通过自适应揭示基本原理进行推理

RL for Reasoning by Adaptively Revealing Rationales

我们提出,来自部分专家演示的强化学习(RL)不仅仅是一种训练启发式方法,而且是解决复杂序列生成任务的一个有前景的框架。监督微调(SFT)依赖于密集的真实标签,随着序列长度的增长,其成本也越来越高。另一方面,强化学习则面临着稀疏奖励和组合大输出空间的问题。我们通过引入自适应回溯(AdaBack)来解决这个问题,这是一种按样本课程学习算法,在训练期间仅显示目标输出的部分前缀。该...

推理的剃刀:推理提高了准确性,但会损害安全和幻觉检测中关键操作点的回忆

Reasoning’s Razor: Reasoning Improves Accuracy but Can Hurt Recall at Critical Operating Points in Safety and Hallucination Detection

推理已成为大型语言模型 (LLM) 的核心范式,不断提高各种基准的准确性。然而,它是否适合精度敏感的任务仍不清楚。我们提出了第一个在严格的低误报率(FPR)制度下分类任务推理的系统研究。我们的分析涵盖两项任务——安全检测和幻觉检测——使用标准法学硕士和大型推理模型(LRM)在微调和零样本设置下进行评估。我们的结果揭示了一个明显的权衡:Think On(推理增强)生成改进......

饮水机闲聊,第一集。 9:人工智能和法学硕士中“思考”和“推理”的真正含义是什么

Water Cooler Small Talk, Ep. 9: What “Thinking” and “Reasoning” Really Mean in AI and LLMs

理解人工智能如何模拟“理性”,以及为什么它不是人类在思考时所做的事情The post Water Cooler Small Talk,Ep. 9:人工智能和法学硕士中“思考”和“推理”的真正含义首先出现在《走向数据科学》上。

通过多步提示和目标推理在实体链接中利用大型语言模型的力量

Leveraging Power of Large Language Model in Entity Linking via Multi-step Prompting and Targeted Reasoning

实体链接 (EL) 传统上依赖于大型注释数据集和广泛的模型微调。虽然最近的小样本方法通过提示来利用大型语言模型 (LLM) 来减少训练要求,但由于昂贵的基于 LLM 的推理,它们常常效率低下。 ARTER(自适应路由和目标实体推理)提出了一种结构化管道,通过策略性地结合候选生成、基于上下文的评分、自适应路由和选择性推理,无需深度微调即可实现高性能。 ARTER 计算一小组...

错误指定的基于仿真的推理中的归纳域转移

Inductive Domain Transfer In Misspecified Simulation-Based Inference

基于模拟的推理 (SBI) 是一种统计推理方法,用于在可能性难以处理但可以进行模拟时估计物理系统的潜在参数。在实践中,SBI 经常受到模型错误指定的阻碍——由于固有的建模简化而导致模拟和现实世界观察结果之间的不匹配。 RoPE 是一种最新的 SBI 方法,它通过两阶段域传输过程解决了这一挑战,该过程将半监督校准与基于最佳传输 (OT) 的分布对齐相结合。然而,RoPE 以完全传导的方式运行……

最佳推理模型 API |比较成本、环境和可扩展性

Best Reasoning Model APIs | Compare Cost, Context & Scalability

使用 Clarifai Local Runners 通过公共 API 在本地运行 Hugging Face 模型。在您自己的硬件上构建、测试和扩展 AI 工作负载。

通过微调 Amazon Nova 模型和按需推理来优化文档 AI 和结构化输出

Optimizing document AI and structured outputs by fine-tuning Amazon Nova Models and on-demand inference

本文提供了针对文档处理任务微调 Amazon Nova Lite 的综合实践指南,重点是税表数据提取。使用我们的开源 GitHub 存储库代码示例,我们演示了从数据准备到模型部署的完整工作流程。

Clarifai 11.9:推出针对代理 AI 推理进行优化的 Clarifai 推理引擎

Clarifai 11.9: Introducing Clarifai Reasoning Engine Optimized for Agentic AI Inference

Clarifai 推理引擎、新工具包、Qwen 模型和 GPU 选项,可实现更快、优化的 AI 工作负载。

顶级 LLM 推理提供商比较 - GPT-OSS-120B

Top LLM Inference Providers Compared - GPT-OSS-120B

比较顶级 GPT‑OSS‑120B 推理提供商的吞吐量、延迟和成本。了解 Clarifai、Vertex AI、Azure、AWS 等如何处理推理繁重的工作负载和实际应用程序。

分析法学硕士知识和推理基准中的辩证偏差

Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks

大型语言模型 (LLM) 在现代自然语言处理中无处不在。然而,之前的研究表明,代表性不足的英语方言的法学硕士成绩有所下降。我们分析了将“标准”美式英语问题典型化为非“标准”方言变体对多项选择题回答任务的影响,发现准确率降低了 20%。此外,我们还调查了非“标准”英语问题中表现不佳的语法基础。我们发现各个语法规则对性能有不同的影响,但有些更……

适用于 GPT-OSS 模型的最佳 GPU (2025) | Clarifai 推理引擎

Best GPUs for GPT-OSS Models (2025) | Clarifai Reasoning Engine

使用 Agno 和 GPT-OSS-120B 构建 AI 代理,从网络搜索到多代理系统

什么是人工智能推理引擎?类型、架构和未来趋势

What Is an AI Reasoning Engine? Types, Architecture & Future Trends

使用 Agno 和 GPT-OSS-120B 构建 AI 代理,从网络搜索到多代理系统

基于推理的异常检测框架:跨域异常检测的实时、可扩展且自动化的方法

Reasoning-based Anomaly Detection Framework: A Real-time, Scalable, and Automated Approach to Anomaly Detection Across Domains

检测大型分布式系统中的异常存在一些挑战。第一个挑战来自需要处理的数据量。在高吞吐量环境中标记异常需要仔细考虑算法和系统设计。第二个挑战来自在生产中利用此类系统的时间序列数据集的异质性。在实践中,异常检测系统很少针对单个用例部署。通常,需要监控多个指标,通常跨多个领域(例如工程、业务和……

对 Amazon Bedrock 批量推理实施自动监控

Implement automated monitoring for Amazon Bedrock batch inference

在这篇文章中,我们演示了金融服务公司如何使用 FM 处理大量客户记录并获取特定的数据驱动产品推荐。我们还展示了如何为 Amazon Bedrock 批量推理作业实施自动监控解决方案。通过使用 EventBridge、Lambda 和 DynamoDB,您可以实时了解批处理操作,从而可以根据客户信用数据高效生成个性化产品推荐。

用于物理推理和行动的高级人工智能

Advanced AI for physical reasoning and action

Google DeepMind 推出了 Gemini Robotics,这是一种人工智能系统,允许机器人“先思考后行动”,规划复杂的任务,甚至在不同类型的机器人之间转移技能。凭借先进的推理、安全功能和跨实体学习,机器人变得真正智能。