准确性领域信息情报检索---XiaoMi-AI

2026年6月3日 15:56

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

在本文中，您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业，因此您可以专注于训练代码，而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性，并将基本模型与多个微调变体进行比较，以便您可以就模型质量做出数据驱动的决策。

亚马逊云科技 _机器学习

2026年6月2日 15:45

Baz 如何使用 Amazon Bedrock AgentCore 提高其 AI 代理代码审查准确性

How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore

本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果

俄罗斯技术国有集团新闻频道

2026年5月28日 08:58

Rostec 系统将提高飞机在索契机场着陆的准确性和安全性

Система Ростеха повысит точность и безопасность посадки самолетов в аэропорту Сочи

与公司的其他解决方案一起，该系统将提高该国最大的航空枢纽之一的容量

亚马逊云科技 _机器学习

2026年5月14日 17:28

使用 Amazon Lex Assisted NLU 提高机器人准确性

Improve bot accuracy with Amazon Lex Assisted NLU

在这篇文章中，您将学习如何有效地实施辅助 NLU。您将学习如何通过有效的意图和槽描述来改进机器人设计，使用测试工作台验证您的实施，并为新的和现有的机器人规划从传统 NLU 到辅助 NLU 的过渡。

KDnuggets

2026年6月5日 14:00

深入探讨语言模型的校准：Platt 缩放、等渗回归、温度缩放

A Deep Dive into Calibration of Language Models: Platt Scaling, Isotonic Regression, Temperature Scaling

发现三种缩小置信度和准确性之间差距的事后方法。

科学美国人

2026年6月6日 12:00

预测市场如何预测科学的未来

How prediction markets could forecast the future of science

在线预测市场正在对从气候变化到量子计算等各个领域进行押注。但研究人员质疑其准确性

与此有关的是什么

2026年6月5日 21:00

气候骗局已被承认。美国人被谎言蒙蔽，理应得到赔偿。

The Climate Scam Is Acknowledged. Americans Were Fed Lies, and Deserve to Be Compensated.

考虑到现在出现了多少过失，现在是认真核算气候歇斯底里症对美国人造成的伤害的时机了。最新至少在一定程度上承认事实和准确性的是《纽约时报》，它是气候变化胡言乱语的主要“主流”媒体支持者。《气候骗局已被承认》一文。美国人被谎言蒙蔽，理应得到赔偿。首先出现在 Watts Up With That? 上。

美国政府问责局__报告

2026年6月4日 07:23

退伍军人事务部：改进监督可以加强医疗保健资金估算流程

Veterans Affairs: Improved Oversight Could Strengthen Processes for Estimating Health Care Funding

GAO 的发现为了支持每年的医疗保健预算预测，退伍军人健康管理局 (VHA) 与精算顾问签订合同，协助 VHA 进行年度参保医疗保健预测模型更新。该模型产生三个基本输出：入学率、利用率和单位成本。每个输出都经过多次复杂的调整，以考虑 VHA 医疗保健的特征以及获得 VHA 医疗保健服务的退伍军人的特点。 VHA 参保者医疗保健预测模型的基本输出 GAO 发现 VHA 开发模型估计的流程符合大多数但并非所有相关标准。例如，VHA 的招生和预测办公室 (E&F) 没有正式的流程要求 VHA 的精算顾问在初始模型交付后将新出现的数据纳入模型中。据 VHA 官员称，在交付初始模型场景后不需要合并新出

MIT新闻 - 人工智能

2026年6月3日 00:00

麻省理工学院的研究人员教人工智能模型解释图表

MIT researchers teach AI models to interpret charts

新的 ChartNet 训练数据集可以提高视觉语言模型的准确性，帮助分析业务趋势或解释科学数据。

The College Fix

2026年6月3日 04:05

DEI 禁令“没有任何作用”：卧底视频引发了有关 UT Austin 的法律问题

DEI ban ‘doesn’t do anything’: Undercover video raises legal questions about UT Austin

德克萨斯大学奥斯汀分校表示，它已经“全面实施”该州的多样性、公平性和包容性禁令，以回应最近的一段秘密视频，该视频显示一名性别研究员工表示，该法律“除了创造更多工作之外没有任何作用”。但媒体准确性总裁 Adam Guillette 告诉 The College Fix [...]

美国政府问责局__报告

2026年6月2日 07:13

联邦统计数据：利益相关者表示就业报告总体上满足了他们的需求，但存在提高数据质量的机会

Federal Statistics: Stakeholders Said Jobs Report Generally Meets Their Needs, but Opportunities Exist to Improve Data Quality

GAO 的发现美国劳工统计局 (BLS) 的就业形势报告（就业报告）根据两项调查（一项针对家庭（家庭调查）和一项针对雇主（机构调查））的数据提供了国家经济的关键信息。具有就业数据专业知识的利益相关者表示，该报告总体上满足了用户的需求。然而，他们表示，偶尔的大幅修改可能会使数据对于及时做出决策的作用降低，而且由于随着时间的推移调查响应率较低，美国劳工统计局面临着数据质量的风险（见图）。 BLS 实现了 2020 至 2025 财年数据精度和修订规模的目标，但在 COVID-19 大流行期间放宽了一项目标。 2015 年 10 月至 2025 年 9 月就业报告调查的响应率 BLS 通过各种方式获

人工智能+

2026年5月27日 14:05

10 部正确运用人工智能的最佳电影

The 10 Best Movies That Get Artificial Intelligence Right

为什么重要：人工智能研究人员排名的 10 部最适合人工智能的电影。 Ex Machina 到 AlphaGo：准确性、预测和道德。

特种部队新闻

2026年5月27日 14:03

朝鲜部署新型火箭炮和战术导弹系统来对抗美军

North Korea Fields New Rocket Artillery and Tactical Missile System to Counter U.S. Forces

朝鲜官方媒体发布了全新朝鲜人民军火箭炮和战术弹道导弹系统的主要照片，突显其前线战术火力持续快速现代化，这对美国及其盟国的地面能力构成了越来越大的威胁。新系统配备两个发射模块，既可以选择一枚射程300公里的KN-24战术弹道导弹，也可以选择9枚射程67公里的240毫米火箭弹。全新系统的测试评估了弹道导弹上的“特定任务弹头”、火箭炮技术的可靠性以及朝鲜部署新型火箭炮和战术导弹系统以对抗美军的准确性。

人工智能+

2026年5月30日 13:26