准确性领域信息情报检索---XiaoMi-AI

2026年6月3日 15:56

利用 Amazon SageMaker AI 上的 SFT 和 DPO 提高代理的工具调用准确性

Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI

在本文中，您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业，因此您可以专注于训练代码，而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性，并将基本模型与多个微调变体进行比较，以便您可以就模型质量做出数据驱动的决策。

亚马逊云科技 _机器学习

2026年6月2日 15:45

Baz 如何使用 Amazon Bedrock AgentCore 提高其 AI 代理代码审查准确性

How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore

本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果

俄罗斯技术国有集团新闻频道

2026年5月28日 08:58

Rostec 系统将提高飞机在索契机场着陆的准确性和安全性

Система Ростеха повысит точность и безопасность посадки самолетов в аэропорту Сочи

与公司的其他解决方案一起，该系统将提高该国最大的航空枢纽之一的容量

亚马逊云科技 _机器学习

2026年5月14日 17:28

使用 Amazon Lex Assisted NLU 提高机器人准确性

Improve bot accuracy with Amazon Lex Assisted NLU

在这篇文章中，您将学习如何有效地实施辅助 NLU。您将学习如何通过有效的意图和槽描述来改进机器人设计，使用测试工作台验证您的实施，并为新的和现有的机器人规划从传统 NLU 到辅助 NLU 的过渡。

经济时报

2026年5月8日 00:30

MoSPI 要求各州将 GDP 基准年改为 2022-23 年，以提高经济数据的准确性

MoSPI asks states to shift GSDP base year to 2022-23 for better economic data accuracy

统计和计划实施部发布了计算国家国内生产总值的新指南。现在的基准年是 2022-23 年，与国家 GDP 修订保持一致。此举旨在提高区域经济数据的准确性和一致性。各州和中央直辖区将采用这些新标准。

美国政府问责局__报告

2026年6月4日 07:23

退伍军人事务部：改进监督可以加强医疗保健资金估算流程

Veterans Affairs: Improved Oversight Could Strengthen Processes for Estimating Health Care Funding

GAO 的发现为了支持每年的医疗保健预算预测，退伍军人健康管理局 (VHA) 与精算顾问签订合同，协助 VHA 进行年度参保医疗保健预测模型更新。该模型产生三个基本输出：入学率、利用率和单位成本。每个输出都经过多次复杂的调整，以考虑 VHA 医疗保健的特征以及获得 VHA 医疗保健服务的退伍军人的特点。 VHA 参保者医疗保健预测模型的基本输出 GAO 发现 VHA 开发模型估计的流程符合大多数但并非所有相关标准。例如，VHA 的招生和预测办公室 (E&F) 没有正式的流程要求 VHA 的精算顾问在初始模型交付后将新出现的数据纳入模型中。据 VHA 官员称，在交付初始模型场景后不需要合并新出

MIT新闻 - 人工智能

2026年6月3日 00:00

麻省理工学院的研究人员教人工智能模型解释图表

MIT researchers teach AI models to interpret charts

新的 ChartNet 训练数据集可以提高视觉语言模型的准确性，帮助分析业务趋势或解释科学数据。

The College Fix

2026年6月3日 04:05

DEI 禁令“没有任何作用”：卧底视频引发了有关 UT Austin 的法律问题

DEI ban ‘doesn’t do anything’: Undercover video raises legal questions about UT Austin

德克萨斯大学奥斯汀分校表示，它已经“全面实施”该州的多样性、公平性和包容性禁令，以回应最近的一段秘密视频，该视频显示一名性别研究员工表示，该法律“除了创造更多工作之外没有任何作用”。但媒体准确性总裁 Adam Guillette 告诉 The College Fix [...]

美国政府问责局__报告

2026年6月2日 07:13

联邦统计数据：利益相关者表示就业报告总体上满足了他们的需求，但存在提高数据质量的机会

Federal Statistics: Stakeholders Said Jobs Report Generally Meets Their Needs, but Opportunities Exist to Improve Data Quality

GAO 的发现美国劳工统计局 (BLS) 的就业形势报告（就业报告）根据两项调查（一项针对家庭（家庭调查）和一项针对雇主（机构调查））的数据提供了国家经济的关键信息。具有就业数据专业知识的利益相关者表示，该报告总体上满足了用户的需求。然而，他们表示，偶尔的大幅修改可能会使数据对于及时做出决策的作用降低，而且由于随着时间的推移调查响应率较低，美国劳工统计局面临着数据质量的风险（见图）。 BLS 实现了 2020 至 2025 财年数据精度和修订规模的目标，但在 COVID-19 大流行期间放宽了一项目标。 2015 年 10 月至 2025 年 9 月就业报告调查的响应率 BLS 通过各种方式获

人工智能+

2026年5月27日 14:05

10 部正确运用人工智能的最佳电影

The 10 Best Movies That Get Artificial Intelligence Right

为什么重要：人工智能研究人员排名的 10 部最适合人工智能的电影。 Ex Machina 到 AlphaGo：准确性、预测和道德。

特种部队新闻

2026年5月27日 14:03

朝鲜部署新型火箭炮和战术导弹系统来对抗美军

North Korea Fields New Rocket Artillery and Tactical Missile System to Counter U.S. Forces

朝鲜官方媒体发布了全新朝鲜人民军火箭炮和战术弹道导弹系统的主要照片，突显其前线战术火力持续快速现代化，这对美国及其盟国的地面能力构成了越来越大的威胁。新系统配备两个发射模块，既可以选择一枚射程300公里的KN-24战术弹道导弹，也可以选择9枚射程67公里的240毫米火箭弹。全新系统的测试评估了弹道导弹上的“特定任务弹头”、火箭炮技术的可靠性以及朝鲜部署新型火箭炮和战术导弹系统以对抗美军的准确性。

人工智能+

2026年5月30日 13:26

人工智能中的图像识别：工作原理

Image Recognition in AI: How It Works

为什么重要：图像识别是如何工作的？查看从像素到预测的完整流程、真实准确性数据、主要用途以及每个团队应该了解的风险。

MagicBox™ 博客

2026年5月29日 05:27

与外部测验相比，嵌入式评估如何提高学习成果？

How Do Embedded Assessments Improve Learning Outcomes Compared to External Quizzes?

拼车、送餐和即时杂货等应用程序的便利性、速度和准确性极大地提高了消费者的期望。消费者现在也期望其他行业获得相同水平的服务，教育也不例外。这还包括 K-12 教育中的数字评估，因为它们是整体学习不可或缺的一部分 [...]阅读更多...

经济时报

2026年5月26日 00:03

AIS 数据错误、错误的 PAN 条目导致 ITR 归档问题

AIS data errors, wrong PAN entries causing ITR filing trouble

永久帐号输入错误和重复交易给纳税人带来了问题。所得税部门正在与报告实体合作以提高数据准确性。该举措旨在防止错配并简化纳税申报。该部门正在提高报告质量，以确保每个人的流程更加顺畅。

LiveScience

2026年5月25日 09:00

科学家使用 IBM 量子计算机训练了一个 AI 模型 - 它正确地回答了基本模型无法回答的问题

Scientists trained an AI model using an IBM quantum computer — and it answered questions correctly that the base model couldn't

当通过量子计算机运行人工智能模型时，科学家仅通过添加相对少量的参数就提高了准确性。

SciTech日报

2026年5月24日 20:47

科学家发现阿尔·戈尔创建的气候污染数据库存在重大错误

Scientists Discover Major Errors in Al Gore-Founded Climate Pollution Database

一项分析发现，Climate TRACE 可能大大低估了城市车辆的二氧化碳排放量，引发了人们对气候政策数据准确性的担忧。世界上一些使用最广泛的气候排放估算可能遗漏的污染比任何人意识到的要多得多。北亚利桑那大学的一项新研究报告称，全球温室气体排放数据库 [...]

Arácnido

2026年5月19日 22:13

跳蜘蛛的性别角色依赖性行为和结构差异

Sex Role–Dependent Behavioral and Architectural Divergence in a Jumping Spider

跳蜘蛛的性别角色依赖性行为和结构差异摘要行为和功能特征的性别差异通常归因于交配努力强度的差异，但对特定性别的亲代需求的作用仍然知之甚少。利用跳蛛 Toxeus maxillosus（雄性在不提供亲代照顾的情况下进行配偶寻找和求爱，而雌性提供从受卵到后代成熟（大约 3 个月）的长期母性照顾），我们进行了一项探索性调查，以了解这些不同的选择压力是否导致空间行为和巢穴结构的差异。结果显示，男性和女性在水胁迫下的路线规划测试和颜色模式联想记忆任务中表现出相同的准确性、延迟和学习相关表现。相比之下，在筑巢试验中，雌性建造了复杂的多入口结构，与容器的角几何形状紧密匹配，而雄性仅建造了简单的巢。此外，无论是

Robogeek新闻频道（关于机器人技术的俄罗斯与世界新闻）

2026年4月16日 16:31

俄罗斯科学家教推荐系统更好地了解用户

Российские ученые научили рекомендательные системы глубже понимать пользователей

俄罗斯储蓄银行实用人工智能中心的科学家与 AIRI 研究所、Innopolis 大学和 ITMO 的研究人员一起，找到了一种将深层语义知识从大型语言模型转移到紧凑推荐系统的方法。对于用户来说，这增加了选择商品、电影和其他内容的准确性，并且不会减慢服务的运行——发布推荐的速度保持在原始轻模型的水平。

准确性关键词检索结果