基准数领域信息情报检索---XiaoMi-AI

2026年3月31日 00:00

ProText：测量长文本中（错误）性别的基准数据集

ProText: A Benchmark Dataset for Measuring (Mis)gendering in Long-Form Texts

我们引入了 ProText，这是一个用于测量风格多样的长篇英语文本中的性别和性别错误的数据集。 ProText 跨越三个维度：主题名词（姓名、职业、头衔、亲属称谓）、主题类别（典型男性、典型女性、中性/非性别）和代词类别（男性、女性、中性、无）。该数据集旨在探索文本转换中的（错误）性别，例如使用最先进的大型语言模型进行摘要和重写，超越传统的代词解析基准并超越......

DataRobot博客

2026年4月20日 22:22

AI 延迟是一种业务风险。以下是管理方法

AI latency is a business risk. Here’s how to manage it

当一家大型保险公司的人工智能系统需要数月时间才能解决本应在数小时内解决的索赔时，问题通常不是孤立的模型。这是围绕模型的系统以及系统在每一步引入的延迟。企业人工智能的速度并不在于令人印象深刻的基准数字。这是关于人工智能是否可以……人工智能后的延迟是一种商业风险。以下是 DataRobot 上首次出现的管理方法。

Roboticmagazine

2026年3月21日 18:02

2026 年人工智能基础设施峰会

AI Infra Summit 2026

人工智能基础设施峰会是最大的人工智能基础设施聚会，协调人工智能技术堆栈的每一层。出席见证行业定义的技术公告，例如 NVIDIA 2025 年的 Rubin CPX，并成为第一个获得 AI 基础设施最大参与者的年度基准数据的人。主要优点：技术见解：涵盖效率和性能的会议 [...]

基准数关键词检索结果

ProText：测量长文本中（错误）性别的基准数据集

AI 延迟是一种业务风险。以下是管理方法

2026 年人工智能基础设施峰会