基准数关键词检索结果

ProText:测量长文本中(错误)性别的基准数据集

ProText: A Benchmark Dataset for Measuring (Mis)gendering in Long-Form Texts

我们引入了 ProText,这是一个用于测量风格多样的长篇英语文本中的性别和性别错误的数据集。 ProText 跨越三个维度:主题名词(姓名、职业、头衔、亲属称谓)、主题类别(典型男性、典型女性、中性/非性别)和代词类别(男性、女性、中性、无)。该数据集旨在探索文本转换中的(错误)性别,例如使用最先进的大型语言模型进行摘要和重写,超越传统的代词解析基准并超越......

2026 年人工智能基础设施峰会

AI Infra Summit 2026

人工智能基础设施峰会是最大的人工智能基础设施聚会,协调人工智能技术堆栈的每一层。出席见证行业定义的技术公告,例如 NVIDIA 2025 年的 Rubin CPX,并成为第一个获得 AI 基础设施最大参与者的年度基准数据的人。主要优点:技术见解:涵盖效率和性能的会议 [...]