数据集关键词检索结果

mAceReason-Math:为 RLVR 准备的高质量多语言数学问题数据集

mAceReason-Math: A Dataset of High-Quality Multilingual Math Problems Ready For RLVR

带可验证奖励的强化学习 (RLVR) 已成功应用于显着提升预训练大型语言模型的能力,特别是在数学和逻辑问题领域。然而,当前的研究和可用的训练数据集仍然以英语为中心。虽然过去已经创建了多语言训练数据和基准,但它们在创建时并未考虑到 RLVR 和当前模型的功能,而且它们的难度通常太低,无法为当前模型提供适当的训练信号。为了解决这一差距,我们提供了 mAceReason-Math,...

我们在真实数据集上使用了 5 种离群值检测方法:它们对 96% 的标记样本不一致

We Used 5 Outlier Detection Methods on a Real Dataset: They Disagreed on 96% of Flagged Samples

在至少通过一种方法标记的 816 种葡萄酒中,只有 32 种进入了一致名单。这些酒有一些共同点。

人工智能通过海量数据集增强化学性能

AI Supercharges Chemistry with Massive Dataset

为什么重要:人工智能通过海量数据集增强化学能力,揭示了 ANI-1x 如何利用人工智能改变分子建模。

英国气象局的北爱尔兰降雨数据集毫无价值

Met Office’s N Ireland Rainfall Dataset Is Worthless

我们知道,英国气象局的长期温度记录因选址不当和城市热岛效应而严重受损。看来他们的降雨数据集也同样被损坏且毫无价值。

两个方差的故事:为什么 NumPy 和 Pandas 给出不同的答案

A Tale of Two Variances: Why NumPy and Pandas Give Different Answers

假设您正在分析一个小数据集:您想要计算一些汇总统计数据以了解该数据的分布,因此您使用 numpy 来计算均值和方差。你的输出看起来像这样:太棒了!现在您已经了解了数据的分布。然而,你的同事来了……《两个方差的故事:为什么 NumPy 和 Pandas 给出不同的答案》一文首先出现在《走向数据科学》上。

破坏央行独立性的宏观经济后果:行长换届的证据

The Macroeconomic Consequences of Undermining Central Bank Independence: Evidence from Governor Transitions

国际货币基金组织的 Marijn A. Bolhuis、Rui Mano 和 Hedda Thorell 研究了行长换届对央行独立性的影响:本文研究了出于政治动机的央行行长换届破坏央行独立性的宏观经济后果。利用涵盖 28 个先进和新兴国家 132 个央行行长换届的新面板数据集 [...]

打开宝库:金星历史档案馆之旅

Opening a Treasure Trove: A Trip to the Historic Archives of Venus

1989 年之前,前麦哲伦轨道飞行器和金星地面探索产生了重要的数据集,这些数据集在规划未来的金星任务时非常有用。

可塑性思维:背景积累驱动LLM的信念漂移

The malleable mind: context accumulation drives LLM’s belief drift

在接受了包含 80,000 个保守政治哲学单词的数据集的训练后,Grok-4 在超过四分之一的时间里改变了其输出对政治问题的立场。这没有任何对抗性提示——训练数据的变化就足够了。由于记忆机制和研究代理 [1, 2] 使法学硕士能够积累 [...]

研究简介:确定淡水参数的内在可预测性

Research Brief: Determining the Intrinsic Predictability of Freshwater Parameters

随着环境数据集的快速增长,研究人员正在利用数据创建预测模型来预测环境变化。然而,某些参数的可预测性可能会有所不同,导致[...]后研究简报:确定淡水参数的内在可预测性首先出现在《湖科学家》上。

新研究发现,人工智能越大并不总是越好

Bigger Not Always Better When it Comes to AI, New Research Finds

根据信息技术服务和咨询公司 Hyperion Research 的说法,在有限数据集上训练的人工智能模型比“一刀切”的解决方案表现更好。

地球现在升温速度是前几十年的两倍

Earth is now heating up twice as fast as in previous decades

根据对五个温度数据集的分析,自 2014 年以来,地球每十年变暖约 0.36°C,这引发了人们对气候临界点可能会比预期更早跨越的担忧

吃鱼子酱会让你成为百万富翁吗?

Does eating caviar make you a millionaire?

观察性研究的作者描述了他们的方法。他们拥有包含许多相关变量的大型数据集,并使用由自动算法选择协变量的预测模型。不出所料,他们得出结论,鱼子酱是财富的一个风险因素,但要格外小心,避免在[...]

软计算,第 30 卷,第 2 期,2026 年 2 月

Soft Computing, Volume 30, Issue 2, February 2026

1) 基于量子安全轻量级模糊提取器的医疗物联网用户认证方案作者:Arman Ahmad, S. Jagatheswari, R. Praveen 页数:787 - 8082) 基于涉及房屋最优选择的区间 2 型中智数的决策作者:Muhammad Touqeer, Ehtisham Rasool, Soheil Salahshour页面:809 - 8213)通过神经网络模型进行比特币和以太坊交易策略作者:Mimmo Parente,Luca Rizzuti页面:823 - 8344)基于参考向量和超距离的多目标进化算法作者:Xujian Wang,Yongjin Jing,Minli Yao页

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

超越单一提取器:重新思考 LLM 预训练的 HTML 到文本提取

Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

构建网络规模的 LLM 预训练数据集的首要预处理步骤之一涉及从 HTML 中提取文本。尽管网络内容多种多样,但现有的开源数据集主要对所有网页应用单个固定提取器。在这项工作中,我们调查这种做法是否会导致互联网数据的覆盖和利用不理想。我们首先表明,虽然不同的提取器可能会在标准语言理解任务上产生相似的模型性能,但在固定过滤管道中幸存的页面可能会有很大差异。这表明一个简单的...

一种用于自回归程序合成的小型系统,可实现受控实验

A Small-Scale System for Autoregressive Program Synthesis Enabling Controlled Experimentation

使用经过训练来完成真实程序的小型模型可以进行哪些研究?通常,研究人员通过大型语言模型(LLM)研究程序合成,这会带来一些问题,例如了解分布内或分布外的内容、了解微调效果、理解标记化的效果以及对进行实验的计算和存储提出更高的要求。我们提出了一个名为 Cadmus 的系统,其中包括一个整数虚拟机 (VM)、一个由不同任务的真实程序组成的数据集,以及一个经过 200 美元以下计算训练的自回归变压器模型……

迹线长度是推理模型中的简单不确定性信号

Trace Length is a Simple Uncertainty Signal in Reasoning Models

法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中,我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验,我们表明迹线长度的表现与其他零样本置信度估计器(例如言语置信度)具有可比较但互补的方式。我们的工作表明,训练后推理从根本上改变了踪迹之间的关系……

使用视觉语言模型扩展数据注释来为物理 AI 系统提供支持

Scaling data annotation using vision-language models to power physical AI systems

在这篇文章中,我们研究了 Bedrock Robotics 如何应对这一挑战。通过加入 AWS 物理 AI 奖学金,该初创公司与 AWS 生成 AI 创新中心合作,应用视觉语言模型来分析施工视频片段、提取操作细节并大规模生成标记的训练数据集,以改进自主施工设备的数据准备。