数据集领域信息情报检索---XiaoMi-AI

1) 基于量子安全轻量级模糊提取器的医疗物联网用户认证方案作者：Arman Ahmad, S. Jagatheswari, R. Praveen 页数：787 - 8082) 基于涉及房屋最优选择的区间 2 型中智数的决策作者：Muhammad Touqeer, Ehtisham Rasool, Soheil Salahshour页面：809 - 8213）通过神经网络模型进行比特币和以太坊交易策略作者：Mimmo Parente，Luca Rizzuti页面：823 - 8344）基于参考向量和超距离的多目标进化算法作者：Xujian Wang，Yongjin Jing，Minli Yao页

走向数据科学

2026年2月25日 12:00

如何定义内部信用风险模型的建模范围

How to Define the Modeling Scope of an Internal Credit Risk Model

基于内部评级 (IRB) 违约概率 (PD) 模型的数据集构建如何定义内部信用风险模型的建模范围一文首先出现在走向数据科学上。

Apple机器学习研究

2026年2月24日 00:00

超越单一提取器：重新思考 LLM 预训练的 HTML 到文本提取

Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

构建网络规模的 LLM 预训练数据集的首要预处理步骤之一涉及从 HTML 中提取文本。尽管网络内容多种多样，但现有的开源数据集主要对所有网页应用单个固定提取器。在这项工作中，我们调查这种做法是否会导致互联网数据的覆盖和利用不理想。我们首先表明，虽然不同的提取器可能会在标准语言理解任务上产生相似的模型性能，但在固定过滤管道中幸存的页面可能会有很大差异。这表明一个简单的...

Apple机器学习研究

2026年2月13日 00:00

一种用于自回归程序合成的小型系统，可实现受控实验

A Small-Scale System for Autoregressive Program Synthesis Enabling Controlled Experimentation

使用经过训练来完成真实程序的小型模型可以进行哪些研究？通常，研究人员通过大型语言模型（LLM）研究程序合成，这会带来一些问题，例如了解分布内或分布外的内容、了解微调效果、理解标记化的效果以及对进行实验的计算和存储提出更高的要求。我们提出了一个名为 Cadmus 的系统，其中包括一个整数虚拟机 (VM)、一个由不同任务的真实程序组成的数据集，以及一个经过 200 美元以下计算训练的自回归变压器模型……

Apple机器学习研究

2026年2月12日 00:00

迹线长度是推理模型中的简单不确定性信号

Trace Length is a Simple Uncertainty Signal in Reasoning Models

法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中，我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验，我们表明迹线长度的表现与其他零样本置信度估计器（例如言语置信度）具有可比较但互补的方式。我们的工作表明，训练后推理从根本上改变了踪迹之间的关系……

亚马逊云科技 _机器学习

2026年2月23日 23:20

使用视觉语言模型扩展数据注释来为物理 AI 系统提供支持

Scaling data annotation using vision-language models to power physical AI systems

在这篇文章中，我们研究了 Bedrock Robotics 如何应对这一挑战。通过加入 AWS 物理 AI 奖学金，该初创公司与 AWS 生成 AI 创新中心合作，应用视觉语言模型来分析施工视频片段、提取操作细节并大规模生成标记的训练数据集，以改进自主施工设备的数据准备。

eLearning行业 | 在线教育博客

2026年2月19日 10:15

eWyse 推出 2AI：缩小学习与业务成果之间的差距

eWyse Launches 2AI: Bridging The Gap Between Learning And Business Results

eWyse 和 Aduro Idea 推出 2AI，这是一个将绩效数据集成到业务和学习绩效系统中以进行执行控制的智能层。本文首次发表在 eLearning Industry 上。

以一声巨响开始！

2026年2月14日 15:01

从一声巨响开始播客 #126 — 尘埃的起源

Starts With A Bang Podcast #126 — The origin of dust

此图像显示了鹰星云内的创造之柱，由两个完全不同的数据集组装而成。右上角的可见光视图展示了这个尘土飞扬的区域如何遮挡其背后的恒星。在左下角，红外视图显示了星星，虽然变红了，但可以在尘埃云后面看到。在更长的波长下，尘埃会由于该区域内部的热量而发光。（图片来源：NASA、ESA、CSA、STScI、J. DePasquale、A. Koekemoer、A. Pagan (STScI)、ESA/哈勃和哈勃遗产团队）在我们的现代宇宙中，宇宙尘埃形成了行星、复杂分子并孕育了生命。但宇宙是如何创造它的呢？在宇宙中，我们最了解我们所看到的：到达我们眼睛、仪器、望远镜和探测器的所有形式的光。更难以看到、理解和

Novataxa | 物种新发现

2026年2月23日 15:55

[爬虫学 • 2026] 之字形 • 白沙带中的之字形：来自马达加斯加的游沙石龙子（有鳞目：Scincidae）的一个新的、高度分化的谱系

[Herpetology • 2026] Zig zag • Zigzags in the White Sand Belt: A New, highly divergent lineage of Sand-swimmer Skink (Squamata: Scincidae) from Madagascar

Zig zag Miralles, Schmidt, Belluardo, Rahagalala, Monvoisin, Ratsoavina, Köhler, Glaw & Vences, 2026 DOI: doi.org/10.11646/megataxa.19.1.3摘要目前的工作报告了在沙地中发现一种新的沙泳蜥蜴（Scincidae：Scincinae）马达加斯加。这种无肢无眼的石龙子是在“大白沙带”北部的实地考察中发现的，“大白沙带”是一系列围绕该岛西部沉积盆地的斑驳白色沙地。新的分类群显示出派生形态特征的独特组合（小型化、无肢、细长的身体、缺乏或被鳞片覆盖的眼睛和耳孔，以及头部鳞

Novataxa | 物种新发现

2026年2月17日 10:04

[爬虫学 • 2026] Sphenomorphus tophus • 来自泰国呵叻高原砂岩生态系统的一种新特有森林石龙子（有鳞目：Scincidae：Sphenomorphus）

[Herpetology • 2026] Sphenomorphus tophus • A New endemic Forest Skink (Squamata: Scincidae: Sphenomorphus) from the sandstone ecosystem of the Khorat Plateau, Thailand

Sphenomorphus tophus Grismer、Pawangkhanant、Naiduangchan、Grismer、Dugdale、Pierce、Quah、Suwannapoom 和 Poyarkov。 2026 呵叻高原森林石龙子 | จิ้งเหลนภูเขาหินทราย || https://www.taprobanica.org Researchgate.net/publication/400821972Abstract在泰国东北部呵叻高原独特的森林砂岩生态系统中发现了一种新的森林石龙子，属于星状石龙子复合体。根据使用 1,184 个 12S 和 16S 碱基对的系统发育

The Hindu Business Line _经济

2026年2月6日 19:55

MoSPI 在 eSankhyiki 门户上推出模型上下文协议服务器测试版

MoSPI launches beta version of Model Context Protocol server on eSankhyiki portal

MoSPI 计划在未来几个月内通过更多数据集扩展该门户，支持更多数据驱动的研究和决策。

数据集关键词检索结果