训练方法关键词检索结果

教人工智能模型说“我不确定”

Teaching AI models to say “I’m not sure”

一种新的训练方法在不牺牲性能的情况下提高了人工智能置信度估计的可靠性,解决了推理模型中产生幻觉的根本原因。

周五视频:Digit 学习硬拉

Video Friday: Digit Learns to Dead-lift

Video Friday 是您每周精选的精彩机器人视频,由您在 IEEE Spectrum 机器人领域的朋友收集。我们还发布了未来几个月即将举行的机器人活动的每周日历。请将您的活动发送给我们以供收录。ICRA 2026:2026年6月1-5日,VIENNARSS 2026:2026年7月13-17日,悉尼多机器人系统暑期学校:2026年7月29日至8月4日,布拉格享受今天的视频!训练 Digit 执行硬拉的策略不仅仅是为了让 Digit 给同事留下深刻的印象,它还让我们突破硬件和训练方法的极限。物体越重(在本例中为 65 磅 [29.5 千克]),我们的控制器需要的全身协调能力就越强,Digi

MixAtlas:多模式 LLM 中期训练的不确定性感知数据混合优化

MixAtlas: Uncertainty-aware Data Mixture Optimization for Multimodal LLM Midtraining

本文在 ICLR 2026 的导航和解决基础模型数据问题研讨会 (NADPFM) 上被接受。原则上的领域重新加权可以大幅提高样本效率和下游泛化能力;然而,多模式预训练的数据混合优化仍未得到充分探索。当前的多模式训练方法仅从数据格式或任务类型等单一角度调整混合物。我们介绍 MixAtlas,这是一个通过系统域分解和更小的代理模型进行计算高效的多模态混合优化的原则框架......

语言模型从混合到专业领域的最佳分割

Optimal Splitting of Language Models from Mixtures to Specialized Domains

本文在 ICLR 2026 基础模型导航和解决数据问题研讨会上被接受。由于可用预训练数据的规模和多样性,语言模型在各种知识、语言和推理任务上取得了令人印象深刻的性能。标准训练方法是一个两阶段范例:首先对完整的数据语料库进行预训练,然后对完整语料库中的高质量、专业数据的子集进行专门化。在多领域设置中,这涉及在每个专门领域上持续预训练多个模型,称为……