任务类型领域信息情报检索---XiaoMi-AI

2026年4月16日 00:00

MixAtlas：多模式 LLM 中期训练的不确定性感知数据混合优化

MixAtlas: Uncertainty-aware Data Mixture Optimization for Multimodal LLM Midtraining

本文在 ICLR 2026 的导航和解决基础模型数据问题研讨会 (NADPFM) 上被接受。原则上的领域重新加权可以大幅提高样本效率和下游泛化能力；然而，多模式预训练的数据混合优化仍未得到充分探索。当前的多模式训练方法仅从数据格式或任务类型等单一角度调整混合物。我们介绍 MixAtlas，这是一个通过系统域分解和更小的代理模型进行计算高效的多模态混合优化的原则框架......

任务类型关键词检索结果

MixAtlas：多模式 LLM 中期训练的不确定性感知数据混合优化