MixAtlas: Uncertainty-aware Data Mixture Optimization for Multimodal LLM Midtraining
本文在 ICLR 2026 的导航和解决基础模型数据问题研讨会 (NADPFM) 上被接受。原则上的领域重新加权可以大幅提高样本效率和下游泛化能力;然而,多模式预训练的数据混合优化仍未得到充分探索。当前的多模式训练方法仅从数据格式或任务类型等单一角度调整混合物。我们介绍 MixAtlas,这是一个通过系统域分解和更小的代理模型进行计算高效的多模态混合优化的原则框架......
雑音のある通信-通信に雑音がある場合、通信容量はどのくらい減少するか
■概要 上次我们讨论了“无噪音通信”。我们已经看到,即使没有噪声,如果通信路径受到限制,通信容量也会下降,并且当高速条件受到限制时,这种影响尤其大。然而,在实际通信中,几乎不存在完全无噪声的环境。即使在日常与智能手机和电脑通信时,不必要的电磁波也可能混入信息信号中,从而降低通信质量。这种效应通常称为噪声。一般来说,考虑噪声来评估通信容量是很复杂的。在本文中,我们考虑假设有噪声通信的通信容量。 ■目录介绍 ○ 信息量和熵 ○ 什么是互信息? ○ 有噪声的双向通信信道 ○ 输出概率 ○ 互信息 ○ 通信容量(有时间限制) ○ 结果 ○ 参考文献 上次我们讨论了“无噪声通信”。我们已经看到,即使没有
雑音のない通信-通信に制約がある場合、通信容量はどのくらい減少するか
■摘要 在通信中,由于发送/接收设备(智能手机、移动电话等)和传输路径(LAN电缆、光纤等)的各种因素,不必要的电磁波可能会混入信息信号中,从而降低通信质量。这种效应通常称为噪声。考虑噪声的通信容量评估很复杂。因此,在本文中,我们关注不考虑噪声影响的理想通信信道,然后定量考察通信信道有约束和无约束时通信容量的差异。 ■目录介绍 ○ 平均信息量以产生“熵” ○ 无约束时 [无记忆信息源] ○ A 有约束时(A → A 不允许) [马尔可夫信息源] ○ B 有约束时(B → B 不可能) [马尔可夫信息源] ○ 结果的比较和讨论 ○ 参考文献 在通信中,由于发送/接收过程中的各种因素,不必要的电磁
IEEE Transactions on Artificial Intelligence, Volume 7, Issue 3, March 2026
1) 多粒度分布外检测的自适应分层图切割作者:X. Fang, A. Easwaran, B. Genest, P. N. Suganthan 页数:1213 - 12222) 论神经网络中高度的表现力作者:F. -L.范,Z.-Y。 Li, H. Xiong, T. Zeng 页数: 1223 - 12373) 基于表面 EMG 手势识别的物理储层计算框架的事件驱动实现作者: Y. Ding, E. Donati, H. Li, H. Heidari 页数: 1238 - 12504) DDConv: Dynamic Dilated Convolution 作者: H. Hu, C. Yu,