难度领域信息情报检索---XiaoMi-AI

2026年3月18日 00:00

Goldilocks RL：调整任务难度以逃避推理奖励稀疏

Goldilocks RL: Tuning Task Difficulty to Escape Sparse Rewards for Reasoning

强化学习已成为解锁大型语言模型推理能力的强大范例。然而，依赖稀疏的奖励使得这个过程的样本效率非常低，因为模型必须以最少的反馈来导航巨大的搜索空间。虽然经典课程学习的目的是通过根据复杂性对数据进行排序来缓解这种情况，但特定模型的正确排序通常是不清楚的。为了解决这个问题，我们提出了 Goldilocks，这是一种新颖的教师驱动的数据采样策略，旨在预测学生模型的每个问题的难度。教师模型...

明亮的课堂创意

2026年4月9日 08:32

PSLE 中文听力理解：捕捉关键信息的技巧

PSLE Chinese Listening Comprehension: Tips to Catch Key Information

PSLE中文听力理解测试学生理解中文口语、识别重要细节并在短时间内准确回答的能力。许多学生发现这个部分具有挑战性，因为它需要注意力集中、思维敏捷和强大的语言识别能力。与书面论文不同，没有机会重新阅读内容，这增加了难度。至 [...]

维也纳国际经济研究所信息

2026年3月22日 00:00

出版物：扩大 CESEE 创新：生态系统动态和战略迁移机会

Publication: Scaling CESEE innovation: Ecosystem dynamics and strategic relocation opportunities

欧洲的创新瓶颈日益体现在扩大有希望的开端的难度上......

Apple机器学习研究

2026年3月13日 00:00

mAceReason-Math：为 RLVR 准备的高质量多语言数学问题数据集

mAceReason-Math: A Dataset of High-Quality Multilingual Math Problems Ready For RLVR

带可验证奖励的强化学习 (RLVR) 已成功应用于显着提升预训练大型语言模型的能力，特别是在数学和逻辑问题领域。然而，当前的研究和可用的训练数据集仍然以英语为中心。虽然过去已经创建了多语言训练数据和基准，但它们在创建时并未考虑到 RLVR 和当前模型的功能，而且它们的难度通常太低，无法为当前模型提供适当的训练信号。为了解决这一差距，我们提供了 mAceReason-Math，...

Apple机器学习研究

2026年3月13日 00:00

多语言推理健身房：程序推理环境的多语言扩展

Multilingual Reasoning Gym: Multilingual Scaling of Procedural Reasoning Environments

我们提出了多语言推理 Gym，它是 Reasoning Gym（Stojanovski 等人，2025）的扩展，它可以在程序上生成跨 14 种语言的可验证推理问题。我们翻译 94 项任务的模板，并以 10 种语言进行母语验证，并进行有针对性的代码或模板调整，以确保语言的自然性。多语言推理 Gym 保留了原始 Reasoning Gym 中使用的程序生成方法的核心优势，例如几乎无限的问题实例生成和可调整的难度，并且仍然可直接用于强化......

DLabs.AI

2021年11月29日 15:24

EdTech 平台利用 AI 增强学习体验的 4 种方式

4 Ways EdTech Platforms Enhance The Learning Experience With AI

人工智能是一种宝贵的教育资源。该技术使学生能够遵循指导性的、超个性化的路径，为他们提供适当的难度级别，让他们能够最好地学习。毕竟，过于简单或过于苛刻的材料只会激怒甚至压倒学生。相比之下，如果适当的资源能够推动学生走得足够远，[…]Artykuł EdTech 平台通过 AI 增强学习体验的 4 种方式 pochodzi z serwisu DLabs.AI。

难度关键词检索结果