LaCy: What Small Language Models Can and Should Learn is Not Just a Question of Loss
本文在 ICLR 基于 LLM 的代理系统内存研讨会上被接受。语言模型不断发展,将更多的世界知识压缩到其参数中,但可以预训练到其中的知识受到其参数大小的上限。特别是小语言模型(SLM)的容量是有限的,导致实际上不正确的生成。这个问题通常可以通过让 SLM 访问外部源来缓解:查询更大模型、文档或数据库的能力。在此背景下,我们研究的根本问题是……
New technique makes AI models leaner and faster while they’re still learning
研究人员利用控制理论在训练过程中消除人工智能模型不必要的复杂性,从而在不牺牲性能的情况下降低计算成本。
Ростех создает первый российский двигатель НК-3 для сверхлегких космических ракет
该发电厂将使用环保燃料,并配有推力矢量控制系统来改变轨迹
对于在职成人学习者来说,通往更好职业生涯的道路常常被“假设之墙”所阻挡。如果托儿服务失败怎么办?如果学费抵不上债务怎么办?如果投资后就业市场没有发挥作用怎么办?《降低未来风险:小型企业如何利用基于结果的融资来建立有弹性的人才管道》一文首先出现在阿斯彭研究所。
What We Learned: A Conversation on Employer-Led Upskilling for Small and Medium-Sized Businesses
本文总结了 UpSkill America 通过多年研究中小型企业 (SMB) 如何有效实施人才发展所收集的基本见解。我们所学到的文章:关于雇主主导的中小型企业技能提升的对话首先出现在阿斯彭研究所。
The Care Catalyst: How Child Care Benefits Make the Difference in Retention for Small Businesses
本简报探讨了阿肯色州如何利用儿童保育福利的战略投资来稳定员工,通过重点介绍 Excel by 8 和两家小型企业的工作来加强全州的小型企业和社区。 帖子“护理催化剂:儿童保育福利如何对小型企业的保留产生影响”首先出现在阿斯彭研究所。
University's AI Model Could Help Coast Guard Avoid Arctic Ice
密歇根大学学生团队创建了一个人工智能模型,可以提高海岸警卫队在北极冰冷水域航行的能力。
NDIA POLICY POINTS: Small Business Research Programs Prove Their Worth
当联邦政府于 10 月 1 日关闭时,美国国防工业基地的承包商面临着严峻的挑战。然而,许多小企业还面临第二个阻力,因为小企业创新研究和小企业技术转让计划的授权在同一天失效。
HURREX 2026: U.S. Navy Launches Major Hurricane Drill to Test Fleet and Shore Readiness
美国舰队司令部 (USFFC) 和海军设施司令部 (CNIC) 指挥官将于 4 月 13 日至 24 日启动年度飓风准备和灾难响应演习 HURRICANE EXERCISE/CITADEL GALE (HURREX/CG) 2026。
25th Infantry Division advances transformation with HIMARS, Precision Strike and DIVARTY integration
华盛顿——第 25 步兵师正在通过整合远程火力、无人系统和新网络来加速印度-太平洋地区的陆军转型。
Understanding Amazon Bedrock model lifecycle
本文向您展示如何在 Amazon Bedrock 中管理 FM 转换,以便您可以确保您的 AI 应用程序随着模型的发展保持运行。我们讨论了三种生命周期状态、如何使用新的扩展访问功能来规划迁移,以及在不中断的情况下将应用程序迁移到新模型的实用策略。
Navy selects Leidos, Defense Unicorns to test software prototypes for ships
Leidos 和 Defense Unicorns 将根据另一项交易协议在实验室环境中测试原型。
Pentagon’s ouster of Anthropic opens doors for small AI rivals
小型国防工业人工智能初创公司突然接到了将军、作战指挥官和财力雄厚的投资者的电话。
A Survival Analysis Guide with Python: Using Time-To-Event Models to Forecast Customer Lifetime
通过 Kaplan-Meier 曲线和 Cox 比例风险回归对客户保留进行建模来理解生存分析。Python 生存分析指南:使用事件时间模型预测客户生命周期一文首先出现在 Towards Data Science 上。
How Visual-Language-Action (VLA) Models Work
人形机器人视觉-语言-动作 (VLA) 模型的数学基础等视觉-语言-动作 (VLA) 模型如何工作的帖子首先出现在走向数据科学上。
Why MLOps Retraining Schedules Fail — Models Don’t Forget, They Get Shocked
我们将艾宾浩斯遗忘曲线拟合到 555,000 笔真实欺诈交易中,得到 R² = −0.31 — 比平坦线更糟糕。这一结果解释了为什么基于日历的再训练在生产中失败,并引入了一种在实际系统中有效的实用冲击检测方法。文章《为什么 MLOps 重新训练计划失败——模型不会忘记,他们会感到震惊》一文首先出现在《走向数据科学》上。
When Things Get Weird with Custom Calendars in Tabular Models
自 2025 年 9 月以来,我们在 Power BI 和 Fabric 表格模型中引入了基于日历的时间智能。虽然这个功能提供了巨大的可能性,但我们必须意识到它的陷阱。以下是其中的一些。当表格模型中的自定义日历变得奇怪时,这篇文章首先出现在走向数据科学上。