Revisiting the Scaling Properties of Downstream Metrics in Large Language Model Training
虽然大型语言模型 (LLM) 的缩放法则传统上关注预训练损失等代理指标,但预测下游任务性能被认为是不可靠的。本文提出了一个直接框架来对培训预算中的基准性能扩展进行建模,从而挑战了这一观点。我们发现,对于固定的令牌与参数比,简单的幂律可以准确地描述多个流行下游任务的日志精度的缩放行为。我们的结果表明,直接方法比之前提出的两阶段程序更好地推断......
流域連携はなぜ必要なのか-上下流の「受益と負担」の非対称性から考える住民参加と流域マネジメント-
■概要 流域合作是沿水脉的区域合作理念,但其必要性不仅仅是一种理念,而是上下游地区之间固有的“利益与负担的不对称”。虽然上游的森林管理和雨水收集往往会给下游带来好处,但成本和负担往往偏向上游。在这种结构下,仅靠道德合作很难维持合作。这里重要的是“分水岭边界”,它可视化生活在同一分水岭中的各方范围。共享分水岭不仅仅是了解地理的问题,而且是确认谁属于同一水网的过程。此外,通过上下游交流具体共享因果关系和相互依存,公民参与成为支持合作而不是启蒙的基础。本文认为,考虑流域边界的共享和程序的合法性是有效流域管理的前提。近年来,“流域合作”一词是在流域防洪和水循环政策背景下迅速确立的。随着暴雨灾害的日益严
Hormuz standoff the 'largest supply shock' ever experienced, says global energy expert
自近两个月前美国和以色列袭击伊朗以来,霍尔木兹海峡的交通几乎陷入停滞。世界上大约 20% 的石化产品通常流经该海峡,大幅削减的连锁反应与日俱增。为了探讨下游影响和未来的动荡时期,杰夫·贝内特与凯伦·杨进行了交谈。
National Park Foundation chief on protecting America's shared spaces
2025年,国家公园游客量将超过3.23亿人次,26个公园创下游客人数记录。但随着公园越来越受欢迎,特朗普政府提议从国家公园管理局削减 10 亿美元,这可能会导致本已人手不足的劳动力减少数千个工作岗位。杰夫·贝内特 (Geoff Bennett) 与国家公园基金会的杰夫·莱因博尔德 (Jeff Reinbold) 进行了更多讨论。
Opioids and Other Drugs Are Accumulating in Freshwater Fish
大学。一项新的研究表明,生活在废水处理厂下游的滑铁卢鱼体内正在积累抗抑郁药、阿片类药物和其他滥用药物......
MixAtlas: Uncertainty-aware Data Mixture Optimization for Multimodal LLM Midtraining
本文在 ICLR 2026 的导航和解决基础模型数据问题研讨会 (NADPFM) 上被接受。原则上的领域重新加权可以大幅提高样本效率和下游泛化能力;然而,多模式预训练的数据混合优化仍未得到充分探索。当前的多模式训练方法仅从数据格式或任务类型等单一角度调整混合物。我们介绍 MixAtlas,这是一个通过系统域分解和更小的代理模型进行计算高效的多模态混合优化的原则框架......
Water flow in prairie watersheds is increasingly unpredictable — but AI could help
在一个可以快速从吸水到将水输送到下游的景观中,湿地湿度的微小差异可能会导致可控的泉水和破坏性洪水之间的差异。 USFWS 山地草原,CC BY 4.0。作者:Ali Ameli,不列颠哥伦比亚大学 近年来,大草原变得越来越大 [...]
One Of The Most Requested Planes For SnF26 Is On Its Way
The Spirit SE-1 周日清晨离开 Grand Junction CO 在 ANN 工作以及作为 SUN n FUN 的媒体合作伙伴,最令人愉快的方面之一就是我们会被问到对来年的活动有何期待。它涵盖了很多地面...战机、航展表演者、如何飞行...凡是你能想到的。但是,今年我们听到的最常见的问题是……Spirit SE-1 会来到莱克兰吗?对于那些过去一年躲在博茨瓦纳下游山洞里的人来说,Spirit SE-1 在 2025 年奥什科什航空展上大受欢迎……它是一款经济实惠的全铝特种轻型运动飞机 (SLSA),基本价格为 69,500 美元。这款银色单座飞机专为休闲而设计,配备由 Spir
Governance-Aware Agent Telemetry for Closed-Loop Enforcement in Multi-Agent AI Systems
企业多代理人工智能系统每小时产生数千次代理间交互,但现有的可观察性工具捕获这些依赖关系而不强制执行任何操作。 OpenTelemetry 和 Langfuse 收集遥测数据,但将治理视为下游分析问题,而不是实时执行目标。其结果是出现“观察但不采取行动”的差距,只有在造成损害后才会发现违反政策的行为。我们提出了治理感知代理遥测(GAAT),这是一种参考架构,可以闭合遥测收集和多代理自动策略执行之间的循环......
What to look for when evaluating AI agent monitoring capabilities
您的人工智能代理每小时都会做出数百个(有时是数千个)决策。批准交易。路由客户。触发您无法直接控制的下游操作。这是大多数企业领导者无法自信回答的令人不安的问题:您真的知道这些代理在做什么吗?如果这个问题让你犹豫不决,那么你并不孤单。许多...评估 AI 代理监控功能时要寻找什么的帖子首先出现在 DataRobot 上。
AI recruiting biz Mercor says it was 'one of thousands' hit in LiteLLM supply-chain attack
第一个公开的下游受害者,但不会是最后一个人工智能招聘初创公司 Mercor 证实,随着 Trivy 妥协的影响继续蔓延,它是受到 LiteLLM 供应链攻击影响的“数千家公司之一”。
Hyphessobrycon ribeiroiLima、Silva-Oliveira、Oliveira 和 Faria,2025 Papéis Avulsos De Zoologia。 65; scielo.br/j/paz Researchgate.net/publication/388856173AbstractHyphessobrycon 的一个新种是在巴西帕拉州塔帕霍斯河下游盆地地区以及从伊塔皮兰加河盆地向西到巴西亚马逊州和罗赖马州的里约内格罗河下游盆地的亚马逊河北岸支流中描述的。这个新物种表现出一种颜色图案,由一个明显的单一肱骨斑点和一个明显的尾柄斑点组成,这种图案与几个同源物种共有
Wellington Airport runway extensions completed 24-03-2026.
昨天,2026 年 3 月 24 日,惠灵顿机场完成了创新型新跑道安全区的安装,机场跑道两端现已安装吸能块。工程材料拦阻系统 (EMAS) 在飞机意外冲出不太可能发生的情况下提供了额外的安全性。它还通过优化安全区之间的空间,有效地延长了跑道的可用长度,使着陆距离增加了 143 m,起飞距离增加了37m. 惠灵顿机场首席执行官马特·克拉克 (Matt Clarke) 表示,这是一个复杂的项目,需要进行大量仔细的规划。“在某种程度上,物理安装模块是最容易的部分。更困难的是重新调整地下照明、导航设备、跑道入口和出口以及飞行程序所需的规划和协调。“大部分工作必须在凌晨 1 点到 6 点之间完成,以避免
Scaling Synthetic Task Generation for Agents via Exploration
用于构建交互式代理的训练后多模式大型语言模型 (MLLM) 在计算机使用、网络导航和机器人等领域具有广阔的前景。扩展此类后期训练的一个关键挑战是缺乏高质量的下游代理任务数据集,这些数据集的任务是多样化的、可行的和可验证的。现有的任务生成方法严重依赖人工注释或用有限的下游环境信息提示 MLLM,这种方法要么成本高昂,要么可扩展性差,因为它生成的任务覆盖范围有限。为了解决这个问题,我们推出了自动播放,一个可扩展的......
▼研究者的眼睛☆为什么需要分水岭合作? - 上下游“利益与负担”不对称视角下的居民参与与流域管理- ☆流域协作中居民参与为何重要? - 流域合作应如何开展共识建立程序? - ☆女性职业意识能否提高? - 摘自我的书《退休后的女性:金钱、工作和生活的现实》(Shodensha Shinsho) ☆ 中国地区海平面上升 - 日本海与公海的薄弱联系和太平洋黑潮的蜿蜒流动更加复杂。 ☆ 与数字“31”相关的各种话题 - 公历中最大的月份是31天 - ☆ 2025财年国民负担率预计为46.1% - 由于人口老龄化,与欧洲四国的差距正在逐渐缩小☆ 中国娱乐的惊人演变(第二部分) - 中国内容的现状和未来的
流域連携における住民参加はなぜ重要なのか-流域連携における合意形成手続きのあり方-
■摘要 针对近年来暴雨灾害频发的情况,防洪工作不仅注重河道整治,还注重森林保护、农田管理、雨水调蓄渗透、土地利用清理等“流域合作”。本文认为,决定其有效性的不是是否有居民参与,而是如何设计参与。具体来说,要从规划初期就提供参与机会,适当捕捉上下游参与方的范围,认真反馈收集到的意见和纳入的理由。将公众参与纳入规划过程作为创造合法性的系统对于就流域合作达成共识至关重要。近年来,暴雨灾害频繁发生,仅靠筑堤、修河道无法充分遏制洪涝灾害的情况也越来越多。因此,重点放在“流域合作”上,将整个流域作为一个整体来促进防洪,不仅包括河流,还包括森林保护、农田和水库管理、雨水储存和渗透以及土地利用审查。流域合作是
在界定巴西流浪蜘蛛的物种时测试内聚选择性路径并评估进化信息的丢失摘要生物多样性是在嵌套的回顾性生殖群落(RRC)中构建的,反映了有关进化过程的不同级别的信息。对物种进行排名涉及根据信息增益和损失的权衡来决定强调哪个级别。对沿不同进化路径维持 RRC 的选择性过程进行建模可以为物种界定中的这些权衡提供信息。我们使用巴西游走蜘蛛(Phoneutria)来说明这种方法。整合遗传标记、几何形态测量、颜色模式和环境数据,我们应用既定的和新颖的方法来测试历史自然和性选择的分歧。我们发现证据表明,生态位和腹腹部颜色的选择有助于形成四种不同的 RRC。其中两个 RRC 还显示了影响生殖器形态进化的锁钥匙机制的