杨殿成关键词检索结果

CoT 推理的潜力:仔细研究跟踪动态

The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics

思想链 (CoT) 提示是一种事实上的标准技术,可从大型语言模型 (LLM) 中引出类似推理的响应,使他们能够在给出最终答案之前阐明各个步骤。虽然与类人推理的相似性是不可否认的,但支撑 CoT 推理成功的驱动力仍然很大程度上不清楚。在这项工作中,我们对源自竞赛级数学问题的 CoT 痕迹进行了深入分析,目的是更好地理解 CoT 如何以及哪些部分实际上对最终答案做出了贡献。为此……

缩小法学硕士文本和语音理解之间的差距

Closing the Gap Between Text and Speech Understanding in LLMs

大型语言模型 (LLM) 可以进行调整,将其文本功能扩展到语音输入。然而,这些适应语音的法学硕士在语言理解任务上始终表现不佳,甚至低于基于文本的法学硕士,甚至级联管道。我们将这种缺陷称为文本-语音理解差距:相对于基于原始文本的 LLM 处理等效文本,当适应语音的 LLM 处理语音输入时观察到的性能下降。最近缩小这一差距的方法要么依赖文本语料库的大规模语音合成,但成本高昂且严重依赖……

depyf:为机器学习研究人员打开PyTorch编译器的不透明盒子

depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers

PyTorch \texttt{2.x} 引入了一个旨在加速深度学习程序的编译器。然而,对于机器学习研究人员来说,充分发挥 PyTorch 编译器的潜力可能具有挑战性。编译器在 Python 字节码级别运行,使其看起来像一个不透明的盒子。为了解决这个问题,我们引入了 \texttt{depyf},这是一个旨在揭开 PyTorch 编译器内部工作原理的工具。 \texttt{depyf} 将 PyTorch 生成的字节码反编译回等效的源代码,并在内存中的代码对象与其磁盘上的源代码之间建立连接...

RIAC与ILA RAS举办“巴西2026:常量与变量”圆桌会议

РСМД и ИЛА РАН провели круглый стол «Бразилия — 2026: константы и переменные»

活动期间,专家们讨论了第二次左转的中期结果、巴西政治体系对新选举周期的准备情况、选民的两极分化和武装部队的作用、经济复兴的“秘诀”及其有效性、巴西利亚的环境政策、在当前地缘政治条件下在外部轨道上保持多方位的能力、俄罗斯与巴西合作的成功和限制因素

俄罗斯外交部外交政策规划司司长阿列克谢·德罗比宁主讲

Лекция директора Департамента внешнеполитического планирования МИД России Алексея Дробинина

2026年2月18日,在俄罗斯国际事务委员会,俄罗斯外交部外交政策规划司司长阿列克谢·尤里耶维奇·德罗宾宁与RIAC成员和工作人员举行会议,致力于构建多极世界秩序

FT:欧洲投资者投资廉价防空系统制造商

FT: европейские инвесторы вложились в производителей дешевых систем ПВО

欧洲投资者投资了两家快速发展的科技初创公司 Frankenburg Technologies 和 Tytan Technologies,这两家公司正在开发低成本防空系统。

陆军时报:五角大楼开始测试无人机,作为新计划的一部分

Army Times: Пентагон приступил к тестированию дронов в рамках новой инициативы

美国陆军部已开始测试低成本神风特攻队无人机的第一阶段,这是旨在扩大其在美军中使用的新计划的一部分。

Euractiv:欧盟不协调的重整军备损害了其安全

Euractiv: нескоординированное перевооружение ЕС подрывает его безопасность

Euractiv 写道,欧盟成员国不愿协调重整军备的努力损害了其安全。

OceanSpin Casino:具有航海风格的高品质赌博平台

OceanSpin Casino: Hochwertige Glücksspielplattform mit nautischem Flair

目录 监管和安全标准 广泛的博彩产品组合 交易选项一目了然 奖金系统和广告系统 移动博彩体验 客户服务和联系方式 许可和安全标准 作为 oceansspin 赌场,我们在库拉索岛当局颁发的综合博彩许可证(许可证号 8048/JAZ)下开展工作,库拉索岛当局自 1996 年以来一直是最传统的互联网博彩监管机构之一。该职责目前负责监督全球 450 多家经批准的运营商,并保证遵守全球标准。该平台对所有数据传输使用 256 位 SSL 加密。所有游戏结果均使用经过验证的随机数生成器 (RNG) 确保,... 继续阅读“OceanSpin Casino:具有航海天赋的高质量赌博平台”

阿斯利康:完全控制的 BI

«АстраЗенека»: BI с полным контролем

阿斯利康数据总监 Alexander Mamontov 和业务分析总监 Alexander Perkin 谈论了向新 BI 平台的过渡以及引入开发和数据管理的全周期实践,这使得扩大 BI 的使用并提高管理决策的质量成为可能。

人事审批:领导层重视优先发展制度并实现改革

Personnel Vetting: Leadership Attention Needed to Prioritize System Development and Achieve Reforms

GAO 的发现自 2016 年以来,国防部 (DOD) 一直在开发国家背景调查服务 (NBIS),这是一个 IT 系统,用于为大多数联邦机构和与政府合作的 13,000 多个行业组织进行背景调查。国防部原本预计 NBIS 将于 2019 年完成,但一再拖延阻碍了部署。 GAO 还发现之前的 NBIS 成本估算和时间表不可靠。在错过多个目标后,国防部国防反情报与安全局 (DCSA) 于 2024 年暂停了 NBIS 开发,以修改其方法。 2025 年,它制定了新的成本估算,并改变了调度方法。GAO 审查了 DCSA 2025 年 NBIS 成本估算,发现它是可靠的,因为它至少基本上满足了可靠成本

美国国家科学基金会:一些重大和中型研究基础设施项目的进度继续延迟

National Science Foundation: Schedule Delays Continue for Some Major and Midscale Research Infrastructure Projects

GAO 发现截至 2025 年 7 月,美国国家科学基金会 (NSF) 通过其主要研究设备和设施建设 (MREFC) 以及研究和相关活动账户资助了 21 个研究基础设施项目。其中包括 13 个重大项目(1 亿美元或更多)和 8 个处于设计、建设和实施不同阶段的中型项目(2,000 万至 1 亿美元)。根据 GAO 2024 年 6 月的报告,其中一些项目经历了进度延迟或范围变更。具体而言,截至 2025 年 7 月,在建的七个主要项目中有四个报告相对于 2024 年 6 月 GAO 报告的时间表延迟了 4 至 27 个月(见下表)。 NSF 将延误归因于多种因素,例如劳动力短缺、承包商绩效不佳

媒体:俄克拉荷马州投资关键安全技术以推进自主航空

Media: Oklahoma Invests in Key Safety Technology to Advance Autonomous Aviation

OKC Velocity 最近报道了 Vigilant Aerospace System 的 OCAST 资助项目,旨在推进机载检测与规避 (DAA) 作为常规超视距 (BVLOS) 无人驾驶飞行的关键安全推动因素。文章报道称,这个为期一年的项目正在俄克拉荷马州立大学俄克拉荷马航空航天研究与教育研究所 (OAIRE) 的飞行测试支持下完成,[…]媒体报道:俄克拉荷马州投资关键安全技术以推进自主航空首先出现在 Vigilant Aerospace Systems, Inc. 上。

参谋长联席会议主席警告特朗普,如果美国攻击伊朗,将面临重大风险

Joint Chiefs Chairman Warns Trump of Significant Risks if US Attacks Iran

凯恩将军无法提供与委内瑞拉相同的成功保证。特朗普总统后来否认了有关凯恩警告的报道。

查塔姆研究所任命 Owen Jenkins 为非洲、中东和北非以及亚太地区研究总监

Chatham House appoints Owen Jenkins as Research Director for Africa, Middle East and North Africa, and Asia Pacific

查塔姆研究所任命欧文·詹金斯为非洲、中东和北非以及亚太地区研究主任新闻发布jon.wallace24 February 2026欧文将于3月9日加入查塔姆研究所。欧文·詹金斯将于3月9日加入查塔姆研究所,担任非洲、中东和北非以及亚太地区研究主任。欧文是英国高级外交官和国际事务领域经验丰富的领导者。他最近在英国外交、联邦与发展办公室 (FCDO) 担任印度-太平洋、中东和北非事务总干事,此前曾担任英国驻印度尼西亚和东帝汶大使。在其职业生涯早期,他曾担任两位总理的阿富汗和巴基斯坦问题特别代表,并在土耳其、阿根廷、布鲁塞尔和印度担任过外交职务。布朗文·马多克斯 (Bronwen Maddox) 表示

不同地区按性别和年龄组划分的平均通勤时间结构

地域で異なる男女・年齢層別の平均通勤時間の構造

■摘要在本文中,我们根据日产综合研究所的独立研究数据,将2019年和2025年按性别和年龄组划分的平均单程通勤时间分为东京地区和其他地区进行了检查。结果证实,东京地区男性和女性的通勤时间往往比其他地区更长。特别是,对于东京地区的男性来说,随着年龄组的增加,通勤时间有明显增加的趋势。另一方面,对于女性来说,虽然2019年年龄组与通勤时间之间的关系存在地区差异,但有人认为,到2025年,这些差异可能会减弱。 ■目录 1 - 简介 2 - 2019年按性别和年龄组划分的通勤时间分布的地区比较 3 - 2025年按性别和年龄组划分的通勤时间分布的地区比较 4 - 结论“年龄组之间的关系”1,我们使用日

美国货币政策正处于转折点 - 前景喜忧参半,政策不确定性增加

転換期を迎える米金融政策-見通しが割れる中で高まる政策不確実性

■摘要 2025年12月FOMC会议显示的点阵图显示,政策利率前景分为希望维持利率不变和希望多次降息的两派,美联储内部尚未形成共识。货币政策存在高度不确定性,与市场消化的降息前景存在差异。2026年1月的FOMC会议上,政策利率四次会议首次维持不变,符合市场预期。 12月会议确认政策利率已进入中性区间,声明中增加了“幅度和时机”,表明政策暂时保持不变,因此保持政策不变是标准政策。尽管通胀率高于目标,但主要原因是关税导致核心商品价格上涨。另一方面,核心服务价格继续趋于通货紧缩趋势,不包括住房成本和住房成本,这些成本与工资高度挂钩。如果不推出新的关税,通胀率很可能通过关税影响的减少而向价格目标下降

通过GDP统计探究实际工资下滑的真正罪魁祸首

GDP統計で探る実質賃金低迷の真犯人

■概要 过去30年,虽然劳动生产率(每小时)有所提高,但实际工资(每小时)却停滞不前。许多人指出,这背后的原因是工资支付与生产力不相称。实际工资(每小时)= 劳动生产率(每小时)x 劳动份额x 贸易条件。实际工资和劳动生产率之间的差异可以通过劳动份额和贸易条件的变化来解释,但如果对每个变量采用不同的统计,则存在由于定义和创建方法的差异而无法保证一致性的问题。在本文中,我们将所有变量统一纳入GDP统计中,并分析了实际工资(每小时)的因素。结果显示,劳动生产率与实际工资之间的差距并不像一般所说的那么大,大部分是由于贸易条件恶化造成的,而劳动份额下降的影响较小。此外,过去30年人均实际工资根本没有增