基准领域信息情报检索---XiaoMi-AI

CityAM _经济学

2026年7月14日 05:31

富时 100 实时指数：特朗普恢复对伊朗的封锁后，石油价格飙升，股市下跌

FTSE 100 Live: Stocks to dip as oil surges after Trump reinstates Iranian blockade

欢迎回到 City AM 直播博客。美国恢复对伊朗进口的封锁后，中东发生最新一波军事行动，油价上涨。国际油价基准布伦特原油周二飙升至每桶 84 美元以上，本周涨幅达到 [...]

走向数据科学

2026年7月11日 15:00

长上下文不是免费的 - 我构建了一个安全的提示修剪层，使 LLM 系统能够正常工作

Long Context Isn’t Free — I Built a Safe Prompt-Pruning Layer That Makes LLM Systems Work

法学硕士不会因为忘记而失败，而是因为记得太多而失败。随着对话的增长，提示会积累冗余和低价值的令牌，从而增加成本和延迟，同时默默地降低输出质量。本文介绍了一个确定性的提示修剪层，它可以在不破坏依赖关系的情况下减少令牌的使用，并由真正的基准测试和经过生产测试的设计提供支持。文章《长上下文不是免费的——我构建了一个使 LLM 系统工作的安全提示修剪层》首先出现在《走向数据科学》上。

经济时报

2026年7月12日 20:53

美伊战争：停火后霍尔木兹石油流量增加，但新的袭击引发担忧，IEA 表示

US-Iran war: Oil flow through Hormuz rises after ceasefire, but fresh strikes spark fears, IEA says

伊朗战争消息：停火后霍尔木兹海峡石油流量大幅恢复。本周重新爆发的敌对行动再次加剧了全球石油市场的不确定性。随着油轮运输恢复，基准原油价格在整个六月下跌。 6月份全球石油供应反弹，支持海湾地区生产复苏。前景取决于持续的油轮运输和局势的缓和。

19FortyFive

2026年7月9日 19:52

对 HIMARS 的需求如此之高，现在有一个等待名单。乌克兰就是原因。

Demand for HIMARS Is So High There’s Now a Waiting List. Ukraine Is Why.

2022 年夏天，洛克希德·马丁公司的 HIMARS 是一款只有炮兵军官喜爱的小众轮式火箭发射器。乌克兰在几周内改变了这一状况。四年过去了，几乎所有与西方结盟的军队都想要一枚，产量翻了一番，但仍然跟不上，而新型导弹的射程也刚刚增加了一倍。就这样，一个大多数人都叫不出名字的系统成为了远程火力的基准。

航空A2Z

2026年7月9日 13:42

世界上有史以来建造的 10 架最昂贵的战斗机

10 Most Expensive Fighter Jets Ever Built in the World

以下是有史以来建造的十架最昂贵的战斗机，按大致单位成本排名，其中一架战略轰炸机作为基准异常值。世界上建造的 10 架最昂贵的战斗机首先出现在 Aviation A2Z 上。

Apple机器学习研究

2026年7月6日 00:00

TopoPrimer：预测模型中缺失的拓扑上下文

TopoPrimer: The Missing Topological Context in Forecasting Models

我们引入了 TopoPrimer，一个框架，使序列总体的全局拓扑结构成为任何预测模型的显式输入。 TopoPrimer 提高了不同领域的准确性，稳定了季节性需求高峰下的预测，并缩小了冷启动差距。 TopoPrimer 通过持久同源性和谱束坐标对每个域进行一次预计算，将每个令牌部署为经过充分训练的模型，并作为预训练主干的轻量级适配器。在这两个组件中，层坐标是主要的精度驱动因素。跨越 Chronos 的四个公共基准和……

EVS Robot 博客

2026年7月6日 05:48

压接自动化单元：闭合夹具、冲压路径和检测之间的环路

Press-Fit Automation Cell: Close The Loop Between Fixture, Press Path, And Inspection

通过控制夹具基准、冲压路径、力位移监控、检查计时、剔除流程和安全访问来构建稳定的压接自动化单元。压接自动化单元：闭合夹具、冲压路径和检查之间的循环首先出现在EVST中。

BAIR

2026年7月7日 02:00

情报是免费的，现在怎么办？代理的数据系统、代理的数据系统以及代理的数据系统

Intelligence is Free, Now What? <br> Data Systems for, of, and by Agents

...民有、民治、民享的政府... — 亚伯拉罕·林肯，葛底斯堡演说 (1863) 人工智能的成本正在迅速下降。到 2023 年初，GPT-4 级功能的成本约为每百万代币 30 美元；如今，同样的价格低于 1 美元，一些提供商将成本压低到 0.10 美元以下。在各个基准中，推理价格每年下降 9 倍到 900 倍，下降中位数接近 50 倍。即使是前沿型号也每一代都变得越来越便宜，开源型号紧随其后。至关重要的是，即使“诺贝尔奖获得者天才级”智能还没有出现，但足以满足绝大多数知识工作的智能今天已经存在，而且每个月都在变得更便宜。按照这个速度，我们很快就会进入几乎免费的智能时代——这种智能对于日常知识

EVS Robot 博客

2026年7月7日 10:41

缸盖机器人装载：定位、抓取和机器节拍之间形成闭环

Cylinder Head Robot Loading: Close The Loop Between Locating, Gripping, And Machine Takt

围绕定位基准、夹具姿势、机器信号、切屑清理、节拍时间和异常返回来规划缸盖机器人装载。缸盖机器人装载：定位、抓取和机器节拍之间的闭环首先出现在EVST。

CityAM _经济学

2026年7月7日 05:31

事情发生了：富时 100 指数上涨，抵御科技股的阴霾；伊朗紧张局势加剧，油价小幅上涨

As it happened: FTSE 100 rises to defy tech gloom; oil creeps up on fresh Iran tensions

欢迎回到 City AM 直播博客。唐纳德·特朗普警告称，美国将在伊朗“完成任务”，这让投资者感到不安，因为他在德黑兰前最高领袖哈梅内伊葬礼后再次发出军事威胁。受此消息影响，国际石油基准布伦特原油价格升至每桶 72 美元以上，但 [...]

CityAM _经济学

2026年7月8日 09:49

随着特朗普宣布伊朗停火，英国借贷成本飙升

UK borrowing costs surge as Trump declares Iran ceasefire over

在唐纳德·特朗普暗示他与伊朗本已脆弱的停火协议结束后，英国借贷成本飙升，周三油价跃升至两周高点。十年期英国国债收益率（政府借贷成本的主要基准）飙升 11 个基点，至 4.96/[...]

走向数据科学

2026年7月3日 13:30

LLM Wiki 过度设计 - 我用纯 Python 编译器替换了我的

LLM Wikis Are Over-Engineered — I Replaced Mine With a Pure Python Compiler

大多数“LLM wiki”使用代理、嵌入和重复模型调用来组织本地注释。我构建了一个确定性的替代方案：一个纯 Python 编译器，仅使用标准库将杂乱的 Markdown 转换为链接的、经过 linted 的 wiki。在此过程中，我修复了两个真正的错误，在两个操作系统上对管道进行了基准测试，并展示了为什么编译器通常比代理更适合机械文本组织。LLM 维基百科过度设计——我用纯 Python 编译器替换了我的编译器首先出现在《走向数据科学》上。

EVS Robot 博客

2026年7月3日 07:54

软袋码垛机器人单元：先稳定握姿再提速

Soft Bag Palletizing Robot Cell: Stabilize Grip Posture Before Speed

围绕袋子变形、拾取姿势、传送带节奏、夹具接触、托盘基准、堆叠模式和恢复逻辑规划软袋码垛自动化。软袋码垛机器人单元：在 SpeedFirst 出现在 EVST 之前稳定抓取姿势。

CityAM _经济学

2026年7月3日 05:37

事实上：随着油价下跌，股市上涨；伊朗威胁对霍尔木兹海峡进行“强有力的回应”

As it happened: Stocks rise as oil lower; Iran threatens ‘forceful response’ over Strait of Hormuz

欢迎回到 City AM 直播博客。霍尔木兹海峡的交通流量正在逐渐回升，这对石油市场产生了重大推动作用。周五上午，国际油价基准布伦特原油稳定在每桶 72 美元附近。它标志着类似的水平 [...]

Apple机器学习研究

2026年7月2日 00:00

关于 RL 微调 VLM 的鲁棒性和思想链一致性

On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs

强化学习 (RL) 微调已成为增强推理密集型任务的大型语言模型 (LLM) 的关键技术，并推动其扩展到视觉语言模型 (VLM)。虽然经过 RL 调整的 VLM 改进了视觉推理基准，但它们仍然容易受到视觉基础薄弱、幻觉和过度依赖文本提示的影响。我们证明，简单的、受控的文本扰动——误导性的标题或不正确的思维链 (CoT) 痕迹——会导致鲁棒性和置信度大幅下降，并且当 CoT 一致性为……时，这些影响会更加明显。

KDnuggets

2026年7月2日 12:00

人类的最后一次考试是一种干扰

Humanity’s Last Exam is a Distraction

本文深入探讨了最终的人工智能系统评估基准，概述了创建它的原因，收集了该领域专家组对此的不同意见，最后总结了最广泛接受的结论。

ΑΙhub

2026年7月2日 08:30

自适应并行推理：高效推理扩展的下一个范例

Adaptive parallel reasoning: the next paradigm in efficient inference scaling

自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们，会怎样？我们对并行推理领域的最新进展进行了详细分析，特别是自适应并行推理。披露：这篇文章部分是景观调查，部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025)，这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。动机除了数据和参数缩放之外，LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的（OpenAI 等人，2024 年；DeepSeek-AI 等人，2025 年）。显式输

EVS Robot 博客

2026年7月2日 07:42

机器看护机器人装载窗口：门、固定装置和拾取节拍

Machine Tending Robot Loading Window: Door, Fixture, And Pick-Place Takt

围绕门定时、夹具基准、零件抓取、切屑和冷却剂风险、拾取放置节拍和操作员恢复规划机器看护机器人单元。机器看护机器人装载窗口：门、夹具和拾取放置节拍首次出现在 EVST。

基准关键词检索结果