基准关键词检索结果

Kimi K2.5是什么?架构、基准测试和 AI 基础设施指南

What Is Kimi K2.5? Architecture, Benchmarks & AI Infra Guide

将公共 MCP 服务器部署为 API 端点,并使用函数调用将其工具集成到 LLM 工作流程中。

MiB:Bill Gurley,基准

MiB: Bill Gurley, Benchmark

在特别的奖励节目中,我与 Benchmark 的 Bill Gurley 谈论了他早期投资于现在常见的名字(如 Uber、Zillow、Grubhub、OpenTable 等)的大赌注,以及他的新书《追逐梦想:如何在你真正热爱的职业中茁壮成长》。他解释说,风险投资的早期……阅读更多 MiB 帖子:Bill Gurley,Benchmark 首先出现在 The Big Picture 上。

印度以2022-23年为基准年的新GDP系列有何变化?

What changes in India’s new GDP series with 2022-23 as base year?

印度统计部发布了新的GDP数据。现在的基准年是 2022-23 年,取代了较早的 2011-12 年。此更新使用新的数据源来更好地反映当前经济。该部也将很快发布系列数据。这样做的目的是为了更准确的经济衡量。

AMUSE:用于代理多说话者理解的视听基准和对齐框架

AMUSE: Audio-Visual Benchmark and Alignment Framework for Agentic Multi-Speaker Understanding

最近的多模态大语言模型 (MLLM),例如 GPT-4o 和 Qwen3-Omni,表现出很强的感知能力,但在多说话者、以对话为中心的环境中表现不佳,这些环境需要代理推理跟踪谁说话、维持角色以及跨时间的基础事件。这些场景是多模式音频-视频理解的核心,其中模型必须在会话视频助手和会议分析等应用程序中联合推理音频和视频流。我们引入 AMUSE,这是一个围绕本质上代理的任务设计的基准,需要模型分解复杂的......

从基准修订的角度解读“解放日”

“Liberation Day” Interpreted through the Lens of the Benchmark Revision

Pawel Skrzypczyński 向我发送了此图的链接:注意到,在基准测试后,“解放日”之后情况看起来更糟——特别是在 8 月……。

领先行业基准就业修正几乎全部严重负面

Leading sector benchmark job revisions were almost all seriously negative

- 作者:新政民主党人 在我开始讨论当前的要点之前,让我快速记录一下今天早上的 1 月份现房销售报告:情况基本相同。近三年来,销售额一直处于横盘区间;价格同比基本持平,仅上涨0.3%;库存高于大流行后水平,但远低于大流行前水平。但还是先说主菜吧。我在Seeking Alpha投资网站上看到了数量惊人的评论,昨天1月新增就业13.1万,意味着就业正在上升,完全忽略了一个月不成趋势,修正值一直在无情下调,而且1月可能是劳工统计局完成季节性调整最困难的一个月——1月裁员264.9万人!只是调整机制的期望更高。到目前为止,对于趋势,特别是就业报告中的领先指标的趋势来说,更重要的是对过去12个月以上数据

曼彻斯特大学学者为最严格的人工智能基准做出贡献

University of Manchester academics contribute to the toughest AI benchmark

印度商品贸易指数基准年修订为2022-23年

Base year of India’s merchandise trade indices revised to 2022-23

政府表示,此举将提高指数的相关性、可靠性和分析实用性

领先行业基准就业修正几乎全部严重负面

Leading sector benchmark job revisions were almost all seriously negative

– 作者:新政民主党人 在我开始讨论当前的要点之前,让我快速记录一下今天早上的 1 月份现房销售报告:情况基本相同。近三年来,销售额一直处于横盘区间;价格同比几乎持平,[…]领先行业基准就业修正几乎全部严重负面,首先出现在愤怒的熊上。

由于经济面临严重不确定性,美联储维持利率稳定

The Fed holds interest rates steady as the economy faces deep uncertainty

由于面临伊朗战争带来的通胀压力以及劳动力市场疲软,美联储维持基准利率稳定。

“恐慌模式”:伊朗能源威胁导致油价飙升,富时 100 指数下跌

‘Panic mode’: FTSE 100 sinks as oil spikes on Iran’s energy threats

由于油价飙升扰乱全球股市,周三市场陷入“恐慌模式”。由于伊朗最新威胁导致海湾地区的能源设施面临疏散,布伦特原油(国际石油基准)价格飙升 5%,至每桶 110 美元。 [...]

利率不是解决美国与伊朗战争引发的通胀的工具 |乔什·瑞安-柯林斯

Interest rates are not the tool to solve the inflation caused by the US’s war with Iran | Josh Ryan-Collins

我们之前曾经历过新冠疫情和乌克兰问题。提高借贷成本是行不通的——只有价格控制、上限和公有制才能做到这一点英国央行利率委员会周四召开会议,面临美以对伊朗非法战争引发的全球通胀冲击。通货膨胀最直接的推动因素是伊朗军队有效关闭霍尔木兹海峡,这是一个全球性的咽喉要道,世界上20%-30%的石油、天然气和化肥投入通常是通过海湾国家运输的。基准石油和天然气价格分别上涨了40%和50%以上。鉴于英国是天然气净进口国,并且拥有一个能源市场,全球天然气价格直接影响电力供应成本,因此英国面临的风险很高。能源价格上限将保护大多数家庭直到夏季,但英国柴油价格已经上涨约 12%,汽油价格上涨 6%。政府已经采取了一项

OpenAI 推出 GPT-5.4 mini 和 nano - 以更低的成本提供接近旗舰的性能

OpenAI's GPT-5.4 mini and nano launch - with near flagship performance at much lower cost

最新的 GPT-5.4 迷你模型提供的基准测试结果与完整的 GPT-5.4 模型惊人地接近,同时运行速度更快,这标志着向为实际应用程序提供支持的更小型 AI 模型的转变。

富时 100 实时指数:股市小幅上涨;无人机袭击后天然气价格飙升

FTSE 100 Live: Stocks inch up; Gas prices surge after drone attacks

早上好,欢迎回到 City AM 直播博客。富时 100 指数昨天收盘上涨 0.5%,收于 10,317.69 便士,其中 Endeavor Mining 上涨 3%。与此同时,全球市场因油价下跌而得到一定程度的缓解。国际石油基准布伦特原油价格 [...]

印度在 27 财年仍将是第五大经济体:CEA Nageswaran

India to remain 5th largest economy in FY27: CEA Nageswaran

表示基准年修正和卢比汇率贬值推迟了日本的升值

用于地球系统建模的下一代流体流动求解器

Next Generation Fluid Flow Solver for Earth System Modeling

气候建模联盟的新型流体求解器为大气建模树立了基准,在潮湿热力学、节能和 CPU/GPU 扩展方面具有无与伦比的一致性。

培养幼儿阶段以外的智能人工智能

Nurturing agentic AI beyond the toddler stage

幼儿的父母对从婴儿期到成年期的发展里程碑面临很多恐惧。婴儿学习说话或走路所需的月数通常被用作健康的基准,或正确诊断潜在健康状况所需的额外测试的指标。家长很高兴……

富时 100 实时指数:股市上涨、油价飙升、泰晤士水务救援新协议

FTSE 100 Live: Stocks jump, Oil spikes, fresh Thames Water rescue deal

早上好,欢迎回到 City AM 直播博客。今天上午,国际油价基准布伦特原油在亚洲早盘交易中上涨 1.8%,至每桶 104.98 美元。随后,特朗普总统表示他不愿意与伊朗达成协议,他的能源部长警告说,战争将 [...]