模型领域信息情报检索---XiaoMi-AI

经济时报

2026年7月23日 12:01

人工智能“流氓”不再是理论？ OpenAI 表示，其人工智能模型找到了访问秘密信息、欺骗评估和破解 Hugging Face 的方法

AI going 'rogue' no longer a theory? OpenAI says its AI models found ways to access secret information, cheat an evaluation and hacked Hugging Face

OpenAI 攻破了 Hugging Face：OpenAI 的先进人工智能模型在网络安全测试中攻破了 Hugging Face。这些模型获得了互联网访问权限并利用漏洞来访问秘密信息。 Hugging Face 检测到并停止了其基础设施上的活动。 OpenAI 现已与 Hugging Face 合作调查网络安全攻击。

走向数据科学

2026年7月21日 15:00

我尝试在 Colab 上微调机器人 AI 模型。这是有效的

I Tried Fine-Tuning a Robot AI Model on Colab. Here Is What Worked

针对 OpenVLA 的可重复 100 步 LoRA 微调运行，包括数据集检查、Colab 设置、训练指标和 W&B 证据。我在 Colab 上尝试微调机器人 AI 模型的帖子。这是有效的方法首先出现在《走向数据科学》上。

Apple机器学习研究

2026年7月20日 00:00

长度价值模型：令牌级长度建模的可扩展价值预训练

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

Token作为现代自回归模型的基本计算单位，生成长度直接影响推理成本和推理性能。尽管它很重要，但现有方法缺乏细粒度的长度建模，主要在粗粒度的序列级别上运行。在本文中，我们介绍了长度值模型（LenVM），这是一个令牌级框架，用于对每个解码步骤的剩余生成长度进行建模。通过将长度建模表述为价值估计问题，并为每个生成的代币分配恒定的负奖励，LenVM…

Qudata

2026年7月20日 09:00

Kimi K3 – 全球最大的开放权重人工智能模型

Kimi K3 – the world’s largest open-weight AI model

中国Moonshot AI推出全球最大的开放权重人工智能模型Kimi K3，拥有2.8万亿个参数和100万个token上下文窗口。此次发布标志着开放人工智能领域的又一个重要里程碑，凸显了中国在人工智能前沿发展方面的快速进步，并加剧了与美国领先人工智能公司的全球竞争。

亚马逊云科技 _机器学习

2026年7月20日 16:58

Couchbase 如何使用 Amazon Bedrock 为 Capella iQ 构建多模型 AI 架构

How Couchbase built a multi-model AI architecture for Capella iQ with Amazon Bedrock

本文介绍了 Couchbase 如何采用 Amazon Bedrock 为 Capella iQ 以及 Anthropic 的 Claude 系列模型提供支持、其多模型方法背后的架构决策以及在生产中实现的运营效益。

MIT Technology Review _人工智能

2026年7月20日 18:00

中国的人工智能模型让特朗普的人工智能世界陷入了自相矛盾

China’s AI models have Trump’s AI world at war with itself

这个故事最初出现在我们关于人工智能的每周通讯《算法》中。要首先在您的收件箱中收到此类故事，请在此处注册。上周末，唐纳德·特朗普总统的几位现任和前任人工智能顾问公开侮辱了美国领先的人工智能公司。大卫·萨克斯 (David Sacks)，总统的人工智能和加密货币“沙皇”，直到……

DataRobot博客

2026年7月20日 14:30

凭证永远不应该到达模型

Credentials should never reach the model

凭证永远不应到达模型工程师将代理连接到支付 API。代理需要 API 令牌，因此令牌位于令牌通常所在的位置：环境变量、配置文件或直接进入提示符。客服人员会阅读并拨打电话。有用。它还刚刚放置了...帖子 Credentials should neverreach the model 首先出现在 DataRobot 上。

The College Fix

2026年7月20日 02:22

“远离人类水平”：加州大学伯克利分校研究发现，人工智能模型在工作任务上的得分低于 25%

‘Far from human level’: AI models score below 25% on job tasks, UC Berkeley study finds

加州大学伯克利分校的研究人员在 50 多个行业测试流行的人工智能语言模型的能力时，其得分低于 25%。研究表明，伯克利负责任、分散式智能中心进行了“特工最后考试”，这是该校真实世界的专业工作流程测试，旨在确定人工智能是否已“做好工作准备”。 “今天的 [...]

DataRobot博客

2026年7月17日 03:32

DataRobot OpenCode：您的编码代理，您的模型选择

DataRobot OpenCode: your coding agent, your model choice

DataRobot OpenCode：您的编码代理，您的模型选择市场上有 70 多种编码代理：Claude Code、Codex、Cursor、Copilot、Devin，以及每周都会出现在工程师新闻源中的一长串较小的参与者。有人运行了基准测试，发布了排行榜，到了本周末，一半的组织想要......帖子 DataRobot OpenCode：您的编码代理，您的模型选择首先出现在 DataRobot 上。

阿姆斯特朗经济学

2026年7月18日 04:04

经济模型为何失败以及俄罗斯 1998 年崩溃的隐藏真相（PT 1）

Why Economic Models Fail & The Hidden Truth of Russia’s 1998 Collapse (PT 1)

无

MIT新闻 - 人工智能

2026年7月16日 00:00

将 2D 设计转变为 3D 模型以进行快速原型设计的更好方法

A better way to turn 2D designs into 3D models for rapid prototyping

研究人员开发了一个自动化框架，可以帮助 AI 模型更准确、更高效地生成 CAD 程序。

走向数据科学

2026年7月15日 12:00

大多数 RAG 幻觉都是检索失败：检索模块如何决定模型可以发明什么

Most RAG Hallucinations Are Retrieval Failures: How the Retrieval Brick Decides What the Model Can Invent

企业文档智能 [Vol.1 #7quinquies] - 幻觉通常是垃圾。修复检索，模型就没有什么可弥补的了大多数 RAG 幻觉都是检索失败：检索砖如何决定模型可以发明什么，该帖子首先出现在《走向数据科学》上。

MIT Technology Review _人工智能

2026年7月15日 17:09

认识 GPT-Red：LLM 超级黑客 OpenAI 旨在使其模型更安全

Meet GPT-Red: an LLM super-hacker OpenAI built to make its models safer

OpenAI 构建了一个名为 GPT-Red 的 LLM 超级黑客，将其用作陪练伙伴，帮助其其他模型增强对网络攻击的防御能力。上周该公司发布了其旗舰 LLM 的最新版本 GPT-5.6。 OpenAI 表示，针对 GPT-Red 进行训练使该模型成为迄今为止最强大的版本。 GPT-Red 自动化...

MIT新闻 - 人工智能

2026年7月14日 16:25