上下文关键词检索结果

RAG 还不够——我构建了使 LLM 系统正常运行的缺失上下文层

RAG Isn’t Enough — I Built the Missing Context Layer That Makes LLM Systems Work

大多数 RAG 教程侧重于检索或提示。当上下文增长时,真正的问题就开始了。本文展示了一个用纯 Python 构建的完整上下文工程系统,该系统控制内存、压缩、重新排名和代币预算 - 因此 LLM 在实际约束下保持稳定。 帖子 RAG 不够 - 我构建了使 LLM 系统工作的缺失上下文层首先出现在《走向数据科学》上。

上下文不是功能,而是系统

Context Is Not A Feature, It Is The System

作者:Alex Zilberman,Chamelio 首席执行官。当人们在法律中谈论人工智能时,他们经常谈论“背景”,就好像它是一个简单的成分一样。添加...

在 AWS 上扩展地震基础模型:使用 Amazon SageMaker HyperPod 进行分布式训练并扩展上下文窗口

Scaling seismic foundation models on AWS: Distributed training with Amazon SageMaker HyperPod and expanding context windows

本文介绍了 TGS 如何使用 Amazon SageMaker HyperPod 实现分布式训练的近线性扩展以及基于 Vision Transformer 的 SFM 的扩展上下文窗口。该联合解决方案将训练时间从 6 个月缩短至仅 5 天,同时能够分析比以前更大的地震体积。

AI 代理的上下文工程:深入探讨

Context Engineering for AI Agents: A Deep Dive

如何优化上下文,这是 AI 代理宝贵的有限资源《AI 代理的上下文工程:深入探究》一文首先出现在《走向数据科学》上。

您的 RAG 系统检索正确的数据,但仍然产生错误的答案。这就是原因(以及如何解决它)。

Your RAG System Retrieves the Right Data — But Still Produces Wrong Answers. Here’s Why (and How to Fix It).

您的 RAG 系统正在以满分检索正确的文档,但它仍然自信地返回错误的答案。我构建了一个 220 MB 的本地实验,证明了几乎没有人谈论的隐藏故障模式:同一检索窗口中的上下文冲突。两个相互矛盾的文档返回,模型选择一个,然后你会得到一个流畅但不正确的响应,并且零警告。本文准确展示了它发生的原因、它悄然中断的三个生产场景,以及修复它的微小管道层 - 不需要额外的模型,不需要 GPU,不需要 API 密钥。系统的行为完全按照设计。答案仍然是错误的。您的 RAG 系统检索正确的数据 — 但仍然产生错误的答案这一帖子。这就是原因(以及如何解决它)。首先出现在《走向数据科学》上。

KV 缓存正在占用您的 VRAM。以下是 Google 如何使用 TurboQuant 修复该问题。

KV Cache Is Eating Your VRAM. Here’s How Google Fixed It With TurboQuant.

探索 TurboQuant(一种新颖的 KV 缓存量化框架)的端到端管道。本概述详细介绍了多级压缩如何通过 PolarQuant 和 QJL 残差实现近乎无损的存储,从而以最小的内存开销实现大量上下文窗口后 KV 缓存正在吞噬您的 VRAM。以下是 Google 如何使用 TurboQuant 修复该问题。首先出现在《走向数据科学》上。

Google 推出 Mac 版 Gemini:教师和教育工作者需要了解的内容

Google Launches Gemini for Mac: What Teachers and Educators Need to Know

您是否正在寻找一种将人工智能无缝集成到您的教学工作流程中的方法? Google 刚刚推出了 Mac 版 Gemini,它可能是您一直在等待的游戏规则改变者。想象一下无需切换选项卡或中断流程即可获得即时人工智能帮助。只需快速按下 Option + Space,您就可以直接从桌面召唤 Gemini,帮助您起草课程计划、回复电子邮件或创建演示文稿。这款新的本机应用程序不仅提供即时访问,还允许您共享屏幕以获取上下文感知帮助。需要分析复杂的数据图表?只需与 Gemini 共享您的窗口,即可获得针对您当前任务的实时见解。此外,借助用于生成图像和视频的内置工具,您可以即时创建自定义资源。想了解 Gemini

复杂与智能系统,第 12 卷,第 4 期,2026 年 4 月

Complex & Intelligent Systems, Volume 12, Issue 4, April 2026

1) 6G Metaverse 网络的 AI 原生云边缘编排:LLM 引导的多代理 DRL 方法作者:Daniel Ayepah-Mensah、Amine Kidane Ghebreziabiher、Jamal Bentahar2) RAMAR:用于零样本讽刺检测的检索增强多代理推理作者:Congyin Hu、Shuang Cao、Fengjiao Jiang3) 改进的大型邻域解决动态取货和送货问题的搜索算法作者:Qingxia Shang,Yuanji Ming,Liang Feng4)Efficient person re-identification via Progressive F

Guidesly 如何为 AWS 上的户外导游构建 AI 生成的行程报告

How Guidesly built AI-generated trip reports for outdoor guides on AWS

在这篇文章中,我们将介绍 Guidesly 如何使用 AWS Lambda、AWS Step Functions、Amazon Simple Storage Service (Amazon S3)、Amazon Relational Database Service (Amazon RDS)、Amazon SageMaker AI 和 Amazon Bedrock 在 AWS 上构建 Jack AI,以提取旅行媒体、通过上下文丰富其内容、应用计算机视觉和生成式 AI,并跨多个渠道安全、可靠且大规模地发布营销就绪内容。

TPConnects 将 MCP 集成到 Iris 中,以支持 AI 就绪的航空公司内容

TPConnects integrates MCP into Iris to enable AI-ready airline content

航空公司零售和内容聚合解决方案提供商 TPConnects Technologies 已将模型上下文协议 (MCP) 集成到其 Iris 平台中,推出了一个 AI 就绪界面……TPConnects 将 MCP 集成到 Iris 中,使 AI 就绪航空公司内容首先出现在《航空商业新闻》上。

为什么每个 AI 编码助手都需要内存层

Why Every AI Coding Assistant Needs a Memory Layer

AI 编码助理需要一个持久的内存层来克服 LLM 的无状态性,并通过系统地跨会话提供上下文来提高代码质量。为什么每个 AI 编码助理需要一个内存层一文首先出现在 Towards Data Science 上。

IEEE Transactions on Cognitive and Developmental Systems,第 18 卷,第 2 期,2026 年 4 月

IEEE Transactions on Cognitive and Developmental Systems, Volume 18, Issue 2, April 2026

1) 机器人抓取中一致路径的抓取表示和检测作者:L. Chen, Z. Li, J. Yang, Z. Lu, P. Wu, T. ChenPages: 302 - 3022) CIDDA: Classifier-Driven Implicit Discriminator Domain Adaptation for EEG-Based Emotion Recognition and Depression Severity Grading作者:R. Hu, Z. Yang, J. Shan, N. Su, Y. Tang, H. Yan, X. Lv, D. Fu, H. Zhu, T. Jia

如何在大规模AI代理部署中实现零停机更新

How to achieve zero-downtime updates in large-scale AI agent deployments

当您的网站出现故障时,您会立即知道。警报响起,用户抱怨,收入可能停止。当你的人工智能代理失败时,这一切都不会发生。他们不断回应。他们只是回应错误。代理可能会出现完全可操作的情况,同时出现幻觉策略细节、在会话中丢失对话上下文或消耗代币预算直到速率限制关闭它们......如何在大规模 AI 代理部署中实现零停机更新的帖子首先出现在 DataRobot 上。

IEEE 模糊系统汇刊,第 34 卷,第 4 期,2026 年 4 月

IEEE Transactions on Fuzzy Systems, Volume 34, Issue 4, April 2026

1) 客座社论:模糊大型模型专题:桥接不确定性和创造力作者:H. Yu、Q. Liu、W. Pedrycz、J. Lu 页数:1039 - 10402) FMA-Net:用于细粒度图像识别的模糊相互注意网络作者:H. Huang、J. -H.李,S.-K。 Oh, Z. Fu, J. H. Yoon, W. Pedrycz 页数:1041 - 10523) 通过大型语言模型对权衡总成本和客户满意度 VRP 中的上下文进行建模作者:H. -W.丁,Z.-S。 Chen, Y. Yang, W. DingPages: 1053 - 10634) 通过模糊隶属聚合审计大型语言模型中的部分数据集使用作

无限及超越:工具使用解锁状态空间模型中的长度泛化

To Infinity and Beyond: Tool-Use Unlocks Length Generalization in State Space Models

状态空间模型 (SSM) 已成为序列建模中 Transformer 的主要替代方案。它们的主要优点是通过固定大小的内存和计算复杂性的线性缩放实现长上下文和长格式生成的效率。我们通过展示一个简单的理论结果来开始这项工作,表明 SSM 无法准确解决任何“真正的长形式”发电问题(在某种意义上我们正式定义),从而削弱了它们的主要竞争优势。然而,我们表明,可以通过允许 SSM 交互式访问外部工具来缓解这一限制。事实上,我们...

使用 Amazon Bedrock AgentCore 和 Amazon Nova Sonic 2.0 通过代理 AI 电影助手提供超个性化的观看体验

Deliver hyper-personalized viewer experiences with an agentic AI movie assistant using Amazon Bedrock AgentCore and Amazon Nova Sonic 2.0

在这篇文章中,我们将介绍两个使用案例,帮助使用代理 AI 工具和框架(包括 Strands Agents SDK、Amazon Bedrock AgentCore 和 Amazon Nova Sonic 2.0)增强用户观看体验。该代理人工智能系统使用模型上下文协议(MCP)来提供个人娱乐礼宾服务,通过自然对话了解用户偏好。

[真菌 • 2025] Hydnellum 杭州(伞形孢菌纲:Thelephorales) • 形态学和分子系统发育揭示了中国东部的一个新物种

[Funga • 2025] Hydnellum hangzhouense (Agaricomycetes: Thelephorales) • Morphology and Molecular Phylogeny reveal One New Species from Eastern China

Hydnellum 杭州 X.P.范YF.孙B.K. Cui, in Fan, Song, Xu, Sun et Cui, 2025. DOI: doi.org/10.11646/phytotaxa.711.1.3 Researchgate.net/publication/393904694摘要 Hydnellum中的物种作为外生菌根真菌,可以与植物根部形成互利共生,促进森林植被的恢复和森林生态系统的稳定。一些Hydnellum真菌还具有食用和药用价值,产生可观的经济效益。在这项研究中,通过形态学和系统发育分析描述了从中国东部杭州收集的一个新种 Hydnellum。从形态上看,杭州毛囊菌具有浅

独家自注意力

Exclusive Self Attention

我们引入了专有自注意力(XSA),这是自注意力(SA)的简单修改,可以提高 Transformer 的序列建模性能。关键思想是限制注意力仅捕获与代币自身价值向量正交的信息(从而排除自身位置的信息),从而鼓励更好的上下文建模。在标准语言建模任务上进行评估时,XSA 在模型大小高达 2.7B 参数的情况下始终优于 SA,并且随着序列长度的增长显示出越来越大的增益。