上下文关键词检索结果

上下文即代码

Context as Code

随着语法变得廉价和丰富,架构控制成为稀缺资源。有效的治理从上游开始,意图、约束和威胁模型在生成开始之前就塑造了代理的工作环境。目标不是更好的提示,而是构建时边界,防止结构上无效的代码进入系统。弗兰肯斯坦工厂 黑暗工厂(如 Dan [...]

使用 Amazon FSx for Lustre 和 TurboQuant 上的 GPUDirect 加速 LLM 模型加载并增加上下文窗口

Accelerate LLM model loading and increase context windows with GPUDirect on Amazon FSx for Lustre and TurboQuant

如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]

使用 Amazon Bedrock AgentCore 打破上下文窗口障碍

Break the context window barrier with Amazon Bedrock AgentCore

在本文中,您将了解如何使用 Amazon Bedrock AgentCore Code Interpreter 和 Strands Agents SDK 实施递归语言模型 (RLM)。最后,您将了解如何在上下文大小没有上限的情况下处理不同长度的文档,使用 Bedrock AgentCore Code Interpreter 作为迭代文档分析的持久工作内存,以及在沙盒 Python 环境中编排次大语言模型 (sub-LLM) 调用来分析特定文档部分。

为您的 AI 提供无限更新的上下文

Give Your AI Unlimited Updated Context

可移植知识层背后的架构以及使其保持活力的自动化。“为您的人工智能提供无限更新的上下文”一文首先出现在“迈向数据科学”上。

Timer-XL:用于时间序列预测的长上下文基础模型

Timer-XL: A Long-Context Foundation Model for Time-Series Forecasting

探索仅解码器 Transformer 基础模型的内部工作原理后置 Timer-XL:用于时间序列预测的长上下文基础模型首先出现在 Towards Data Science 上。

讨厌 Windows 中的右键菜单?微软刚刚承诺让你调整它 - 很快

Hate the right-click menu in Windows? Microsoft just promised to let you tweak it - soon

一位顶级 Microsoft 副总裁承诺提供一个更快、更简单且更可自定义的上下文菜单,当您右键单击文件资源管理器或桌面上的某个项目时,就会出现该菜单。

如何在 Amazon Bedrock 上大规模构建自动驾驶 AI 操作

How to build self-driving AI operations on Amazon Bedrock at scale

在这篇文章中,我们介绍 Amazon Bedrock Ops Alert,这是一种三层自动化监控解决方案,可主动检测操作问题、动态调整警报阈值、按类别对警报进行分类、自动创建上下文感知支持案例、在同一警报类别的未解决案例已处于活动状态时帮助防止重复案例,并向 AI SRE 团队提供情境化通知。我们将介绍解决方案架构以及如何将其部署在您自己的环境中。

让本地 LLM 代理真正发挥作用的基础设施

The Infrastructure Behind Making Local LLM Agents Actually Useful

使用本地开放权重模型、vLLM 和长上下文基础设施构建快速、可靠的科学代理的经验教训使本地 LLM 代理真正有用的基础设施背后的帖子首先出现在走向数据科学上。

“代理人工智能”是代币的篝火,而晶圆厂产能、电网和损益表则是刹车:(不是)当日读物

"Agentic AI" Is a Bonfire of the Tokens While Fab Capacity, Power Grids, and P&Ls Are the brakes: (NOT THE) READ OF THE DAY

我们将“注意力就是你所需要的一切”规模化为一个工业规模的随机鹦鹉农场,然后安装了代理和工具,直到它开始看起来更像是我们的想法。现在,工程现实——晶圆厂、电力和令人眼花缭乱的代币账单——正在询问我们所做的事情是否值得。通用法学硕士开始在自己的输出上进行近亲繁殖,这与依靠严格约束的对抗性合成数据而蓬勃发展的游戏人工智能不同。我们是否将自己困在潜在推理空间的一个充满斜坡的子超平面中?从注意力开始就是你所需要的,然后进行扩展。结果是,正如 Cosma Shalizi 三年前指出的那样:分享赠送订阅Cosma Shalizi:神经网络“大型语言模型”中的“注意力”、“变形金刚”:“[一项]令人难以置信的

使用 Strands Agents、NVIDIA NIM 和 Amazon Bedrock AgentCore 构建高性能生成式 AI 系统

Build high-performance generative AI systems with Strands Agents, NVIDIA NIM, and Amazon Bedrock AgentCore

在这篇文章中,您将学习如何构建一个多代理活动审核系统,该系统使用集成架构(结合了 NVIDIA NIM 进行 GPU 加速推理)来演示并行推理、上下文持久性和可追踪执行路径。 Amazon Bedrock AgentCore 提供托管运行时、共享内存和内置可观察性,Strands Agents 提供无服务器多代理编排。此方法支持生产环境中的性能、可扩展性和操作洞察力。虽然该示例侧重于营销内容审核,但相同的模式也适用于数字助理、审核自动化和检索增强生成管道。

面向开发人员的 DataRobot:Cursor、Gemini 和 Claude 技能

DataRobot for Developers: Skills in Cursor, Gemini, and Claude

针对新平台进行构建的最困难的部分是教授您的工具。您的编码代理不了解 SDK 的约定。您的 IDE 不识别 CLI 命令。您的终端不知道身份验证模式。每一个间隙都是一次上下文切换,而每一次上下文切换都是从工作中花费的时间。 DataRobot...面向开发人员的 DataRobot:光标、Gemini 和 Claude 技能一文首先出现在 DataRobot 上。

Online Gokplatform Nederland:Alle Informatie Dat U Hoort Te Kennen Over Virtueel Gokken

Online Gokplatform Nederland: Alle Informatie Dat U Hoort Te Kennen Over Virtueel Gokken

Overzicht Wetgeving 遇见了 Certificationn binnen het Binnenlandse Kansspelmarkt Dit Spelaanbod binnen Binnenlandse Digitale Speelhuizen Betaalopties plus Verwerkingstijd Verantwoord Gokken en Beschermingsmaatregelen Bonussen 遇见了 Legale Casino 的 Mobiel Gokken 和 Beschikbaarheid 的促销活动 Wetgeving 遇见了 Vergun

使用 Amazon Bedrock AgentCore Memory 扩展 Kiro CLI 中的会话内存

Extending conversational memory in Kiro CLI using Amazon Bedrock AgentCore Memory

在这篇文章中,我们将演示如何通过实施与 Amazon Bedrock AgentCore Memory 集成的自定义模型上下文协议 (MCP) 服务器来扩展 Kiro CLI 的会话内存。您可以使用 Kiro CLI 直接从终端与 Kiro 的 AI 代理进行交互。 Amazon Bedrock AgentCore Memory 是一项完全托管的服务,允许 AI 代理保留过去交互中的信息,从而创建更加智能和上下文感知的对话。通过实施自定义 MCP 服务器,您可以为 Kiro CLI 提供工具来存储和检索对话上下文、监控内存使用情况以及管理底层 Bedrock Agent 核心内存基础设施。

Allient Inc. 将出席即将举行的人形机器人热优化关节网络研讨会

Allient Inc. to Present at Upcoming Webinar on Engineering Thermally-Optimized Joints for Humanoids

该网络研讨会将探讨人形关节设计中的关键挑战,以及如何在系统级上下文中解释运动数据,而不是依赖标准规范。它还将研究用于人形和先进机器人应用的电机选择和性能优化的实用工程方法,重点是实现可靠、热效率高的性能。

AI 生成的针对我自己的网络钓鱼攻击:网络犯罪分子如何使用 ChatGPT 和类似工具

An AI-generated phishing attack on myself: How Cybercriminals Use ChatGPT and Similar Tools

一次非常适合我的网络钓鱼攻击。语气正确,上下文合适,并且正确引用了我的专业环境中的细节。一瞬间,一切都显得可信。但我问自己:这些关于我的信息从哪里来?攻击者是如何如此精确地瞄准我的?这并非巧合。网络钓鱼攻击不再依赖于大规模分发,而是依赖于精心准备的欺骗。在人工智能的帮助下,网络犯罪分子分析公开信息、创建个性档案并使用适当的触发器。在本文中,我将展示如何创建此类攻击。

为什么每个人都说“你是生日”?让千禧一代感到困惑的奇怪 Z 世代俚语可能是互联网上迄今为止最有趣的侮辱

Why is everyone saying ‘You the Birthday’? The bizarre Gen Z slang phrase confusing millennials may secretly be the internet’s funniest insult yet

这个短语听起来语法不正确,在没有上下文的情况下毫无意义,但仍然在互联网上充斥着评论区。但根据互联网文化观察家和自称“长期在线”的 TikTok 用户的说法,这种混乱实际上是这个笑话发挥作用的原因。

为什么有些大脑比其他人转换速度更快

Why Some Brains Switch Gears Faster Than Others

您大脑的内部计时系统可能有助于确定您思考的速度和效率。人脑不断管理以不同速度移动的信息流。有些信号需要对环境的突然变化立即做出反应,而另一些则涉及较慢的思维形式,例如解释含义、上下文或复杂情况。 [...]

自适应并行推理:高效推理扩展的下一个范式

Adaptive Parallel Reasoning: The Next Paradigm in Efficient Inference Scaling

自适应并行推理概述。如果推理模型可以自行决定何时分解和并行化独立子任务、生成多少个并发线程以及如何根据当前问题协调它们,会怎样?我们对并行推理领域的最新进展进行了详细分析,特别是自适应并行推理。披露:这篇文章部分是景观调查,部分是自适应并行推理的视角。作者之一 (Tony Lian) 共同领导了 ThreadWeaver (Lian et al., 2025),这是下面讨论的方法之一。作者旨在以自己的方式呈现每种方法。 动机 除了数据和参数缩放之外,LLM 推理能力的最新进展很大程度上是由推理时间缩放驱动的(OpenAI 等人,2024 年;DeepSeek-AI 等人,2025 年)。显式输