None

模型上下文协议 (MCP) 确实很有用。它为开发人工智能工具的人们提供了一种标准化的方式来调用函数并从外部系统访问数据。您无需为每个数据源构建自定义集成,而是可以通过任何 AI 都能理解的通用协议公开数据库、API 和内部工具。然而,我[...]

来源:O'Reilly Media _AI & ML

模型上下文协议 (MCP) 确实很有用。它为开发人工智能工具的人们提供了一种标准化的方式来调用函数并从外部系统访问数据。您无需为每个数据源构建自定义集成,而是可以通过任何 AI 都能理解的通用协议公开数据库、API 和内部工具。

然而,过去一年我一直在观察团队采用 MCP,我发现了一种令人不安的模式。开发人员正在使用 MCP 将他们的 AI 助手快速连接到他们能找到的每个数据源(客户数据库、支持票证、内部 API、文档存储)并将其全部转储到 AI 的上下文中。而且由于人工智能足够聪明,可以对大量数据进行排序并挑选出相关的部分,所以一切都正常!与直觉相反,这实际上是一个问题。人工智能会愉快地处理大量数据并产生合理的答案,因此没有人会想到质疑这种方法。

这是数据囤积。就像物质囤积者无法扔掉任何东西,直到他们的家变得杂乱不堪而无法居住一样,数据囤积有可能给我们的团队带来严重的问题。开发人员了解到,他们可以获取远多于人工智能需求的数据,并且只需很少的规划或结构即可提供数据,并且人工智能足够聪明,可以处理这些数据并仍然给出良好的结果。

当连接新数据源需要数小时而不是数天时,许多开发人员不会花时间询问上下文中实际属于哪些数据。这就是为什么您最终会得到运行成本高昂且无法调试的系统,而整个开发人员群体却错过了学习构建健壮且可维护的应用程序所需的关键数据架构技能的机会。

团队如何学习囤积

永远不会发展的技能

数据囤积的隐性成本

避免数据囤积陷阱的实用工具

数据囤积的快速嗅觉测试

  • 工具名称是名词 (getCustomer()),而不是动词 (checkEligibility())。