如何建立强大的深度研究系统

了解如何使用自己的深度研究系统访问大量信息《如何构建强大的深度研究系统》一文首先出现在《走向数据科学》上。

来源:走向数据科学

是您可以在Chatgpt和Google Gemini等应用中激活的流行功能。它允许用户像往常一样询问查询,并且该应用程序花费更长的时间来适当地研究问题,并提出比普通LLM的答案更好的答案。

您也可以将其应用于您自己的文档集合。例如,假设您有成千上万的内部公司信息文档,您可能需要创建一个深入的研究系统,以引入用户问题,扫描所有可用(内部)文档,并根据该信息提出一个很好的答案。

此信息图强调了本文的主要内容。我将讨论您需要在哪种情况下建立深入的研究系统,在哪些情况下,更简单的方法(例如抹布或关键字搜索)更合适。继续,我将讨论如何构建一个深入的研究系统,包括收集数据,创建工具并将其与编排LLM和子代理一起融合在一起。图片由chatgpt。

目录

为什么要建立深入的研究系统?

您可能会问自己的第一个问题是:

为什么我需要深入的研究系统?

这是一个公平的问题,因为在许多情况下还有其他可行的选择:

    将所有数据馈送到llmragkeyword搜索
  • 将所有数据馈送到LLM
  • rag
  • 关键字搜索
  • 如果您可以摆脱这些简单的系统,则几乎应该总是这样做。迄今为止,最简单的方法就是将所有数据馈送到LLM中。如果您的信息包含在不到100万个令牌中,那么这绝对是一个不错的选择。

    如何建立深层研究系统

    深度研究API 多代理研究系统

    收集和索引信息

    任何信息查找系统的第一步是将您的所有信息收集到一个地方。也许您在应用程序中有信息:

      Google drivenotionsalesforce
  • Google Drive
  • 概念
  • Salesforce
  • 关键字搜索索引。例如BM25
  • 您还可以允许代理访问其他功能,例如:

  • 互联网搜索
  • 中等