langchain for Eda:在Python中建立CSV理智 - 检查代理

数据科学家的实用Langchain教程检查CSVSTHE The COST THE LANGCHAIN对EDA:在Python中建立CSV理智 - 检查代理,首先是迈向数据科学。

来源:走向数据科学

,代理执行动作。

这正是我们在今天的文章中要尝试的。

在本文中,我们将使用Langchain和Python来构建自己的CSV理智检查代理。使用此代理,我们将自动化典型的探索性数据分析(EDA)任务,以显示列,检测缺失值(NAN)并检索描述性统计信息。

代理人逐步决定要拨打哪个工具以及何时回答有关我们数据的问题。这与传统意义上的应用程序有很大的不同,在传统意义上,开发人员定义了过程的工作原理(例如,通过IF-ELSE循环)。它也远远超出了简单的提示,因为我们正在构建一个行为的系统(尽管以一种简单的方式),而不仅仅是说话。

如果您:

    …与大熊猫一起工作,想自动化EDA。…发现LLMS令人兴奋,但到目前为止,Langchain的经验很少。…想了解一个简单的示例,以了解代理商的真正工作(从设置到迷你评估)。
  • …与Pandas合作,想自动化EDA。
  • …找到LLM的令人兴奋,但到目前为止,Langchain的经验很少。
  • …想使用一个简单的示例了解代理如何真正工作(从设置到迷你评估)。
  • 目录我们构建的内容和示例中的hyhands-the:csv-sanity-Check代理具有langchainmini-evaluation-findine的思想 - 陷阱,提示和下一步的stepswhere,您可以继续学习吗?

    目录 我们的构建以及为什么 动手示例:langchain 迷你评估 最终想法 - 陷阱,技巧和下一步 您可以在哪里继续学习?

    代理是我们分配任务的系统。然后,系统决定自己使用哪些工具来解决这些任务。

    这需要三个组成部分:

    代理= LLM +工具 +控制逻辑

    让我们仔细看看这三个组成部分:

  • LLM提供了智能:它了解问题,计划步骤并决定该怎么做。
  • get_schema() get_nulls())

    让我们看一个简单的例子:

    用户问:“ CSV的平均年龄是多少?”

    df.describe() df