使用OpenPyXl和AI代理生成Excel文件的数据字典

使用AI:利用OpenPyXl和Generative AI自动化Excel文档来创建数据字典。了解如何利用AI代理在Excel文件中添加列描述和元数据,提高透明度和协作。使用OpenPyXl和AI代理为Excel文件生成数据字典首先出现在数据科学上。

来源:走向数据科学

我一直在今天工作的每家公司,都是:有弹性的MS Excel。

Excel于1985年首次发行,直到今天一直保持强劲。它在关系数据库的兴起,许多编程语言的发展,具有无限数量的在线应用程序的兴起中幸存下来,最后,它也幸免于AI的时代。

ph!

您对Excel的弹性有何疑问?我没有。

我认为,这样做的原因是迅速启动和操纵文件的实用性。考虑一下这种情况:我们在工作,会议上,突然领导者共享一个CSV文件,并要求快速计算或一些计算的数字。现在,选项为:

实用性启动和操纵文档

1。打开一个IDE(或笔记本),然后像疯狂地开始编码以生成简单的matplotlib图形;

2。打开Power BI,导入数据,然后开始使用动态图形创建报告。

3。在Excel中打开CSV,编写几个公式,然后创建图形。

我不能为您说话,但是很多次我选择选项3。尤其是因为Excel文件与所有内容兼容,易于共享,并且友好。

我说的所有这些都是介绍我的观点,即即使随着AI的快速开发,我认为Excel文件也不会很快消失。许多人会喜欢的,许多人会讨厌那个。

因此,我在这里的行动是利用AI来更好地记录Excel文件。数据团队对Excel的主要投诉之一是缺乏最佳实践和可重复性,因为这些列的名称可以具有任何名称和数据类型,但文档为零。

因此,我创建了一个读取Excel文件并创建此小文档的AI代理。这是它的工作方式:

  • Excel文件被转换为CSV并馈送到大语言模型(LLM)中。
  • AI代理使用列信息(可变名称,数据类型,描述)生成数据字典。
  • 用注释保存的输出文件。
  • 代码

    VENV [5]