具有 SQL 存储过程的数据分析自动化脚本

使用可重用的执行脚本简化您的查询。

来源:KDnuggets
图片由编辑提供

# 简介

#

在当前的数字时代,数据已成为更容易存储的商品。凭借拥有丰富业务数据的优势,分析数据以帮助企业获得洞察力变得比以往任何时候都更加重要。

在大多数企业中,数据存储在结构化数据库中,并使用 SQL 来获取数据。通过SQL,我们可以以我们想要的形式查询数据,只要脚本有效。

问题在于,有时,获取我们想要的数据的查询很复杂并且不是动态的。在这种情况下,我们可以使用 SQL 存储过程将繁琐的脚本简化为简单的可调用程序。

本文讨论使用 SQL 存储过程创建数据分析自动化脚本。

好奇吗?方法如下。

# SQL 存储过程

SQL 存储过程是直接存储在数据库中的 SQL 查询的集合。如果您精通Python,您可以将它们视为函数:它们将一系列操作封装到我们可以随时调用的单个可执行单元中。这是有益的,因为我们可以让它变得动态。

这就是为什么理解 SQL 存储过程很有帮助,它可以让我们简化代码并自动执行重复性任务。

让我们通过一个例子来尝试一下。在本教程中,我将使用 MySQL 作为数据库,使用 Kaggle 中的股票数据作为表示例。在本地计算机上设置 MySQL Workbench 并创建一个可以存储表的架构。在我的示例中,我创建了一个名为 Finance_db 的数据库,其中包含一个名为 stock_data 的表。

MySQL 股票数据 财务数据库 股票数据

我们可以使用如下所示的方式查询数据。

使用finance_db;

从stock_data中选择*;

一般来说,存储过程具有以下结构。

分隔符 $$
创建过程 procedure_name(param_1, param_2, . . ., param_n)
开始
    指令_1;
    指令_2;
    。 。 。
    指令_n;
结束 $$
分隔符;

如您所见,存储过程可以接收传递到查询中的参数。

AggregateStockMetrics

您可以像这样调用存储过程: