数据分析师的 SQL:数据提取和转换的基本查询

在本文中,我们将介绍每个数据分析师都应该了解的最重要的 SQL 查询。

来源:KDnuggets
图片由编辑提供

# 简介

#

数据分析师需要处理数据库中存储的大量信息。在创建报告或找到见解之前,他们必须首先提取正确的数据并准备使用。这就是 SQL(结构化查询语言)的用武之地。SQL 是一种帮助分析师检索数据、清理数据并将其组织成所需格式的工具。

在本文中,我们将介绍每个数据分析师都应该了解的最重要的 SQL 查询。

# 1. 使用 SELECT 选择数据

SELECT 语句是 SQL 的基础。您可以选择特定列或使用 * 返回所有可用字段。

选择 *
SELECT 姓名、年龄、工资 FROM 员工;

此查询仅从员工表中提取姓名、年龄和薪水列。

名称 年龄 工资 员工

# 2. 使用 WHERE 过滤数据

WHERE 将行范围缩小到符合您的条件的行。它支持比较和逻辑运算符来创建精确的过滤器。

哪里
SELECT * FROM 员工 WHERE 部门 = '财务';

WHERE 子句仅返回属于财务部门的员工。

# 3. 使用 ORDER BY 对结果进行排序

ORDER BY 子句按升序或降序对查询结果进行排序。它用于按数字、文本或日期值对记录进行排名。

排序依据
SELECT 姓名、工资 FROM 员工 ORDER BY 工资 DESC;

此查询按工资降序对员工进行排序,因此工资最高的员工首先出现。

# 4. 使用 DISTINCT 删除重复项

DISTINCT 关键字仅返回列中的唯一值。当生成干净的类别或属性列表时,它非常有用。

独特
从员工中选择不同的部门;

DISTINCT 删除重复条目,仅返回每个部门名称一次。

# 5. 使用 LIMIT 限制结果

LIMIT 子句限制查询返回的行数。它通常与 ORDER BY 配合使用,以显示大型表中的顶级结果或样本数据。

限制
选择姓名、工资 
来自员工 
按工资 DESC 排序 
限制 5;

# 6. 使用 GROUP BY 聚合数据

SUM()