详细内容或原文请订阅后点击阅览
数据分析师的 SQL:数据提取和转换的基本查询
在本文中,我们将介绍每个数据分析师都应该了解的最重要的 SQL 查询。
来源:KDnuggets# 简介
#数据分析师需要处理数据库中存储的大量信息。在创建报告或找到见解之前,他们必须首先提取正确的数据并准备使用。这就是 SQL(结构化查询语言)的用武之地。SQL 是一种帮助分析师检索数据、清理数据并将其组织成所需格式的工具。
在本文中,我们将介绍每个数据分析师都应该了解的最重要的 SQL 查询。
# 1. 使用 SELECT 选择数据
SELECT 语句是 SQL 的基础。您可以选择特定列或使用 * 返回所有可用字段。
选择*
SELECT 姓名、年龄、工资 FROM 员工;
此查询仅从员工表中提取姓名、年龄和薪水列。
名称
年龄
工资
员工
# 2. 使用 WHERE 过滤数据
WHERE 将行范围缩小到符合您的条件的行。它支持比较和逻辑运算符来创建精确的过滤器。
哪里SELECT * FROM 员工 WHERE 部门 = '财务';
WHERE 子句仅返回属于财务部门的员工。
# 3. 使用 ORDER BY 对结果进行排序
ORDER BY 子句按升序或降序对查询结果进行排序。它用于按数字、文本或日期值对记录进行排名。
排序依据SELECT 姓名、工资 FROM 员工 ORDER BY 工资 DESC;
此查询按工资降序对员工进行排序,因此工资最高的员工首先出现。
# 4. 使用 DISTINCT 删除重复项
DISTINCT 关键字仅返回列中的唯一值。当生成干净的类别或属性列表时,它非常有用。
独特从员工中选择不同的部门;
DISTINCT 删除重复条目,仅返回每个部门名称一次。
# 5. 使用 LIMIT 限制结果
LIMIT 子句限制查询返回的行数。它通常与 ORDER BY 配合使用,以显示大型表中的顶级结果或样本数据。
限制选择姓名、工资 来自员工 按工资 DESC 排序 限制 5;
# 6. 使用 GROUP BY 聚合数据
SUM()
