Lux + Pandas:懒惰分析师的自动可视化

当 Lux 可以一键显示您需要的内容时,为什么要编写 10 行 matplotlib 代码?

来源:KDnuggets
Image by Editor

# 简介

#

如今每个人都需要处理大量数据。我们都喜欢用 Pandas 来处理数据。但说实话,滚动数据帧并手动绘制图表会很无聊。例程很少改变:加载 DataFrame、检查几列、运行 describe() 并构建同一组图表来查找模式。它有效,但重复且耗时。我在最近的一个项目中注意到了这一点,当时我花了最初的几个小时制作基本的直方图、散点图和相关视觉效果,只是为了回答有关分布和关系的简单问题。

Pandas describe() 确实有效,但重复且耗时。

Lux 是一个 Python 库,它直接与 Pandas 集成,并在您显示 DataFrame 时自动生成富有洞察力的可视化效果。它不会取代分析推理;相反,它消除了延迟的手动工作。它可以帮助分析师、学生和数据科学家甚至在开始建模之前更快地探索数据、发现趋势并理解模式。在本文中,我们将探讨 Lux 的工作原理、如何设置,以及为什么它是仍然想要智能结果的“懒惰”分析师的完美伴侣。

Lux 一旦显示 DataFrame 就会自动生成富有洞察力的可视化效果 “懒惰”分析师的完美伴侣

# 安装

在了解 Lux 的工作原理之前,我们先安装 Lux 并在笔记本环境 (Jupyter/Google Colab) 中激活它。您可以使用 pip 安装它,如下所示:

!pip install lux-api
!pip install lux-widget

然后,像平常使用 Pandas 一样导入它:

import pandas as pd
import lux

如果您使用 Google Colab,您还必须启用小部件管理器:

from google.colab import output
输出.enable_custom_widget_manager()

导入后,Lux 会自动连接到您的 Pandas 环境。

# Why Lux?

传统的探索性数据分析 (EDA) 工作流程是:

df.head()
df.describe()
sns.pairplot(df)
df[col].hist()
plt.scatter(df[x], df[y])