详细内容或原文请订阅后点击阅览
Lux + Pandas:懒惰分析师的自动可视化
当 Lux 可以一键显示您需要的内容时,为什么要编写 10 行 matplotlib 代码?
来源:KDnuggets# 简介
#如今每个人都需要处理大量数据。我们都喜欢用 Pandas 来处理数据。但说实话,滚动数据帧并手动绘制图表会很无聊。例程很少改变:加载 DataFrame、检查几列、运行 describe() 并构建同一组图表来查找模式。它有效,但重复且耗时。我在最近的一个项目中注意到了这一点,当时我花了最初的几个小时制作基本的直方图、散点图和相关视觉效果,只是为了回答有关分布和关系的简单问题。
Pandasdescribe()
确实有效,但重复且耗时。
Lux 是一个 Python 库,它直接与 Pandas 集成,并在您显示 DataFrame 时自动生成富有洞察力的可视化效果。它不会取代分析推理;相反,它消除了延迟的手动工作。它可以帮助分析师、学生和数据科学家甚至在开始建模之前更快地探索数据、发现趋势并理解模式。在本文中,我们将探讨 Lux 的工作原理、如何设置,以及为什么它是仍然想要智能结果的“懒惰”分析师的完美伴侣。
Lux 一旦显示 DataFrame 就会自动生成富有洞察力的可视化效果 “懒惰”分析师的完美伴侣# 安装
在了解 Lux 的工作原理之前,我们先安装 Lux 并在笔记本环境 (Jupyter/Google Colab) 中激活它。您可以使用 pip 安装它,如下所示:
!pip install lux-api !pip install lux-widget
然后,像平常使用 Pandas 一样导入它:
import pandas as pd import lux
如果您使用 Google Colab,您还必须启用小部件管理器:
from google.colab import output 输出.enable_custom_widget_manager()
导入后,Lux 会自动连接到您的 Pandas 环境。
# Why Lux?
传统的探索性数据分析 (EDA) 工作流程是:
df.head() df.describe() sns.pairplot(df) df[col].hist() plt.scatter(df[x], df[y])
