Pandas DataFrame 绝对初学者指南

了解如何从字典、列表和 NumPy 数组初始化数据框这篇文章《Pandas DataFrames 绝对初学者指南》首先出现在 Towards Data Science 上。

来源:走向数据科学

背景,学习Python进行数据分析有点挑战性。语法更简单——正确。然而,语言和术语完全不同。在 SQL 中,您必须与数据库、表和列进行交互。然而,在 Python 中,对于数据分析,数据结构是你的面包和黄油。

Python 中的数据结构就像数据存储对象。 Python 包含多种内置数据结构,例如列表、元组、集合和字典。所有这些都用于存储和操作数据。有些是可变的(列表),有些则不是(元组)。要了解有关 Python 数据结构的更多信息,我强烈建议阅读 Wes McKinney 所著的《Python for Data Analysis》一书。我刚开始读它,我认为它很棒。

“用于数据分析的 Python”,作者:Wes McKinney。

在这篇文章中,我将向您介绍 Pandas 中的 DataFrame 是什么以及如何一步一步创建 DataFrame。

了解数组基础知识

Python 中有一个名为 NumPy 的库;你可能听说过。它主要用于数学和数值计算。它提供的功能之一是创建数组的能力。你可能想知道。数组到底是什么?

你可能听说过

数组与列表类似,但它仅存储相同数据类型的值。然而,列表可以存储不同数据类型的值(int、text、boolean 等)。这是列表的示例

my_list = [1, “你好”, 3.14, True]

列表也是可变的。换句话说,您可以添加和删除元素。

返回数组。在 Numpy 中,数组可以是多维的——这称为 ndarray(N 维数组)。例如,让我们在 Python 中导入 Numpy 库。

将 numpy 导入为 np

要在 Numpy 中创建基本数组,我们使用 np.array() 函数。在这个函数中,我们的数组被存储。

np.array()
arr = np.array([1, 2, 3, 4, 5])arr

这是结果:

数组([1, 2, 3, 4, 5])

检查数据类型。

类型(arr)

我们将获取数据类型。

numpy.ndarray
arr*2

结果:

数组([ 2, 4, 6, 8, 10])

输出: