详细内容或原文请订阅后点击阅览
NumPy 中的隐藏宝石:每个数据科学家都应该知道的 7 个函数
我已经学习数据分析一年了。到目前为止,我对 SQL 和 Power BI 充满信心。向 Python 的过渡非常令人兴奋。我接触过一些简洁、更智能的数据分析方法。在温习了 Python 基础知识后,理想的下一步 [...]NumPy 中的隐藏宝石:每个数据科学家应该知道的 7 个函数首先出现在《迈向数据科学》上。
来源:走向数据科学数据分析已经一年了。到目前为止,我对 SQL 和 Power BI 充满信心。向 Python 的过渡非常令人兴奋。我接触过一些简洁、更智能的数据分析方法。
温习了 Python 基础知识后,理想的下一步是开始学习一些用于数据分析的 Python 库。 NumPy 就是其中之一。作为一名数学迷,我自然会喜欢探索这个 Python 库。
该库专为想要使用 Python 执行数学计算的个人而设计,从基础数学和代数到微积分等高级概念。 NumPy 几乎可以完成这一切。
在本文中,我想向您介绍一些我一直在使用的 NumPy 函数。无论您是数据科学家、金融分析师还是研究狂,这些功能都会对您有很大帮助。话不多说,让我们开始吧。
示例数据集(全文使用)
在深入研究之前,我将定义一个小数据集来锚定所有示例:
import numpy as nptemps = np.array([30, 32, 29, 35, 36, 33, 31])
使用这个小型温度数据集,我将分享 7 个使数组操作变得轻松的函数。
1. np.where() — 向量化的 If-Else
在定义这个函数之前,先快速展示一下该函数
arr = np.array([10, 15, 20, 25, 30])indices = np.where(arr > 20)print(indices)
输出: (array([3, 4]),)np.where 是一个基于条件的函数。当指定条件时,它会输出该条件为 true 的索引/索引。例如,在上面的示例中,指定了一个数组,并且我声明了一个 np.where 函数,用于检索数组元素大于 20 的记录。输出为 array([3, 4]),因为这是该条件为 true 的位置/索引 - 将为 25 和 30。
输出:(array([3, 4]),)np.where
条件选择/替换
import numpy as nparr = np.array([1, 2, 3, 4, 5])result = np.where(arr % 2 == 0, ‘even’, ‘odd’)print(result)
np.ptp()
