5个鲜为人知的python特征每个数据科学家都应该知道

了解许多人错过的五个方便的python功能,但可以使您的数据科学更轻松。

来源:KDnuggets
编辑图片| chatgpt

#简介

Python是数据科学领域中使用的最流行的语言之一,其简单性,多功能性和功能强大的库生态系统(包括Numpy,Pandas,Scikit-Learn和Tensorflow)被重视。尽管这些工具提供了许多繁重的工作,但Python本身包含一系列功能,这些功能可以帮助您编写更清洁,更快,更有效的代码。这些功能中的许多人都没有注意到,但是它们可以改善您的构建和管理项目的方式。

python numpy pandas Scikit-Learn TensorFlow

在本文中,我们探讨了五个鲜为人知但有益的Python功能,每个数据科学家在其工具包中都应具有这些功能。

#1。循环上的其他子句

else

您是否知道,而python中的循环可以有其他条款?

while

虽然这听起来可能是违反直觉的,但仅当循环完成而无需断开语句时才执行。当您通过数据集搜索并只想在从未满足特定条件时才能运行一些逻辑时,这很有用。

休息
数据集中的行:
    如果行['target'] =='desired_value':
        打印(“找到!”)
        休息
别的:
    打印(“找不到”)

在此片段中,仅当循环完成而不会遇到休息时,ELSE块才能执行。这使您可以避免在循环外创建额外的标志或条件。

#2。数据级模块

数据级

Python 3.7中引入的Dataclasses模块提供了装饰器和辅助功能,该功能会自动生成特殊方法,例如__init __(),__repr __()和__EQ __()和__eq __()。当您需要轻巧的类来存储参数,结果或配置设置而无需编写重复的样板代码时,这在数据科学中很有用。

__Init __() __repr __() __eq __()
从数据级导入数据级

@DataClass
班级实验室:
    Learning_rate:float
    batch_size:int
    时代:int
@dataclass

#3。海象操作员(:=)

:= 海象操作员 avg

#4。索引循环的枚举()